เรื่องเด่น คัมภีร์ล้านนา ทรงคุณค่าสู่โลกดิจิตอลภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มช.

ในห้อง 'บันเทิงและศิลปวัฒนธรรม' ตั้งกระทู้โดย โพธิสัตว์ ชาวพุทธ, 1 เมษายน 2019.

  1. โพธิสัตว์ ชาวพุทธ

    โพธิสัตว์ ชาวพุทธ เป็นที่รู้จักกันดี

    วันที่สมัครสมาชิก:
    24 กรกฎาคม 2017
    โพสต์:
    5,297
    กระทู้เรื่องเด่น:
    2,273
    ค่าพลัง:
    +9,528
    0b98ce0b8a5e0b989e0b8b2e0b899e0b899e0b8b2-e0b897e0b8a3e0b887e0b884e0b8b8e0b893e0b884e0b988e0b8b2.jpg

    Lanna OCR Application เป็นหนึ่งในผลงานการออกแบบ Application ที่น่าสนใจ ของนักศึกษาระดับปริญญาเอก ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ ด้วยการทำงานที่สร้างสรรค์ เพื่อนำแนวคิดและองค์ความรู้ที่ทันสมัยมาตอบโจทย์การศึกษาประวัติศาสตร์ยุคโบราณให้มีความสะดวกและแม่นยำยิ่งขึ้น เรียกได้ว่าเป็นการนำวิทยาการใหม่มาใช้เป็นเครื่องมือเรียนรู้โลกยุคเก่าได้อย่างลงตัว

    98ce0b8a5e0b989e0b8b2e0b899e0b899e0b8b2-e0b897e0b8a3e0b887e0b884e0b8b8e0b893e0b884e0b988e0b8b2-1.jpg

    และเบื้องหลังกว่าจะมาเป็น Application สุดทันสมัยนี้ นอกจากนักวิจัยจะต้องมีความรู้ความสามารถทางด้านวิทยาการคอมพิวเตอร์แล้ว นักวิจัยยังต้องใช้เวลาในการศึกษาภาษาล้านนานานนับปี เพื่อให้มีความรู้เข้าใจในลักษณะของภาษาที่ปรากฏบนคัมภีร์ใบลานที่เก็บรักษาไว้ในที่ต่างๆ อย่างถ่องแท้ จึงจะสามารถพัฒนามันสมองของคอมพิวเตอร์ให้สามารถเข้าใจและทำงานตอบสนองสิ่งที่นักวิจัยและนักประวัติศาสตร์ต้องการได้อย่างแม่นยำ

    98ce0b8a5e0b989e0b8b2e0b899e0b899e0b8b2-e0b897e0b8a3e0b887e0b884e0b8b8e0b893e0b884e0b988e0b8b2-2.jpg

    รศ.ดร.จีรยุทธ ไชยจารุวณิช อาจารย์ประจำภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ ที่ปรึกษาโครงการวิจัย กล่าวถึงที่มาของโครงการวิจัยนี้ว่า”เรามีโอกาสเข้ามามีส่วนร่วมกับโครงการนี้ โดยการนำเอาภาพ ทั้งไมโครฟิล์ม ทั้งภาพถ่ายดิจิตอล ของทั้งสถาบันวิจัยสังคม สำนักส่งเสริมศิลปวัฒนธรรม สำนักหอสมุด มหาวิทยาลัยเชียงใหม่ และสำนักอาคารเรือนเดิม คณะมนุษยศาสตร์ มหาวิทยาลัยเชียงใหม่ มาร่วมทำโครงการที่เชื่อมโยงฐานข้อมูลใบลาน ซึ่งทำให้เราเห็นภาพรวมของคอลเล็คชันใบลานที่เราได้มีการสำรวจและก็สะสมที่ผ่านมาจนถึงปัจจุบัน

    98ce0b8a5e0b989e0b8b2e0b899e0b899e0b8b2-e0b897e0b8a3e0b887e0b884e0b8b8e0b893e0b884e0b988e0b8b2-3.jpg

    ทั้งนี้ ในลำดับถัดไป เมื่อเราได้รวบรวมจัดทำเป็นฐานข้อมูลใบลานไว้แล้ว เราก็นำองค์ความรู้ที่ปรากฏอยู่ในใบลานมาใช้ประโยชน์ต่อสังคม ซึ่งเนื้อหาส่วนใหญ่ที่ปรากฏอยู่ในใบลานก็จะเกี่ยวข้องกับพุทธศาสนาเป็นหลัก มีจำนวนไม่น้อยที่เป็นภูมิปัญญาท้องถิ่น จะมีเรื่องของประวัติศาสตร์ วรรณกรรม กฎหมาย ตำรายา พิธีกรรมต่างๆ ที่ถูกบันทึกเอาไว้ ซึ่งก็จะเป็นประโยชน์สำหรับผู้ที่สนใจศึกษาเกี่ยวข้องกับเรื่องของประวัติศาสตร์ วัฒนธรรมของท้องถิ่นล้านนาของเรา ซึ่งในกระบวนการที่จะสามารถนำความรู้มาใช้ประโยชน์ได้ เราจำเป็นจะต้องทำให้เครื่องคอมพิวเตอร์สามารถเข้าใจถึงอักษรที่ถูกจารบนใบลาน (จาร = ใช้เหล็กแหลมเขียนลงบนใบลาน) จึงเป็นที่มาของโครงการวิจัยของนักศึกษาปริญญาเอก ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ ที่ได้ทำการวิจัยในเรื่องของการสกัดตัวอักษรล้านนาที่ปรากฏอยู่บนใบลาน”

    98ce0b8a5e0b989e0b8b2e0b899e0b899e0b8b2-e0b897e0b8a3e0b887e0b884e0b8b8e0b893e0b884e0b988e0b8b2-4.jpg

    ด้านนายปภังกร อิ่นแก้ว นักศึกษาระดับปริญญาเอก ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ นักวิจัย กล่าวถึงการทำงานของระบบรู้จำภาพอักษรล้านนาว่า “ในงานวิจัยนี้เราได้ศึกษาเกี่ยวกับการรู้จำภาพอักษร ก็คือการสอนให้คอมพิวเตอร์รู้ว่าตัวอักษรที่คอมพิวเตอร์เห็นมันเป็นตัวอะไร ตัวเขียนแบบนี้คือตัว ก ข ซึ่งเป็นเรื่องของการรู้จำภาพอักษร และในโครงการวิจัยนี้ก็ได้สร้างโปรแกรมคอมพิวเตอร์ขึ้นมาตัวหนึ่ง เพื่อที่จะรับข้อมูลที่เป็นภาพถ่ายใบลาน แล้วก็สั่งให้คอมพิวเตอร์ทำการพิมพ์ตามอักษรที่คอมพิวเตอร์เห็น ซึ่งผลลัพธ์ที่ได้มาก็จะได้เป็นไฟล์ Microsoft Word

    วิธีการกว่าที่จะแปลงภาพถ่ายมาเป็นไฟล์ Microsoft Word ก็จะมีขั้นตอนการประมวลผลหลายขั้นตอน โดยขั้นตอนคร่าวๆ 2 ขั้นตอน ก็คือ การประมวลผลภาพและการรู้จำตัวอักษร

    98ce0b8a5e0b989e0b8b2e0b899e0b899e0b8b2-e0b897e0b8a3e0b887e0b884e0b8b8e0b893e0b884e0b988e0b8b2-5.jpg

    การประมวลผลภาพ คือ การปรับภาพต้นฉบับ input ที่เข้ามาให้อยู่ในรูปแบบที่เหมาะสมที่คอมพิวเตอร์จะนำตัวอักษรไปรู้จำได้ เริ่มต้นก็จะมีวิธีการแปลงภาพสีให้เป็นภาพขาวดำก่อน แล้วทำการลดสัญญาณรบกวน ทำการปรับภาพให้อยู่ในรูปแบบที่เหมาะสม ต่อมาก็จะมีการตัดข้อความเป็นบรรทัดๆ แล้วก็ตัด Crop แต่ละบรรทัดเป็นตัวอักษร

    เมื่อคอมพิวเตอร์มีอักษรทุกๆ ตัวที่ปรากฏอยู่บนใบลานแล้ว ต่อมาคอมพิวเตอร์ก็จะนำเอาอักษรแต่ละตัวไปรู้จำ ว่าอักษรตัวนี้คือตัวอักษรอะไร แล้วก็ทำการพิมพ์มาตามลำดับที่ปรากฏอยู่บนใบลาน ก็จะได้เป็นไฟล์ Microsoft Word ซึ่งไฟล์ Microsoft Word นี้ เราก็สามารถเอาไปพิมพ์ซ้ำ หรือแก้ไขใหม่ได้”

    98ce0b8a5e0b989e0b8b2e0b899e0b899e0b8b2-e0b897e0b8a3e0b887e0b884e0b8b8e0b893e0b884e0b988e0b8b2-6.jpg

    ปัจจุบันงานวิจัยนี้ได้มีส่วนช่วยสนับสนุนกระบวนการสำรวจและอนุรักษ์คัมภีร์โบราณ โดยเป็นเครื่องมือในการจัดการสำเนาภาพถ่ายคัมภีร์โบราณ และแปลงภาพถ่ายสำเนาในรูปแบบไฟล์ภาพดิจิตอลเป็นไฟล์ข้อความ ซึ่งมีประโยชน์อย่างมากในการนำผลลัพธ์ที่ได้ไปต่อยอดทั้งในการเผยแพร่ และในการวิจัย โดยคณะผู้วิจัยได้เผยแพร่แอพพลิเคชั่น LannaOCR รุ่นทดลองใช้ที่ http://lannakadee.cmu.ac.th/lannaocr

    งานวิจัยและพัฒนานี้ได้ดำเนินการอย่างต่อเนื่องเพื่อเพิ่มประสิทธิภาพของ Application ให้สูงขึ้น เพื่อตอบสนองความต้องการของผู้ใช้ให้ได้มากที่สุด โดย Application นี้ ถูกนำไปใช้งานจริงในโครงการสำรวจ รวบรวม และจัดทำระบบสารสนเทศสำเนาภาพถ่ายพระธรรมคัมภีร์ใบลานพระนครน่าน สมัยเจ้าอนันตวรฤทธิเดชฯ นอกจากนี้ส่วนหนึ่งของงานวิจัยนี้ยังเคยได้รับรางวัล The Best Student Paper Award จากงานประชุมวิชาการนานาชาติ 18th International Conference on Asia-Pacific Digital Libraries (ICADL 2016) ที่ประเทศญี่ปุ่นด้วย

    ขอขอบคุณที่มา
    https://www.chiangmainews.co.th/page/archives/959515
     

แชร์หน้านี้

Loading...