แม้ว่าเทคโนโลยีการบันทึกวิดีโอจะทำให้คอมพิวเตอร์จับภาพและแปลงเหตุการณ์เป็นดิจิทัลได้ไม่ยาก แต่การตีความและใช้งานข้อมูลดังกล่าวเป็นเรื่องที่ท้าทายกว่ามาก การวิจัยของดร.คอร์เนเลีย เฟอร์มุลเลอร์ที่มหาวิทยาลัยแมริแลนด์ที่คอลเลจพาร์คกำลังหาวิธีแปลความสามารถของมนุษย์ในการมองเห็นและทำความเข้าใจข้อมูลภาพเป็นโค้ดเครื่องจักร โดยเป็นส่วนหนึ่งของงานวิจัยนี้ เธอได้สร้างระบบที่ช่วยให้หุ่นยนต์สามารถตีความและคาดการณ์การกระทำของมนุษย์ ซึ่งถือเป็นขั้นตอนสำคัญในการพัฒนาหุ่นยนต์ที่สามารถทำงานร่วมกับมนุษย์ได้
ความก้าวหน้าทางเทคโนโลยีหุ่นยนต์ทำให้สามารถสร้างหุ่นยนต์ที่ไม่ถูกจำกัดอยู่แต่ในห้องทดลอง แต่สามารถผจญภัยในภูมิประเทศจริงได้ ตั้งแต่ป่าไปจนถึงแม่น้ำ ไปจนถึงโรงไฟฟ้านิวเคลียร์ หุ่นยนต์สมัยใหม่สามารถเดินทางผ่านพื้นที่ที่มนุษย์เข้าไม่ถึง เพื่อช่วยเหลือในงานสำคัญๆ เช่น การดำเนินการกู้ภัย
ภาพประกอบของผู้ช่วยการผลิตทางไซเบอร์ฟิสิคัล ระบบจะตรวจสอบมนุษย์ขณะประกอบชิ้นงาน และในกรณีที่อาจเกิดข้อผิดพลาด ระบบจะให้คำแนะนำแก่ช่างประกอบผ่านจอแสดงผล
อย่างไรก็ตาม เพื่อที่จะใช้ประโยชน์จากศักยภาพของหุ่นยนต์ที่เคลื่อนที่ได้มากขึ้นอย่างเต็มที่ หุ่นยนต์จะต้องสามารถโต้ตอบและตีความสภาพแวดล้อมได้ สำหรับหุ่นยนต์ เช่น โดรน การบังคับและควบคุมทั้งหมดจะทำผ่านผู้ควบคุมที่เป็นมนุษย์จากระยะไกล เซ็นเซอร์และกล้องบนเครื่องจะรายงานข้อมูลแบบสดเพื่อให้ผู้ควบคุมที่เป็นมนุษย์ออกคำสั่งชุดที่จำเป็น ข้อเสียของวิธีนี้มีมากมาย การเชื่อมต่อที่เชื่อถือได้ระหว่างผู้ใช้ระยะไกลและหุ่นยนต์เป็นสิ่งสำคัญ และการถ่ายโอนข้อมูลจะต้องรวดเร็วเพียงพอเพื่อหลีกเลี่ยงการทำให้เกิดความล่าช้าที่ไม่จำเป็นในกระบวนการถ่ายโอนคำสั่งและการรายงาน
ด้วยความก้าวหน้าของปัญญาประดิษฐ์ ทำให้ปัจจุบันสามารถสร้างเครื่องจักรที่มีการตัดสินใจโดยอัตโนมัติได้ในระดับหนึ่ง คำถามก็คือ เราจะแปลความซับซ้อนของโลกแห่งความเป็นจริงให้เป็นรูปแบบที่เครื่องจักรสามารถเข้าใจได้อย่างไร ดร. คอร์เนเลีย เฟอร์มุลเลอร์และทีมงานของเธอที่มหาวิทยาลัยแมริแลนด์ที่คอลเลจพาร์ค เป็นผู้เชี่ยวชาญด้านการพัฒนาระบบการรับรู้สำหรับเครื่องจักร ระบบดังกล่าวเป็นชุดแปลภาษาที่แปลงสิ่งเร้าภายนอกเป็นสิ่งที่หุ่นยนต์สามารถประมวลผลและกระทำได้ การพัฒนาระบบเหล่านี้ทำให้สามารถสร้างหุ่นยนต์ที่ไม่เพียงแต่จดจำและแยกแยะเครื่องมือประเภทต่างๆ ได้เท่านั้น แต่ยังรู้ด้วยว่าต้องดำเนินการแบบใดจึงจะโต้ตอบและใช้เครื่องมือนั้นเพื่อทำงานเฉพาะได้
คณิตศาสตร์และการคำนวณสามารถบอกเราได้ว่าอะไรเป็นไปได้ แต่เราต้องการแรงบันดาลใจจากธรรมชาติเกี่ยวกับสิ่งที่เราควรศึกษาคำคมสมอง
การเรียนรู้ที่จะเรียนรู้
สำหรับมนุษย์ การจดจำภาพและรูปแบบถือเป็นปัญหาเล็กน้อย แม้ว่ากระบวนการทางเคมีและชีวภาพพื้นฐานสำหรับการมองเห็นจะมีความซับซ้อน แต่เราก็สามารถประมวลผลและตอบสนองต่อข้อมูลภาพได้อย่างมีประสิทธิภาพ คอร์เนเลีย เฟอร์มุลเลอร์ได้ศึกษาว่ามนุษย์รับรู้และคิดอย่างไรเกี่ยวกับเหตุการณ์ที่ซับซ้อน และนำข้อมูลเชิงลึกเหล่านี้มาใช้กับหุ่นยนต์
ทีมงานประมวลผลวิดีโอการทำอาหารบนอินเทอร์เน็ตเพื่อรับคำอธิบายของการกระทำที่โดดเด่นโดยอัตโนมัติ
ในภาษาอังกฤษ ประโยคโดยทั่วไปจะประกอบด้วยประธาน กรรม และกริยา หากเราสามารถระบุส่วนประกอบแต่ละส่วนได้ เราก็จะสามารถระบุได้ว่าใคร (ประธาน) เป็นผู้กระทำการกระทำเฉพาะใด (กริยา) กับสิ่งของประเภทใด (วัตถุ) แล้วโครงสร้างนี้สามารถนำไปใช้กับข้อมูลภาพได้อย่างไร
หากเราเข้าไปในห้องและเห็นแมวกำลังนั่งอยู่บนเสื่อและต้องการแปลเป็นประโยค เราสามารถมองฉากนี้ผ่านกรอบ "ประธาน กรรม การกระทำ" กรรมคือแมว การกระทำหรือกริยาคือนั่ง และเสื่อคือกรรม อย่างไรก็ตาม เพื่อให้เราสามารถทำเช่นนี้ได้ เราต้องทราบข้อมูลบางส่วน: แมวและเสื่อมีลักษณะอย่างไร รูปแบบการเคลื่อนไหวแบบใดที่สามารถตีความว่าเป็นการนั่งได้
ดร. เฟอร์มุลเลอร์ได้ใช้แนวคิดในการอธิบายเหตุการณ์นี้เพื่อสร้างอัลกอริทึมที่สามารถใช้เป็นพื้นฐานของโมดูลการให้เหตุผลสำหรับเครื่องจักรได้ ปัจจุบัน งานของเธอเน้นที่บริบทของการทำความเข้าใจการจัดการวัตถุโดยมนุษย์ ด้วยความสามารถในการจัดเก็บการสังเกตภาพเป็นหมวดหมู่ เช่น หัวเรื่องหรือวัตถุ และจดจำการเคลื่อนไหวของมือมนุษย์บางอย่าง เครื่องจักรจึงสามารถเริ่มตีความการกระทำ และพัฒนากฎเกณฑ์สำหรับการตอบสนองต่อการกระทำที่ซับซ้อนยิ่งขึ้นเพื่อให้เครื่องจักรทำงานโดยอัตโนมัติ
ทางลัดของความสมมาตร
ปัญหาของการจดจำภาพและวัตถุนั้นเป็นเรื่องที่ยาก ความเป็นไปได้อย่างหนึ่งที่จะทำให้เครื่องจดจำแมวได้ก็คือการฝึกให้เครื่องจดจำแมวจากชุดรูปภาพที่มีแมวเป็นพันตัว อย่างไรก็ตาม เครื่องจะต้องได้รับความช่วยเหลือเพื่อให้สามารถแยกแยะระหว่างแมวกับพื้นหลังของภาพได้ และหากเครื่องได้รับการฝึกให้จดจำเฉพาะรูปภาพของแมวดำเท่านั้น เครื่องอาจไม่สามารถจดจำแมวที่มีสีต่างกันได้โดยยังถือว่าเป็นแมวอยู่ดี หากเครื่องแสดงภาพถ่ายของแมวจากมุมที่ต่างออกไปหรือถูกบดบังบางส่วน เครื่องอาจไม่สามารถจดจำวัตถุได้เช่นกัน
ระบบการรับรู้เป็นชุดแปลประเภทหนึ่งที่แปลงสิ่งเร้าภายนอกให้เป็นสิ่งที่หุ่นยนต์สามารถประมวลผลและกระทำได้คำคมสมอง
มนุษย์เก่งมากในการใช้ความสมมาตรของวัตถุเพื่อเร่งเวลาการประมวลผลภาพและระบุวัตถุที่ถูกบดบังบางส่วน เราเก่งในการ "เติมช่องว่าง" และแทรกภาพ ซึ่งเป็นสาเหตุที่สมองของเราถูกหลอกได้ง่ายด้วยภาพลวงตา ดร. เฟอร์มุลเลอร์ได้นำหลักการนี้ไปใช้เพื่อให้เครื่องจักรสามารถใช้คุณสมบัติความสมมาตรของวัตถุได้ด้วยการใช้อัลกอริทึมที่เหมาะสมเพื่อสร้างส่วนที่หายไปของวัตถุขึ้นมาใหม่และระบุรายการต่างๆ วิธีนี้ได้ผลดีโดยเฉพาะอย่างยิ่งหากหุ่นยนต์จำเป็นต้องระบุวัตถุที่มนุษย์สร้างขึ้น เนื่องจากวัตถุเหล่านี้มักจะมีระดับความสมมาตรสูง
หลังจากสังเกตมนุษย์แล้ว หุ่นยนต์จะเลียนแบบการกระทำการเติมมัสตาร์ด
หุ่นยนต์ร่วมมือช่วยมนุษย์
งานวิจัยปัจจุบันชิ้นหนึ่งของดร. เฟอร์มุลเลอร์คือการออกแบบระบบไซเบอร์-ฟิสิคัลเต็มรูปแบบที่สามารถช่วยมนุษย์ในการประกอบชิ้นส่วนได้ ซึ่งเกี่ยวข้องกับการนำการจดจำวัตถุมาเป็นส่วนหนึ่งของงานด้านวิสัยทัศน์คอมพิวเตอร์ควบคู่ไปกับการพัฒนาระบบการรับรู้ของเธอ งานของเธอได้รับแรงบันดาลใจอย่างมากจากกระบวนการทางชีววิทยา เธอกล่าวว่า "คณิตศาสตร์และการคำนวณสามารถบอกเราได้ว่าอะไรเป็นไปได้ แต่เราต้องได้รับแรงบันดาลใจจากธรรมชาติเกี่ยวกับสิ่งที่เราควรศึกษา"
อุปกรณ์ที่ตั้งใจไว้จะสามารถจดจำและทำนายการกระทำของมนุษย์ในสภาพแวดล้อมที่ซับซ้อน มีเสียงดัง และแออัด และจากการสังเกตมนุษย์ทำงานประกอบ ทำให้สามารถระบุข้อผิดพลาดและปัญหาได้ อุปกรณ์ที่มีความซับซ้อนและสื่อสารได้ดังกล่าวจะเปิดประตูสู่การใช้งานอุปกรณ์ดังกล่าวในด้านอื่นๆ ของหุ่นยนต์ เช่น การค้นหาและกู้ภัย
ข้อมูลจากนิตยสาร Research Features