Stenella frontalis (โลมาลายจุดแอตแลนติก) เป็นสายพันธุ์โลมาซึ่ง นักวิทยาศาสตร์ เลือกมาศึกษาวิจัย ภาพโดย: iNaturalist |
เมื่อเร็วๆ นี้ Google ได้ร่วมมือกับนักวิทยาศาสตร์คอมพิวเตอร์ของ Google และนักชีววิทยาทางทะเลเพื่อสร้างแบบจำลองภาษาขนาดใหญ่ (LLM) ที่ออกแบบมาเพื่อสนทนากับปลาโลมา โดยเรียกว่า DolphinGemma
เป้าหมายหลักของโครงการนี้คือ การสำรวจ และถอดรหัสวิธีการสื่อสารที่ซับซ้อนของปลาโลมา และวางรากฐานสำหรับการโต้ตอบสองทางระหว่างมนุษย์และสัตว์ทะเลเหล่านี้
ปัญญาประดิษฐ์และการสื่อสารของสัตว์
โมเดล DolphinGemma ถูกสร้างขึ้นจากชุดข้อมูลอันหลากหลายที่รวบรวมมาตลอดสี่ทศวรรษโดย Wild Dolphin Project (WDP) นี่เป็นโครงการวิจัยประชากรปลาโลมาลายจุดแอตแลนติก ( Stenella frontalis ) ที่ดำเนินมายาวนานที่สุดในโลก ในบาฮามาส
ในระหว่างการศึกษา WDP ได้รวบรวมข้อมูลเสียงและวิดีโอใต้น้ำจำนวนมาก ซึ่งเชื่อมโยงกับบุคคลแต่ละบุคคลภายในโรงเรียน โดยบันทึกลักษณะความสัมพันธ์ทางสังคมและประวัติชีวิตของพวกเขา
ชุดข้อมูลนี้ประกอบด้วยคู่เสียงและพฤติกรรมที่สอดคล้องกัน เช่น เสียงเกี้ยวพาราสี เสียงร้องแสดงความก้าวร้าว และ "เสียงนกหวีดประจำตัว" ซึ่งทำหน้าที่เป็นเครื่องหมายระบุตัวตนของแต่ละตัว
![]() |
แม่โลมาเฝ้าดูลูกโลมาขณะที่มันหากิน (ซ้าย) โดยใช้เสียงนกหวีดอันเป็นเอกลักษณ์ของแม่โลมาเพื่อเรียกลูกโลมาให้กลับมา ภาพคลื่นเสียงของเสียงนกหวีดนั้น (ขวา) ภาพ: Google. |
ทรัพยากรนี้มอบข้อมูลที่จำเป็นให้กับนักวิจัยของ Google เพื่อฝึกโมเดลปัญญาประดิษฐ์ที่สามารถวิเคราะห์ความแตกต่างของการสื่อสารของปลาโลมา ซึ่งคล้ายกับวิธีที่โมเดลภาษาขนาดใหญ่ประมวลผลภาษาของมนุษย์
DolphinGemma ทำงานบนกลไกอินพุต-เอาท์พุตเสียง ช่วยให้โมเดลสามารถ "ฟัง" เสียงของปลาโลมา และคาดการณ์ลำดับเสียงถัดไป จึงสามารถบันทึกโครงสร้างในระบบการสื่อสารได้
การประยุกต์ใช้ปัญญาประดิษฐ์ช่วยเพิ่มความเร็วในการถอดรหัสการสื่อสารของสัตว์ได้อย่างมาก โปรแกรมคอมพิวเตอร์ขนาดใหญ่สามารถจัดการกับเสียงได้หลากหลายประเภท ตั้งแต่เสียงสุนัขเห่าไปจนถึงเสียงนกร้อง พวกมันจดจำรูปแบบเสียงที่คุ้นเคยและใช้สภาพแวดล้อมเพื่อคาดเดาว่าสัตว์กำลังพยายามพูดอะไร
โลมา ซึ่งเป็นสมาชิกในกลุ่มสัตว์เลี้ยงลูกด้วยนมในทะเล "Cetacea" (อันดับปลาวาฬ) ถือเป็นสัตว์ที่เหมาะสมต่อการวิจัยเป็นอย่างยิ่ง เนื่องจากมีโครงสร้างทางสังคมที่ซับซ้อนและมีวิธีการสื่อสารที่หลากหลาย เสียงที่มีลักษณะคล้าย "เสียงคลิก" และเสียงนกหวีดที่มีความถี่สูงนั้นสามารถบันทึกและป้อนเข้าสู่คอมพิวเตอร์เพื่อให้ AI เรียนรู้ที่จะวิเคราะห์ "ไวยากรณ์" ได้ค่อนข้างง่าย
พูดคุยกับโลมาด้วยสมาร์ทโฟนของคุณ
การประยุกต์ใช้งานที่มีศักยภาพอย่างหนึ่งของ DolphinGemma คือการพัฒนาระบบ CHAT (Cetacean Hearing Augmentation Telemetry) ระบบดังกล่าวซึ่งติดตั้งบนสมาร์ทโฟนที่ดัดแปลงแล้ว มีความสามารถในการสร้างเสียงเทียมที่เป็นลักษณะเฉพาะของปลาโลมาได้
เสียงเหล่านี้ "ผูกติด" กับสิ่งที่โลมาใช้หรือชื่นชอบ เช่น หญ้าทะเลหรือเครื่องมือของนักวิทยาศาสตร์ จุดมุ่งหมายคือเพื่อให้โลมามีความอยากรู้อยากเห็นและเลียนเสียงนกหวีดที่เครื่องจักรส่งเสียงเพื่อ "ขอ" สิ่งต่างๆ เหล่านั้น เหมือนกับที่เรากำลังฝึกสนทนาธรรมดาๆ กัน
![]() |
โทรศัพท์ Google Pixel 9 วางอยู่ภายในฮาร์ดแวร์ระบบ CHAT ภาพ: Google. |
ในอนาคต เวอร์ชั่นอัพเกรดของ CHAT จะมาพร้อมกับพลังการประมวลผลที่ทรงพลังและอัลกอริทึมที่ชาญฉลาดมากขึ้น โดยมุ่งหวังที่จะเพิ่มความเร็วในการตอบสนองและความชัดเจนในการโต้ตอบระหว่างมนุษย์กับปลาโลมา อย่างไรก็ตาม การใช้รูปแบบการสื่อสารที่ซับซ้อนมากขึ้นในสภาพแวดล้อมทางธรรมชาติทำให้เกิดประเด็นทางจริยธรรมที่สำคัญที่จำเป็นต้องได้รับการพิจารณา
Google วางแผนที่จะเปิดตัว DolphinGemma เป็นโมเดลโอเพ่นซอร์สในช่วงฤดูร้อนนี้ โดยเปิดโอกาสให้นักวิจัยทั่วโลกนำไปประยุกต์ใช้ในการศึกษาสายพันธุ์ปลาโลมาอื่นๆ ได้
คาดว่า DolphinGemma จะเป็นก้าวสำคัญในการปรับปรุงความเข้าใจเกี่ยวกับสัตว์ทะเลชนิดหนึ่งที่มนุษย์คุ้นเคยมากที่สุด
ในขณะที่ความสามารถในการสนทนาที่ซับซ้อนกับปลาโลมายังคงเป็นเป้าหมายในระยะยาว แต่ศักยภาพในการสื่อสารสองทางที่โมเดลนี้นำเสนอถือเป็นสัญญาณที่ดีของความเป็นไปได้ใหม่ๆ ที่ปัญญาประดิษฐ์สามารถนำมาใช้กับสาขาการวิจัยพฤติกรรมสัตว์ได้
ที่มา: https://znews.vn/google-phat-trien-ai-giup-giao-tiep-voi-ca-heo-post1546286.html
การแสดงความคิดเห็น (0)