รายชื่อรุ่นที่มีใน Gemini |
Gemini 2.5 Flash คือโมเดล AI ใหม่ของ Google ด้วยความสามารถในการอนุมาน โมเดลนี้สามารถเชื่อมต่อแอปพลิเคชันต่างๆ เช่น Google Search, Google Maps และ YouTube ได้
ด้วยความสามารถนี้ ผู้ใช้สามารถขอให้ Gemini สรุป วิดีโอ ใน YouTube ได้ โดยเฉพาะถ้าพวกเขาต้องการประหยัดเวลาเมื่อรับชมวิดีโอยาวๆ
หากต้องการใช้โมเดลนี้ เพียงไปที่เว็บไซต์ Gemini หากคุณใช้คอมพิวเตอร์ หรือดาวน์โหลดแอปที่มีชื่อเดียวกันบน iOS หรือ Android จากนั้นคลิกที่ชื่อโมเดลที่มุมซ้ายบน เลือก Gemini 2.5 Flash (ทดลอง)
สรุปไฮไล ท์กีฬา
บนเว็บ ผู้ใช้สามารถพิมพ์คำขอสำหรับแชทบอท จากนั้นลากและวางลิงก์วิดีโอ ในขณะที่อุปกรณ์พกพาจะต้องคัดลอกลิงก์
ตัวอย่างเช่น อาจขอให้ Gemini สรุปเหตุการณ์หลักในวิดีโอไฮไลท์กีฬา ซึ่งมีความยาวประมาณ 5-20 นาที
เพียงพิมพ์คำถาม เช่น “เกิดอะไรขึ้นในแมตช์นี้” จากนั้นวางลิงก์วิดีโอแล้วกด Enter ไม่กี่วินาทีต่อมา Gemini จะแสดงรายการไฮไลต์พร้อมไทม์สแตมป์ที่เกี่ยวข้องในวิดีโอ
![]() |
ความสามารถของราศีเมถุนในการสรุปไฮไลท์วีดีโอการแข่งขันกีฬา |
ผู้ใช้สามารถขอให้ Gemini สังเคราะห์หัวข้อต่างๆ ต่อไปได้ ตัวอย่างเช่น แชทบอทสามารถระบุผู้เล่นคนแรกที่ยิงได้อย่างแม่นยำ แต่เวลาจะคลาดเคลื่อนจากเวลาในวิดีโอไปสองสามวินาที
มีแนวโน้มว่าเครื่องมือนี้จะใช้คำบรรยายเพื่อรวบรวมวิดีโอการกีฬา ดังนั้นไทม์ไลน์จึงขึ้นอยู่กับคำพูดของผู้บรรยายมากกว่าภาพจริง
ด้วยความสามารถในการใช้เหตุผลและสังเคราะห์ ผู้ใช้สามารถขอให้ Gemini ค้นหาข้อมูลบนอินเทอร์เน็ตเกี่ยวกับหัวข้อที่เกี่ยวข้องกับวิดีโอได้
บทสรุปวิดีโอแบบยาว
ถัดมา Gemini สามารถสรุปวิดีโอยาวๆ ได้ สำหรับพอดแคสต์ความยาว 1 ชั่วโมง 40 นาที ใช้เวลาเพียงไม่กี่วินาทีในการสรุปหัวข้อหลักและเนื้อหาที่พูดคุยกัน
หากคุณพบว่าข้อเสนอแนะนั้นไม่ชัดเจนและไม่สมบูรณ์ คุณสามารถขอให้ Gemini สรุปให้ละเอียดขึ้นได้ นอกจากนี้ แต่ละหัวข้อยังมีการประทับเวลาที่สอดคล้องกันในวิดีโอเพื่อให้ติดตามได้อย่างรวดเร็ว
![]() |
ความสามารถของ Gemini ที่จะสรุปเนื้อหาวิดีโอพอดแคสต์ความยาวเกือบ 2 ชั่วโมง |
Gemini ยังคงอาศัยการแปลคำพูดหรือข้อความ ไม่ใช่การวิเคราะห์ภาพวิดีโอจริง ตัวอย่างเช่น AI ไม่ระบุรายละเอียดเกี่ยวกับทีมพิธีกรของรายการแม้ว่าจะมีชื่อของพวกเขาปรากฏในวิดีโอ หรือแม้แต่แสดงรายชื่อเนื้อหาหลักทั้งหมดแม้ว่าจะมีการกล่าวถึงในคำอธิบาย
ในทางกลับกัน Gemini ทำงานได้ดีเยี่ยมในการสรุปเสียงจากวิดีโออย่างรวดเร็ว รวมถึงการวิเคราะห์โดยละเอียดหากมีการขอเพิ่มเติม
แน่นอนว่า นอกเหนือจากพอดแคสต์แล้ว ผู้ใช้ยังสามารถขอให้ Gemini สรุปวิดีโออื่นๆ ยาวๆ เช่น บทช่วยสอน การวิเคราะห์ทางเทคนิค... เพื่อเข้าใจแนวคิดหลักและอ้างอิงข้อมูลเพิ่มเติมหากจำเป็น
บทสรุปการสัมภาษณ์ผ่านวิดีโอ
วิดีโอสัมภาษณ์เป็นประเภทหนึ่งที่มักต้องมีการสรุปเนื้อหา ด้วยความสามารถในการวิเคราะห์เสียง Gemini สามารถสรุปเนื้อหาสำคัญของการสัมภาษณ์นักแสดงภาพยนตร์ได้ค่อนข้างดี เนื่องจากวิดีโอสัมภาษณ์มีเนื้อหาการบรรยายจำนวนมาก
![]() |
ความสามารถในการสรุปการสัมภาษณ์วิดีโอของ Gemini |
อย่างไรก็ตาม Gemini เข้ามาช่วยได้ตรงจุดนี้ เนื่องจากเครื่องมือนี้ยังไม่สามารถวิเคราะห์องค์ประกอบอื่นๆ นอกเหนือจากเสียงในวิดีโอได้ เช่น สถานที่สัมภาษณ์ การแสดงออกของบุคคล การกระทำ หรือรายละเอียดที่มองเห็นได้
โดยรวมแล้ว Gemini ทำงานได้ดีในการสรุปเสียงจากวิดีโอ YouTube และวิเคราะห์และดึงข้อมูลที่เกี่ยวข้องออกมาตราบใดที่มีการกล่าวถึงด้วยวาจา ด้วยข้อมูลภาพ ผู้ใช้ยังคงต้องดูวิดีโอเพื่อทำความเข้าใจเนื้อหาทั้งหมด
ที่มา: https://znews.vn/tom-tat-video-youtube-mien-phi-voi-gemini-post1549612.html
การแสดงความคิดเห็น (0)