ZestBuy

Google เปิดตัว Gemini Live Translate แปลเสียงสดได้กว่า 70 ภาษา

โปรไฟล์ Phanuphong.TPhanuphong.T06-10

Google ประกาศเปิดตัว Gemini 3.5 Live Translate โมเดล AI ด้านการแปลภาษารุ่นใหม่ที่ออกแบบมาเพื่อการแปลเสียงแบบเรียลไทม์โดยเฉพาะ โดยบริษัทระบุว่านี่เป็นระบบแปลเสียงเป็นเสียง (Speech-to-Speech Translation) ที่มีความสามารถก้าวหน้าที่สุดของ Google ในปัจจุบัน และถูกพัฒนาขึ้นเพื่อให้การสื่อสารระหว่างผู้พูดต่างภาษาดูเป็นธรรมชาติมากกว่าระบบแปลภาษาแบบเดิม

จุดเด่นสำคัญของ Gemini 3.5 Live Translate คือการแปลบทสนทนาได้แทบจะทันทีในระหว่างที่ผู้ใช้กำลังพูด โดยไม่จำเป็นต้องรอให้ประโยคจบก่อนเหมือนระบบแปลภาษาในอดีต ทำให้การสนทนาระหว่างคนที่ใช้ภาษาต่างกันสามารถดำเนินต่อไปได้อย่างลื่นไหลมากขึ้น

การเปิดตัวครั้งนี้ถือเป็นอีกก้าวสำคัญของ Google หลังจากในช่วงไม่กี่ปีที่ผ่านมา บริษัทพยายามผลักดันเทคโนโลยี AI ด้านเสียงและการแปลภาษาอย่างต่อเนื่อง ทั้งใน Google Translate, Gemini และอุปกรณ์ฮาร์ดแวร์หลายประเภท

รองรับมากกว่า 70 ภาษาและจับภาษาได้อัตโนมัติ

Google ระบุว่า Gemini 3.5 Live Translate รองรับภาษามากกว่า 70 ภาษา และสามารถตรวจจับภาษาที่ผู้พูดกำลังใช้งานได้โดยอัตโนมัติ ผู้ใช้จึงไม่จำเป็นต้องตั้งค่าภาษาต้นทางล่วงหน้าเหมือนระบบแปลแบบดั้งเดิม

ด้วยจำนวนภาษาที่รองรับในระดับนี้ ทำให้ระบบสามารถสร้างคู่ภาษาในการแปลได้หลายพันรูปแบบ ไม่ว่าจะเป็นการสนทนาระหว่างภาษาอังกฤษ ญี่ปุ่น เกาหลี สเปน ฝรั่งเศส ไทย หรือภาษาอื่น ๆ ที่อยู่ในระบบ

Google ระบุว่าจุดประสงค์สำคัญคือการลดอุปสรรคด้านภาษาในการสื่อสารประจำวัน ทั้งการเดินทาง การเรียน การทำงาน และการติดต่อกับผู้คนจากประเทศต่าง ๆ

พยายามรักษาน้ำเสียงและอารมณ์ของผู้พูด

หนึ่งในปัญหาของระบบแปลภาษาแบบเดิมคือแม้จะแปลความหมายได้ถูกต้อง แต่รูปแบบการพูด น้ำเสียง และอารมณ์ของผู้พูดมักหายไปในกระบวนการแปล

Google ระบุว่า Gemini 3.5 Live Translate ถูกออกแบบให้สามารถรักษาน้ำเสียง จังหวะการพูด การเน้นคำ และลักษณะการสื่อสารของแต่ละคนเอาไว้ได้มากที่สุด ทำให้เสียงที่ถูกแปลออกมายังคงให้ความรู้สึกใกล้เคียงกับต้นฉบับ

แนวทางดังกล่าวช่วยให้บทสนทนาดูเป็นธรรมชาติมากขึ้น โดยเฉพาะในสถานการณ์ที่ต้องอาศัยอารมณ์หรือบริบทของผู้พูด เช่น การประชุม การสอน การนำเที่ยว การบริการลูกค้า หรือการสนทนาในชีวิตประจำวัน

ออกแบบมาให้ใช้งานได้แม้อยู่ในสภาพแวดล้อมที่มีเสียงรบกวน

Google ระบุว่าระบบใหม่ไม่ได้ถูกพัฒนาสำหรับห้องประชุมที่เงียบเท่านั้น แต่ยังถูกฝึกให้ทำงานในสถานการณ์จริงที่มีเสียงรบกวนรอบข้าง

Gemini 3.5 Live Translate สามารถจัดการกับเสียงพูดที่ทับซ้อนกัน เสียงรบกวนจากสภาพแวดล้อม และรูปแบบการพูดที่ไม่เป็นทางการได้ดีกว่าระบบแปลภาษาในอดีต

คุณสมบัติดังกล่าวทำให้สามารถนำไปใช้งานในสถานที่สาธารณะ เช่น สนามบิน สถานีรถไฟ ร้านอาหาร ห้องเรียน หรือการเดินทางท่องเที่ยวได้สะดวกมากขึ้น ซึ่งเป็นสถานการณ์ที่ระบบแปลภาษาแบบเดิมมักทำงานได้ไม่เต็มประสิทธิภาพ

ต่อยอดจากเทคโนโลยีแปลภาษาของ Google Translate

แม้ Google จะมีบริการแปลภาษาแบบเรียลไทม์มานานแล้ว แต่ Gemini 3.5 Live Translate ถือเป็นการต่อยอดครั้งใหญ่จากระบบเดิม

ก่อนหน้านี้ Google ได้นำความสามารถของ Gemini มาใช้ปรับปรุง Google Translate ให้เข้าใจสำนวน คำแสลง และบริบททางภาษาได้ดีขึ้น ลดปัญหาการแปลแบบตรงตัวที่อาจทำให้ความหมายคลาดเคลื่อน

แนวทางเดียวกันถูกนำมาต่อยอดใน Gemini 3.5 Live Translate ซึ่งไม่ได้มองเฉพาะคำศัพท์ แต่พยายามเข้าใจความหมายของประโยคในภาพรวมก่อนแปลออกมาเป็นภาษาปลายทาง ส่งผลให้ผลลัพธ์ดูเป็นธรรมชาติและใกล้เคียงกับการสื่อสารของมนุษย์มากขึ้น

Google มองว่าการแปลภาษาแบบสดคืออนาคตของการสื่อสาร

Google ระบุว่าเป้าหมายระยะยาวของเทคโนโลยีนี้คือการทำให้ผู้คนสามารถพูดคุยกับใครก็ได้ทั่วโลกโดยไม่ต้องกังวลเรื่องกำแพงภาษา

ในมุมของบริษัท ระบบแปลภาษายุคใหม่ไม่ควรเป็นเพียงเครื่องมือแปลคำศัพท์ แต่ควรทำหน้าที่เป็นตัวกลางที่ช่วยให้บทสนทนาเกิดขึ้นได้อย่างเป็นธรรมชาติที่สุด

การเปิดตัว Gemini 3.5 Live Translate จึงสะท้อนทิศทางของ Google ที่กำลังผลักดัน AI ให้เข้ามามีบทบาทในชีวิตประจำวันมากขึ้น โดยเฉพาะด้านการสื่อสารระหว่างผู้คนจากหลากหลายประเทศและวัฒนธรรม

หลังจากก่อนหน้านี้ Google ได้ประกาศอัปเดตครั้งใหญ่ของ Gemini 3.5 ในงาน Google I/O 2026 พร้อมขยายการใช้งาน AI ไปยัง Search, Workspace, Android และบริการต่าง ๆ ในระบบนิเวศของบริษัทอย่างต่อเนื่อง

สำหรับผู้ใช้งานทั่วไป เทคโนโลยีลักษณะนี้อาจกลายเป็นหนึ่งในฟีเจอร์ AI ที่เห็นผลชัดเจนที่สุดในชีวิตประจำวัน เพราะช่วยลดข้อจำกัดด้านภาษาในการเดินทาง การเรียนรู้ การทำงาน และการติดต่อสื่อสารกับผู้คนทั่วโลกได้โดยตรง ซึ่งเป็นเป้าหมายที่ Google พยายามผลักดันมาโดยตลอดผ่านทั้ง Gemini และ Google Translate ในช่วงหลายปีที่ผ่านมา

ที่มา blog

ความคิดเห็น

ยังไม่มีความคิดเห็น