جوجل تطلق Gemini 3.5 Live Translate للترجمة الصوتية الفورية بأكثر من 70 لغة
أطلقت جوجل نموذجها الصوتي Gemini 3.5 Live Translate للترجمة الفورية كلام-إلى-كلام عبر أكثر من 70 لغة، بترجمة مستمرة تحافظ على نبرة المتحدث، عبر Meet وTranslate وLive API.
أعلنت Google يوم الثلاثاء التاسع من يونيو 2026 عن إطلاق نموذجها الصوتي الأحدث Gemini 3.5 Live Translate، المخصّص للترجمة الفورية من الكلام إلى الكلام عبر أكثر من 70 لغة. ويأتي الإعلان بعد عشرين عامًا على انطلاق مشروع الترجمة في Google، الذي يترجم اليوم أكثر من تريليون كلمة شهريًا لمليارات المستخدمين عبر منتجاتها.
ترجمة مستمرة دون انتظار
أبرز ما يميّز النموذج أنه يولّد الكلام المترجَم بشكل متواصل بدلًا من انتظار المتحدث حتى ينهي جملته، كما هو الحال في أنظمة الترجمة التقليدية القائمة على التناوب. هذا النهج يوازن بين الانتظار قليلًا لتحسين دقة السياق والترجمة الفورية للبقاء متزامنًا مع المتحدث، فينتج صوتًا انسيابيًا دون فواصل محرجة، ويبقى متأخرًا بثوانٍ قليلة فقط طوال الجلسة.
ويكشف النموذج عن اللغات تلقائيًا دون إعداد يدوي، ويولّد كلامًا طبيعيًا يحافظ على نبرة المتحدث وإيقاعه وطبقة صوته. كما صُمّم ليعمل في البيئات الصاخبة وغير المتوقعة بفضل مقاومته للضوضاء.
أين يتوفّر النموذج؟
يبدأ طرح Gemini 3.5 Live Translate اليوم عبر ثلاث واجهات. فهو متاح للمطوّرين في معاينة عامة عبر واجهة Gemini Live API ومنصة Google AI Studio، تحت معرّف النموذج gemini-3.5-live-translate-preview، ويمكن استخدامه في حالات مثل الدبلجة الحية للمحتوى المرئي والترجمة الفورية متعددة اللغات. أما الشركات فتحصل على معاينة خاصة داخل Google Meet هذا الشهر، فيما يتوفّر للجميع عبر تطبيق Google Translate على نظامي أندرويد وiOS.
وفي Google Meet تحديدًا، يقفز دعم اللغات من خمس لغات فقط إلى أكثر من 70 لغة، بما يتيح أكثر من ألفي تركيبة لغوية ممكنة داخل الاجتماع الواحد. وفي تطبيق الترجمة، تعمل ميزة الترجمة الحية مع أي سمّاعات متصلة، كما أضافت نسخة أندرويد وضع استماع يتيح وضع الهاتف على الأذن كمكالمة عادية ليصل الصوت المترجَم عبر السماعة دون أن يسمعه من حولك.
الأساس التقني والأمان
يستند Gemini 3.5 Live Translate إلى نموذج Gemini 3 Pro، بنافذة سياق صوتية تصل إلى 128 ألف رمز. والجدير بالذكر أن كل الصوت الذي يولّده النموذج يحمل علامة مائية غير مسموعة بتقنية SynthID، وهي إجراء يهدف إلى المساعدة في مكافحة التضليل والتمييز بين الصوت المولّد آليًا والصوت الحقيقي.
الاستخدام العملي المبكر
بدأت بعض الشركات اختبار النموذج فعليًا؛ فخدمة النقل Grab تجرّبه لتسهيل التواصل بين السائقين والركّاب عند نقاط الالتقاء، علمًا أن مستخدميها يجرون أكثر من عشرة ملايين مكالمة صوتية شهريًا. كما أفادت جهات أخرى بملاحظات إيجابية حول جودة الترجمة ودقتها وانخفاض زمن الاستجابة.
ماذا يعني هذا للمستخدم العربي؟
مع دعم أكثر من 70 لغة وكشف تلقائي للغة، يفتح النموذج بابًا أوسع للتواصل الفوري عبر حواجز اللغة في الاجتماعات والأعمال والسفر. وبالنسبة للمطوّرين في المنطقة، تتيح واجهة Gemini Live API بناء تطبيقات ترجمة حية ودبلجة محتوى دون الحاجة إلى بناء بنية صوتية معقّدة من الصفر، وإن بقي قياس جودة الترجمة في السياقات العربية المتنوّعة أمرًا يستحق الاختبار العملي.