Google anuncia Gemini 3.5 Live Translate para traducción instantánea de voz a voz
Google ha estado persiguiendo la traducción en tiempo real durante años, lo cual dice que ha sido uno de sus "experimentos pioneros de aprendizaje automático". Hemos visto numerosas demostraciones en el escenario de los eventos de Google en el pasado, pero necesitabas teléfonos Google, auriculares u otra configuración específica. El año pasado, Google llevó la traducción en tiempo real a más usuarios en la aplicación Translate, y ahora está expandiendo la disponibilidad aún más. Con el lanzamiento de Gemini 3.5 Live Translate, tendrás acceso a traducción instantánea en más lugares y con menor latencia que nunca antes.
El nuevo modelo de IA es parte de la familia versión 3.5 que se lanzó en I/O. Antes de hoy, Google solo había lanzado la versión Flash, pero esperamos que un modelo Pro salga en las próximas semanas. Gemini 3.5 Live Translate es un modelo de voz a voz ajustado para detectar y traducir automáticamente en más de 70 idiomas.
Google dice que Gemini 3.5 Live Translate es lo suficientemente rápido para mantenerse al día con una conversación normal, siguiendo apenas unos segundos detrás del hablante mientras también coincide con la entonación, el ritmo y el tono. En resumen, la voz suena más como tú que como un robot genérico. Las demostraciones, que todas están siendo grabadas bajo condiciones controladas, suenan impresionantes. No tendrás que esperar mucho para verificar las capacidades del modelo tú mismo.
Traducción de voz en Google Meet con Gemini 3.5 Live Translate.
Gemini 3.5 Live Translate se está implementando en varias partes del ecosistema de Google. Los desarrolladores pueden comenzar a crear con una vista previa pública en Gemini Live API o AI Studio. El modelo procesa el habla continuamente y maneja automáticamente todas las entradas multilingües, ahorrando a los desarrolladores la configuración manual de ajustes. También filtra el ruido de fondo en entornos ocupados.
