Gemini de Google: Nueva Función para Transcribir Audios

Descubre Gemini de Google y su nueva función para subir archivos de audio. Facilita tus tareas con transcripciones y resúmenes.Publicado por Sofia Saavedra el 8 de septiembre, 2025 | Última actualización 8 septiembre, 2025

El 8 de septiembre de 2025, Google anunció que Gemini, su chatbot de inteligencia artificial, ahora permite subir archivos de audio para analizarlos o transcribirlos. La actualización ya está disponible tanto en la versión web como en las aplicaciones móviles para Android y iOS.

La nueva función busca facilitar el trabajo y el estudio de quienes dependen de grabaciones de voz. Los usuarios podrán cargar entrevistas, clases o notas personales y pedirle a Gemini que las transcriba o resuma a partir de una instrucción directa.

Cómo funciona la herramienta

En la versión web, los audios se cargan desde el ícono “+” y la opción “Subir archivos”. Una vez seleccionado el archivo, basta con añadir la instrucción deseada, como “Transcríbelo” o “Resúmelo”.

En las aplicaciones móviles, el procedimiento es similar: se debe pulsar el ícono “+”, elegir “Archivos” y cargar la grabación. Además de transcribir, Gemini puede responder preguntas sobre el contenido del audio o generar resúmenes de grabaciones extensas.

Límites y compatibilidad

El sistema admite formatos estándar como MP3, WAV, FLAC y M4A. Los audios en formato OPUS, comunes en WhatsApp, deben convertirse previamente.

En la versión gratuita, se permite procesar audios de hasta 10 minutos. Con planes de pago como Google AI Pro o AI Ultra, el límite se amplía hasta 3 horas por archivo. Los archivos pueden tener un peso máximo de 100 MB y es posible subir hasta 10 en un mismo prompt, ya sea sueltos o comprimidos en ZIP.

Una de las funciones más solicitadas

Josh Woodward, jefe de Google Labs y responsable de Gemini, indicó en X (antes Twitter) que el soporte para audios era la característica más pedida por los usuarios. La compañía destacó que esta herramienta abre nuevas posibilidades para estudiantes, periodistas y profesionales que dependen del procesamiento de grabaciones.

Con esta actualización, Google busca consolidar a Gemini como un asistente más versátil y útil en el día a día. La incorporación del soporte para audios responde a una necesidad expresada por los usuarios y amplía el abanico de usos del chatbot

Para estar siempre al día con las últimas noticias y contenidos exclusivos, les invitamos a seguirnos en todas nuestras plataformas sociales de SéUno. Conéctense con nosotros en Facebook, X(Twitter), Instagram, TikTok, YouTube y Threads. ¡No se pierdan ninguna actualización y formen parte de nuestra creciente comunidad en línea!