OpenAI, la empresa pionera en inteligencia artificial generativa, ha dado un gran salto en la evolución de su famoso chatbot, ChatGPT. Hasta ahora, los usuarios solo podían interactuar por escrito con esta IA avanzada, pero eso está a punto de cambiar drásticamente. En este artículo, exploraremos las emocionantes capacidades de ChatGPT que ahora le permiten ‘ver, oír y hablar’, brindando una nueva dimensión a las conversaciones con inteligencia artificial.
ChatGPT Amplía sus Horizontes
Hasta el momento, ChatGPT era conocido por su capacidad para generar respuestas textuales coherentes y útiles. Sin embargo, OpenAI ha dado un paso audaz al habilitar la conversación en voz alta con esta IA. A partir de ahora, los usuarios de pago podrán disfrutar de conversaciones de voz bidireccionales con ChatGPT. Esta característica incluye la capacidad de recibir respuestas habladas de la máquina y enviar imágenes, fotos, capturas de pantalla y documentos para obtener respuestas detalladas.
Accesibilidad y Creatividad sin Límites
OpenAI ha destacado cómo la inclusión de la voz y las imágenes en ChatGPT amplía significativamente sus aplicaciones. Ahora, los usuarios pueden aprovechar esta IA para tareas cotidianas, como verificar el contenido de la nevera o incluso obtener recetas paso a paso. Además, ChatGPT puede ser una herramienta divertida para contar historias o resolver debates de manera interactiva.
Disponibilidad y Opciones de Voz
Esta emocionante actualización estará disponible en dispositivos iOS y Android, brindando flexibilidad a los usuarios móviles. OpenAI también ha incluido opciones de personalización al permitir a los usuarios elegir entre cinco voces distintas. La voz predeterminada emula la de una mujer joven y es ampliamente accesible.
Tecnología detrás de la Magia
Para hacer posible la conversación de voz, OpenAI utiliza su herramienta Whisper, que utiliza IA para convertir la voz del usuario en texto. Luego, la compañía emplea su avanzado modelo de conversión de texto a voz para las respuestas del chatbot. Esta tecnología es capaz de crear voces sintéticas realistas a partir de solo unos segundos de voz real.

Nuevos Horizontes y Desafíos
Si bien esta actualización abre nuevas oportunidades y aplicaciones, OpenAI no ignora los desafíos potenciales. La empresa advierte sobre el riesgo de que actores maliciosos utilicen esta tecnología para engañar o cometer fraudes, lo que enfatiza la importancia de un uso ético y responsable de la IA conversacional.
Impacto en la Industria Musical
OpenAI también anunció una asociación con Spotify, donde se utilizará la tecnología de ChatGPT para traducir podcasts a idiomas adicionales mientras se mantienen las voces originales de los presentadores e invitados, demostrando aún más el potencial de esta IA en diferentes campos.