No se puede decir que OpenAI se haya quedado en el camino recibiendo cada vez más datos de usuarios interesados en la IA generativa. Y es que el siguiente paso lógico era entender al usuario y responderle en consecuencia para darle las respuestas a las preguntas que formula.

ChatGPT ya te escucha y responde con su propia voz

La inteligencia artificial está cada día más desarrollada. Más allá de crear caras, las compañías están cada día llegando a puntos que jamás se habían imaginado, hasta el punto en que la voz de una persona no solo fuera una entrada de datos, también algo tan humano como un motivo para dar una respuesta hablada al usuario.

Y ya no hablamos de contarte lo que ha buscado, sino que es capaz de razonarte la respuesta en función de la información que se le facilita. Este es un pequeño resumen que tenemos con las novedades de ChatGPT que por fin te escucha y habla.

Conversaciones con la IA

Una de las mejoras que OpenAI ha introducido en su inteligencia artificial es la de escuchar y hablar con el usuario. En su web se puede apreciar una muestra de cómo funciona el sistema de recepción sonora de la aplicación, como escucha e interpreta los datos y cómo es capaz de generar la respuesta acorde a las exigencias de la persona.

Si ya te parecía increíble que la IA te lanzase una propuesta extensa sobre un tema como recetas para toda la semana o un viaje, por fin te responderá con voz propia. Es capaz de mantener una conversación extensa y utiliza la voz de actores de doblaje para crear las voces. Además, no deja de lado su sistema de reconocimiento de voz para transcribir a texto las palabras que recibe.

Nuevas herramientas de voz generativa

En este sentido, el programa también es capaz de crear voces sintéticas desde que escucha una voz real. Esto sería de gran ayuda para la accesibilidad de algunas personas que les gustaría escuchar su voz si ya no pueden hacerlo o, algo que se está haciendo muy común, traducir un podcast con la misma voz del autor aunque no esté hablando en el idioma.

Conversaciones con imágenes

La compañía no se ha quedado atrás todo este tiempo en el desarrollo de la IA. La firma le ha dotado de un sistema con el que es posible hacer preguntas con una o varias imágenes. Puedes hacer una pregunta sobre la imagen que has introducido para que elabore una respuesta a lo que necesitas.

El programa es tan potente, ya que puedes hacer una foto al refrigerador y te puede dar algunas recetas con lo que ve, preguntar si tienes alguna herramienta que necesitas en tu caja o incluso que busque un dato concreto en un gráfico que le has propuesto.

Hay que destacar que la app es capaz de traducir textos, aunque todavía hay idiomas en los que la traducción le cuesta más entenderla. Esto no será un problema, ya que al paso que avanza la aplicación es cuestión que mejore en este sentido.

Be my eyes

Otra función de accesibilidad está en una aplicación llamada Be My Eyes. Pensada para las personas invidentes, la cámara servirá a ChatGPT para interpretar lo que una persona tiene delante para que se haga una idea del paisaje. Además, gracias a su nuevo modelo conversacional, la persona puede obtener datos valiosos del entorno, como si una persona le estuviera acompañando en todo momento para ayudarle.

 

Fuente: adslzone