Siri, Google Now…. Como hacer que los teléfonos nos hablen y nos entiendan mejor

ss

A pesar de que algunos teléfonos ya cuentan con algo parecido a un asistente personal digital, como es el caso de Sirien iPhone o la aplicación Google Now, a la hora de la verdad éstos apenas saben responder preguntas básicas como cuál es el restaurante chino más cercano.

Las grandes compañías tecnológicas quieren cambiar esto, y para dar el primer paso, dicen, lo primero es lograr que estos asistentes sean capaces de mantener con nosotros conversaciones fluidas que se desarrollen de forma natural.

Para ello lo que se necesita es crear una verdadera Inteligencia Artificial (IA), capaz de interactuar con humanos utilizando su mismo lenguaje.

Lenta evolución

¿Qué alternativas existen entonces para elevar el coeficiente intelectual de estos asistentes?

Microsoft, por ejemplo, todavía no cuenta con un asistente virtual en su plataforma Windows Phone, pero la compañía está experimentando con una IA que ya opera en ascensores y computadoras de escritorio de su sede.

Eric Horvitz, director de la unidad de investigación de Microsoft, cree que parte de la solución involucra permitir a las computadoras ir más allá de las preguntas previsibles.

"La habilidad de un sistema a la hora de entender más ampliamente el contexto de una comunicación resulta ser muy importante", explicó a la BBC.

"Hay unas señales de contexto básicas; estas incluyen ubicación, hora del día, día de la semana, patrones de comportamiento de uso y el modo (estás conduciendo, caminando, sentado o en tu oficina)".

"El calendario de una persona puede ser una fuente rica en contexto, así como el correo electrónico".

Como un tango complejo

Según dice, para que una interacción sea natural el programa también necesita aprender a simular el ritmo y cadencia de los humanos al hablarse los unos a los otros.

Para hacer esto, las computadoras deberían estar pensando en su respuesta mientras la persona todavía está hablando, en lugar de esperar a que terminen.

"Resulta que la conversación es más o menos como un tango muy, muy complejo, una danza entre dos personas".

"No involucra sólo hablar en turnos, como ves en los asistentes de celular de hoy en día. En realidad es una operación muy complicada, fluida, donde la gente habla, reflexiona y escucha una y otra vez, algunas veces haciendo todo a la vez".

Se cree que la IA diseñada por Microsoft podría estar basada en Cortana, uno de los personajes de su serie de videojuegos Halo y que ésta podría eser presentada en abril.

Paralingüística

Apple por su parte es famosa por su secretismo en torno a nuevos desarrollos. Pero investigadores de la compañía cuya tecnología ayuda a operar Sirinos dan algunas pistas sobre cómo pretenden mejorarla.

Nuance, empresa especializada en dispositivos de reconocimiento de voz, dice que sus investigadores estudian actualmente lo que se conoce como "paralingüística", que analiza la forma en que los usuarios hablan en lugar de lo que dicen.

"Estamos analizando los elementos acústicos para ser capaces de detectar emociones en el habla", revela John West de Nuance.

"La entonación, lo que se conoce como prosodia (el tono utilizado cuando se habla) se desenvuelve bien cuando estás feliz. Si estás triste es más abrupta".

Según West, ya son capaces de introducir tonos de duda y otras señales no verbales. "Sin embargo, precisan ser cuidadosamente programadas porque tienen que entender dónde hacer las pausas, respiraciones y posiblemente una tos".

Aprender del usuario

Pero el profesor Young cree que se necesita llevar a cabo un cambio más fundamental: más allá de decir a una IA cómo responder, deberíamos hacer que aprenda a partir de un proceso de prueba y error.

Precisamente en este sistema se basa el dispositivo que está desarrollando bajo el nombre de Parlancey que funcionaría más o menos así:

-Humano:Quiero comer una pizza.

- IA:Perdón, pero no sé lo que es una pizza.

- Humano:Ok. ¿Sabes dónde puedo encontrar un buen restaurante italiano?

- IA:Sí, hay uno a 20 metros bajando la calle a tu derecha.

- Humano:Gracias.

Si el usuario parece satisfecho, dice Young, la computadora asocia este conocimiento a la base de datos.

"Así que la próxima vez que alguien le pregunta sobre una pizza sabe que se consiguen en un restaurante italiano. Y no se le ha dicho esto sino que lo aprendió a través de los mismos usuarios".

Young cree que la compra de la firma de IA DeepMindpor parte de Google podría acelerar el desarrollo de este tipo de sistemas capaces de aprender por sí solos, mejorando así la calidad ofrecida.

No como en las películas

Pero aun así, ni él ni Microsoft saben que no serán capaces de ofrecer el mismo tipo de Inteligencia Artificial que tanto le gusta a Hollywood.

"Cuando llego en la mañana mi asistente de IA de mi puerta me reconoce y en una bonita voz británica dice: "Buenos días Eric". Y lo disfruto incluso sabiendo que es artificial", dice Horvitz.

"Así que creo que seremos capaces de crear personalidades muy atractivas. Sin embargo, a diferencia de lo que vemos en las películas, probablemente no lo verán en casa como muchos esperan o desean".

Con información de BBC Mundo