logo

Chatbots, el futuro hecho realidad

09/12/2021

Según la curva del Hype Cycle de Gartner los chatbots han pasado de la fase de expectativas hinchadas a la fase de pozo de desilusión, a la espera de encontrar aplicaciones productivas de siguiente generación.

gartner hype cycle for artificial intelligence 2021

Veamos cuál ha sido la historia para llegar hasta aquí y cuál es la perspectiva para los próximos años.

Chatbots de 1ª Generación

Los primeros asistentes virtuales datan de los años 60 con la aparición de Eliza, un chatbot capaz de seguir una conversación en base a reformular lo que el usuario dice. Se puede conversar con una implementación reciente de Eliza en la siguiente web.

Interfaz de usuario gráfica, Texto, Aplicación, Correo electrónico

Descripción generada automáticamente

En las décadas de los 70, 80 y 90 se produjo lo que se conoce como “el invierno de la Inteligencia Artificial (IA)”, años en los que descendió el interés por esta tecnología debido a las escasas aplicaciones prácticas y, como consecuencia, se dejaron de invertir fondos. Este hecho afectó también al desarrollo de los asistentes virtuales. A finales de los años 90s comenzaron a aparecer algunos ejemplos como Clippy en Microsoft Office. Sin embargo, Clippy fue retirado en versiones posteriores del software por las quejas de algunos usuarios que lo encontraban más molesto que útil.

Imagen que contiene Icono

Descripción generada automáticamente

Durante estos primeros años, el funcionamiento de los asistentes virtuales se basaba en reglas y palabras clave. Si el usuario se salía de dichas reglas o palabras clave, el chatbot dejaba de funcionar. Hoy en día podemos encontrar todavía ejemplos de este tipo de asistentes al llamar a los call centers de algunas empresas: “Si desea la primera opción pulse #1, si desea la segunda opción pulse #2”. Se pueden considerar los últimos supervivientes de los asistentes de primera generación.

Chatbots de 2ª Generación

Con el despertar de la IA entre los años 2000 y 2010, aparecieron los chatbots de segunda generación. Algunos dignos representantes son Siri (2011), Cortana (2014), Alexa (2014) y Google Assistant (2016), creados por los gigantes de la tecnología Apple, Microsoft, Amazon y Google, respectivamente. Estos ejemplos inauguraron la segunda generación de chatbots que han poblado en los últimos años las páginas web de multitud de empresas y las principales herramientas de mensajería y redes sociales (Messenger, Whatsapp, Telegram, etc.).

El funcionamiento de los chatbots de segunda generación se basa en un conjunto preprogramado de “intenciones”, que es como se denominan a las distintas funciones que se desea cubrir con el chatbot (saludar, ofrecer información sobre un pedido, agradecer, despedirse, etc.). Así, cada intención representa una pregunta a las que el chatbot es capaz de dar respuesta. Dependiendo de la aplicación, se tendrán más o menos intenciones programadas y, en la actualidad, existen chatbots con más de 2.000 intenciones funcionando correctamente.

Además, se pueden diferenciar los chatbots de ámbito general, diseñados para conversar sobre cualquier tema, y los de ámbito específico, especializados en una determinada tarea. Normalmente, las aplicaciones comerciales suelen usar los chatbots de ámbito específico, con el objetivo de que las conversaciones sean más coherentes y se obtengan mejores resultados.

Sea cual sea el tipo de chatbot (de ámbito general o específico) se le suele dotar de unas capacidades mínimas de conversación para saludar, despedirse, agradecer, etc. y, de esta manera, responder de forma simpática a las cuestiones comunes en una conversación (lo que se conoce coloquialmente como chit-chat o small talk). Estas intenciones suelen ofrecerse empaquetadas en módulos listos para usar y, por tanto, no es necesario desarrollarlas desde cero en cada ocasión.

Los chatbots de segunda generación se parecen a sus predecesores en que sus intenciones están preestablecidas o preprogramadas. Se diferencian de ellos en que el flujo de la conversación no es tan rígido, pues permiten saltar de un tema a otro de manera natural mediante el almacenamiento del contexto de la conversación, recordando así los temas de los que se ha hablado.

Otro aspecto que diferencia a los chatbots de segunda generación de sus antecesores es que, si el usuario no dice literalmente alguna frase para las que fue entrenado, el “cerebro” del asistente virtual trata de buscar la intención que más se aproxima (algo de lo que eran incapaces los de primera generación).

Actualmente, la inmensa mayoría de los asistentes virtuales que se encuentran publicados son de segunda generación. Son especialmente eficaces para aplicaciones de preguntas frecuentes, tales como:

“¿Cuál es vuestro horario de apertura?”

“¿Se puede devolver un pedido?”

Además, los chatbots más avanzados de segunda generación se integran con las aplicaciones de negocio de la empresa a la que dan servicio. Por ejemplo, se conectan a la base de datos de productos y contestan teniendo en cuenta la disponibilidad u ofertas de productos en tiempo real.

Otra característica relevante es la personalización que hace que la experiencia de usuario sea de un nivel superior. Así, por ejemplo, podrá saludar por su nombre al usuario, tener en cuenta la franja horaria del usuario para saludar con “buenos días”, “buenas tardes” o “buenas noches”, decidir si es un momento adecuado para contactar, hacer recomendaciones de productos en función del histórico de compras o consultas y ser más efectivo en la venta cruzada, etc.

¿Y qué nos deparará el futuro? Los chatbots de 3ª Generación

Los recientes avances en la rama de la Inteligencia Artificial conocida como Procesado del Lenguaje Natural (PLN) o NLP (Natural Language Processing) están empujando a los chatbots hacia la tercera generación. Tareas como la generación automática de texto tienen mucho que aportar para mejorar la experiencia de usuario evitando frases repetitivas. También las técnicas para vencer la “memoria de pez” de la que se acusa a los chatbots de segunda generación, que a menudo solo recuerdan el contexto de la conversación durante los 20 minutos de media que dura una sesión.

En un futuro próximo no será necesario entrenar a los asistentes virtuales con preguntas y respuestas fijas. El asistente será capaz de generar respuestas personalizadas y diferentes combinando información procedente del histórico de la conversación, el histórico de compras o el catálogo de productos, información en tiempo real de internet, etc.

Algunos ejemplos de los asistentes inauguradores de esta tercera generación:

  • XiaoIce de Microsoft es un asistente personal que está triunfando en China y está diseñado para ser un amigo más: pregunta qué tal te encuentras, recuerda lo último que has hablado con él, no se olvida de fechas importantes… Hasta tal punto que ha llegado a enamorar a algunos de sus usuarios.
  • BlenderBot 2.0 es el último asistente virtual de Facebook publicado en formato software libre. Tiene memoria a largo plazo y completa la información de la conversación con búsquedas en internet en tiempo real. De esta manera, dispone de información actualizada y no solo del momento en el que se entrenó su modelo de PLN.

Los avances en los últimos años en el campo del PLN han supuesto una verdadera revolución de la que se siguen extrayendo aplicaciones prácticas para la industria. El mayor éxito lo han conseguido modelos como BERT, GPT3 o T5, basados en redes neuronales profundas con miles de millones de parámetros o neuronas. Estos modelos han sido entrenados con cantidades ingentes de información procedente de páginas web como Wikipedia y bases de datos de libros digitalizados.

Gracias a la técnica conocida como Transfer Learning, se parte de los modelos preentrenados (a menudo disponibles como software libre) y se hace un “ajuste fino” para enseñar al modelo los detalles particulares de la aplicación donde se va a usar. Se ha demostrado que estos modelos consiguen resultados excepcionales en tareas como respuesta a preguntas, traducción, generación de texto o resumen automático.

En una línea de desarrollo coherente con lo expuesto hasta ahora, se espera que en los próximos meses los asistentes virtuales alcancen la meseta de la productividad de la gráfica de Gartner y sus aplicaciones consigan facilitar la vida de los usuarios con experiencias de primer nivel.

 

 


 

David Faustino Pérez Three Points

David Faustino Pérez García

Relación al cliente multicanal en Telefónica España

Ingeniero de Telecomunicaciones por la Universidad Politécnica de Madrid



© Instituto de Innovación Digital de las Profesiones. Planeta Formación y Universidades. Todos los derechos reservados.
Por cualquier consulta, escríbanos a info@inesdi.com