Chatbots en euskera y catalán, ¿es posible crearlos?

¿Es posible desarrollar chatbots en euskera o en catalán? ¿Cómo lo implemento? Lo primero que haces cuándo compras un teléfono, instalas un programa o te pones a ver una serie es elegir el idioma en el que quieres hacerlo. Como usuarios nos hemos acostumbrado a poder elegir entre diferentes opciones y, por ello, la experiencia que ofrecen los chatbots no debería ser diferente. Pero, ¿cómo podemos entrenar a un chatbot que hable varios idiomas? ¿es posible crear chatbots en euskera o catalán? Y es que no debemos olvidar que en el caso de España, lidiar con esta situación puede ser incluso más complicado ya que, al margen del castellano, se hablan otros idiomas y dialectos como el euskera, el catalán, el valenciano, el gallego o el asturleonés.

Aunque en la geografía española se hablen múltiples idiomas es cierto que el volumen de personas que lo hablan no es el mismo. El catalán, el valenciano y el euskera se llevan la palma y, por ello, muchas empresas sí ven interesante ofrecer la experiencia de su chatbot en varios idiomas.

Es el caso del Olentzero.chat. Este chatbot lanzado por Chatbot Chocolate, agencia especializada en el desarrollo de chatbots, durante las navidades del 2017 y del 2018 simulaba ser Olentzero, personaje de la mitología vasca que se encarga de traer los regalos a los niños en Navidad. Esta interfaz conversacional ofrecía al usuario una experiencia completamente libre (podías preguntarle cualquier cosa) en varios idiomas: castellano y nueve dialectos del euskera. De este modo, el chatbot era capaz de identificar simplemente con el primer input del usuario en qué idioma le estaba hablando este. En consecuencia, el chatbot determinaba que ese era el idioma en el que debía interactuar con el usuario la conversación fluía libremente como si de un humano se tratara. Otro caso es el de Osakidetza.

Para conseguir desarrollar chatbots que sean capaces de ofrecer este tipo de experiencias de usuario, es preciso llevar a cabo un entrenamiento previo. En este sentido, entrevistamos a Ángel Hernández, socio director de Chatbot Chocolate, creadores del chatbot en euskera (y en WhatsApp) sobre el que venimos hablando.

“En 2017, se nos planteó un desafío, fruto de la falta de tecnología de chatbots que permitiese euskera, que además fuese sencillo y rápido de entrenar por un perfil no técnico; hoy, con nuestra tecnología, multinacionales cotizadas del sector moda, retail o telecomunicaciones, lo utilizan además de para idiomas habituales como el español o el inglés, para poder entrenar su chatbot en catalán o en polaco” destaca Hernández cuando le preguntamos sobre chatbots en diferentes idiomas.

Y es que, como destaca Hernández, no todas las tecnologías están actualmente preparadas para un determinado idioma, lo que conlleva que, algunas de ellas, tengan que pasar por una fase intermedia de uso de un API de traducción (p.e. de catalán a castellano), para poder ser procesado por un motor de NLP en castellano, para luego volver a ser traducida (de castellano a catalán). Unproceso tedioso que no siempre da los resultados esperados.

¿Y qué ocurre si nos olvidamos de los chatbots escritos y miramos hacia los Asistentes Virtuales? ¿Qué ocurre con el euskera o el catalán? En el caso de los asistentes virtuales como Alexa o Google Assistant la situación es diferente. El asistente es el que ofrece la experiencia y, en consecuencia, es quién debe saber interactuar con el usuario en los diferentes idiomas que pueda haber en España. Pero, ¿qué ocurre si Alexa no habla euskera o catalán? Pues que el usuario no podrá configurar su sesión en ese idioma y, en consecuencia, no habrá tampoco skills operativas en ese lenguaje. De ahí que cada vez que Amazon o Google lanzan al mercado un nuevo idioma o acento (por ejemplo, español argentino o español colombiano), las noticias sobre el lanzamiento aparecen en todos los medios.

En el caso de España, hasta que Amazon o Google no ofrezcan experiencias completas en euskera o catalán no habrá empresas que se decidan a apostar por desarrollos conversacionales de voz en estos entornos.