¿Novedades 2021 del Ecosistema Amazon Alexa?

Hace unos días os hablábamos de las novedades presentadas en el Google Assistant Developer Day 2020 celebrado el pasado 8 de Octubre, y cómo en él se dejaba patente la fuerte apuesta de la compañía por esta línea de negocio. Si bien esto es cierto, estamos seguros que dicha evolución se ha visto forzada por la presión de Amazon y sus últimos movimientos en el ecosistemas Alexa.

El asistente de Amazon se encuentra integrado ya en miles de millones de dispositivos y los usuarios interactúan con él billones de veces por semana. En 2016 tan solo había 135 Skills, ahora a finales de 2020 hay ya más de 750.000 desarrolladores registrados en la plataforma. Desde 2019 se ha incrementado un 35% el número de desarrolladores, duplicándose en países como Italia, Brasil y España. Además, la base de usuarios activos de Alexa ha subido un 120% en el último año. Las Skills se hacen cada vez más populares.

Amazon prevé que la I.A. y la denominada “voice computing” serán indispensables en la vida diaria de las personas en el futuro. Según un estudio de “Ipsos Developer Consumer Survey”, la mitad de los consumidores y dos tercios en el caso de los desarrolladores creen que en 10 años las personas, al menos en su gran mayoría, interactuarán con la tecnología y los negocios mediante la voz.

Esta evolución puede incluso verse acelerada debido a diferentes coyunturas sociales, por ejemplo durante la pandemia se ha visto un mayor grado de interacción con dispositivos Alexa mientras los usuarios han tenido que permanecer en casa, haciendo uso de ellos para entretenerse, mantenerse conectados con sus seres queridos e informarse.

Entre otros ejemplos, se han utilizado dispositivos Alexa, como el Echo Show, en Hospitales para realizar consultas médicas o interacción con enfermos por video, evitando así el contacto del doctor con el paciente. También se ha hecho uso de ellos en residencias de mayores, para poder mantener el contacto con las personas mayores que se encontraban aisladas.

¡Os contamos ahora en detalle los últimos movimientos!

Nuevas herramientas para desarrolladores Alexa

Quick Links: Simplificando el acceso a las Skills

Los Quick Links pueden mejorar el descubrimiento de las Skills y ayudar a su posicionamiento de cara al cliente. Con Quick Links para Alexa, los usuarios pueden iniciar y usar las Skills rápidamente en un dispositivo Alexa con un solo clic sin tener que preocuparse por recordar la frase de invocación correcta.

Estos Links llevan al usuario a una página web desde la que iniciará sesión, y donde podrá elegir dónde abrir la Skill, desde el propio navegador o desde un dispositivo Alexa conectado a la red en la que se encuentren.

Mediante estos Links las empresas pueden dar acceso a cualquier usuario a sus Skills desde un simple enlace en una web, una app móvil, vía mail o las redes sociales, facilitando así el proceso para el usuario.

Skill Resumption: Manejando múltiples conversaciones

Hasta ahora las conversaciones con Skills de Alexa eran secuenciales y sólo podían seguir el hilo de una conversación si ésta se producía en un único contexto. En el momento en que el usuario cambiase de tema en la conversación y después quisiera volver al tema anterior, la Skill perdía el hilo, siendo incapaz de recordar la información y el contexto de la conversación anterior. ¿Os imagináis tener que terminar si o si una conversación con tu amig@ para poder pasar a la siguiente y así no perder todo lo hablado? ¿O que un amigo se olvidase de la conversación que tuviste hace un momento con él? Eso no resulta muy natural.

Con esta nueva funcionalidad, en lugar de realizar solo una tarea a la vez y necesitar terminarla antes de pasar a la siguiente, Alexa puede enviarla a segundo plano mientras maneja otras solicitudes y recuperarla cuando sea necesario.

Para conseguirlo se utiliza su memoria almacenada, infiriendo de lo que el usuario está hablando y teniendo en cuenta el contexto y el historial. Esto permite eliminar parte de la fricción que provoca en el usuario hablar con un Asistente de Voz. Además los usuarios que no están acostumbrados a este tipo de asistentes no tendrán que perder tiempo adaptándose a una conversación menos natural, con comandos y otras etiquetas.

Multi Value Slots: Agilizando las conversaciones

Los Slots son campos de información variable dentro de la petición de un usuario que una Skill debe obtener. Hasta ahora sólo permitían recoger un único valor concreto, por ejemplo:

  • Usuario: “Quisiera encargar una pizza familiar.”
  • Skill: “Perfecto, dígame el primer ingrediente.”
  • Usuario: “Piña.”
  • Skill: “¿Piña? Bueno, el cliente siempre tiene la razón. Anotado, dígame el segundo ingrediente.”

Con los Multi Value Slots se permite a los usuarios proporcionar una lista de elementos de una manera más natural. En lugar de encadenar varios Slots o hacer varias preguntas para obtener una lista de elementos, se puede utilizar un solo Slot, lo que siempre es más ágil. En el modelo de la interacción, el desarrollador podrá definir las expresiones de muestra con un solo Slot que recopila todos los valores, en lugar de utilizar varios Slots.

Siguiendo nuestro anterior ejemplo y haciendo uso de un Multi Value Slot de ingredientes:

  • Usuario: “Quisiera encargar una pizza familiar.”
  • Skill: “Perfecto, dígame los ingredientes.”
  • Usuario: “Piña, huevo y bacon.”
  • Skill: “Recibido, ¿quiere añadir alguna bebida?”

Shared Slots: Reutilizando “código”

En ocasiones diferentes Skills de un mismo desarrollador comparten una misma funcionalidad, hasta ahora la única forma de abordarlo era implementando dicha funcionalidad en cada una de las Skills por separado.

Para solventar este problema se han presentado los Shared Slots. Se trata de Slots personalizados que pueden ser reutilizados en otras Skills o modelos de interacción. Los desarrolladores podrán crear este tipo de objetos en cualquiera de las Skills y automáticamente estarán disponibles en todas las Skills de la cuenta. La reutilización de este tipos de Slots garantiza que el usuario tenga una experiencia consistente, permitiendo además mejorar la productividad en el desarrollo.

Analytics Dashboard: Conociendo el comportamiento de los usuarios

Para ayudar a comprender cómo interactúan los usuarios con nuestras Skills, Amazon nos proporciona un conjunto de herramientas que permiten generar una serie de informes de métricas de uso. Estos informes se encuentran disponibles desde la página de Analytics de la Amazon Developer console.

Algunos ejemplos de la información que se puede obtener:

  • % de conversaciones completadas
  • Número de peticiones que no han podido ser manejadas
  • La veces que se ha interrumpido la conversación
  • Número de invocaciones mediante Quick links
  • Sesiones que han estado activas

NLU basado en Redes Neuronales: Comprendiendo mejor al usuario

Alexa presenta mejoras de la compresión del lenguaje natural introducidas en las Skills gracias al reconocimiento del lenguaje natural basado en redes neuronales. Esta mejora ya se encuentra disponible y no requiere de ningún tipo de cambio o migración para los desarrolladores. Se espera una mejora de 15% de media en el reconocimiento del lenguaje natural, dependiendo del tipo de Skill y su propósito.

Alexa For Apps

Aunque muchos usuarios lo desconocen, existe una aplicación móvil de Alexa, pero su penetración en el mercado queda muy lejos de la que sería su análoga, Google Assistant, aunque claro, venir por defecto instalada en millones de terminales Android siempre ayuda.

Relacionado: Alexa vs Google Home: ¿Cuál es el mejor asistente virtual?

Amazon busca disminuir esta diferencia y para ello, potencia su aplicación Alexa con Alexa for Apps, que permite a los usuarios interaccionar con sus aplicaciones a través de ella.

Alexa for Apps permite agregar enlaces de voz a una Skill personalizada para que se conecte a aplicaciones de iOS y Android. Agregando Alexa for Apps a una Skill personalizada los usuarios de dispositivos móviles podrán usar su voz para buscar rápidamente, ver más información y acceder a cualquier funcionalidad de una App nativa.

Así se amplía la funcionalidad de las Skills personalizadas y puede admitir una amplia variedad de casos de uso, que incluyen:

  • Ver más información: permite abrir la aplicación y brinda a los usuarios información visual adicional y otras opciones más complejas. Por ejemplo, después de que un cliente reserva un viaje con la Skill de Uber, Alexa le preguntará al cliente si desea ver la ubicación del conductor en un mapa en tiempo real.
  • Acceder a funcionalidades de la App: Los usuarios pueden activar cualquier funcionalidad que seleccionen dentro de la aplicación mediante su voz. Por ejemplo, la Skill de Tik Tok permite a los usuarios comenzar a grabar con su voz.

Alexa Conversations

Proveer una experiencia de conversación natural va más allá de que el sistema entienda al usuario. Para que la experiencia resulte natural, el sistema debe ser capaz de saber responder a un gran número de frases y términos inesperados. La interfaz además debe tener cierta memoria para poder mantener el contexto de la conversación entre sesiones.

Alexa Conversations (Beta) es la apuesta de Amazon para dar respuesta a estas necesidades en las interfaces conversacionales. Se trata de un enfoque basado en el “Deep Learning” para la gestión de diálogos que permite crear experiencias de voz naturales y similares a las humanas. Alexa Conversations es una herramienta que ayuda a los desarrolladores a crear Skills que puedan responder a una amplia gama de frases y flujos conversacionales inesperados, y brinda a las Skills memoria conversacional para mantener interacciones largas y bidireccionales entre Alexa y el usuario, incluso entre sesiones.

Las grandes novedades en Alexa Conversations son:

  • Creación de diálogos avanzada.
  • Traspaso de contexto entre dispositivos y sesiones.
  • Funcionalidad de correcciones.

Alexa Conversations ayuda a reducir la cantidad de código necesaria en el Back-End y sobretodo el número de “Training Data” en el modelo de lenguaje.

Cuando en una Skill queremos recopilar muchos datos simultáneamente en la misma frase, el número de permutaciones sube exponencialmente, acorde al número de diferentes datos que queramos recoger.

Por ejemplo en una Skill de alerta meteorológica si podemos especificar la localización, la franja horaria, la fecha y el tipo de alerta, tendríamos que recopilar hasta 4 posibles datos, que el usuario podría indicarnos de muchísimas formas posibles.

Con Alexa conversations basta con que el desarrollador introduzca sólo con unos pocos ejemplos de diálogo y el sistema se hará cargo de todos las permutaciones posibles.

ASK SDK Controls Framework

ASK SDK es el Kit de desarrollo Open Source para Node.js que permite crear vía código la lógica de las Skills de forma fácil y rápida. El recientemente presentado ASK SDK Controls Framework extiende la funcionalidad de este SDK ofreciendo una solución escalable para crear Skills, con componentes reutilizables llamados controles.

Al desarrollar Skills, puede ser difícil crear componentes relacionados con la interacción para reutilizarlos entre proyectos. ASK SDK Controls permite la construcción de Skills a partir de componentes independientes que se pueden compartir entre proyectos y personas.

Un desafío común a la hora de desarrollar Skills es la necesidad de crear un modelo de interacción que pueda interpretar una amplia gama de expresiones sin que existan conflictos. ASK SDK Controls también proporciona una solución para el diseño y la generación programática del modelo de interacción.

Se debe tener en cuenta que cuando se crean componentes reutilizables mediante ASK SDK Controls también es necesario crear intents y Slots compartidos por los componentes.

El SDK dispone de las siguientes mejoras funcionales:

  • Seguimiento de preguntas y respuestas, incluidas preguntas sencillas de sí o no y secuencias de varios pasos.
  • Resolver errores de transcripción, por ejemplo “hola”, “hora”.
  • Reaccionar de forma adecuada cuando un usuario dice cosas fuera de orden o cuando el usuario toma la iniciativa y dirige la conversación en una nueva dirección.
  • Mantener el flujo a medida que cambia el tema de conversación.
  • Asegurarse de que Alexa haga una pregunta y haga avanzar la conversación en cada turno del diálogo.

Alexa Connect Kit

Amazon trabaja para poner más facilidades a la hora de integrar Alexa en dispositivos Hardware de la manera más sencilla. Prueba de ello es que existen ya más de 100.000 productos de Smart Home con Alexa desarrollados por terceros.

Alexa Connect Kit es un módulo creado para facilitar la integración de Alexa en cualquier hardware y que permite que cualquier dispositivo con alimentación pueda convertirse en un dispositivo Smart con Alexa. Simplemente añadiendo el módulo ACK a cualquier dispositivo éste se integrará completamente con el ecosistema de Alexa.

Este kit permite a los desarrolladores no tener que invertir tiempo gestionando servicios en la nube, creando una Skill de Alexa o programando un sistema de conectividad y seguridad complejo. El módulo de Alexa Connect Kit lleva ya integradas todas estas características, por lo que basta con conectarlo al hardware deseado para que funcione.

Imaginemos que tu empresa ha desarrollado un árbol de navidad con luces y sonidos, qué mejor manera de mejorar el producto que integrando Alexa Connect Kit en él para poder controlar las luces y los sonidos mediante Alexa.

Esto es lo que ha hecho la empresa “Mr. Christmas” con su Smart Christmas Tree.

alexa tree

Pero hay muchos más ejemplos de la integración exitosa de este kit como son las cafeteras inteligentes de Hamilton Beach, el robot de cocina de Crock-Pot, o los interruptores inteligentes de EATON.