Voice tech, los dispositivos de voz y la multiplicación de sus funcionalidades a partir de un corazón de inteligencia artificial, se encaminan a una nueva disrupción en la forma en la que interactuamos con el mundo digital, donde los emprendedores también pueden meter su cuña.

 

La revolución de la voz no ha hecho más que comenzar

¿Cuántas horas pasas frente a la pantalla? El balance semanal de tiempo que gastas (o inviertes) en el móvil a veces te sorprende con más de tres horas diarias entre búsquedas, noticias, redes sociales, videos, apps de música, juegos, pedidos online…  A eso añade las del ordenador, tableta y otras.

Aunque parezca que no pudieras vivir sin ellas, todo indica que buena parte de lo que hoy haces con ayuda de la pantalla táctil, podrías hacerlo solo con la voz.

Imagino que no necesitas que te presente a Siri, de Apple, nacido en 2011; a Alexa, de Amazon, lanzado en 2014, al igual que Cortana, de Microsoft, u otros VUIs (Voice User Interfaces o interfaces conversacionales) de su tipo.

Seguramente los conozcas y hayas convivido años con ellos, pero justo ahora empieza a despuntar el potencial que explica la expectativa sobre esta ola de tecnologías. Es decir, sus posibilidades de cambiar -y simplificar- gradualmente pequeñas tareas cotidianas que tenemos arraigadas.

Podrías decir que ya se ha dicho algo similar con las gafas u otras tecnologías disruptivas que vienen evolucionando lentamente. Pero, a juzgar por los informes, las ventas y el dinero que fluyen en esta dirección, la llamada “revolución de la voz”, está tomando impulso.

La casa, el coche y el lugar de trabajo son los primeros en espacios donde la voz aparece con pronósticos de cambios significativos en el corto plazo, por constituir un acceso sencillo al IoT o “internet de las cosas”.

Es también una realidad que faltan tiempo y ajustes para que los usuarios desarrollen una interacción más profunda que transforme sus vidas.

Marc Torrens, experto en Inteligencia Artificial (IA) e innovación y emprendedor, dice que “la revolución de la voz está empezando, pero aún estamos muy lejos de todo su potencial”. Aunque la tecnología de reconocimiento de voz está llegando a su madurez, faltan aplicaciones y motores conversacionales detrás que la hagan más potente”.

Según el también profesor de IA de Esade Business School, la tecnología es “robusta”, pero aún se impone el “desafío de desarrollar asistentes que sean capaces de ‘conversar’ de forma natural con el usuario, así como aplicaciones donde la voz sea una interfaz con la máquina más conveniente que otras interfaces como las pantallas táctiles o los teclados”.

Cuando tenga todo lo necesario, este mundo digital, y eventualmente oral, sin interfaz, someterá al usuario de internet a cambios. Y si no, piensa en algo que ya está ocurriendo: que Alexa te brinde una sola respuesta y no la lista que acostumbras a recibir cuando haces una búsqueda en Google. Imagina ese impacto en el comercio.

Otra gran pregunta es si el usuario además tendrá que resignarse a perder privacidad al ampliar la información que “comparte” a diario con su voz, o si estos aparatos lo “escucharán” de forma constante.

¿Qué cuál es tu rol aquí? Sígueme, ya verás.

 

Algunas cifras sobre voicetech

Aunque no es el único mercado al que pueden aplicarse las tecnologías de voz, fíjate: para finales de año habrá unos 200 millones de altavoces inteligentes, y en pocos años más superarán la cantidad de personas en el planeta, según un informe de la firma de análisis de mercados Canalys.

Eso es un 82,4% más que el año pasado, con Estados Unidos a la cabeza, pero con una explosión de crecimiento atribuida a China, mientras que Reino Unido y Alemania son los europeos mejor posicionados.

Esto quiere decir que, aún con cuestiones por resolver, el mercado avanza. Los altavoces van expandiendo sus funcionalidades con apps en los escaparates de tiendas virtuales como las de smartphones, e incorporando idiomas.

Las empresas están aplicando cada vez más asistentes de voz hacia adentro y con sus clientes, eliminando teclados u operaciones con pantallas táctiles en busca de más eficiencia. 

Te dejo un dato más: la expectativa es que el flujo de fondos destinado al negocio de la voz se triplique hacia 2025. De allí que las startups relacionadas recibirían este año unos 1.570 millones de dólares, en contraposición con los 581 millones en 2018, con un aumento significativo en las rondas de inversión de esas tecnologías, según datos del VC Mangrove Capital Partners.

La expectativa es que el flujo de fondos destinado al negocio de la voz se triplique hacia 2025.

 

La hora de la interacción: aplicaciones

En España, como en el resto de Europa, las aplicaciones más exitosas se encuentran aún en el ámbito doméstico: en casa, en el móvil y, sobre todo, en el coche, describe Torrens.

Con comandos de voz podemos escuchar una canción, ver una película, apagar las luces, encender la calefacción, o bien, buscar información en la web o hacer una reserva en un restaurante”, ejemplifica. Igualmente, podemos configurar el navegador mientras conducimos, o escuchar podcasts, uno de los productos digitales de voz que más se ha difundido en producción y consumo en varios países.

Amazon lanzó Alexa para coches hace poco más de un año, y ya se alió con fabricantes para instalar su Echo Auto, que provee una experiencia sin manos con funcionalidades varias para los conductores. La adopción aquí parece obvia, ya que son más las personas que tienen coche que las que tienen altavoces smart.

Un ejemplo de desarrollo para autos es Drivetime, una aplicación para conductores con juegos de trivia y preguntas como Jeopardy!, basados en control de voz, que levantó 11 millones de dólares este año en una ronda con participación de las unidades de voz de Amazon y Google.

Todo habla de evolución, pero la revolución digital de la voz quiere ir más a fondo. Aunque, por ejemplo, hay miles de skills de Alexa disponibles, muchos de los usuarios de altavoces smart aún tienen una interacción básica.

Inversores consultados por el sitio especializado Techcrunch distinguen oportunidades en la interacción. Para Nicole Quinn, socia de Lightspeed Venture Partners, la voz será la próxima plataforma de adopción masiva, pero para que eso ocurra se necesitan más herramientas que entusiasmen y fidelicen a los usuarios.

Era igual para móviles antes de que la App Store nos permitiera descubrir nuevas aplicaciones. Necesitamos lo mismo para la voz”, comenta. Cuando ocurra, dice, será adoptada para compras, juegos, viajes u otros.

Justamente, el tema ventas es todavía un área promisoria por explotar.

 

Moviendo ficha: alianzas estratégicas

El sector corporativo ha vislumbrado las posibilidades. Walmart se asoció hace unos meses con Google  y más recientemente con Apple para impulsar las ventas por este medio en Estados Unidos, como parte de su estrategia multicanal. En el primer caso, con solo decir “Hey Google, talk to Walmart”, los clientes van directo al carrito y pueden empezar a llenarlo.

La promesa es que cuanto más se use, mejor funcionará. Por ejemplo, si la primera vez se elige un litro de una determinada marca, la segunda solo dirá “leche” y la orden será identificada. Esta facilidad está disponible en smartphones, tabletas, altavoces, relojes u otros dispositivos.

Igualmente, Starbucks inició las ventas vía speakers en China, con Tmall Genie, el dispositivo de Alibaba que está entre los más vendidos del mundo. La cadena asegura entregas en media hora y una experiencia de vanguardia a quienes se animen.

Y en el mundo de la fast food, McDonalds también busca ponerse al día. En septiembre adquirió Apprente, una firma de inteligencia artificial de Mountain View enfocada en plataformas de voz para órdenes complejas, de múltiples acentos, idiomas e items. Se espera que esta tecnología provea servicios más rápidos y precisos en los Macautos, pero que a futuro facilite la incorporación de órdenes de voz por móviles y kioscos.

 

Inteligencia parcial

Por el momento, la implementación de empresas apunta en general a “mejorar la experiencia de usuario en las áreas de servicio al cliente, y no siempre de forma exitosa”, describe Torrens.

La dificultad para los asistentes de voz en el servicio al cliente es que pueden servir para casos muy simples y específicos con órdenes muy concretas. Pero cuando la interacción es más compleja, y la voz podría suponer un avance, normalmente los asistentes no funcionan”, señala.

La explicación es, a su entender, el gran punto pendiente: “Los motores de IA detrás de las interfaces de voz aún están muy lejos de tener una inteligencia capaz de ‘conversar’ con cierto sentido común y generalidad”.

Amazon lo mostraba con mucho humor y llevándolo a la exageración con su famoso anuncio de la SuperBowl:

Torrens, como especialista en inteligencia artificial, cree que “la auténtica revolución solo llegará cuando los motores de IA detrás de esas interfaces sean capaces de desarrollar conversaciones un poco más generales, con sentido común, improvisación, y naturalidad”. Para llegar a este punto, aún queda mucho camino.

Esta limitación se ve claramente en los VUIs desde hace largo tiempo: Siri, Alexa o Google no son capaces de responder de forma atinada a cualquier pregunta, ni son capaces de lidiar con acentos u otros rebusques del lenguaje oral a la hora de atender una consulta.

Esto deriva en dos realidades. Por un lado, el comercio vía voz está despegando. La consultora de mercado Juniper estima que en cuatro años trepará a 80.000 millones de dólares por año. Pero esta cifra “incluye transferencias de dinero y compras de bienes digitales”, detalla.

En cuatro años se estima que el comercio vía voz aumente a 80.000 millones de dólares/año

Por otro, las limitaciones pesan sobre la evolución de las compras y la experiencia por medio de asistentes de voz.

¿Cuán inteligentes son estos dispositivos? Pues no tanto, indica un estudio de Forrester. La mayor parte de las 180 consultas sobre productos y servicios de seis industrias realizadas a asistentes de Amazon, Apple, Google y Microsoft fueron similares a estas:

  • “Alexa, ¿cuáles son los mejores detergentes para platos?”
  • “Perdón, esa no la sé”.

 

  • “Hey Google, qué marca vende los jerséis de hombre más suaves?”
  • “Perdón, no puedo ayudar con eso todavía. Aún estoy aprendiendo”.

 

Solo un “decepcionante” 35% de las consultas fueron resueltas, según un criterio de relevancia y utilidad.

Los problemas de la aplicación comercial de los asistentes mostraron una combinación de: fallos para brindar respuestas, en general redirigidas a alguna información de la web; inhabilidad para entender el contexto de la “conversación”, y mala experiencia de usuario.

Otro punto de cuestionamiento, que podría eventualmente poner trabas a la adopción, es el reto de la privacidad. Los estudios muestran las preocupaciones de los consumidores, incluso sobre la “escucha pasiva” de los dispositivos.

 

Tajada para emprendedores

Ahora sí. ¿Quieres participar? El académico de Esade vislumbra un rol para las startups:  “Especializarse en el mundo de las aplicaciones y no tanto en la tecnología de base, que está y estará liderada por las grandes compañías de tecnología como Amazon, Apple, Google, Facebook o Microsoft”.

El ecosistema de aplicaciones (como las famosas skills o funcionalidades para Alexa, el mejor ejemplo por estos días) dará a las pequeñas empresas de tecnología innovadoras un papel clave, asegura. Estas pueden llegar a tener mucho valor añadido y requieren de grandes dosis de innovación. “Actualmente, con el Cloud Computing y las interfaces públicas (las APIs) se pueden crear una multiplicidad de servicios nuevos y aplicaciones”, añade.

Para quién desarrollar es la siguiente pregunta. “Veo más potencial en el consumidor final que en el B2B. Aunque las startups se crean para demostrar que lo que parece ser que será se puede cambiar…”, arriesga Torrens.

Las más evidentes, a los ojos del experto, son las que surgirán en torno a las tareas que nos impiden interactuar con pantallas, como el deporte, la conducción o determinados juegos.

Pero también las tecnologías de voz son útiles para proporcionar autonomía a aquellos que no pueden interactuar con los dispositivos con pantallas y/o teclados, como invidentes o personas sin movilidad.

Del mismo modo, la voz puede contribuir al acompañamiento de gente mayor con dificultades para interactuar con pantallas, por lo que este modo de operación les ayuda a acceder a la tecnología, dice Torrens.

Por último, agrega un caso experimental de Reino Unido, donde se propuso un asistente virtual basado en la voz para quienes padecen crisis de ansiedad o tendencias suicidas, y se demostró que la tecnología podía aliviar estas situaciones en muchos casos disminuyendo el número de crisis.

Cabría preguntarse entonces, si para los desarrolladores de aplicaciones la monetización será tan dificultosa como para los de apps de smartphones.

Como en otros casos, los interrogantes se irán disipando. Recuerda que en tecnología los pioneros corren con ventajas y el que ríe último no suele reír mejor.

 

TE PUEDE INTERESAR  Cannapreneurs: ¿emprender con el cannabis?