Retell AI permite a las empresas construir 'agentes de voz' para responder llamadas telefónicas

Los centros de llamadas están adoptando la automatización. Existe un debate sobre si eso es algo positivo, pero está sucediendo, y posiblemente se esté acelerando.

Según la firma de investigación TechSci Research, el mercado global de inteligencia artificial para centros de contacto podría crecer a casi $3 mil millones en 2028, frente a los $2.4 mil millones en 2022. Mientras tanto, una encuesta reciente encontró que alrededor de la mitad de los centros de llamadas planean adoptar alguna forma de inteligencia artificial en el próximo año.

La motivación es bastante obvia: los centros de llamadas buscan reducir costos mientras escalan sus operaciones.

Evie Wang, una emprendedora, dijo a TechCrunch: 'Las empresas con operaciones pesadas de centros de llamadas, que buscan escalar rápidamente sin las limitaciones de agentes humanos en centros de contacto, son muy receptivas a la adopción de soluciones efectivas de agentes de voz AI'. 'Este enfoque no solo reduce sus costos generales, sino que también disminuye los tiempos de espera'.

Wang es una de las cofundadoras de Retell AI, que proporciona una plataforma que las empresas pueden utilizar para crear 'agentes de voz' alimentados por inteligencia artificial que responden a llamadas de clientes y realizan tareas básicas como programar citas. Los agentes de Retell están impulsados por una combinación de grandes modelos de lenguaje (LLMs) afinados para casos de uso de servicio al cliente y un modelo de voz que da voz al texto generado por los LLMs.

Los clientes de Retell incluyen algunos operadores de centros de contacto, pero también pequeñas y medianas empresas que lidian regularmente con altos volúmenes de llamadas, como la empresa de telemedicina Ro. Pueden construir agentes de voz utilizando las herramientas de bajo código de la plataforma, o pueden cargar un LLM personalizado (por ejemplo, un modelo abierto como el Llama 3 de Meta) para adaptar aún más la experiencia.

'Invertimos mucho en la experiencia de conversación por voz, ya que vemos que como el aspecto más crítico de la experiencia del agente de voz AI', dijo Wang. 'No vemos a los agentes de voz AI como meros juguetes que se pueden crear con unas cuantas líneas de comandos, sino más bien como herramientas que pueden ofrecer un valor sustancial a las empresas y reemplazar flujos de trabajo complejos'.

Retell funcionó bastante bien en mis breves pruebas, al menos en el lado de la llamada.

Programé una llamada con un bot de Retell utilizando el formulario de demostración en el sitio web de Retell. El bot me guió a través del proceso de programar una cita hipotética con el dentista, haciendo preguntas como mi fecha y hora preferidas, número de teléfono, etc.

No puedo decir que la voz sintética del bot fue la mejor que he escuchado en términos de realismo, ciertamente no a la altura de Eleven Labs o la API de texto a voz de OpenAI. (Actualización: Wang me dice que Retell está utilizando una voz personalizada de ElevenLabs, lo que podría explicar la calidad inferior). Wang, en defensa de Retell, dijo que el equipo se ha centrado principalmente en reducir la latencia y manejar casos límite, como interrupciones que podrían ocurrir en una conversación.

La latencia es baja: en mi prueba, el bot respondió prácticamente sin dudar a mis respuestas y preguntas de seguimiento. Y se mantuvo en su guion. Por más que lo intenté, no pude confundirlo o provocarlo para que se comportara de una manera que no debería. (Cuando le pregunté al bot sobre mis registros dentales, insistió en que hablara con la administradora de la oficina).

Entonces, ¿son plataformas como Retell el futuro de los centros de llamadas?

Tal vez. Para tareas básicas como la programación de citas, la automatización tiene mucho sentido, por eso tanto las nuevas empresas como las grandes empresas de tecnología ofrecen soluciones que compiten directamente con Retell. (Consulte Parloa, PolyAI, Contact Center AI de Google Cloud, etc.)

Es un fruto al alcance de la mano, y aparentemente generador de ingresos. Retell afirma tener cientos de clientes, todos los cuales pagan por minuto de conversación del agente de voz. Hasta la fecha, Retell ha recaudado un total de $4.53 millones en capital, cortesía de patrocinadores que incluyen Y Combinator (donde la empresa fue incubada).

Pero el veredicto está pendiente para consultas más complicadas, especialmente dada la tendencia de los LLMs a inventar hechos y desviarse incluso con salvaguardias en su lugar.

A medida que las ambiciones de Retell crecen, estoy ansioso por ver cómo la empresa navega por los muchos desafíos técnicos bien establecidos en el espacio. Wang, al menos, parece confiado en el enfoque de Retell.

'Con el advenimiento de los LLMs y los avances recientes en síntesis de voz, la inteligencia artificial conversacional está mejorando lo suficiente como para crear casos de uso realmente emocionantes', dijo Wang. 'Por ejemplo, con una latencia inferior a un segundo y la capacidad de interrumpir al AI, hemos observado que los usuarios hablan en oraciones más completas y conversan como lo harían con otra persona. Estamos tratando de hacer que sea fácil para los desarrolladores construir, probar, implementar y monitorear agentes de voz AI, en última instancia, para ayudarles a lograr la preparación para la producción'.