El cofundador y CEO de Rabbit, Jesse Lyu, no le tiene miedo a la muerte... la muerte de la empresa, al menos. Le dijo a TechCrunch que la empresa es una startup cuyo destino puede ser influenciado por los caprichos de rivales multimillonarios, pero eso no es motivo para rendirse y volver a casa.
Apareciendo en el escenario en StrictlyVC LA, Lyu explicó su enfoque bastante filosófico ante la amenaza de que Google, Microsoft o Apple vengan a aplastarlos. (Las citas han sido ligeramente editadas para mayor claridad).
El r1 de Rabbit, el asistente de inteligencia artificial de bolsillo que atrajo considerable atención después de su debut en el CES, es ciertamente una propuesta original. La mitad del tamaño de un teléfono, el dispositivo actúa estrictamente como un asistente controlado por voz, pero es capaz de operar remotamente tus aplicaciones y realizar acciones complejas, así como responder preguntas y mantener una conversación como ChatGPT. Describió las dos partes como 'intención' y 'acción.'
'Tuve esta visión hace muchos años, en realidad hace 10 años, pero la tecnología no estaba lista. Esta es la primera vez en la historia que un dispositivo como este es realmente posible', dijo Lyu.
Explicó que había estado intrigado por las capacidades de los LLM para entender el lenguaje y la intención y que con la aparente versatilidad de los sistemas basados en transformadores, era natural intentar hacer que también realicen acciones.
¿Puede un diseño llamativo diferenciar al r1 de Rabbit de un montón de asistentes virtuales?
'Inmediatamente intentamos usar super-prompts para que este modelo de lenguaje haga cosas, y el resultado fue muy lamentable', recordó. 'Hay una demostración de otra empresa que utiliza un LLM para ir al último video de YouTube de MrBeast y dejar un comentario. Sí, en teoría, los modelos de lenguaje pueden hacer eso. Pero eso te obligaría a literalmente ver tu pantalla haciendo ese paso a paso. Y toma aproximadamente entre dos y tres minutos para completar una tarea así. Simplemente no creemos que eso pueda convertirse en una buena experiencia de usuario final.'
Su solución es el 'modelo de acción grande,' que está entrenado en horas y horas de usuarios reales interactuando con aplicaciones populares: 'Spotify, Uber, Expedia, DoorDash, lo que sea. Tenemos las 800 aplicaciones de mayor frecuencia. Luego configuramos esta red simbólica neural y le pedimos a esta inteligencia artificial, a la que ahora llamamos modelo de acción grande, que revise esos clips, pero cuadro por cuadro. La idea es que simbólicamente, la IA eventualmente será lo suficientemente inteligente como para extraer todos los botones, todos los elementos, y luego básicamente podemos construir una lógica para automatizar.'
La parte del lenguaje todavía se ejecuta en servicios de LLM de terceros como Perplexity, que parece estar tratando de capitalizar el éxito de Rabbit, ofreciendo un año de servicio gratuito además de lo que proporcione el r1. Sugerí que los costos de la API y otras consideraciones podrían representar un peligro para la solvencia de la startup.
'En primer lugar, no estamos perdiendo dinero vendiendo el r1, lo cual es un logro muy, muy, muy significativo, especialmente para una nueva startup en la gen 1. No vamos a estar en bancarrota vendiendo más unidades. Doy todo el crédito a mi equipo de hardware de chicos increíbles por ser capaces de negociar a la baja los componentes y los costos del BOM [documento de materiales],' dijo. 'Estamos muy cerca de las 100,000 órdenes. Dos días antes del discurso principal, le dije a mi equipo que sería realmente bueno si pudiéramos vender 500 unidades en el primer día. Pero vendimos 18,000.'
En cuanto a una suscripción, Lyu simplemente no lo ve funcionando, especialmente cuando la tesis del dispositivo es ser barato y sencillo. Aunque mencionó que los usuarios podrán entrenar y vender sus propios modelos específicos de aplicaciones más adelante, y Rabbit se llevaría una parte de eso, pero advirtió que este es un plan a largo plazo sin detalles específicos aún.
Por último, cuando se enfrenta al hecho de que las compañías más grandes y ricas del mundo están gastando miles de millones para avanzar en la IA, Lyu proporcionó una perspectiva casi zen sobre la perspectiva de ser aplastado bajo el talón de Google, Microsoft o Apple (cuyo CEO Tim Cook acaba de decir que 'romperá nuevas barreras' en IA este año).
'No soy delirante, para pensar que no somos una startup. Somos una startup', dijo. 'Quiero decir, la primera lección que aprendí de Y Combinator hace dos años es que el 99% de las startups morirán. Si tu mentalidad como emprendedor es, 'Oh, tengo una idea genial, y puedo garantizar que esto funcionará, no importa lo que todas estas grandes empresas tecnológicas intenten...', quiero decir, estás delirando. No hay algo así. La realidad es que una startup es un juego de supervivencia, y es mejor que pases tu tiempo enfocándote en tus propias cosas.'
'Van a hacer lo que van a hacer y yo voy a hacer lo que voy a hacer, ¿verdad? Tiene que haber algunos fundadores, cuando escucharon que Apple está haciendo Apple Cars, se detuvieron, ¿verdad? Simplemente cancelaron. Ahora ¿qué? Creo que es bueno tener este nivel de competencia que solo nos ayudará a crecer más rápido, o a morir más rápido, que es la naturaleza de las startups. Es una u otra cosa, aún no lo sé. Pero estoy haciendo todo lo posible, como dije, es un juego de supervivencia.'
Puedes ver el panel completo abajo.