Jesse Lyu, fundador y líder de Rabbit, una compañía especializada en tecnología de inteligencia artificial, no pretende que el R1 reemplace a los smartphones de inmediato. No obstante, este invento de su empresa, un dispositivo de IA autónomo valorado en 199 dólares, podría, debido a sus ambiciosos objetivos, llegar a sustituir a los teléfonos móviles a largo plazo, aunque actualmente no sea así.
Diseño del Rabbit R1
El diseño del R1 recuerda a una consola Playdate o a una versión moderna de los televisores portátiles de los años 90. De tamaño aproximadamente la mitad de un iPhone, incluye una pantalla táctil de 2,88 pulgadas, una cámara rotativa para fotografías y vídeos, y una rueda/botón de desplazamiento. Incorpora un procesador MediaTek a 2,3 GHz, 4 GB de RAM y 128 GB de almacenamiento en un cuerpo curvo, creado en colaboración con Teenage Engineering. Rabbit asegura que su batería dura todo el día.
Cómo funcionar el Rabbit R1
El R1 destaca por su software, especialmente por el sistema operativo Rabbit OS y la tecnología de IA subyacente. En lugar de basarse en modelos de lenguaje extensos como ChatGPT, utiliza un “Gran Modelo de Acción” diseñado para operar aplicaciones de manera universal. Rabbit OS, similar en concepto a Alexa o Google Assistant, puede gestionar música, transportes, compras de alimentos, envío de mensajes y realizar tareas diversas a través de una interfaz unificada, eliminando la necesidad de múltiples aplicaciones y credenciales. La pantalla del R1 muestra tarjetas categorizadas para distintas funciones, permitiendo a los usuarios verificar los resultados.
Software del R1
El R1 destaca por su software, especialmente por el sistema operativo Rabbit OS y la tecnología de IA subyacente. En lugar de basarse en modelos de lenguaje extensos como ChatGPT, utiliza un “Gran Modelo de Acción” diseñado para operar aplicaciones de manera universal. Rabbit OS es similar a Alexa o Google Assistant en concepto. Es capaz de gestionar tu música, organizar el transporte, comprar alimentos, enviar mensajes y realizar diversas tareas a través de una interfaz unificada. No hay necesidad de múltiples aplicaciones y credenciales de inicio de sesión: basta con hacer una solicitud y dejar que el dispositivo se encargue.
La visualización en pantalla del R1 consistirá en tarjetas categorizadas para música, transporte, chats de vídeo, etc. Según Lyu, la pantalla servirá sobre todo para que los usuarios confirmen por sí mismos los resultados del dispositivo.
Rabbit ha optado por entrenar su modelo, el Large Action Model (LAM), para que interactúe con aplicaciones existentes en lugar de desarrollar múltiples API.
En lugar de crear varias API y convencer a los desarrolladores para que integraran la compatibilidad con el R1, Rabbit optó por entrenar su modelo para que utilizara por sí solo las aplicaciones existentes. El modelo, conocido como Large Action Model (LAM), fue entrenado por humanos que interactuaron con aplicaciones populares como Spotify y Uber, demostrando al modelo cómo funcionan. A través de este entrenamiento, el LAM fue capaz de aprender varias tareas, como reconocer un icono de Ajustes, identificar un pedido confirmado y localizar menús de búsqueda. Como resultado, este conocimiento puede aplicarse a cualquier aplicación, independientemente de su plataforma.
Entrenar tus propias acciones
El R1 cuenta con un modo de entrenamiento específico que permite al usuario instruir al dispositivo en una tarea concreta. En el futuro, el dispositivo podrá realizar la tarea de forma independiente. A modo de ejemplo, Lyu explica: “Puedes decir simplemente: ‘En primer lugar, inicia Photoshop. A continuación, importa tus fotos. A continuación, crea un lazo alrededor de la marca de agua y pulsa varias veces para eliminarla”. Este sería el proceso para eliminar marcas de agua”. Lyu menciona que el sistema operativo Rabbit sólo tarda 30 segundos en procesar esta tarea, tras lo cual eliminará automáticamente todas las marcas de agua en el futuro.
La aplicación práctica de todas estas funciones es la principal preocupación. En el R1, puede realizar ciertas tareas y acceder a un portal web llamado Rabbit Hole para iniciar sesión en todos sus diferentes servicios. Si desea enseñar al dispositivo a utilizar Photoshop, puede iniciar una de las máquinas virtuales de Rabbit y enseñarle allí en lugar de utilizar su propio dispositivo y software. Sin embargo, garantizar un funcionamiento fluido para múltiples usuarios, en varios dispositivos y plataformas, será una tarea ardua.
Si ChatGPT puede compararse con la búsqueda en Internet, Rabbit OS puede compararse con la tienda de aplicaciones.
Conclusiones
Al escuchar la conversación de Lyu sobre Rabbit OS y el R1, no resulta del todo evidente cuáles son las intenciones de la empresa con este dispositivo. Aunque no puede sustituir totalmente a un teléfono en cuanto a potencia, sí ofrece funciones como las videollamadas y una ranura para tarjetas SIM. Su función principal es la de asistente de voz, pero también tiene pantalla y cámara. No es únicamente un asistente de voz, sino que realiza muchas de las mismas funciones. Rabbit afirma que Rabbit OS prioriza la seguridad y la privacidad, pero también requiere que los usuarios se conecten a sus servicios de uso frecuente a través de su interfaz. Según Lyu, el R1 es tanto un accesorio útil como el dispositivo todo en uno definitivo para casi todo.
El dispositivo R1 ya puede reservarse en rabbit.tech y, según Lyu, se enviará en marzo. Lyu también cree, o tal vez desea, que el dispositivo salga a la venta antes que Humane’s AI Pin.