El auge de los chatbots de IA generativa ha popularizado el término "modelo de lenguaje grande", la tecnología de IA subyacente que trabaja detrás de escena. Los modelos de lenguaje grande (LLM) generan resultados basados en un conjunto de lenguaje predicho en respuesta a la entrada del usuario, lo que hace que parezca que la IA es capaz de pensar por sí misma.
Pero los LLM no son los únicos modelos importantes en la ciudad; Los grandes modelos de acción (LAM) podrían ser el próximo gran avance en IA.
Un LAM es un sistema de inteligencia artificial capaz de comprender la entrada humana y realizar la acción correspondiente. Este es un enfoque ligeramente diferente a los sistemas de IA que se centran únicamente en generar respuestas. El término "modelo de acción grande" fue introducido por primera vez por Rabbit Inc., desarrolladores del dispositivo Rabbit r1. En el vídeo de lanzamiento del Rabbit r1 de la compañía, se dice que un LAM es un nuevo modelo fundamental que ayuda a llevar la IA de las palabras a la acción.
Los LAM se entrenan en grandes conjuntos de datos de acciones del usuario; por tanto, aprenden imitando acciones humanas o mediante demostraciones. A través de la demostración, los LAM pueden comprender y navegar por las interfaces de usuario de diferentes sitios web o aplicaciones móviles y realizar acciones específicas según sus instrucciones. Según Rabbit, un LAM puede lograr esto incluso si se cambia ligeramente la interfaz.
Puede pensar en los LAM como una extensión de las capacidades existentes de los LLM. Mientras que los LLM generan texto o resultados multimedia basados en la entrada del usuario al predecir la siguiente palabra o token (usted hace una pregunta y un LLM proporciona un texto o resultado multimedia), los LAM van más allá al agregar la capacidad de realizar acciones complejas en su nombre. .
Los LAM consisten en realizar acciones complejas en su nombre. Sin embargo, el punto crítico a tener en cuenta es la capacidad de realizar acciones complejas. Esto hace que los LAM sean más útiles para realizar tareas avanzadas, pero no significa que no puedan realizar acciones más simples.
En teoría, esto significa que puedes, por ejemplo, decirle a un LAM que haga algo en tu nombre, como pedir un café en tu Starbucks cercano, un viaje en Uber e incluso hacer una reserva de hotel. Por lo tanto, es diferente a realizar tareas simples como pedirle al Asistente de Google, Siri o Alexa que enciendan el televisor o las luces de la sala.
Debajo del capó, según la visión compartida por Rabbit Inc., el LAM puede acceder al sitio web o aplicación relevante como Uber y navegar a través de su interfaz para realizar una acción, por ejemplo, pedir un viaje o cancelar uno. si cambias de opinión.
El concepto de LAM es apasionante, quizás incluso más que el de los LLM. Los LAM serán el futuro después de la IA generativa, lo que nos permitirá compensar tareas mundanas y centrarnos en otras actividades satisfactorias. Sin embargo, por más emocionantes que parezcan, los LAM aún no están listos.
El primer producto comercial que prometía aprovechar un LAM (el conejo r1) no cumplió plenamente su promesa de marketing de realizar acciones en nombre de sus usuarios. El dispositivo falló tan espectacularmente en su punto de venta principal que muchas revisiones de primera mano lo calificaron de bastante inútil.
Peor aún, una investigación realizada por Coffeezilla, un YouTuber, en colaboración con un grupo selecto de ingenieros de software con acceso a parte del código base de r1, descubrió que Rabbit usaba scripts Playwright para realizar acciones en lugar de un LAM. Entonces, en lugar de un dispositivo que ejecuta un modelo de IA único, en realidad solo ejecuta un montón de declaraciones de estilo If > Then; muy lejos del prometido LAM.
Si hay algo que puedes aprender del dispositivo r1 de Rabbit es, sí, la visión está ahí. Sin embargo, es necesario trabajar antes de realizarlo, así que no se emocione todavía.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3