Reconstruyendo Alexa: cómo Amazon combina modelos, agentes y uso del navegador para lograr una IA más inteligente

Suscríbase a nuestros boletines diarios y semanales para recibir las últimas actualizaciones y contenido exclusivo sobre la cobertura de inteligencia artificial líder en la industria. Más información
Amazon está apostando por la interoperabilidad de agentes y la mezcla de modelos para hacer que su nuevo asistente de voz Alexa sea más efectivo, reequipando su asistente de voz insignia con capacidades de agente y tareas de uso del navegador.
Esta nueva Alexa ha sido rebautizada como Alexa+, y Amazon enfatiza que esta versión “hace más”. Por ejemplo, ahora puede informar de manera proactiva a los usuarios si hay un nuevo libro disponible de su autor favorito o si su artista favorito está en la ciudad, e incluso ofrecerles comprar una entrada. Alexa+ razona a través de instrucciones y recurre a “expertos” en diferentes bases de conocimiento para responder preguntas de los usuarios y completar tareas como “¿Dónde está la pizzería más cercana a la oficina? ¿Les gustará a mis compañeros de trabajo? Haz una reserva si crees que les gustará”.
En otras palabras, Alexa+ combina agentes de IA, capacidades de uso de computadoras y el conocimiento que aprende del ecosistema más amplio de Amazon para ser lo que Amazon espera que sea un asistente de voz doméstico más capaz e inteligente.
Actualmente, Alexa+ funciona en los modelos Nova de Amazon y en los modelos de Anthropic . Sin embargo, Daniel Rausch, vicepresidente de Alexa y Echo de Amazon, le dijo a VentureBeat que el dispositivo seguirá siendo "independiente del modelo" y que la empresa podría presentar otros modelos (al menos los modelos disponibles en Amazon Bedrock ) para encontrar el mejor para realizar tareas.
“Se trata de elegir las integraciones adecuadas para completar una tarea, determinar el tipo correcto de instrucciones, lo que se necesita para completar la tarea y luego orquestar todo el proceso”, dijo Rausch. “Lo más importante que hay que entender es que Alexa seguirá evolucionando con los mejores modelos disponibles en Bedrock”.
La combinación o el enrutamiento de modelos permite a las empresas y a otros usuarios elegir el modelo de IA adecuado para cada consulta. Los desarrolladores recurren cada vez más a la combinación de modelos para reducir costos. Después de todo, no es necesario que un modelo de razonamiento responda a todas las solicitudes; algunos modelos realizan mejor determinadas tareas.
La unidad de inteligencia artificial y nube de Amazon, AWS , ha sido durante mucho tiempo una defensora de la combinación de modelos. Recientemente, anunció una función en Bedrock llamada Intelligent Prompt Routing , que dirige las indicaciones al mejor modelo y tamaño de modelo para resolver la consulta.
Y podría funcionar. “Puedo decirles que no puedo decir qué modelo está utilizando para cada respuesta dada de Alexa en cada tarea”, dijo Rausch.
Rausch dijo que Alexa+ reúne a los agentes de tres maneras diferentes. La primera es la API tradicional; la segunda es la implementación de agentes que pueden navegar por sitios web y aplicaciones como Computer Use de Anthropic ; la tercera es la conexión de agentes con otros agentes.
“Pero en el centro de todo, orquestando todos esos diferentes tipos de experiencias, se encuentran estos LLM básicos, muy capaces y de última generación”, dijo Rausch.
Agregó que si una aplicación de terceros ya tiene su propio agente, ese agente aún puede comunicarse con los agentes que trabajan dentro de Alexa+ incluso si el agente externo se construyó utilizando un modelo diferente.
Rausch enfatizó que el equipo de Alexa utilizó las herramientas y la tecnología de Bedrock, incluidas las nuevas herramientas de orquestación de múltiples agentes .
Mike Krieger, CPO de Anthropic, dijo a VentureBeat que incluso las versiones anteriores de Claude no podrán lograr lo que Alexa+ quiere.
“En la demostración se aprecia un momento de '¿Por qué ahora?' realmente interesante, porque, por supuesto, los modelos han mejorado”, afirmó Krieger. “Pero si intentara hacer esto con Sonnet 3.0 o nuestros modelos de nivel 3.0, creo que tendría muchas dificultades para utilizar muchas herramientas diferentes a la vez”.
Aunque ni Rausch ni Krieger confirmaron qué modelo específico de Anthropic utilizó Amazon para construir Alexa+, vale la pena señalar que Anthropic lanzó Claude 3.7 Sonnet el lunes y está disponible en Bedrock.
El primer contacto de muchos usuarios con la IA se produjo a través de asistentes de voz como Alexa, Google Home o incluso Siri de Apple. Estos permiten a las personas externalizar algunas tareas, como encender las luces. No tengo un dispositivo Alexa o Google Home, pero recientemente descubrí lo conveniente que puede ser tener uno cuando me hospedé en un hotel. Podía decirle a Alexa que detuviera la alarma, encendiera las luces y abriera una cortina mientras todavía estaba bajo las sábanas.
Pero, aunque Alexa, los dispositivos Google Home y Siri se hicieron omnipresentes en la vida de las personas, empezaron a mostrar su edad cuando la IA generativa se hizo popular. De repente, la gente quería respuestas en tiempo real de los asistentes de IA y exigía resoluciones de tareas más inteligentes, como agregar varias reuniones a los calendarios sin necesidad de que se les pidiera demasiado.
Amazon admitió que el auge de la IA de última generación, especialmente de los agentes, ha hecho posible que Alexa finalmente alcance su potencial.
“Hasta este momento, estábamos limitados por la tecnología en lo que Alexa podía ser”, dijo Panos Panay, vicepresidente sénior de dispositivos y servicios de Amazon, durante una demostración.
Rausch dijo que la esperanza es que Alexa+ continúe mejorando, agregue nuevos modelos y, con suerte, haga que más personas se sientan cómodas con lo que la tecnología puede hacer.
Si desea impresionar a su jefe, VB Daily lo tiene cubierto. Le brindamos información exclusiva sobre lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, para que pueda compartir información y obtener el máximo retorno de la inversión.
Lea nuestra Política de privacidad
Gracias por suscribirse. Vea más boletines de VB aquí .
Se produjo un error.

venturebeat