M
MercyNews
Home
Back
Gambit: El arnés de código abierto para construir agentes de IA confiables
Tecnologia

Gambit: El arnés de código abierto para construir agentes de IA confiables

Hacker News3h ago
3 min de lectura
📋

Hechos Clave

  • Gambit es un arnés de agentes de código abierto lanzado para ayudar a los desarrolladores a construir agentes de IA más confiables.
  • El framework invierte las pipelines de orquestación tradicionales, colocando los grandes modelos de lenguaje en el núcleo del flujo de trabajo.
  • Los desarrolladores pueden definir agentes usando archivos markdown autónomos o programas en TypeScript.
  • El sistema utiliza "decks" para crear interfaces typesafe para la comunicación entre diferentes agentes.
  • Las evaluaciones automáticas, llamadas "graders", están integradas en cada paso de la cadena de agentes.
  • El arnés incluye agentes de prueba que generan datos sintéticos para pruebas y evaluación basadas en escenarios.

Un Nuevo Framework para Agentes de IA

El panorama del desarrollo de agentes de IA ha recibido una nueva herramienta significativa con el lanzamiento de Gambit, un arnés de agentes de código abierto diseñado para agilizar la creación de sistemas de IA confiables. Este framework aborda la compleja orquestación típicamente requerida al construir agentes, ofreciendo un entorno más intuitivo y typesafe para los desarrolladores.

A diferencia de los frameworks de orquestación de agentes tradicionales que siguen una pipeline de computación pesada, Gambit invierte el modelo estándar. El resultado es un sistema que prioriza el gran modelo de lenguaje (LLM) mientras maneja la llamada a herramientas, la planificación y la gestión de la ventana de contexto con menos intervención del desarrollador.

Invertiendo la Pipeline

La orquestación de agentes tradicional a menudo sigue una ruta lineal: computación → computación → computación → LLM → computación → computación → LLM. Esta estructura puede ser engorrosa e ineficiente, requiriendo un esfuerzo de orquestación significativo. Gambit invierte este paradigma.

Con el nuevo arnés, el flujo de trabajo se convierte en: LLM → LLM → LLM → computación → LLM → LLM → computación → LLM. Este cambio coloca el modelo de lenguaje en la vanguardia del proceso, tratando el arnés como un sistema operativo para el agente. Gestiona las interacciones complejas entre diferentes componentes, permitiendo a los desarrolladores centrarse en la lógica en lugar de la infraestructura.

Los arneses de agentes son como un sistema operativo para un agente... manejan la llamada a herramientas, la planificación, la gestión de la ventana de contexto y no requieren tanta orquestación por parte del desarrollador.

"Los arneses de agentes son como un sistema operativo para un agente... manejan la llamada a herramientas, la planificación, la gestión de la ventana de contexto y no requieren tanta orquestación por parte del desarrollador."

— Equipo de Desarrollo de Gambit

Definiendo Agentes con Decks

Los desarrolladores pueden describir cada agente dentro de Gambit usando dos métodos principales: un archivo markdown autónomo o un programa en TypeScript. Esta flexibilidad se adapta a diferentes preferencias y requisitos del proyecto, desde prototipado rápido hasta código de producción robusto y type-safe.

El framework introduce el concepto de decks para gestionar las interacciones de los agentes. Un agente raíz puede incorporar dinámicamente otros agentes según sea necesario, y Gambit crea una forma type-safe para definir las interfaces entre ellos. Esto asegura que los agentes puedan invocar a otros agentes sin problemas, con cada agente diseñado usando parámetros de modelo específicos adaptados a su tarea.

  • Archivos markdown autónomos para una configuración rápida
  • Programas completos en TypeScript para lógica compleja
  • Interfaces typesafe para una comunicación de agentes confiable
  • Diseño modular de agentes con parámetros personalizados

Evaluación y Pruebas Automáticas

La garantía de calidad está integrada directamente en el framework Gambit a través de evaluaciones automáticas en cada paso de la cadena. Estas evaluaciones, llamadas graders, son un tipo de deck especializado diseñado para evaluar y puntuar conversaciones o turnos individuales.

Más allá de los graders, el arnés soporta la definición de agentes de prueba en una base de deck por deck. Estos agentes de prueba están diseñados para imitar escenarios realistas que un agente podría encontrar, generando datos sintéticos tanto para la revisión humana como para la calificación automatizada. Esta capacidad permite pruebas rigurosas sin necesidad de una recolección manual extensa de datos.

El desarrollo de Gambit fue impulsado por experiencia práctica. Sus creadores habían construido previamente un editor de video basado en LLM pero estaban insatisfechos con los resultados. Esta frustración los llevó por el camino de mejorar la calidad de los LLM en tiempo de inferencia, culminando en la creación de este arnés.

Aplicaciones Prácticas y Visión

Gambit está siendo probado actualmente con socios de diseño tempranos, y la retroalimentación ha sido positiva. El framework está posicionado para habilitar una variedad de aplicaciones interesantes, particularmente en la comunidad de código abierto.

La visión para Gambit incluye fomentar agentes y asistentes verdaderamente de código abierto donde la lógica, el código y los prompts puedan compartirse fácilmente. También apunta a implementar calificación basada en rúbricas para garantizar resultados específicos, como prevenir fugas accidentales de PII (Información de Identificación Personal).

  • Agentes de código abierto compartibles con lógica transparente
  • Calificación basada en rúbricas para cumplimiento y seguridad
  • Despliegue rápido de bots con mínima intervención humana

Además, el arnés está diseñado para trabajar con herramientas como Codex o Claude Code, permitiendo a los desarrolladores lanzar un bot utilizable en minutos. El ejecutor de línea de comandos y los graders facilitan la construcción de una primera versión que es efectiva con muy poca supervisión humana.

Viendo Hacia el Futuro

Gambit representa un paso adelante en hacer el desarrollo de agentes de IA más accesible y confiable. Al invertir la pipeline tradicional y proporcionar herramientas de evaluación integradas, aborda los puntos de dolor clave que enfrentan los desarrolladores al orquestar comportamientos complejos de agentes.

Mientras los creadores reconocen que el arnés carece de algunas partes obvias, la decisión de lanzarlo temprano está destinada a generar conversaciones y recopilar retroalimentación de la comunidad. A medida que el proyecto evoluciona, tiene el potencial de convertirse en una herramienta fundamental para construir la próxima generación de aplicaciones de IA.

Preguntas Frecuentes

¿Cuál es el propósito principal del arnés Gambit?

Gambit está diseñado para funcionar como un sistema operativo para agentes de IA, simplificando el proceso de desarrollo al manejar la llamada a herramientas, la planificación y la gestión del contexto. Su objetivo es reducir la necesidad de una orquestación pesada por parte del desarrollador típicamente requerida en los frameworks de agentes.

¿Cómo se diferencia Gambit de los frameworks de agentes tradicionales?

Los frameworks tradicionales a menudo siguen una pipeline de computación pesada, mientras que Gambit invierte esta estructura para priorizar el gran modelo de lenguaje. Este enfoque permite un flujo de trabajo más fluido donde los LLM interactúan directamente, con tareas de computación como soporte según sea necesario.

¿Qué características soportan las pruebas y evaluación en Gambit?

El arnés incluye evaluaciones automáticas, llamadas "graders", que puntuan conversaciones en cada paso. Además, los desarrolladores pueden definir agentes de prueba que generan datos sintéticos para imitar escenarios del mundo real, asegurando que los agentes sean robustos antes del despliegue.

¿Pueden los desarrolladores usar Gambit con modelos de IA existentes?

Sí, Gambit permite que cada agente sea diseñado con los parámetros de modelo que tengan sentido para una tarea específica. También es compatible con herramientas como Codex o Claude Code para un despliegue y desarrollo rápido de bots.

Continue scrolling for more

La IA transforma la investigación y las demostraciones matemáticas
Technology

La IA transforma la investigación y las demostraciones matemáticas

La inteligencia artificial está pasando de ser una promesa a una realidad en las matemáticas. Los modelos de aprendizaje automático generan teoremas originales, forzando una reevaluación de la investigación y la enseñanza.

Just now
4 min
217
Read Article
TSMC acelera inversión de 165 mil millones de dólares en EE.UU.
Economics

TSMC acelera inversión de 165 mil millones de dólares en EE.UU.

Taiwan Semiconductor Manufacturing Company acelera su expansión multimillonaria en Arizona, impulsada por un nuevo acuerdo comercial y un sólido desempeño financiero.

21m
5 min
0
Read Article
Artículo de prueba de Engadget bloqueado: ¿Qué pasó?
Technology

Artículo de prueba de Engadget bloqueado: ¿Qué pasó?

Un artículo de prueba publicado en Engadget ha sido bloqueado, impidiendo el acceso al contenido original. El incidente subraya los desafíos en la disponibilidad de medios digitales.

25m
5 min
0
Read Article
Hombre de Utah condenado a tres años por fraude criptográfico de 2.9 millones de dólares
Crime

Hombre de Utah condenado a tres años por fraude criptográfico de 2.9 millones de dólares

Un hombre de Utah ha sido condenado a tres años en prisión federal por orquestar un esquema de fraude criptográfico de 2.9 millones de dólares que involucró transacciones de efectivo a criptomonedas no autorizadas.

25m
5 min
0
Read Article
Ransomware DeadLock explota contratos inteligentes de Polygon
Technology

Ransomware DeadLock explota contratos inteligentes de Polygon

Investigadores han identificado DeadLock, un nuevo ransomware que explota contratos inteligentes de Polygon para ocultar su infraestructura y evadir desmantelamientos.

44m
5 min
0
Read Article
Guía de fin de semana en São Paulo: Carnaval, conciertos y encuentros olímpicos
Entertainment

Guía de fin de semana en São Paulo: Carnaval, conciertos y encuentros olímpicos

São Paulo ofrece un fin de semana vibrante con Carnaval, conciertos de Alcione y Teresa Cristina, encuentros con atletas olímpicos y exposiciones culturales.

45m
5 min
0
Read Article
Guía Cultural del Gran Recife: Música, Festivales y Arte
Culture

Guía Cultural del Gran Recife: Música, Festivales y Arte

El Gran Recife ofrece una agenda cultural diversa este fin de semana, con conciertos de Nattan y Mombojó, la feria Fenahall y el Festival de Chopp, además de exposiciones de arte.

45m
5 min
0
Read Article
EE.UU. y Taiwán firman nuevo acuerdo comercial
Politics

EE.UU. y Taiwán firman nuevo acuerdo comercial

EE.UU. y Taiwán firman un nuevo acuerdo comercial que reduce aranceles y fomenta la inversión en semiconductores, fortaleciendo la cadena de suministro tecnológica.

50m
5 min
6
Read Article
Cuba evalúa costo de alianza con Venezuela tras muerte de 32 tropas
Politics

Cuba evalúa costo de alianza con Venezuela tras muerte de 32 tropas

Un incidente en Venezuela resultó en la muerte de 32 tropas cubanas, exponiendo los riesgos estratégicos de los compromisos internacionales de Cuba y planteando preguntas sobre el costo de sus alianzas.

57m
3 min
6
Read Article
Demócratas de la Cámara presionan a la SEC por el caso de Justin Sun pausado
Politics

Demócratas de la Cámara presionan a la SEC por el caso de Justin Sun pausado

Tres demócratas de la Cámara instan a la SEC a explicar su retirada del cumplimiento de criptomonedas y la pausa en el caso de Justin Sun, citando preocupaciones de "pago por juego".

59m
5 min
6
Read Article
🎉

You're all caught up!

Check back later for more stories

Volver al inicio