Agentes LLM de Autoaprendizaje: un enfoque fractal para el conocimiento específico de dominio
← Todos los PostsTEXTO EN ESPAÑOL MEJORADO Durante su entrenamiento, los LLM adquieren una
sólida comprensión del lenguaje; sin embargo, están limitados por un punto de
corte temporal fijo en cuanto a conocimientos. Además, se optimizan para rendir
de forma general en múltiples dominios, lo que los hace versátiles y amplios,
aunque no siempre profundos. De forma predeterminada, suelen producir respuestas
genéricas e información superficial. Muy pronto se popularizó el paradigma de
dejar que los LLM se ocupen del lenguaje y la semántica, mientras que mecanismos
separados aportan el conocimiento especializado. El modo predominante de
inyectar ese conocimiento es la Generación Aumentada con Recuperación (RAG, del
inglés Retrieval-Augmented Generation), en la que el saber de dominio se
almacena como vectores y se consulta mediante técnicas de búsqueda estándar.
Este enfoque dota a los LLM de conocimientos especializados bastante profundos,
pero también crea un problema fractal: el motor de respaldo (back-end) RAG puede
quedar obsoleto y requerir actualizaciones. Por ello, se han añadido
herramientas de búsqueda que permiten a los LLM invocar Google u otros
buscadores para obtener información más reciente. Aun así, esto no elimina por
completo la necesidad del back-end RAG, pues sigue siendo ventajoso contar con
conocimientos específicos más allá de lo que aporten unas cuantas búsquedas en
Google. En 2389 creemos que el futuro es multiagente. En lugar de depender de un
único agente monolítico, interactuarás con cientos o miles de agentes. En una
conversación, un agente de viajes gestiona los vuelos, un agente hotelero las
reservas y un agente gastronómico selecciona restaurantes locales según tus
preferencias. ## ¿Pueden aprender los agentes? Una de las grandes limitaciones
teóricas es: ¿cómo permitir que miles de agentes desarrollen conocimientos
especializados de dominio? Tradicionalmente, crear bases de conocimiento
implicaba construir y mantener cada una a mano, algo que claramente no escala.
Uno de mis intereses personales consiste en averiguar cómo lograr que un agente
aprenda por sí mismo. ¿Es factible darle rienda suelta para que, con el tiempo,
desarrolle su propia especialización y se adapte a los intereses del usuario?
Incluso si el mismo agente está disponible de forma general, una versión
personalizada podría ajustarse no solo en estilo y respuestas, sino también en
su conocimiento subyacente. Esta entrada explora algunos experimentos recientes
sobre agentes autoaprendientes. He estado trabajando en dos proyectos: 1.
Creación autónoma de bases de conocimiento: ¿Puede un agente construir su
propia base sobre un tema a partir de información mínima? Esto apunta a disponer
de miles de agentes sin configurarlos uno por uno. 2. Aumento interactivo del
conocimiento: Con un proceso similar, ¿puede un agente reflexionar sobre
interacciones recientes, detectar lagunas en su conocimiento o áreas de interés
del usuario y reunir información para ampliarlo? — ## Naturaleza fractal de
los agentes LLM Gran parte de mi trabajo para este artículo se inspira, aunque
de forma laxa, en proyectos como Co-Scientist de
Google
y el artículo Agent Laboratory, en los que
varios agentes realizan múltiples pasadas sobre una actividad para perfeccionar
una idea o profundizar en temas siguiendo un diseño fractal. Por ejemplo, Google
Co-Scientist emplea ciclos iterativos de verificación: se genera una idea, otros
agentes la puntúan y se refina a lo largo de varias iteraciones. En el artículo
Agent Laboratory, los agentes rotan entre roles —investigador posdoctoral,
estudiante de doctorado, ingeniero de software e ingeniero de aprendizaje
automático— para probar y pulir iterativamente posibles ideas de publicaciones
académicas. Como científico de datos en la industria del comercio electrónico,
gran parte de mi trabajo se ha centrado en algoritmos de búsqueda semántica en
el back-end. Al implementar agentes con back-end RAG, todo suele reducirse a una
búsqueda semántica de tipo fractal —ya sea RAG, GraphRAG u otra variante—. De
forma análoga, el concepto de agente autoaprendiente consiste en permitir que un
agente examine una idea o conversación inicial, extraiga elementos de interés,
jerga o conceptos y luego investigue ideas relacionadas. Repetir este proceso en
distintos niveles de profundidad genera una investigación cada vez más detallada
sobre un tema. — ## De novato a casi experto No afirmo que los agentes se
conviertan en expertos absolutos tras pasar por este proceso, pero sí aprenden
detalles interesantes y generan respuestas más atractivas que sus equivalentes
de fábrica. La clave es permitir que un agente decida cómo utilizar la
herramienta de búsqueda. Para ello realiza varias rondas en forma fractal con
ciclos de introspección. El proceso funciona así: 1. El agente recibe una
consulta o tema y lo descompone en un conjunto de consultas de alto nivel. El
objetivo de esta primera pasada es reunir un superconjunto de información:
cronologías, principios de diseño y temas generales. 2. Después recupera
conjuntos de resultados de búsqueda para ese superconjunto. Estos sitios se
transforman en un formato similar a Markdown y, de cada uno, se extraen
conceptos, ideas y temas. Esto permite rondas adicionales de búsqueda basadas en
la nueva información descubierta. ### Ejemplo: cocina francesa En una prueba,
hice que el agente aprendiera sobre cocina francesa con el siguiente prompt: >
«French Cuisine, regional specialties, ingredients, cooking principles, dishes,
recipes» A partir de ello, el agente generó una lista de temas de alto nivel
para investigar: 1. Tema: Regiones de Francia y sus características culinarias Objetivo: Identificar y clasificar las distintas regiones de Francia para explorar sus tradiciones y especialidades culinarias únicas. 2. Tema: Ingredientes comunes en la cocina francesa Objetivo: Elaborar una lista completa de ingredientes fundamentales en la cocina francesa y analizar las diferencias regionales y las recetas tradicionales. 3. Tema: Técnicas de cocina fundamentales en la gastronomía francesa Objetivo: Recopilar información sobre los métodos esenciales de preparación para entender los principios detrás de cada plato. 4. Tema: Platos tradicionales franceses por región Objetivo: Crear una lista de platos icónicos específicos de cada región para comprender su relevancia cultural. 5. Tema: Recetas de platos clásicos franceses Objetivo: Reunir un conjunto de recetas de platos emblemáticos que ejemplifiquen las técnicas e ingredientes identificados. Basándose en estos temas, el agente
creó consultas más específicas: Searching (1/34): List of regions in France with descriptions Searching (2/34): Famous regional dishes in France by region Searching (3/34): Local ingredients specific to French regions Searching (4/34): Traditional French cooking methods by region Searching (5/34): List of notable chefs and culinary schools in France by region Searching (6/34): Traditional recipes from each region of France Searching (7/34): Common ingredients in French cuisine Searching (8/34): French cooking techniques Searching (9/34): Regional specialties of French cuisine # (consultas originales en inglés) En
la primera ronda, el agente recopila un superconjunto de información sobre
cocina francesa. Luego realiza rondas adicionales de búsqueda usando el contexto
de los artículos iniciales, profundizando en los detalles de cada región y sus
matices culinarios. En el fragmento siguiente se observa cómo ahonda en las
cocinas de las distintas regiones de Francia. Una vez terminado el proceso,
podemos añadir todos los artículos al back-end RAG de este agente. Expanded search (1/40): List of culinary specialties by region in France Expanded search (2/40): Overview of administrative regions of France Expanded search (3/40): Historical recipes by French region Expanded search (4/40): Culinary characteristics of French overseas regions Expanded search (5/40): Culinary specialties of Provence-Alpes-Côte d'Azur Expanded search (6/40): Culinary specialties of Brittany Expanded search (7/40): Culinary specialties of Hauts-de-France Expanded search (8/40): Culinary specialties of Normandy Expanded search (9/40): Culinary specialties of Île-de-France Expanded search (10/40): Culinary specialties of Grand Est Expanded search (11/40): Culinary specialties of Occitania # (consultas originales en inglés) ### Prueba de la
base de conocimiento Como verificación rápida, ejecuté una consulta de ejemplo
tanto en GPT-4o-mini mediante un cliente web (con búsqueda activada) como en mi
agente personalizado (GPT-4o-mini con acceso al nuevo back-end de cocina
francesa). ### Consulta de ejemplo: «¿Cuáles son las especialidades regionales
de Normandía?» Salida genérica de GPT-4o-mini (en inglés): > Normandy has a
ton of unique culinary treats that capture its history and local ingredients.
Highlights include cheeses like Camembert de Normandie, Pont-l’Évêque, and
Neufchâtel; apple-based treats from its orchards, including cider and Calvados;
fresh seafood due to its extensive coastline; rich dairy products; and hearty
traditional dishes like Tripes à la mode de Caen. La respuesta era razonable
pero genérica. Veamos qué hace el nuevo agente. ### Procedimiento de respuesta
del nuevo agente 1. Descomposición de la consulta - Regional specialties of
Normandy - Normandy food traditions - Traditional dishes from Normandy 2.
Búsqueda en el back-end y agregación El agente consulta su base para cada
búsqueda refinada, extrae contexto y genera una respuesta completa a partir de
los resultados agregados. 3. Ejemplo de respuesta final (traducida) >
Normandía es famosa por sus ricas tradiciones culinarias y especialidades
regionales, caracterizadas por una combinación de ingredientes locales,
influencias históricas y platos distintivos. A continuación, algunos destacados:
1. Quesos > > - Camembert de Normandía: queso blando de corteza
enmohecida e interior cremoso. > - Livarot: forma cilíndrica rodeada por
tiras de paja trenzada; corteza lavada. > - Pont-l’Évêque: queso cuadrado
con corteza anaranjada característica. > - Neufchâtel: queso blando, a
menudo con forma de corazón. > > ### 2. Mariscos > > - Mejillones con crema
normanda: se sirven con crème fraîche local o salsas a base de queso. > -
Moluscos y crustáceos: vieiras, ostras y gambas; destacan platos como
Marmite Dieppoise (estofado de pescado) y Moules à la crème (mejillones en
salsa de crema). > > ### 3. Platos de carne > > - Cordero prés-salés: criado
en marismas salinas cerca del Mont-Saint-Michel. > - Callos à la mode de
Caen: guiso lento de callos enriquecido con sidra local. > - Andouille de
Vire: embutido sazonado elaborado con tripa de cerdo. > > ### 4. Sidra y
Calvados > > - Cidre: bebida emblemática disponible en estilos que van de
seco a dulce. > - Calvados: aguardiente de manzana que se bebe solo o se usa
en salsas. > > ### 5. Repostería y postres > > - Tarte normande: tarta de
manzana que refleja la tradición manzanera de la región. > - Galettes y
crêpes: tortitas saladas de trigo sarraceno y crêpes dulces, a menudo
acompañadas de sidra. > > Conclusión > La gastronomía de Normandía suele
resumirse en las «cuatro C» (Cider, Calvados, Cream y Camembert). Ya sea a
través de sus quesos exquisitos, mariscos frescos o contundentes platos de
carne, Normandía ofrece una experiencia culinaria profundamente arraigada en la
tradición. Un miembro de nuestro equipo, cuya familia es de Normandía, respaldó
los resultados, así que lo consideramos un éxito inicial. — ## Dejar que los
agentes aprendan con el tiempo La segunda parte del experimento analiza si un
agente puede aprender a partir de las consultas o conversaciones del usuario, de
manera que la versión personal del agente se especialice respecto al agente
base. El proceso es similar al de investigar desde cero, pero con pasos
adicionales: - Generación de consultas (query generation): el agente usa un
LLM para crear consultas candidatas basadas en el contexto actual y en las
lagunas de su conocimiento. - Puntuación de consultas (query scoring): cada
una se evalúa (por ejemplo, de 0 a 100) según relevancia, novedad y alineación
con el contexto del usuario. - Selección de las N mejores: se filtran las
consultas con puntuación superior a un umbral. Si no hay suficientes, se repite
la generación (con un límite para evitar bucles). - Ejecución de búsquedas:
para cada consulta seleccionada, el agente realiza búsquedas semánticas o
vectoriales y recupera los K mejores resultados. - Procesado e ingestión de
resultados: los resultados se analizan para extraer información útil, que se
incorpora a la base de conocimiento en evolución del agente. - Actualización
de la base e índices: se integran los nuevos datos y se actualizan los índices
de búsqueda semántica, de modo que el repositorio permanezca enriquecido y
vigente. ### Ejemplo: actualización del conocimiento sobre restaurantes Resumen
de conversación: Preguntó por restaurantes en West Loop, Chicago; mostró interés en cocina italiana, francesa y japonesa. También manifestó curiosidad por los chefs de Smyth y Loyalist. La base de conocimiento del agente cubre
unos cientos de restaurantes, pero carece de detalles actualizados sobre chefs,
menús vigentes o enfoques culinarios singulares. Generación de consultas Selected top 3 queries: 1. ¿Cuál es la trayectoria y la filosofía culinaria de los chefs de Smyth y Loyalist? (Puntuación: 90) 2. ¿Cuáles son los platos insignia y los ingredientes únicos que se utilizan en los restaurantes franceses de West Loop? (Puntuación: 88) 3. ¿Existen experiencias o eventos gastronómicos especiales en Smyth o Loyalist que atraigan comensales? (Puntuación: 85) # (consultas traducidas al español) El agente detecta que su conocimiento
sobre restaurantes en West Loop es aceptable, pero carece de detalles sobre
Smyth y Loyalist. Dos de las tres consultas se centran en esa carencia, mientras
que la tercera cubre ingredientes característicos de la cocina francesa en la
zona. Tras ejecutar las consultas, el agente descarga páginas relevantes, las
procesa como Markdown y las integra en su back-end RAG. Para la consulta «Chef
John Shields» (chef ejecutivo de Smyth y Loyalist), los dos primeros resultados
son: - Resultado 1 Título: Smyth | Smyth and The Loyalist URL:
https://www.smythandtheloyalist.com/smyth/ Contenido: > El restaurante
Smyth, de tres estrellas Michelin —uno de solo trece en el país con tal
distinción—, eleva la labor de agricultores y pescadores norteamericanos en el
apogeo de su temporada. Los chefs John Shields y Karen Urie Shields aportan
treinta años de experiencia culinaria en lugares como Alinea, Tru y Charlie
Trotter’s. - Resultado 2 Nombre: John’s Food and Wine Descripción:
Local New American que ofrece un menú estacional con platos como beef
tartare y caballa entera a la parrilla en un ambiente informal. Aunque algunos
resultados posteriores sean menos relevantes, el agente puede sintetizar
suficiente contexto útil para responder preguntas sobre el chef John Shields.
— ## Reflexiones finales Estos experimentos son pasos modestos hacia la
creación de agentes que aprendan y se adapten a partir de sus interacciones con
los usuarios, un avance hacia disponer de miles de agentes sin configurarlos
manualmente. Aun así, quedan muchos retos y líneas futuras de trabajo: -
Verificación de la calidad: ¿cómo comprobar la fiabilidad de la información
añadida a la base? - Eficiencia computacional: ¿es viable ejecutar cientos
de búsquedas en producción? - Compartición de información: ¿cómo deberían
compartir conocimientos los agentes en dominios afines y en qué nivel? ¿La
información que aprende un agente se propaga al back-end general? Aunque estos
ejemplos son básicos, muestran el potencial de agentes que aprenden y
evolucionan con las interacciones de los usuarios. El paso de un modelo de
lenguaje genérico a un agente especializado y autoaprendiente apenas comienza, y
las posibilidades son tan emocionantes como vastas.

