Ir al contenido
Agentes LLM de Autoaprendizaje: un enfoque fractal para el conocimiento específico de dominio

Agentes LLM de Autoaprendizaje: un enfoque fractal para el conocimiento específico de dominio

← Todos los Posts

TEXTO EN ESPAÑOL MEJORADO Durante su entrenamiento, los LLM adquieren una

sólida comprensión del lenguaje; sin embargo, están limitados por un punto de corte temporal fijo en cuanto a conocimientos. Además, se optimizan para rendir de forma general en múltiples dominios, lo que los hace versátiles y amplios, aunque no siempre profundos. De forma predeterminada, suelen producir respuestas genéricas e información superficial. Muy pronto se popularizó el paradigma de dejar que los LLM se ocupen del lenguaje y la semántica, mientras que mecanismos separados aportan el conocimiento especializado. El modo predominante de inyectar ese conocimiento es la Generación Aumentada con Recuperación (RAG, del inglés Retrieval-Augmented Generation), en la que el saber de dominio se almacena como vectores y se consulta mediante técnicas de búsqueda estándar. Este enfoque dota a los LLM de conocimientos especializados bastante profundos, pero también crea un problema fractal: el motor de respaldo (back-end) RAG puede quedar obsoleto y requerir actualizaciones. Por ello, se han añadido herramientas de búsqueda que permiten a los LLM invocar Google u otros buscadores para obtener información más reciente. Aun así, esto no elimina por completo la necesidad del back-end RAG, pues sigue siendo ventajoso contar con conocimientos específicos más allá de lo que aporten unas cuantas búsquedas en Google. En 2389 creemos que el futuro es multiagente. En lugar de depender de un único agente monolítico, interactuarás con cientos o miles de agentes. En una conversación, un agente de viajes gestiona los vuelos, un agente hotelero las reservas y un agente gastronómico selecciona restaurantes locales según tus preferencias. ## ¿Pueden aprender los agentes? Una de las grandes limitaciones teóricas es: ¿cómo permitir que miles de agentes desarrollen conocimientos especializados de dominio? Tradicionalmente, crear bases de conocimiento implicaba construir y mantener cada una a mano, algo que claramente no escala. Uno de mis intereses personales consiste en averiguar cómo lograr que un agente aprenda por sí mismo. ¿Es factible darle rienda suelta para que, con el tiempo, desarrolle su propia especialización y se adapte a los intereses del usuario? Incluso si el mismo agente está disponible de forma general, una versión personalizada podría ajustarse no solo en estilo y respuestas, sino también en su conocimiento subyacente. Esta entrada explora algunos experimentos recientes sobre agentes autoaprendientes. He estado trabajando en dos proyectos: 1. Creación autónoma de bases de conocimiento: ¿Puede un agente construir su propia base sobre un tema a partir de información mínima? Esto apunta a disponer de miles de agentes sin configurarlos uno por uno. 2. Aumento interactivo del conocimiento: Con un proceso similar, ¿puede un agente reflexionar sobre interacciones recientes, detectar lagunas en su conocimiento o áreas de interés del usuario y reunir información para ampliarlo? — ## Naturaleza fractal de los agentes LLM Gran parte de mi trabajo para este artículo se inspira, aunque de forma laxa, en proyectos como Co-Scientist de Google y el artículo Agent Laboratory, en los que varios agentes realizan múltiples pasadas sobre una actividad para perfeccionar una idea o profundizar en temas siguiendo un diseño fractal. Por ejemplo, Google Co-Scientist emplea ciclos iterativos de verificación: se genera una idea, otros agentes la puntúan y se refina a lo largo de varias iteraciones. En el artículo Agent Laboratory, los agentes rotan entre roles —investigador posdoctoral, estudiante de doctorado, ingeniero de software e ingeniero de aprendizaje automático— para probar y pulir iterativamente posibles ideas de publicaciones académicas. Como científico de datos en la industria del comercio electrónico, gran parte de mi trabajo se ha centrado en algoritmos de búsqueda semántica en el back-end. Al implementar agentes con back-end RAG, todo suele reducirse a una búsqueda semántica de tipo fractal —ya sea RAG, GraphRAG u otra variante—. De forma análoga, el concepto de agente autoaprendiente consiste en permitir que un agente examine una idea o conversación inicial, extraiga elementos de interés, jerga o conceptos y luego investigue ideas relacionadas. Repetir este proceso en distintos niveles de profundidad genera una investigación cada vez más detallada sobre un tema. — ## De novato a casi experto No afirmo que los agentes se conviertan en expertos absolutos tras pasar por este proceso, pero sí aprenden detalles interesantes y generan respuestas más atractivas que sus equivalentes de fábrica. La clave es permitir que un agente decida cómo utilizar la herramienta de búsqueda. Para ello realiza varias rondas en forma fractal con ciclos de introspección. El proceso funciona así: 1. El agente recibe una consulta o tema y lo descompone en un conjunto de consultas de alto nivel. El objetivo de esta primera pasada es reunir un superconjunto de información: cronologías, principios de diseño y temas generales. 2. Después recupera conjuntos de resultados de búsqueda para ese superconjunto. Estos sitios se transforman en un formato similar a Markdown y, de cada uno, se extraen conceptos, ideas y temas. Esto permite rondas adicionales de búsqueda basadas en la nueva información descubierta. ### Ejemplo: cocina francesa En una prueba, hice que el agente aprendiera sobre cocina francesa con el siguiente prompt: > «French Cuisine, regional specialties, ingredients, cooking principles, dishes, recipes» A partir de ello, el agente generó una lista de temas de alto nivel para investigar: 1. Tema: Regiones de Francia y sus características culinarias Objetivo: Identificar y clasificar las distintas regiones de Francia para explorar sus tradiciones y especialidades culinarias únicas. 2. Tema: Ingredientes comunes en la cocina francesa Objetivo: Elaborar una lista completa de ingredientes fundamentales en la cocina francesa y analizar las diferencias regionales y las recetas tradicionales. 3. Tema: Técnicas de cocina fundamentales en la gastronomía francesa Objetivo: Recopilar información sobre los métodos esenciales de preparación para entender los principios detrás de cada plato. 4. Tema: Platos tradicionales franceses por región Objetivo: Crear una lista de platos icónicos específicos de cada región para comprender su relevancia cultural. 5. Tema: Recetas de platos clásicos franceses Objetivo: Reunir un conjunto de recetas de platos emblemáticos que ejemplifiquen las técnicas e ingredientes identificados. Basándose en estos temas, el agente creó consultas más específicas: Searching (1/34): List of regions in France with descriptions Searching (2/34): Famous regional dishes in France by region Searching (3/34): Local ingredients specific to French regions Searching (4/34): Traditional French cooking methods by region Searching (5/34): List of notable chefs and culinary schools in France by region Searching (6/34): Traditional recipes from each region of France Searching (7/34): Common ingredients in French cuisine Searching (8/34): French cooking techniques Searching (9/34): Regional specialties of French cuisine # (consultas originales en inglés) En la primera ronda, el agente recopila un superconjunto de información sobre cocina francesa. Luego realiza rondas adicionales de búsqueda usando el contexto de los artículos iniciales, profundizando en los detalles de cada región y sus matices culinarios. En el fragmento siguiente se observa cómo ahonda en las cocinas de las distintas regiones de Francia. Una vez terminado el proceso, podemos añadir todos los artículos al back-end RAG de este agente. Expanded search (1/40): List of culinary specialties by region in France Expanded search (2/40): Overview of administrative regions of France Expanded search (3/40): Historical recipes by French region Expanded search (4/40): Culinary characteristics of French overseas regions Expanded search (5/40): Culinary specialties of Provence-Alpes-Côte d'Azur Expanded search (6/40): Culinary specialties of Brittany Expanded search (7/40): Culinary specialties of Hauts-de-France Expanded search (8/40): Culinary specialties of Normandy Expanded search (9/40): Culinary specialties of Île-de-France Expanded search (10/40): Culinary specialties of Grand Est Expanded search (11/40): Culinary specialties of Occitania # (consultas originales en inglés) ### Prueba de la base de conocimiento Como verificación rápida, ejecuté una consulta de ejemplo tanto en GPT-4o-mini mediante un cliente web (con búsqueda activada) como en mi agente personalizado (GPT-4o-mini con acceso al nuevo back-end de cocina francesa). ### Consulta de ejemplo: «¿Cuáles son las especialidades regionales de Normandía?» Salida genérica de GPT-4o-mini (en inglés): > Normandy has a ton of unique culinary treats that capture its history and local ingredients. Highlights include cheeses like Camembert de Normandie, Pont-l’Évêque, and Neufchâtel; apple-based treats from its orchards, including cider and Calvados; fresh seafood due to its extensive coastline; rich dairy products; and hearty traditional dishes like Tripes à la mode de Caen. La respuesta era razonable pero genérica. Veamos qué hace el nuevo agente. ### Procedimiento de respuesta del nuevo agente 1. Descomposición de la consulta - Regional specialties of Normandy - Normandy food traditions - Traditional dishes from Normandy 2. Búsqueda en el back-end y agregación El agente consulta su base para cada búsqueda refinada, extrae contexto y genera una respuesta completa a partir de los resultados agregados. 3. Ejemplo de respuesta final (traducida) > Normandía es famosa por sus ricas tradiciones culinarias y especialidades regionales, caracterizadas por una combinación de ingredientes locales, influencias históricas y platos distintivos. A continuación, algunos destacados:

1. Quesos > > - Camembert de Normandía: queso blando de corteza

enmohecida e interior cremoso. > - Livarot: forma cilíndrica rodeada por tiras de paja trenzada; corteza lavada. > - Pont-l’Évêque: queso cuadrado con corteza anaranjada característica. > - Neufchâtel: queso blando, a menudo con forma de corazón. > > ### 2. Mariscos > > - Mejillones con crema normanda: se sirven con crème fraîche local o salsas a base de queso. > - Moluscos y crustáceos: vieiras, ostras y gambas; destacan platos como Marmite Dieppoise (estofado de pescado) y Moules à la crème (mejillones en salsa de crema). > > ### 3. Platos de carne > > - Cordero prés-salés: criado en marismas salinas cerca del Mont-Saint-Michel. > - Callos à la mode de Caen: guiso lento de callos enriquecido con sidra local. > - Andouille de Vire: embutido sazonado elaborado con tripa de cerdo. > > ### 4. Sidra y Calvados > > - Cidre: bebida emblemática disponible en estilos que van de seco a dulce. > - Calvados: aguardiente de manzana que se bebe solo o se usa en salsas. > > ### 5. Repostería y postres > > - Tarte normande: tarta de manzana que refleja la tradición manzanera de la región. > - Galettes y crêpes: tortitas saladas de trigo sarraceno y crêpes dulces, a menudo acompañadas de sidra. > > Conclusión > La gastronomía de Normandía suele resumirse en las «cuatro C» (Cider, Calvados, Cream y Camembert). Ya sea a través de sus quesos exquisitos, mariscos frescos o contundentes platos de carne, Normandía ofrece una experiencia culinaria profundamente arraigada en la tradición. Un miembro de nuestro equipo, cuya familia es de Normandía, respaldó los resultados, así que lo consideramos un éxito inicial. — ## Dejar que los agentes aprendan con el tiempo La segunda parte del experimento analiza si un agente puede aprender a partir de las consultas o conversaciones del usuario, de manera que la versión personal del agente se especialice respecto al agente base. El proceso es similar al de investigar desde cero, pero con pasos adicionales: - Generación de consultas (query generation): el agente usa un LLM para crear consultas candidatas basadas en el contexto actual y en las lagunas de su conocimiento. - Puntuación de consultas (query scoring): cada una se evalúa (por ejemplo, de 0 a 100) según relevancia, novedad y alineación con el contexto del usuario. - Selección de las N mejores: se filtran las consultas con puntuación superior a un umbral. Si no hay suficientes, se repite la generación (con un límite para evitar bucles). - Ejecución de búsquedas: para cada consulta seleccionada, el agente realiza búsquedas semánticas o vectoriales y recupera los K mejores resultados. - Procesado e ingestión de resultados: los resultados se analizan para extraer información útil, que se incorpora a la base de conocimiento en evolución del agente. - Actualización de la base e índices: se integran los nuevos datos y se actualizan los índices de búsqueda semántica, de modo que el repositorio permanezca enriquecido y vigente. ### Ejemplo: actualización del conocimiento sobre restaurantes Resumen de conversación: Preguntó por restaurantes en West Loop, Chicago; mostró interés en cocina italiana, francesa y japonesa. También manifestó curiosidad por los chefs de Smyth y Loyalist. La base de conocimiento del agente cubre unos cientos de restaurantes, pero carece de detalles actualizados sobre chefs, menús vigentes o enfoques culinarios singulares. Generación de consultas Selected top 3 queries: 1. ¿Cuál es la trayectoria y la filosofía culinaria de los chefs de Smyth y Loyalist? (Puntuación: 90) 2. ¿Cuáles son los platos insignia y los ingredientes únicos que se utilizan en los restaurantes franceses de West Loop? (Puntuación: 88) 3. ¿Existen experiencias o eventos gastronómicos especiales en Smyth o Loyalist que atraigan comensales? (Puntuación: 85) # (consultas traducidas al español) El agente detecta que su conocimiento sobre restaurantes en West Loop es aceptable, pero carece de detalles sobre Smyth y Loyalist. Dos de las tres consultas se centran en esa carencia, mientras que la tercera cubre ingredientes característicos de la cocina francesa en la zona. Tras ejecutar las consultas, el agente descarga páginas relevantes, las procesa como Markdown y las integra en su back-end RAG. Para la consulta «Chef John Shields» (chef ejecutivo de Smyth y Loyalist), los dos primeros resultados son: - Resultado 1 Título: Smyth | Smyth and The Loyalist URL: https://www.smythandtheloyalist.com/smyth/ Contenido: > El restaurante Smyth, de tres estrellas Michelin —uno de solo trece en el país con tal distinción—, eleva la labor de agricultores y pescadores norteamericanos en el apogeo de su temporada. Los chefs John Shields y Karen Urie Shields aportan treinta años de experiencia culinaria en lugares como Alinea, Tru y Charlie Trotter’s. - Resultado 2 Nombre: John’s Food and Wine Descripción: Local New American que ofrece un menú estacional con platos como beef tartare y caballa entera a la parrilla en un ambiente informal. Aunque algunos resultados posteriores sean menos relevantes, el agente puede sintetizar suficiente contexto útil para responder preguntas sobre el chef John Shields. — ## Reflexiones finales Estos experimentos son pasos modestos hacia la creación de agentes que aprendan y se adapten a partir de sus interacciones con los usuarios, un avance hacia disponer de miles de agentes sin configurarlos manualmente. Aun así, quedan muchos retos y líneas futuras de trabajo: - Verificación de la calidad: ¿cómo comprobar la fiabilidad de la información añadida a la base? - Eficiencia computacional: ¿es viable ejecutar cientos de búsquedas en producción? - Compartición de información: ¿cómo deberían compartir conocimientos los agentes en dominios afines y en qué nivel? ¿La información que aprende un agente se propaga al back-end general? Aunque estos ejemplos son básicos, muestran el potencial de agentes que aprenden y evolucionan con las interacciones de los usuarios. El paso de un modelo de lenguaje genérico a un agente especializado y autoaprendiente apenas comienza, y las posibilidades son tan emocionantes como vastas.

Más Posts

4 posts · 8.723 words · ~43 min total read · 11 tags · hugo 0.148.2 · eb1f81b · built Feb 3 22:49
2389 Radio
2389 RADIO Select a station