¿Qué es un LLM?
La historia que explica TODA la IA de hoy
Un solo problema —detectar si un texto es positivo o negativo— resuelto en 5 eras. Cuando termines, tendrás el mapa mental que casi nadie tiene.
El problema que lo explica todo
Eres ingeniero. Por cada tuit que llega, di si es positivo o negativo. Eso es todo. ¿Cómo lo resolverías?
La respuesta a esta pregunta tan simple ha cambiado 5 veces en 25 años. Entender por qué = entender ChatGPT, Claude y los agentes.
La era de los diccionarios
Una lista de palabras buenas, otra de malas. Sumas y restas puntos. Simple… y frágil.
"me encanta este sitio"
→ genial(+1) → POSITIVO ✓
"recomendable si quieres
tirar el dinero"
→ recomendable(+1) → POSITIVO ✗
Contar palabras no es entender. Sin contexto, el lenguaje humano es imposible.
Deep learning… y el infierno de etiquetar
Las redes neuronales aprenden solas la relación texto → sentimiento. Pero hay una trampa: el aprendizaje supervisado.
Humanos etiquetando
Miles de tuits marcados a mano: "positivo", "negativo". Trabajo, dinero y tiempo.
Cambio de planes
¿Ahora de 1 a 5 estrellas? A reetiquetar TODO desde cero. Tarea nueva = dataset nuevo.
La cadena de la época: una tarea nueva = un dataset nuevo = un entrenamiento nuevo.
Así aprende una red neuronal
En el entrenamiento ajusta millones de conexiones hasta acertar la salida. Aprende ella sola la relación entrada → salida, sin reglas escritas a mano.
Para texto: redes recurrentes
Leen la frase palabra a palabra, arrastrando la memoria de lo anterior para predecir lo siguiente.
Cada celda pasa su “memoria” a la siguiente → así capta el contexto de la secuencia. Predecir la palabra que falta será la clave del entrenamiento moderno.
Transformers + aprendizaje autosupervisado
El golpe de genio: no pagamos por etiquetar. Le damos ejercicios de cuaderno de colegio.
texto, etiqueta ← humano
"qué bien", positivo
"qué mal", negativo
... (carísimo)
"el gato se subió al ___"
→ predice: "tejado"
# pregunta + respuesta
# GRATIS y a escala
Nacen Hugging Face 🤗, BERT, T5… modelos preentrenados que descargas gratis. pipeline("sentiment-analysis") en 3 líneas.
La arquitectura Transformer
La clave es la atención: cada palabra “mira” a todas las demás y pesa cuáles importan. Por eso entiende el contexto mejor que cualquier red anterior.
GPT-3 y las habilidades emergentes
175.000 millones de parámetros. Solo se le entrenó para UNA cosa: autocompletar texto. Pero al escalar…
Traduce
Programa
return a + b
Chatea
Nadie le enseñó a hacer nada de esto. Emergió solo al hacerlo más grande.
El problema, resuelto sin entrenar nada
Volvemos a nuestro tuit. Solo escribiendo un prompt:
"esta librería está genial" → positivo
"tener que hacer esto" → ? # acierta solo
# ¿clasificar Harry Potter vs. El Señor de los Anillos?
"Cuenta con mi hacha" → El Señor de los Anillos
"Dobby es libre" → Harry Potter
Diccionario (2000s) → dataset carísimo (2012) → fine-tuning (2017) → una frase bien escrita (2020). Eso es un LLM.
Prueba tú mismo todos estos ejemplos en el notebook (Google Colab)Todo va de quitar trabajo humano y meter escala
25 años en una sola dirección:
- menos reglas a mano
- menos etiquetas a mano
- modelos cada vez más grandes
- y cada vez que escalamos… emerge inteligencia que nadie programó
Esa idea explica todo lo que ha pasado. Y todo lo que viene.
De LLMs a agentes
Dale a un LLM herramientas, memoria y capacidad de actuar paso a paso…
- Responde y para
- Sin memoria
- No hace, solo dice
- Usa herramientas
- Recuerda y planifica
- Actúa por ti, paso a paso
Esa es la revolución que vivimos ahora mismo, en 2026.
De usar la IA
a construirla
El camino entero, ordenado y de cero a experto:
Suscríbete · enlace en la descripción y en el comentario fijado
Agentes de Inteligencia Artificial
Ya sabes qué es un LLM. Ahora dale herramientas, memoria y autonomía y conviértelo en un agente. Aprende a construirlos de cero a experto.