Esta ha sido una de mis experiencias más gratificantes del año 2024: lanzar un curso en Frogames Formación para aprender en solamente 8 semanas sobre IA e Ingeniería de LLMs. Como parte del curso, desarrollamos una serie de proyectos comerciales importantes. El proyecto final es una conclusión fantástica: desarrollar una solución de Agente de IA autónoma que resuelve un problema empresarial complejo. Funciona mucho mejor de lo que imaginaba posible.
¿Aún no estás inscrito en el curso completo?
Accede a todo el contenido del curso Ingeniería de LLMs e IA Generativa y domina las técnicas más avanzadas de IA generativa. ¡No pierdas esta oportunidad para transformar tu carrera profesional! 🚀
Apúntate al curso ahoraA continuación, te incluyo una lista de enlaces y recursos útiles que acompañan el curso.
Repositorio de ingeniería de LLms, Configuraciones y Transparencias
- El repositorio Github del curso
- El README con instrucciones de configuración, y detalles específicos para PC y Mac
- Y las slides del curso, disponibles solamente en el curso de Frogames Formación
Nota importante: actualiza tu código después de cada semana
Regularmente envío actualizaciones a los laboratorios, que incluyen más consejos, aplicaciones comerciales y ejercicios. Vale la pena traer el código más reciente al comienzo de cada semana, comenzando con la Semana 2.
Primero, desde el directorio raíz del proyecto llm_engineering
, haz un pull de la última versión del proyecto desde git y luego haz un merge de cualquiera de tus cambios. Las instrucciones las tienes detalladas aquí para los que estéis menos familiarizados con git.
Luego, actualiza tu entorno para incorporar las bibliotecas más recientes. Si utilizaste Anaconda para configurar su entorno, en una ventana de Anaconda (PC) o Terminal (Mac), ejecuta:
conda env update --f environment.yml --prune
O si utilizaste virtualenv en lugar de Anaconda, ejecuta esto desde tu entorno activado en Powershell (PC) o Terminal (Mac):
pip install -r requirements.txt
Luego reinicia el kernel (menú Kernel >> Reiniciar kernel y borrar salidas de todas las celdas) para obtener los cambios.
Modelos de Frontier – Interfaz web
- ChatGPT (último modelo GPT-4o) de OpenAI
- Claude (último modelo Claude 3.5 Sonnet) de Anthropic
- Gemini Advance (último modelo Gemini 1.5 Pro) de Google
- Chat with Command R+ de Cohere
- Meta.ai (su modelo es Llama 3) de Meta
- Perplexity (últimos modelos Perplexity Pro) de Perplexity.ai
Modelos de Frontier – API
- GPT API de OpenAI
- Claude API de Anthropic
- Gemini API de Google
Otros enlaces útiles a modelos sobre ingeniería de LLMs
El artículo seminal de 2017 'La atención es todo lo que necesitas' de los científicos de Google que dieron origen al Transformer es este de aquí. Esta frase del Resumen lo dice todo:
Proponemos una nueva arquitectura de red simple, el Transformer, basada únicamente en mecanismos de atención, prescindiendo por completo de la recurrencia y las convoluciones.
El famoso artículo ‘Sobre los peligros de los loros estocásticos: ¿pueden los modelos lingüísticos ser demasiado grandes?’ que analizaba el sesgo y el engaño es este de aquí.
Se describe y vincula el generador de indicaciones de Anthropic en este otro.
Y aquí están las tablas de clasificación de Vellum , incluidos los costes y las ventanas de contexto.
Aquí está el juego creado por Ed, coinstructor del curso, llamado Outsmart, que enfrenta a los modelos entre sí en una batalla de negociación.
Herramientas comunes utilizadas en ingeniería de LLMs:
- Hugging Face – El centro de referencia para modelos, conjuntos de datos, tablas de clasificación e incluso aplicaciones, y los autores de muchos marcos esenciales de código abierto, incluida la biblioteca pionera de Transformers.
- LangChain – Librería de código abierto que proporciona abstracciones que conectan múltiples operaciones LLM bajo una API simple
- Gradio – Un marco de interfaz de usuario ridículamente simple que le permite crear prototipos de interfaz de usuario en una línea de código, sin necesidad de experiencia en interfaz de usuario.
- Weights & Biases – Herramientas para analizar y visualizar durante el entrenamiento.
- Google Colab – Escribe, evalúa y comparte cuadernos de forma remota en un box en Google Cloud
- Amazon SageMaker es una alternativa más amplia que incluye Notebooks
- Modal.com La plataforma de IA sin servidor
No cubiertos en eel curso: usando un servicio gestionado
- Amazon Bedrock es el servicio administrado de AWS:
“La forma más sencilla de crear y escalar aplicaciones de IA generativas con modelos básicos” - Vertex AI es el servicio administrado de Google Cloud:
“Innove más rápido con IA preparada para la empresa, mejorada con los modelos de Gemini” - Azure Machine Learning es el servicio administrado deMicrosoft.
“Desarrolle modelos de ML críticos para el negocio a escala”
Links a los ficheros de Google Colab
Deberías poder usar el nivel gratuito o el gasto mínimo para completar todos los proyectos de la clase. Personalmente, me registré en Colab Pro+ y me encanta, pero no es obligatorio.
Obtén más información sobre Google Colab y crea una cuenta de Google (si aún no tienes una) aquí
Los enlaces de Colab están en los ficheros respectivos de cada semana que los necesites en el curso de ingeniería de LLMs y también aquí:
- Para el día 1 de la semana 3, este Google Colab muestra lo que puedes hacer con Colab.
- Para el día 2 de la semana 3, aquí hay un Colab para HuggingFace y aprender a utilizar sus pipelines API
- Para el día 3 de la semana 3, aquí hay un Colab sobre Tokenizadores disponibles desde Hugging Face
- Para el día 4 de la semana 3, aquí hay un Colab para HuggingFace y aprender a utilizar sus modelos
- Para el día 4 de la semana 3, aquí hay un Colab para fabricar el resumen final de las Actas de Reunión, el proyecto que desarrollamos en esa tercera semana de curso de ingeniería de LLMs.
- Para la semana 7, volveremos a usar los siguientes notebooks de Colab: Día 1 | Día 2 | Días 3 and 4 | Día 5
Las Tablas de Clasificación y Arenas
- Hugging Face Open LLM
- Hugging Face Big Code
- Hugging Face LLM-Perf
- Todas las tablas de clasificación de Hugging Face leaderboards – medicas, en Portugués y más
- Vellum.ai Leaderboard – Incluye BBHard, además de comparación de costes y ventanas de contexto
- SEAL tablas de clasificación especializadas de Scale.ai
- AlpacaEval
- LMSYS Chatbot Arena y puedes contribuir con tus votos aquí
- OpenAI’s benchmark report desde su anuncio de GPT-4o
- Anthropic’s benchmark report desde su anuncio de Claude 3.5 Sonnet
Ejemplos reales de LLMs con impacto comercial
- Harvey.ai – Derecho
- Nebula.io – Talento (donde trabaja Ed, coinstructor del curso!)
- Bloop.ai – Tecnología (portando código obsoleto)
- Einstein Copilot: Health – Cuidado y salud médica
- Khanmigo – Educación
Extra – Links a Robotica
Robótica Humanoide:
Modelos de Rototica y Frameworks:
- GROOT de Nvidia
- RFM1 – 8B de parámetros de LLM para Robotica de Covariant
- LeRobot framework Hugging Face
Recreación de la visualización del conjunto de datos de robótica:
Consulta el repositorio LeRobot GitHub aquí y sigue sus instrucciones para configurarlo:
git clone https://github.com/huggingface/lerobot.git && cd lerobot conda create -y -n lerobot python=3.10 && conda activate lerobot pip install . pip install ".[aloha, pusht]"
Y luego, para visualizar el conjunto de datos del robot Aloha-Mobile cocinando un camarón, ejecuta la siguiente línea de código:
python lerobot/scripts/visualize_dataset.py --repo-id lerobot/aloha_mobile_shrimp --episode-index 0
Un Proyecto Extra para divertirte con la ingeniería de LLms
En el curso mencionamos mi experimento para entrenar un LLM con un historial de 240.000 mensajes de texto. El relato del instructor en inglés del curso, Ed Donner del proceso está aquí, y las siguientes publicaciones del blog te llevan a la aventura de replicarlo tú mismo.
Finalmente
¡Gracias por leer todos los recursos hasta el final! Avísame si hay algo que pueda agregar aquí y, por favor, conéctate conmigo en LinkedIn y mantente en contacto.
¿Aún no estás inscrito en el curso completo?
Accede a todo el contenido del curso Ingeniería de LLMs e IA Generativa y domina las técnicas más avanzadas de IA generativa. ¡No pierdas esta oportunidad para transformar tu carrera profesional! 🚀
Apúntate al curso ahora