Ingeniería de LLMs

Dominando la IA Generativa y la ingeniería de LLMs - Recursos

Juan Gabriel Gomila Juan Gabriel Gomila
9 minutos

Leer el artículo
Audio generated by DropInBlog's Blog Voice AI™ may have slight pronunciation nuances. Learn more

Esta ha sido una de mis experiencias más gratificantes del año 2024: lanzar un curso en Frogames Formación para aprender en solamente 8 semanas sobre IA e Ingeniería de LLMs. Como parte del curso, desarrollamos una serie de proyectos comerciales importantes. El proyecto final es una conclusión fantástica: desarrollar una solución de Agente de IA autónoma que resuelve un problema empresarial complejo. Funciona mucho mejor de lo que imaginaba posible.

¿Aún no estás inscrito en el curso completo?

Curso Ingeniería de LLMs

Accede a todo el contenido del curso Ingeniería de LLMs e IA Generativa y domina las técnicas más avanzadas de IA generativa. ¡No pierdas esta oportunidad para transformar tu carrera profesional! 🚀

Apúntate al curso ahora

A continuación, te incluyo una lista de enlaces y recursos útiles que acompañan el curso.

Repositorio de ingeniería de LLms, Configuraciones y Transparencias
Nota importante: actualiza tu código después de cada semana

Regularmente envío actualizaciones a los laboratorios, que incluyen más consejos, aplicaciones comerciales y ejercicios. Vale la pena traer el código más reciente al comienzo de cada semana, comenzando con la Semana 2.

Primero, desde el directorio raíz del proyecto llm_engineering, haz un pull de la última versión del proyecto desde git y luego haz un merge de cualquiera de tus cambios. Las instrucciones las tienes detalladas aquí para los que estéis menos familiarizados con git.

Luego, actualiza tu entorno para incorporar las bibliotecas más recientes. Si utilizaste Anaconda para configurar su entorno, en una ventana de Anaconda (PC) o Terminal (Mac), ejecuta:

conda env update --f environment.yml --prune

O si utilizaste virtualenv en lugar de Anaconda, ejecuta esto desde tu entorno activado en Powershell (PC) o Terminal (Mac):

pip install -r requirements.txt

Luego reinicia el kernel (menú Kernel >> Reiniciar kernel y borrar salidas de todas las celdas) para obtener los cambios.

Modelos de Frontier – Interfaz web
  1. ChatGPT (último modelo GPT-4o) de OpenAI
  2. Claude (último modelo Claude 3.5 Sonnet) de Anthropic
  3. Gemini Advance (último modelo Gemini 1.5 Pro) de Google
  4. Chat with Command R+ de Cohere
  5. Meta.ai (su modelo es Llama 3) de Meta
  6. Perplexity (últimos modelos Perplexity Pro) de Perplexity.ai
Modelos de Frontier – API
  1. GPT API de OpenAI
  2. Claude API de Anthropic
  3. Gemini API de Google
Otros enlaces útiles a modelos sobre ingeniería de LLMs

El artículo seminal de 2017 'La atención es todo lo que necesitas' de los científicos de Google que dieron origen al Transformer es este de aquí. Esta frase del Resumen lo dice todo:

Proponemos una nueva arquitectura de red simple, el Transformer, basada únicamente en mecanismos de atención, prescindiendo por completo de la recurrencia y las convoluciones.

El famoso artículo ‘Sobre los peligros de los loros estocásticos: ¿pueden los modelos lingüísticos ser demasiado grandes?’ que analizaba el sesgo y el engaño es este de aquí.

Se describe y vincula el generador de indicaciones de Anthropic en este otro.

Y aquí están las tablas de clasificación de  Vellum , incluidos los costes y las ventanas de contexto.

Aquí está el juego creado por Ed, coinstructor del curso, llamado Outsmart, que enfrenta a los modelos entre sí en una batalla de negociación.

Herramientas comunes utilizadas en ingeniería de LLMs:
  1. Hugging Face – El centro de referencia para modelos, conjuntos de datos, tablas de clasificación e incluso aplicaciones, y los autores de muchos marcos esenciales de código abierto, incluida la biblioteca pionera de Transformers.
  2. LangChain – Librería de código abierto que proporciona abstracciones que conectan múltiples operaciones LLM bajo una API simple
  3. Gradio – Un marco de interfaz de usuario ridículamente simple que le permite crear prototipos de interfaz de usuario en una línea de código, sin necesidad de experiencia en interfaz de usuario.
  4. Weights & Biases – Herramientas para analizar y visualizar durante el entrenamiento.
  5. Google Colab – Escribe, evalúa y comparte cuadernos de forma remota en un box en Google Cloud
  6. Modal.com La plataforma de IA sin servidor
No cubiertos en eel curso: usando un servicio gestionado
  1. Amazon Bedrock es el servicio administrado de AWS:
    “La forma más sencilla de crear y escalar aplicaciones de IA generativas con modelos básicos”
  2. Vertex AI es el servicio administrado de Google Cloud:
    “Innove más rápido con IA preparada para la empresa, mejorada con los modelos de Gemini”
  3. Azure Machine Learning es el servicio administrado deMicrosoft. 
    “Desarrolle modelos de ML críticos para el negocio a escala”
Links a los ficheros de Google Colab

Deberías poder usar el nivel gratuito o el gasto mínimo para completar todos los proyectos de la clase. Personalmente, me registré en Colab Pro+ y me encanta, pero no es obligatorio.

Obtén más información sobre Google Colab y crea una cuenta de Google (si aún no tienes una) aquí

Los enlaces de Colab están en los ficheros respectivos de cada semana que los necesites en el curso de ingeniería de LLMs y también aquí:

  • Para el día 1 de la semana 3, este Google Colab muestra lo que puedes hacer con Colab.
  • Para el día 2 de la semana 3, aquí hay un Colab para HuggingFace y aprender a utilizar sus pipelines API
  • Para el día 3 de la semana 3, aquí hay un Colab sobre Tokenizadores disponibles desde Hugging Face
  • Para el día 4 de la semana 3, aquí hay un Colab para HuggingFace y aprender a utilizar sus modelos
  • Para el día 4 de la semana 3, aquí hay un Colab para fabricar el resumen final de las Actas de Reunión, el proyecto que desarrollamos en esa tercera semana de curso de ingeniería de LLMs.
  • Para la semana 7, volveremos a usar los siguientes notebooks de Colab: Día  1 | Día 2 | Días 3 and 4 | Día  5
Las Tablas de Clasificación y Arenas
Ejemplos reales de LLMs con impacto comercial
Extra – Links a Robotica

Robótica Humanoide:

Modelos de Rototica y Frameworks:

  • GROOT de Nvidia
  • RFM1 – 8B de parámetros de LLM para Robotica de Covariant
  • LeRobot framework Hugging Face

Recreación de la visualización del conjunto de datos de robótica:

Consulta el repositorio LeRobot GitHub  aquí y sigue sus instrucciones para configurarlo:

git clone https://github.com/huggingface/lerobot.git && cd lerobot 
conda create -y -n lerobot python=3.10 && conda activate lerobot 
pip install . 
pip install ".[aloha, pusht]" 

Y luego, para visualizar el conjunto de datos del robot Aloha-Mobile cocinando un camarón, ejecuta la siguiente línea de código:

python lerobot/scripts/visualize_dataset.py --repo-id lerobot/aloha_mobile_shrimp --episode-index 0
Un Proyecto Extra para divertirte con la ingeniería de LLms

En el curso mencionamos mi experimento para entrenar un LLM con un historial de 240.000 mensajes de texto. El relato del instructor en inglés del curso, Ed Donner del proceso está aquí, y las siguientes publicaciones del blog te llevan a la aventura de replicarlo tú mismo.

Finalmente

¡Gracias por leer todos los recursos hasta el final! Avísame si hay algo que pueda agregar aquí y, por favor, conéctate conmigo en LinkedIn y mantente en contacto.

¿Aún no estás inscrito en el curso completo?

Accede a todo el contenido del curso Ingeniería de LLMs e IA Generativa y domina las técnicas más avanzadas de IA generativa. ¡No pierdas esta oportunidad para transformar tu carrera profesional! 🚀

Apúntate al curso ahora

« Volver al Blog

Obtener mi regalo ahora