Dominando la IA Generativa y la ingeniería de LLMs - Recursos

Juan Gabriel Gomila IA | Recursos | LLM
17/12/2024 12:00pm 9 minutos

Leer el artículo

Audio generated by DropInBlog's Blog Voice AI™ may have slight pronunciation nuances. Learn more

Esta ha sido una de mis experiencias más gratificantes del año 2024: lanzar un curso en Frogames Formación para aprender en solamente 8 semanas sobre IA e Ingeniería de LLMs. Como parte del curso, desarrollamos una serie de proyectos comerciales importantes. El proyecto final es una conclusión fantástica: desarrollar una solución de Agente de IA autónoma que resuelve un problema empresarial complejo. Funciona mucho mejor de lo que imaginaba posible.

El curso original en inglés, ideado por Edward Donner con sus recursos originales se puede consultar en su propio portal web.

¿Aún no estás inscrito en el curso completo?

Accede a todo el contenido del curso Ingeniería de LLMs e IA Generativa y domina las técnicas más avanzadas de IA generativa. ¡No pierdas esta oportunidad para transformar tu carrera profesional! 🚀

Apúntate al curso ahora

A continuación, te incluyo una lista de enlaces y recursos útiles que acompañan el curso.

Repositorio de ingeniería de LLms, Configuraciones y Transparencias

El repositorio Github del curso
El README con instrucciones de configuración, y detalles específicos para PC y Mac
Y las slides del curso, disponibles solamente en el curso de Frogames Formación

Nota importante: actualiza tu código después de cada semana

Regularmente envío actualizaciones a los laboratorios, que incluyen más consejos, aplicaciones comerciales y ejercicios. Vale la pena traer el código más reciente al comienzo de cada semana, comenzando con la Semana 2.

Primero, desde el directorio raíz del proyecto llm_engineering, haz un pull de la última versión del proyecto desde git y luego haz un merge de cualquiera de tus cambios. Las instrucciones las tienes detalladas aquí para los que estéis menos familiarizados con git.

Luego, actualiza tu entorno para incorporar las bibliotecas más recientes. Si utilizaste Anaconda para configurar su entorno, en una ventana de Anaconda (PC) o Terminal (Mac), ejecuta:

conda env update --f environment.yml --prune

O si utilizaste virtualenv en lugar de Anaconda, ejecuta esto desde tu entorno activado en Powershell (PC) o Terminal (Mac):

pip install -r requirements.txt

Luego reinicia el kernel (menú Kernel >> Reiniciar kernel y borrar salidas de todas las celdas) para obtener los cambios.

Modelos de Frontier – Interfaz web

ChatGPT (último modelo GPT-4o) de OpenAI
Claude (último modelo Claude 3.5 Sonnet) de Anthropic
Gemini Advance (último modelo Gemini 1.5 Pro) de Google
Chat with Command R+ de Cohere
Meta.ai (su modelo es Llama 3) de Meta
Perplexity (últimos modelos Perplexity Pro) de Perplexity.ai

Modelos de Frontier – API

GPT API de OpenAI
Claude API de Anthropic
Gemini API de Google

Otros enlaces útiles a modelos sobre ingeniería de LLMs

El artículo seminal de 2017 'La atención es todo lo que necesitas' de los científicos de Google que dieron origen al Transformer es este de aquí. Esta frase del Resumen lo dice todo:

Proponemos una nueva arquitectura de red simple, el Transformer, basada únicamente en mecanismos de atención, prescindiendo por completo de la recurrencia y las convoluciones.

El famoso artículo ‘Sobre los peligros de los loros estocásticos: ¿pueden los modelos lingüísticos ser demasiado grandes?’ que analizaba el sesgo y el engaño es este de aquí.

Se describe y vincula el generador de indicaciones de Anthropic en este otro.

Y aquí están las tablas de clasificación de Vellum , incluidos los costes y las ventanas de contexto.

Aquí está el juego creado por Ed, coinstructor del curso, llamado Outsmart, que enfrenta a los modelos entre sí en una batalla de negociación.

Herramientas comunes utilizadas en ingeniería de LLMs:

Hugging Face – El centro de referencia para modelos, conjuntos de datos, tablas de clasificación e incluso aplicaciones, y los autores de muchos marcos esenciales de código abierto, incluida la biblioteca pionera de Transformers.
LangChain – Librería de código abierto que proporciona abstracciones que conectan múltiples operaciones LLM bajo una API simple
Gradio – Un marco de interfaz de usuario ridículamente simple que le permite crear prototipos de interfaz de usuario en una línea de código, sin necesidad de experiencia en interfaz de usuario.
- Alternativas incluyen Streamlit, Dash y la más reciente Mesop de Google
Weights & Biases – Herramientas para analizar y visualizar durante el entrenamiento.
Google Colab – Escribe, evalúa y comparte cuadernos de forma remota en un box en Google Cloud
- Amazon SageMaker es una alternativa más amplia que incluye Notebooks
Modal.com La plataforma de IA sin servidor

No cubiertos en el curso: usando un servicio gestionado

Amazon Bedrock es el servicio administrado de AWS:
“La forma más sencilla de crear y escalar aplicaciones de IA generativas con modelos básicos”
Vertex AI es el servicio administrado de Google Cloud:
“Innove más rápido con IA preparada para la empresa, mejorada con los modelos de Gemini”
Azure Machine Learning es el servicio administrado deMicrosoft.
“Desarrolle modelos de ML críticos para el negocio a escala”

Links a los ficheros de Google Colab

Deberías poder usar el nivel gratuito o el gasto mínimo para completar todos los proyectos de la clase. Personalmente, me registré en Colab Pro+ y me encanta, pero no es obligatorio.

Obtén más información sobre Google Colab y crea una cuenta de Google (si aún no tienes una) aquí

Los enlaces de Colab están en los ficheros respectivos de cada semana que los necesites en el curso de ingeniería de LLMs y también aquí:

Para el día 1 de la semana 3, este Google Colab muestra lo que puedes hacer con Colab.
Para el día 2 de la semana 3, aquí hay un Colab para HuggingFace y aprender a utilizar sus pipelines API
Para el día 3 de la semana 3, aquí hay un Colab sobre Tokenizadores disponibles desde Hugging Face
Para el día 4 de la semana 3, aquí hay un Colab para HuggingFace y aprender a utilizar sus modelos
Para el día 4 de la semana 3, aquí hay un Colab para fabricar el resumen final de las Actas de Reunión, el proyecto que desarrollamos en esa tercera semana de curso de ingeniería de LLMs.
Para la semana 7, volveremos a usar los siguientes notebooks de Colab: Día 1 | Día 2 | Días 3 and 4 | Día 5

Las Tablas de Clasificación y Arenas

Hugging Face Open LLM
Hugging Face Big Code
Hugging Face LLM-Perf
Todas las tablas de clasificación de Hugging Face leaderboards – medicas, en Portugués y más
Vellum.ai Leaderboard – Incluye BBHard, además de comparación de costes y ventanas de contexto
SEAL tablas de clasificación especializadas de Scale.ai
AlpacaEval
LMSYS Chatbot Arena y puedes contribuir con tus votos aquí
OpenAI’s benchmark report desde su anuncio de GPT-4o
Anthropic’s benchmark report desde su anuncio de Claude 3.5 Sonnet

Ejemplos reales de LLMs con impacto comercial

Harvey.ai – Derecho
Nebula.io – Talento (donde trabaja Ed, coinstructor del curso!)
Bloop.ai – Tecnología (portando código obsoleto)
Einstein Copilot: Health – Cuidado y salud médica
Khanmigo – Educación

Extra – Links a Robotica

Robótica Humanoide:

Phoenix de Sanctuary
Figure 01 de Figure

Modelos de Rototica y Frameworks:

GROOT de Nvidia
RFM1 – 8B de parámetros de LLM para Robotica de Covariant
LeRobot framework Hugging Face

Recreación de la visualización del conjunto de datos de robótica:

Consulta el repositorio LeRobot GitHub aquí y sigue sus instrucciones para configurarlo:

git clone https://github.com/huggingface/lerobot.git && cd lerobot 
conda create -y -n lerobot python=3.10 && conda activate lerobot 
pip install . 
pip install ".[aloha, pusht]"

Y luego, para visualizar el conjunto de datos del robot Aloha-Mobile cocinando un camarón, ejecuta la siguiente línea de código:

python lerobot/scripts/visualize_dataset.py --repo-id lerobot/aloha_mobile_shrimp --episode-index 0

Un Proyecto Extra para divertirte con la ingeniería de LLms

En el curso mencionamos mi experimento para entrenar un LLM con un historial de 240.000 mensajes de texto. El relato del instructor en inglés del curso, Ed Donner del proceso está aquí, y las siguientes publicaciones del blog te llevan a la aventura de replicarlo tú mismo.

Finalmente

¡Gracias por leer todos los recursos hasta el final! Avísame si hay algo que pueda agregar aquí y, por favor, conéctate conmigo en LinkedIn y mantente en contacto.

¿Aún no estás inscrito en el curso completo?

Apúntate al curso ahora

« Volver al Blog

Dominando la IA Generativa y la ingeniería de LLMs - Recursos

¿Aún no estás inscrito en el curso completo?

Repositorio de ingeniería de LLms, Configuraciones y Transparencias

Nota importante: actualiza tu código después de cada semana

Modelos de Frontier – Interfaz web

Modelos de Frontier – API

Otros enlaces útiles a modelos sobre ingeniería de LLMs

Herramientas comunes utilizadas en ingeniería de LLMs:

No cubiertos en el curso: usando un servicio gestionado

Links a los ficheros de Google Colab

Las Tablas de Clasificación y Arenas

Ejemplos reales de LLMs con impacto comercial

Extra – Links a Robotica

Un Proyecto Extra para divertirte con la ingeniería de LLms

Finalmente

¿Aún no estás inscrito en el curso completo?

Artículos relacionados

Black Mirror se vuelve real: ajustar un LLM con mensajes de texto

Guía paso a paso: perfecciona un LLM en tus textos (parte 1)

Cómo ajustar un modelo LLM con tus datos de texto (parte 2)

Nuestro curso de Unity te sale GRATIS