Cómo usar BERT para análisis de sentimientos paso a paso (sin morir en el intento)

Juan Gabriel Gomila IA
21/02/2026 12:00pm 9 minutos

Leer el artículo

Audio generated by DropInBlog's Blog Voice AI™ may have slight pronunciation nuances. Learn more

Contenidos

¿Por qué usar BERT para análisis de sentimientos?
Paso 1: Preparación del entorno
Paso 2: Recolección y limpieza de datos
Paso 3: Tokenización con BERT
Paso 4: Preparar los datos para entrenamiento
Paso 5: Cargar un modelo preentrenado
Paso 6: Entrenamiento del modelo
Paso 7: Evaluación del modelo
Paso 8: Uso práctico del modelo
Consejos finales para no morir en el intento
Conclusión
Aprende sobre Inteligencia Artificial con la Ruta de Frogames Formación
FAQs

Si alguna vez te has enfrentado a grandes cantidades de texto y has querido entender lo que opinan los usuarios sobre un producto, un servicio o una marca, sabrás que hacerlo manualmente es prácticamente imposible. Ahí es donde entra BERT para análisis de sentimientos, una técnica basada en inteligencia artificial que ha revolucionado la forma de interpretar el lenguaje natural. En este post te voy a guiar paso a paso para que aprendas a usar BERT sin morir en el intento, desde la preparación de los datos hasta obtener resultados claros y comprensibles.

¿Por qué usar BERT para análisis de sentimientos?

Antes de sumergirnos en el cómo, conviene entender el qué. BERT (Bidirectional Encoder Representations from Transformers) es un modelo de lenguaje desarrollado por Google que destaca por su capacidad de comprender el contexto de las palabras dentro de una frase. A diferencia de modelos más simples, BERT no lee el texto de forma unidireccional, sino que analiza cada palabra considerando lo que hay antes y después de ella. Esto lo hace ideal para tareas complejas de procesamiento del lenguaje natural (NLP), como BERT para análisis de sentimientos.

Cuando hablamos de análisis de sentimientos, nos referimos a clasificar textos según la emoción o la opinión que expresan: positiva, negativa o neutral. Con BERT, puedes detectar matices que otros modelos podrían pasar por alto, como la ironía, los dobles sentidos o expresiones coloquiales.

Paso 1: Preparación del entorno

Antes de empezar a entrenar modelos, necesitas preparar tu entorno de trabajo. Lo habitual es usar Python junto con librerías como Transformers de Hugging Face, PyTorch o TensorFlow.

Instala las librerías necesarias:


pip install transformers torch scikit-learn pandas numpy

Asegúrate de tener acceso a GPU si trabajas con grandes volúmenes de datos, ya que BERT es exigente en recursos.
Prepara un entorno limpio con Jupyter Notebook o cualquier IDE que te permita ir probando el código paso a paso.

Paso 2: Recolección y limpieza de datos

El siguiente paso es conseguir los datos que vas a analizar. Puede ser un dataset público o tus propios comentarios, reseñas o tweets. La limpieza de los datos es crucial: elimina caracteres innecesarios, convierte todo a minúsculas y maneja los valores nulos.


import pandas as pd

# Carga de datos
df = pd.read_csv("comentarios.csv")

# Limpieza básica
df['texto'] = df['texto'].str.lower().str.replace(r'[^\w\s]', '', regex=True)
df = df.dropna(subset=['texto', 'sentimiento'])

Recuerda que para BERT para análisis de sentimientos, cada texto debe estar etiquetado con su clase (positiva, negativa, neutral), especialmente si vas a entrenar tu propio modelo.

Paso 3: Tokenización con BERT

BERT no entiende texto plano; necesita que el texto se convierta en tokens. Para ello usamos el tokenizador de Hugging Face.


from transformers import BertTokenizer

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

# Ejemplo de tokenización
ejemplo = "Me encanta este producto"
tokens = tokenizer(ejemplo, padding='max_length', max_length=64, truncation=True, return_tensors="pt")

Esta tokenización prepara tus datos para el modelo, ajustando la longitud y añadiendo los tokens especiales que BERT necesita.

Paso 4: Preparar los datos para entrenamiento

Una vez tokenizados los textos, debes convertirlos en tensores y dividirlos en conjuntos de entrenamiento y validación.


from sklearn.model_selection import train_test_split
import torch

X = df['texto'].tolist()
y = df['sentimiento'].map({'positiva':0, 'neutral':1, 'negativa':2}).tolist()

X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=42)

Si quieres entrenar un modelo desde cero, necesitarás crear un DataLoader que alimente los datos a BERT en lotes.

Paso 5: Cargar un modelo preentrenado

Para no empezar desde cero, lo recomendable es usar un modelo de BERT preentrenado y hacer fine-tuning para tu tarea de sentimientos.


from transformers import BertForSequenceClassification

model = BertForSequenceClassification.from_pretrained('bert-base-uncased', num_labels=3)

Aquí num_labels=3 corresponde a tus clases: positiva, neutral y negativa. Si tu dataset tiene otra configuración, ajusta este parámetro.

Paso 6: Entrenamiento del modelo

El entrenamiento implica definir un optimizador, una función de pérdida y un número de épocas. Aquí un ejemplo simplificado:


from torch.utils.data import DataLoader, TensorDataset
from transformers import AdamW

# Crear tensores (ejemplo simplificado)
train_data = TensorDataset(tokens['input_ids'], torch.tensor(y_train))
train_loader = DataLoader(train_data, batch_size=16, shuffle=True)

optimizer = AdamW(model.parameters(), lr=2e-5)
loss_fn = torch.nn.CrossEntropyLoss()

# Bucle de entrenamiento simplificado
for epoch in range(3):
    model.train()
    for batch in train_loader:
        optimizer.zero_grad()
        input_ids, labels = batch
        outputs = model(input_ids, labels=labels)
        loss = outputs.loss
        loss.backward()
        optimizer.step()

Este paso puede llevar tiempo según el tamaño del dataset y la potencia de tu máquina, pero recuerda: paciencia, que BERT para análisis de sentimientos merece el esfuerzo.

Paso 7: Evaluación del modelo

Una vez entrenado, debes comprobar cómo se comporta tu modelo con datos que no ha visto antes. Esto se hace con el conjunto de validación.


from sklearn.metrics import classification_report

model.eval()
val_preds = []

for texto in X_val:
    inputs = tokenizer(texto, return_tensors="pt", truncation=True, padding=True)
    outputs = model(**inputs)
    pred = torch.argmax(outputs.logits, dim=1)
    val_preds.append(pred.item())

print(classification_report(y_val, val_preds))

Con esto podrás ver métricas como precisión, recall y F1-score, que te indican qué tan fiable es tu modelo para clasificar sentimientos.

Paso 8: Uso práctico del modelo

Ahora que tienes un modelo entrenado, puedes usarlo para analizar comentarios, reseñas o tweets en tiempo real. Basta con tokenizar el texto nuevo y pasar los tokens por el modelo.


nuevo_texto = "No me ha gustado nada este servicio"
inputs = tokenizer(nuevo_texto, return_tensors="pt", truncation=True, padding=True)
outputs = model(**inputs)
prediccion = torch.argmax(outputs.logits, dim=1)

etiquetas = {0:'positiva', 1:'neutral', 2:'negativa'}
print(f"Sentimiento predicho: {etiquetas[prediccion.item()]}")

De esta forma, podéis automatizar la interpretación de sentimientos de cualquier fuente de texto.

Consejos finales para no morir en el intento

Usa un subconjunto de datos al principio: Entrenar BERT con todo el dataset puede ser lento y frustrante. Empieza con una muestra pequeña para pruebas.
GPU sí o sí: BERT es un modelo pesado. Sin GPU, entrenar puede ser extremadamente lento.
Experimenta con hiperparámetros: Aprendizaje, batch size y número de épocas afectan mucho al rendimiento.
Preprocesa bien los datos: Aunque BERT es robusto, eliminar ruido y normalizar los textos mejora la precisión.
Visualiza los resultados: Una matriz de confusión o gráficos de predicciones te ayudan a entender los errores y aciertos del modelo.

Conclusión

Aprender a usar BERT para análisis de sentimientos puede parecer intimidante al principio, pero siguiendo estos pasos puedes dominarlo sin problemas. Desde la preparación de datos, pasando por la tokenización, el entrenamiento y la evaluación, hasta la predicción práctica, cada etapa es clave para obtener un modelo fiable.

Lo mejor de BERT es su capacidad para comprender el contexto y las sutilezas del lenguaje, algo que otros modelos no consiguen con facilidad. Aplicarlo al análisis de sentimientos te permitirá automatizar tareas, obtener insights precisos y entender mejor las opiniones de tus usuarios o clientes.

Si sigues este paso a paso, verás que BERT para análisis de sentimientos no es solo una herramienta potente, sino también accesible, siempre que sigas buenas prácticas y no tengas miedo de experimentar. Con un poco de paciencia y curiosidad, podrás convertir grandes cantidades de texto en información valiosa y procesable.

Aprende sobre Inteligencia Artificial con la Ruta de Frogames Formación

Si te ha interesado lo que has leído en este post, te encantará saber que puedes profundizar en este tema y en todas las competencias esenciales de la Inteligencia Artificial a través de la Ruta de Aprendizaje de Frogames Formación.

Esta ruta ha sido creada para quienes desean adentrarse desde cero en el mundo de la IA y avanzar paso a paso hasta dominar las herramientas, lenguajes y técnicas que utilizan los profesionales del sector. Aprenderás de forma práctica y progresiva a diseñar, entrenar y desplegar modelos de inteligencia artificial capaces de resolver problemas reales.

A lo largo del recorrido, explorarás conceptos fundamentales como el machine learning, las redes neuronales, el procesamiento de datos, la visión por computador y el procesamiento del lenguaje natural. También trabajarás con tecnologías clave como Python, TensorFlow, Keras, scikit-learn o Pandas, siempre aplicadas a proyectos prácticos.

Cada módulo está diseñado para que pongas en práctica lo aprendido mediante ejercicios y proyectos reales, construyendo paso a paso un porfolio que demuestre tu capacidad para desarrollar soluciones inteligentes, optimizadas y listas para el mundo profesional.

Si quieres aprender a entrenar modelos, analizar datos, automatizar procesos y comprender cómo funciona la tecnología que está transformando el mundo, la Ruta de Inteligencia Artificial de Frogames Formación es justo lo que necesitas.

¡Da el primer paso hacia una de las profesiones más demandadas, innovadoras y con mayor proyección del futuro!

¡Nos vemos en clase!

Preguntas Frecuentes

¿Qué es BERT para análisis de sentimientos?

Es un modelo de inteligencia artificial que clasifica textos según su emoción (positiva, negativa o neutral) usando comprensión del contexto.

¿Qué necesito para usar BERT?

Python, librerías como Transformers, PyTorch o TensorFlow, y preferiblemente GPU para entrenar modelos grandes.

¿Cómo preparo los datos?

Debes limpiar el texto, convertirlo a minúsculas, eliminar caracteres innecesarios y etiquetar cada ejemplo con su clase de sentimiento.

¿Es necesario entrenar BERT desde cero?

No; lo recomendable es usar un modelo preentrenado y hacer fine-tuning para tu tarea específica.

¿Puedo usar BERT para analizar comentarios en tiempo real?

Sí, una vez entrenado, puedes tokenizar nuevos textos y obtener predicciones de sentimiento de manera automatizada.

« Volver al Blog