Cómo Tidyverse puede mejorar tu análisis de datos en R

Cómo Tidyverse puede mejorar tu análisis de datos en R

María Santos María Santos
24 minutos

Leer el artículo
Audio generated by DropInBlog's Blog Voice AI™ may have slight pronunciation nuances. Learn more

En la actualidad, la cantidad de datos que se generan a diario es enorme y con la proliferación de dispositivos digitales y la creciente presencia en línea de individuos y empresas, esta cantidad de datos sigue aumentando exponencialmente. Por lo tanto, el análisis de datos se ha vuelto cada vez más importante en todos los campos, desde el marketing y las finanzas hasta la salud y la educación. El análisis de datos con Tidyverse permite descubrir patrones y tendencias, identificar problemas y oportunidades, tomar decisiones informadas y mejorar la eficiencia y la efectividad en las organizaciones y empresas. Además, el análisis de datos también es fundamental para la investigación científica y para abordar problemas sociales y ambientales complejos. En resumen, el análisis de datos es esencial en la actualidad para comprender mejor el mundo que nos rodea y tomar decisiones informadas y efectivas. 

Tidyverse es un conjunto de paquetes de software de código abierto para análisis de datos en R. Fue desarrollado por el científico de datos Hadley Wickham y su equipo de desarrolladores con el objetivo de proporcionar una colección coherente de herramientas para el análisis de datos. Tidyverse es ampliamente utilizado por la comunidad de análisis de datos debido a su enfoque en la limpieza, manipulación y visualización de datos de manera efectiva y eficiente.

Tidyverse consta de varios paquetes, entre los que destacan:

  • ggplot2 para la visualización de datos
  • dplyr para la manipulación de datos
  • tidyr para la limpieza y transformación de datos
  • readr para la lectura de diferentes tipos de archivos de datos
  • purrr para la programación funcional y la iteración de datos

Cada paquete de Tidyverse está diseñado para trabajar en conjunto y facilitar el proceso de análisis de datos. Al utilizar Tidyverse, los usuarios pueden realizar análisis de datos de manera más eficiente y con menos código, lo que permite centrarse en el proceso de análisis en sí y no en la manipulación de los datos. Además, Tidyverse está diseñado para ser fácil de aprender y utilizar para los principiantes en análisis de datos, lo que lo convierte en una herramienta valiosa para aquellos que deseen mejorar sus habilidades de análisis de datos en R.

Tidyverse

¿Qué es Tidyverse?

Tidyverse es un conjunto de paquetes de software de código abierto para análisis de datos en R, desarrollado por Hadley Wickham y su equipo de desarrolladores. Los paquetes de Tidyverse se enfocan en la limpieza, manipulación, transformación y visualización de datos de manera eficiente y efectiva.

A continuación, se describen brevemente los principales paquetes de Tidyverse y su función en el análisis de datos:

  • ggplot2: Es un paquete para la visualización de datos. Ofrece una amplia variedad de opciones de gráficos y una sintaxis intuitiva para crear gráficos personalizados. Su enfoque es en la creación de gráficos claros y legibles, y en permitir al usuario personalizar cada aspecto del gráfico.
  • dplyr: Es un paquete para la manipulación de datos. Proporciona un conjunto de funciones para seleccionar, filtrar, reordenar y agrupar datos de manera sencilla. También permite unir y combinar conjuntos de datos.
  • tidyr: Es un paquete para la limpieza y transformación de datos. Ofrece funciones para convertir datos de formato ancho a formato largo (y viceversa), así como para separar y unir columnas de datos.
  • readr: Es un paquete para la lectura de diferentes tipos de archivos de datos. Proporciona una forma rápida y sencilla de leer archivos CSV, TSV y otros formatos de archivo comunes en R.
  • purrr: Es un paquete para la programación funcional y la iteración de datos. Permite aplicar funciones a cada elemento de una lista o vector, así como crear y manipular listas de manera eficiente.

Estos paquetes se complementan entre sí y son diseñados para trabajar juntos en una sintaxis clara y concisa, lo que permite realizar análisis de datos de manera más efectiva y eficiente en R. Además, la comunidad de usuarios de Tidyverse ofrece una amplia variedad de recursos y tutoriales en línea para ayudar a los usuarios a aprender y utilizar estos paquetes de manera efectiva.

Ventajas de usar Tidyverse para análisis de datos

El uso de Tidyverse en el análisis de datos presenta varias ventajas, entre las que destacan:

  1. Sintaxis intuitiva: Tidyverse utiliza una sintaxis clara y concisa que facilita la manipulación y visualización de datos. Además, la sintaxis es consistente entre los diferentes paquetes, lo que permite que los usuarios se sientan cómodos y eficientes al trabajar en diferentes aspectos del análisis de datos.
  2. Eficiencia: Tidyverse está diseñado para ser eficiente en términos de tiempo y esfuerzo. Los paquetes están optimizados para trabajar juntos, lo que permite realizar tareas de análisis de datos complejas con menos líneas de código.
  3. Flexibilidad: Tidyverse ofrece una amplia variedad de paquetes que se enfocan en diferentes aspectos del análisis de datos, desde la limpieza y manipulación hasta la visualización y modelado de datos. Esto permite que los usuarios personalicen su proceso de análisis de datos y lo adapten a sus necesidades específicas.
  4. Comunidad activa: La comunidad de usuarios de Tidyverse es activa y colaborativa, lo que significa que los usuarios pueden encontrar una amplia variedad de recursos en línea, como tutoriales, foros y paquetes adicionales, para ayudar en su proceso de análisis de datos.
  5. Fácil aprendizaje: Tidyverse está diseñado para ser fácil de aprender para usuarios nuevos en análisis de datos en R. La sintaxis es intuitiva y los paquetes están diseñados para trabajar juntos de manera efectiva y eficiente, lo que facilita la curva de aprendizaje.

En resumen, el uso de Tidyverse en el análisis de datos permite a los usuarios trabajar de manera más efectiva y eficiente, con una sintaxis intuitiva y una comunidad activa y colaborativa que ofrece recursos y soporte adicional.

Instalación y configuración de Tidyverse

Para descargar e instalar Tidyverse, sigue los siguientes pasos:

  1. Abre R o RStudio.
  2. Ejecuta el siguiente comando para instalar Tidyverse: install.packages("tidyverse"). Este comando instalará todos los paquetes de Tidyverse, incluyendo ggplot2, dplyr, tidyr, readr y otros paquetes que se usan comúnmente en el análisis de datos.
  3. Una vez que la instalación esté completa, carga los paquetes con el siguiente comando: library(tidyverse). Este comando carga todos los paquetes de Tidyverse en la sesión actual de R o RStudio.
  4. Si deseas instalar o cargar un paquete específico de Tidyverse, utiliza el siguiente comando: install.packages("nombre_del_paquete") (para instalar) y library(nombre_del_paquete) (para cargar)

Es importante tener en cuenta que Tidyverse requiere de algunas dependencias que pueden ser instaladas automáticamente durante el proceso de instalación, y también es posible que requiera de una versión más actualizada de R. Por esta razón, es importante revisar los mensajes que aparecen en la consola de R durante el proceso de instalación y asegurarse de tener la versión de R adecuada.

Una vez que Tidyverse esté instalado, estarás listo para utilizarlo en tus proyectos de análisis de datos.

Para cargar y configurar los paquetes de Tidyverse en RStudio, sigue los siguientes pasos:

  1. Abre RStudio.
  2. Crea un nuevo script en RStudio haciendo clic en "Archivo" > "Nuevo archivo" > "Script de R".
  3. En el script, carga Tidyverse utilizando el comando: library(tidyverse). Este comando carga todos los paquetes de Tidyverse en la sesión actual de RStudio.
  4. Configura la visualización de gráficos utilizando el siguiente comando: options(ggplot2.theme=theme_bw()). Este comando configura el tema de ggplot2 para que los gráficos tengan un fondo blanco y una línea de cuadrícula gris.
  5. Verifica que Tidyverse se ha cargado correctamente y está listo para usar. Puedes hacerlo utilizando el siguiente comando: tidyverse_packages(). Este comando te mostrará una lista de todos los paquetes de Tidyverse que se han cargado correctamente.

Una vez que Tidyverse está cargado y configurado, podrás usar todos los paquetes incluidos para el análisis de datos.

Análisis de datos con Tidyverse

Cómo cargar datos en RStudio utilizando Tidyverse

Para cargar datos en RStudio utilizando Tidyverse, sigue los siguientes pasos:

  1. Asegúrate de tener los datos que deseas cargar en un formato compatible con Tidyverse, como un archivo .csv, .txt, .xls, etc.
  2. En RStudio, crea un nuevo script de R.
  3. Carga Tidyverse utilizando el comando: library(tidyverse).
  4. Utiliza una función de Tidyverse para cargar los datos. Por ejemplo, para cargar un archivo .csv, utiliza la función read_csv() y especifica la ruta y el nombre del archivo entre comillas. Por ejemplo: datos <- read_csv("ruta_del_archivo/nombre_del_archivo.csv"). Si el archivo se encuentra en el directorio de trabajo actual, solo es necesario especificar el nombre del archivo: datos <- read_csv("nombre_del_archivo.csv"). Esto cargará los datos en un objeto llamado "datos" en la sesión de RStudio.
  5. Verifica que los datos se hayan cargado correctamente utilizando una función de Tidyverse para inspeccionar los datos. Por ejemplo, utiliza la función head() para ver las primeras filas de los datos: head(datos). Esto te mostrará las primeras 6 filas de los datos en la consola de RStudio.

Una vez que los datos están cargados, podrás utilizar los paquetes de Tidyverse para limpiar, transformar y visualizar los datos.

Cómo manipular y transformar datos utilizando los paquetes dplyr y tidyr

Los paquetes dplyr y tidyr de Tidyverse proporcionan herramientas para manipular y transformar datos en RStudio. A continuación, se presentan algunos ejemplos de cómo utilizar estas herramientas:

Filtrar filas con dplyr

Utiliza la función filter() para filtrar filas de un conjunto de datos según una condición. Por ejemplo, para filtrar filas donde la variable "edad" es mayor o igual a 18, utiliza:

datos_filtrados <- datos %>% filter(edad >= 18)

Esto creará un nuevo objeto "datos_filtrados" que contiene solo las filas donde la variable "edad" es mayor o igual a 18.

Seleccionar columnas con dplyr

Utiliza la función select() para seleccionar columnas específicas de un conjunto de datos. Por ejemplo, para seleccionar solo las columnas "nombre", "edad" y "sexo", utiliza:

datos_seleccionados <- datos %>% select(nombre, edad, sexo)

Esto creará un nuevo objeto "datos_seleccionados" que contiene solo las columnas "nombre", "edad" y "sexo".

Agrupar y resumir datos con dplyr

Utiliza la función group_by() para agrupar un conjunto de datos por una o más variables, y luego utiliza la función summarise() para realizar operaciones de resumen en cada grupo. Por ejemplo, para calcular la media de la variable "edad" para cada valor único de la variable "sexo", utiliza:

datos_resumidos <- datos %>% group_by(sexo) %>% summarise(media_edad = mean(edad))

Esto creará un nuevo objeto "datos_resumidos" que contiene la media de la variable "edad" para cada valor único de la variable "sexo".

Transformar datos de ancho a largo con tidyr

Utiliza la función pivot_longer() para transformar datos de ancho a largo. Por ejemplo, si tienes una tabla donde las columnas representan diferentes años y quieres transformarla para que las columnas representen una variable "año" y otra variable "valor", utiliza:

datos_largos <- datos_anchos %>% pivot_longer(cols = c("2000", "2001", "2002"), names_to = "año", values_to = "valor")

Esto creará un nuevo objeto "datos_largos" que tiene una fila para cada combinación de la variable "año" y la variable "valor".

Transformar datos de largo a ancho con tidyr

Utiliza la función pivot_wider() para transformar datos de largo a ancho. Por ejemplo, si tienes una tabla donde cada fila representa una combinación de la variable "año" y la variable "valor" y quieres transformarla para que las columnas representen diferentes años, utiliza:

datos_anchos <- datos_largos %>% pivot_wider(names_from = "año", values_from = "valor")

Esto creará un nuevo objeto "datos_anchos" que tiene una columna para cada valor único de la variable "año", y las filas representan diferentes combinaciones de la variable "valor".

Cómo visualizar datos utilizando ggplot2

El paquete ggplot2 de Tidyverse proporciona herramientas para crear visualizaciones de datos en RStudio. A continuación, se presentan algunos ejemplos de cómo utilizar ggplot2:

Crear un diagrama de dispersión

Utiliza la función ggplot() para crear un nuevo objeto de visualización, y luego utiliza la función geom_point() para crear un diagrama de dispersión. Por ejemplo, para crear un diagrama de dispersión de la variable "peso" en el eje Y y la variable "altura" en el eje X, utiliza:

ggplot(datos, aes(x = altura, y = peso)) +

  geom_point()

Esto creará un nuevo objeto de visualización con un diagrama de dispersión de la variable "peso" en el eje Y y la variable "altura" en el eje X.

Crear un diagrama de barras

Utiliza la función geom_bar() para crear un diagrama de barras. Por ejemplo, para crear un diagrama de barras de la variable "sexo", utiliza:

ggplot(datos, aes(x = sexo)) +

  geom_bar()

Esto creará un nuevo objeto de visualización con un diagrama de barras de la variable "sexo".

Crear un diagrama de líneas

Utiliza la función geom_line() para crear un diagrama de líneas. Por ejemplo, para crear un diagrama de líneas de la variable "ventas" a lo largo del tiempo, utiliza:

ggplot(datos, aes(x = tiempo, y = ventas)) +

  geom_line()

Esto creará un nuevo objeto de visualización con un diagrama de líneas de la variable "ventas" a lo largo del tiempo.

Personalizar la apariencia de una visualización

Utiliza diversas funciones para personalizar la apariencia de una visualización, por ejemplo:

ggplot(datos, aes(x = tiempo, y = ventas)) +

  geom_line(color = "blue", linetype = "dashed") +

  labs(title = "Ventas a lo largo del tiempo", x = "Tiempo", y = "Ventas")

Esto creará un nuevo objeto de visualización con un diagrama de líneas de la variable "ventas" a lo largo del tiempo, con la línea en color azul y de tipo discontinuo, y con etiquetas personalizadas para el título, el eje X y el eje Y.

Estos son solo algunos ejemplos de las muchas posibilidades que ofrece ggplot2 para visualizar datos en RStudio.

Cómo trabajar con diferentes tipos de datos utilizando los paquetes de Tidyverse

Los paquetes de Tidyverse proporcionan herramientas para trabajar con diferentes tipos de datos, incluyendo datos numéricos, categóricos, de fecha y hora, entre otros. A continuación, se presentan algunas funciones y ejemplos para trabajar con diferentes tipos de datos:

Datos numéricos

Para trabajar con datos numéricos, el paquete dplyr proporciona varias funciones útiles, como summarize(), mutate() y filter(). Por ejemplo, para encontrar la suma de una columna numérica en un conjunto de datos, se puede utilizar la función summarize():

library(dplyr)

datos %>% 

  summarize(suma_columna_numerica = sum(columna_numerica))

Esto calculará la suma de la columna "columna_numerica" y la mostrará en una nueva columna llamada "suma_columna_numerica".

Datos categóricos

Para trabajar con datos categóricos, el paquete dplyr proporciona la función group_by(), que permite agrupar los datos según una columna categórica y luego realizar operaciones en cada grupo. Por ejemplo, para calcular la media de una columna numérica para cada categoría de una columna categórica, se puede utilizar:

datos %>% 

  group_by(columna_categorica) %>% 

  summarize(media_columna_numerica = mean(columna_numerica))

Esto calculará la media de la columna "columna_numerica" para cada categoría de la columna "columna_categorica".

Datos de fecha y hora

Para trabajar con datos de fecha y hora, el paquete lubridate proporciona varias funciones útiles, como ymd() para convertir una fecha en formato "año-mes-día" a una fecha en R, mdy() para convertir una fecha en formato "mes-día-año" a una fecha en R, y ymd_hms() para convertir una fecha y hora en formato "año-mes-día hora:minuto:segundo" a una fecha y hora en R. Por ejemplo, para crear una columna que muestre el día de la semana de una columna de fechas, se puede utilizar:

library(lubridate)

datos %>% 

  mutate(dia_semana = wday(columna_fecha, label = TRUE))

Esto creará una nueva columna llamada "dia_semana" que muestra el día de la semana en formato de etiqueta (por ejemplo, "Lun" para lunes).

En resumen, los paquetes de Tidyverse proporcionan una amplia gama de herramientas para trabajar con diferentes tipos de datos de manera eficiente y efectiva en R.

Ejemplos de análisis de datos con Tidyverse

Aquí presentamos algunos ejemplos de análisis de datos utilizando Tidyverse, que incluyen tanto manipulación de datos como visualizaciones.

Manipulación de datos con dplyr y tidyr

Supongamos que tenemos un conjunto de datos de ventas que contiene información sobre las ventas de diferentes productos en diferentes regiones en diferentes años. Queremos encontrar la región con las ventas más altas en un año determinado. Para hacerlo, podemos utilizar las funciones de dplyr y tidyr de la siguiente manera:

library(dplyr)

library(tidyr)

ventas <- read.csv("ventas.csv")

ventas %>% 

  filter(anio == 2021) %>% 

  group_by(region) %>% 

  summarise(ventas_totales = sum(ventas)) %>% 

  arrange(desc(ventas_totales)) %>% 

  head(1)

Esto filtra los datos para el año 2021, agrupa los datos por región, calcula la suma de ventas para cada región y luego ordena los datos en orden descendente según las ventas totales y selecciona la región con las ventas más altas.

Visualización de datos con ggplot2

Supongamos que queremos visualizar las ventas de diferentes productos en diferentes regiones a lo largo del tiempo. Para hacerlo, podemos utilizar ggplot2 de la siguiente manera:

library(ggplot2)

ventas <- read.csv("ventas.csv")

ggplot(ventas, aes(x = anio, y = ventas, color = producto)) + 

  geom_line() + 

  facet_wrap(~region)

Esto crea una gráfica de líneas que muestra las ventas de cada producto en cada región a lo largo del tiempo. Además, utiliza facet_wrap() para mostrar cada región en una subgráfica separada para una mejor visualización.

En resumen, Tidyverse proporciona una amplia gama de herramientas para manipular y visualizar datos de manera eficiente y efectiva. Con las funciones de dplyr y tidyr, podemos manipular los datos de acuerdo con nuestras necesidades, mientras que con ggplot2, podemos crear visualizaciones impresionantes para resumir y comunicar nuestros resultados.

Tidyverse también proporciona herramientas para aplicar técnicas de modelado de datos. Aquí presentamos algunos ejemplos:

Regresión lineal con lm()

Supongamos que tenemos un conjunto de datos de ventas que contiene información sobre las ventas de diferentes productos en diferentes regiones en diferentes años. Queremos ajustar un modelo de regresión lineal simple para predecir las ventas en función del precio. Podemos hacerlo utilizando la función lm() de la siguiente manera:

library(dplyr)

ventas <- read.csv("ventas.csv")

modelo <- lm(ventas ~ precio, data = ventas)

summary(modelo)

Esto ajusta un modelo de regresión lineal simple que predice las ventas en función del precio. La salida de summary(modelo) proporciona información sobre el modelo ajustado, como los coeficientes de regresión y el coeficiente de determinación.

Análisis de componentes principales con prcomp()

Supongamos que tenemos un conjunto de datos que contiene información sobre diferentes variables de clima en diferentes ciudades. Queremos realizar un análisis de componentes principales (PCA) para reducir la dimensionalidad de los datos. Podemos hacerlo utilizando la función prcomp() de la siguiente manera:

library(dplyr)

clima <- read.csv("clima.csv")

pca <- prcomp(select(clima, -ciudad))

summary(pca)

Esto realiza un análisis de componentes principales para las variables de clima en el conjunto de datos, excluyendo la variable de ciudad. La salida de summary(pca) proporciona información sobre las componentes principales y su contribución a la variabilidad total de los datos.

En resumen, Tidyverse también proporciona herramientas para aplicar técnicas de modelado de datos. Con funciones como lm() y prcomp(), podemos ajustar modelos estadísticos y reducir la dimensionalidad de los datos, respectivamente.

Conclusiones

En resumen, las principales ventajas de Tidyverse para análisis de datos son:

  • Sintaxis consistente: Todos los paquetes de Tidyverse utilizan una sintaxis coherente y fácil de aprender, lo que permite a los usuarios de R ahorrar tiempo y evitar errores comunes.
  • Manipulación de datos eficiente: Los paquetes dplyr y tidyr proporcionan herramientas poderosas y eficientes para manipular y transformar datos, lo que permite a los usuarios limpiar y preparar datos para análisis de manera más rápida y eficiente.
  • Visualización de datos de alta calidad: El paquete ggplot2 proporciona una forma flexible y potente de crear visualizaciones de datos de alta calidad, lo que permite a los usuarios explorar y comunicar los resultados de manera efectiva.
  • Integración con otras herramientas de análisis de datos: Tidyverse se integra bien con otras herramientas populares de análisis de datos, como tidymodels, lo que permite a los usuarios realizar tareas de modelado estadístico, aprendizaje automático y otros tipos de análisis de datos.
  • Comunidad activa y en constante crecimiento: Tidyverse tiene una comunidad activa y en constante crecimiento de usuarios y desarrolladores que contribuyen a su desarrollo, proporcionan soporte y comparten recursos útiles para aprender y utilizar Tidyverse.

Si deseas continuar aprendiendo y mejorando tus habilidades de análisis de datos con Tidyverse, aquí te dejamos algunas sugerencias:

  • Explorar la documentación oficial: La documentación oficial de Tidyverse es muy completa y detallada, y es un excelente lugar para comenzar a aprender sobre los diferentes paquetes y sus funciones. También puedes encontrar muchos ejemplos y tutoriales útiles.
  • Unirse a la comunidad de Tidyverse: Tidyverse tiene una comunidad activa en línea donde puedes hacer preguntas, compartir recursos y obtener ayuda de otros usuarios de Tidyverse y desarrolladores. Puedes unirte a grupos de discusión en foros como el de RStudio Community, Slack, Twitter, entre otros.
  • Tomar cursos y tutoriales en línea: Existen muchos cursos y tutoriales en líneaque cubren Tidyverse. En Frogames Formación tenemos el curso Curso completo de R para Data Science con Tidyverse
  • Practicar con proyectos de análisis de datos: La mejor manera de mejorar tus habilidades de análisis de datos es practicar con proyectos reales. Puedes buscar conjuntos de datos públicos en línea, como los disponibles en Kaggle, y tratar de analizarlos utilizando Tidyverse.
  • Colaborar en proyectos de código abierto: Si tienes habilidades en programación, puedes contribuir a los proyectos de Tidyverse en GitHub y hacer mejoras o correcciones de errores en los paquetes existentes. También puedes crear tus propios paquetes de Tidyverse y compartirlos con la comunidad.

Aquí te presentamos algunas recomendaciones adicionales para el uso efectivo de Tidyverse en el análisis de datos:

  • Planificación y organización: Antes de comenzar a trabajar en tu análisis de datos, es importante tener un plan claro en mente. Esto incluye definir tus objetivos, establecer las preguntas que quieres responder, identificar los datos que necesitas y definir el alcance del proyecto. Además, debes asegurarte de mantener tus datos organizados y etiquetados adecuadamente para facilitar su acceso y uso posterior.
  • Comprender los datos: Antes de empezar a aplicar las técnicas de análisis de datos, es importante que comprendas tus datos. Esto incluye conocer las características de los datos, como su distribución, varianza, outliers, etc. También es importante que tengas en cuenta el contexto en el que se generaron los datos para interpretar correctamente los resultados.
  • Mantener la reproducibilidad: Es importante que tu análisis de datos sea reproducible para que otros puedan verificar tus resultados y replicar tu trabajo en el futuro. Para ello, puedes utilizar herramientas como RMarkdown, que permite combinar código, texto y gráficos en un documento que se puede compartir y reproducir fácilmente.
  • Optimizar el rendimiento: Tidyverse puede manejar grandes conjuntos de datos, pero aún así, puede haber ocasiones en las que se requiera optimizar el rendimiento. Para ello, puedes utilizar técnicas como el procesamiento por lotes, el filtrado temprano, la manipulación de datos a nivel de columna y la eliminación de datos redundantes.
  • Documentar tu trabajo: Es importante documentar tu trabajo para que otros puedan entenderlo y utilizarlo. Puedes utilizar herramientas como RMarkdown y GitHub para crear documentación y compartir tu trabajo con otros.
  • Mantenerse actualizado: Tidyverse es una herramienta en constante evolución, por lo que es importante mantenerse actualizado sobre las últimas versiones y nuevas características. Además, debes estar al tanto de las mejores prácticas y técnicas de análisis de datos para garantizar que tu trabajo sea efectivo y riguroso.

En resumen, Tidyverse es un conjunto de paquetes de software de código abierto para análisis de datos en R que ofrece una amplia variedad de herramientas para manipular, transformar y visualizar datos de manera efectiva y eficiente. Tidyverse puede ser una herramienta poderosa para el análisis de datos en una amplia variedad de campos y disciplinas.

« Volver al Blog

Obtener mi regalo ahora