Una guía completa de la distribución hipergeométrica

Una guía completa de la distribución hipergeométrica

María Santos María Santos
9 minutos

Leer el artículo
Audio generated by DropInBlog's Blog Voice AI™ may have slight pronunciation nuances. Learn more

Las distribuciones de probabilidad, como la distribución hipergeométrica, juegan un papel fundamental en estadística al proporcionar un marco teórico para comprender y analizar los datos. Son modelos matemáticos que describen la probabilidad de ocurrencia de diferentes eventos o resultados en un conjunto de datos.

La distribución hipergeométrica es una de las distribuciones discretas más relevantes en estadística. Se utiliza cuando se trabaja con una población finita y se extrae una muestra sin reemplazo. Es especialmente útil en situaciones en las que estamos interesados en contar el número de éxitos en la muestra.

Al comprender y aplicar la distribución hipergeométrica, los estadísticos, investigadores y profesionales pueden tomar decisiones más informadas y precisas en una variedad de contextos. Es una herramienta valiosa para el análisis de datos en campos como la genética, la investigación de mercado, el muestreo de calidad y muchos otros en los que se trabaja con poblaciones finitas y muestras sin reemplazo.

Conceptos básicos de la distribución hipergeométrica

La distribución hipergeométrica es un modelo estadístico utilizado cuando se extrae una muestra sin reemplazo de una población finita. Se utiliza para calcular la probabilidad de obtener un número específico de éxitos en la muestra, teniendo en cuenta el tamaño de la población y la cantidad de éxitos en ella.

Características principales de la distribución hipergeométrica

La distribución hipergeométrica no asume independencia entre los eventos, ya que la extracción sin reemplazo tiene en cuenta los resultados previos.

Se utiliza cuando se trabaja con poblaciones finitas y la muestra representa una proporción significativa de la población.

A diferencia de la distribución binomial, la distribución hipergeométrica es más adecuada para situaciones donde los resultados previos afectan las probabilidades futuras.

Parámetros clave de la distribución hipergeométrica

  • Tamaño de la población: Es el número total de elementos en la población. Por ejemplo, el número total de regalos disponibles para seleccionar en una fiesta sorpresa
  • Número de éxitos: Representa la cantidad de elementos en la población que cumplen con una característica deseada. Por ejemplo, el número de regalos adecuados para la fiesta sorpresa
  • Tamaño de la muestra: Es la cantidad de elementos que se extraen de la población. Por ejemplo, la cantidad de regalos seleccionados para la fiesta sorpresa.

Cálculo y fórmula de probabilidad

La fórmula de probabilidad de la distribución hipergeométrica es:

Distribucion hipergeometrica

donde:

  • P(X = x) es la probabilidad de obtener x éxitos en la muestra
  • K sobre x es el coeficiente binomial que representa el número de formas de seleccionar x éxitos de K elementos
  • N - K sobre n - x es el coeficiente binomial que representa el número de formas de seleccionar n - x elementos restantes de N - K elementos restantes
  • N sobre n es el coeficiente binomial que representa el número total de formas de seleccionar n elementos de N elementos

Entonces, para llevar a cabo el cálculo de la probabilidad de eventos específicos, primero identifica los valores de K (número de éxitos en la población), N (tamaño de la población), n (tamaño de la muestra) y x (número de éxitos deseados en la muestra). Luego, utiliza la fórmula de probabilidad de la distribución hipergeométrica para calcular P(X = x).

Veamos un ejemplo: supongamos que en una urna hay 20 bolas, de las cuales 5 son rojas y 15 son azules. Queremos extraer 8 bolas sin reemplazo y deseamos calcular la probabilidad de obtener exactamente 3 bolas rojas en la muestra.

La información de la que disponemos es:

  • K = 5 (número de éxitos en la población -> bolas rojas)
  • N = 20 (tamaño de la población -> total de bolas) 
  • n = 8 (tamaño de la muestra -> bolas extraídas)
  • x = 3 (número de éxitos deseados en la muestra -> bolas rojas deseadas)

Usando la fórmula de probabilidad de la distribución hipergeométrica:

Calculando los coeficientes binomiales y la probabilidad resultante, obtenemos el valor de P(X = 3), que nos dará la probabilidad de obtener exactamente 3 bolas rojas en la muestra extraída.

Uso de la distribución hipergeométrica en la práctica

La distribución hipergeométrica encuentra aplicación en diversos campos. En genética, se utiliza para analizar la segregación de genes en una población. En muestreo, se emplea para evaluar la calidad de lotes o para estimar características en una población finita. En control de calidad, se aplica para medir la proporción de productos defectuosos en una muestra.

Diferencias con otras distribuciones

A diferencia de la distribución binomial, que se utiliza cuando se extrae una muestra con reemplazo, la distribución hipergeométrica considera la extracción sin reemplazo, lo que refleja de manera más precisa la realidad en situaciones donde los resultados previos afectan las probabilidades futuras.

Por otro lado, la distribución de Poisson se emplea para eventos raros y se basa en una tasa de ocurrencia promedio, mientras que la distribución hipergeométrica se centra en contar el número de éxitos en una muestra.

Aplicaciones prácticas de la distribución hipergeométrica

Un ejemplo de aplicación práctica de la distribución hipergeométrica es en la selección de lotes para control de calidad en una fábrica de productos electrónicos. Si se extrae una muestra de componentes sin reemplazo y se cuenta la cantidad de componentes defectuosos en esa muestra, la distribución hipergeométrica se puede utilizar para calcular la probabilidad de obtener una determinada cantidad de componentes defectuosos en el lote.

Otro ejemplo es en la investigación de enfermedades genéticas, donde se busca determinar la probabilidad de heredar un gen específico de los padres a los hijos. La distribución hipergeométrica se utiliza para calcular la probabilidad de que cierta cantidad de individuos hereden el gen en una población finita, teniendo en cuenta el tamaño de la población y el número de individuos con el gen.

Estos casos reales demuestran cómo la distribución hipergeométrica es una herramienta útil en diferentes contextos, permitiendo calcular probabilidades y tomar decisiones basadas en datos en situaciones donde se extraen muestras sin reemplazo de una población finita.

Propiedades y limitaciones de la distribución hipergeométrica

La distribución hipergeométrica tiene propiedades importantes. Su media es calculada como

donde n es el tamaño de la muestra, K es el número de éxitos en la población y N es el tamaño de la población.

La varianza se calcula como

lo que refleja la variabilidad en el número de éxitos en la muestra.

Limitaciones y suposiciones

La distribución hipergeométrica tiene algunas limitaciones y suposiciones. Una suposición clave es que los eventos extraídos de la población son independientes entre sí, lo cual puede no ser realista en algunos escenarios.

Además, la distribución hipergeométrica se utiliza generalmente cuando la muestra es una proporción significativa de la población, por lo que no es apropiada cuando la muestra es grande en relación al tamaño de la población.


La distribución hipergeométrica es una herramienta valiosa en estadística debido a su capacidad para modelar eventos en poblaciones finitas y tener en cuenta los resultados previos. Su aplicabilidad se extiende a diversas áreas, como genética, muestreo y control de calidad. Permite calcular probabilidades precisas en escenarios realistas donde la extracción se realiza sin reemplazo y las probabilidades cambian con cada extracción.

Si te ha interesado la distribución hipergeométrica, te invitamos a profundizar en este tema y explorar cómo se aplica en tu área de interés. Podrías investigar ejemplos adicionales, estudios de casos o problemas prácticos relacionados con esta distribución. Además, recuerda que en Frogames tenemos la Ruta de Matemáticas Avanzadas, donde en el curso de Probabilidad para Machine Learning y Big Data con R y Python te contamos acerca de la distribución hipergeométrica y muchas otras distribuciones relevantes más.

Al comprender mejor la distribución hipergeométrica, podrás tomar decisiones informadas y realizar análisis más precisos en tu campo de estudio o trabajo. La estadística ofrece un mundo fascinante de posibilidades, y la distribución hipergeométrica es una herramienta valiosa para comprender mejor los fenómenos que nos rodean.

« Volver al Blog

Obtener mi regalo ahora