Distribución de probabilidad: qué es
Desde la inteligencia artificial hasta la economía, estas distribuciones nos ayudan a comprender el comportamiento de los datos

Te explicamos qué es distribución de probabilidad. Crédito: Shutterstock
- Puntos clave
- Definición
- Definición formal<br>
- Tipos de distribución de probabilidad
- Distribuciones de probabilidad discretas
- 1. Distribución binomial
- 2. Distribución de poisson
- 3. Distribución geométrica
- Distribuciones de probabilidad continuas
- 1. Distribución normal
- 2. Distribución exponencial
- 3. Distribución uniforme
- Representación gráfica de la distribución de probabilidad
- Parámetros de una distribución
- Aplicaciones de la distribución de probabilidad
- Estadística y análisis de datos
- Finanzas y economía
- Inteligencia artificial y machine learning
- Ingeniería y calidad
- Ciencias naturales y sociales
- Cómo elegir una distribución adecuada
- Conclusión
- FAQs
- ¿Qué es una variable aleatoria?
- ¿Qué representa la curva de una distribución normal?
- ¿Qué es el valor esperado en una distribución?
- ¿Por qué es importante la distribución de probabilidad?
- Fuentes
En el fascinante mundo de las matemáticas y la estadística, la distribución de probabilidad se erige como un concepto clave para analizar y predecir eventos aleatorios. Desde la inteligencia artificial hasta la economía, y abarcando la biología y la ingeniería, estas distribuciones nos ayudan a comprender el comportamiento de los datos y a tomar decisiones fundamentadas en probabilidades.
Puntos clave
- Es una función que asigna probabilidades a los resultados posibles de una variable aleatoria.
- Puede ser discreta (valores contables) o continua (valores infinitos dentro de un rango).
- Se usa en estadística y análisis de datos.
- Finanzas y modelado de riesgo.
- Inteligencia artificial y machine learning.
- Ingeniería y control de calidad.
- Ciencias sociales y naturales.
Definición
La distribución de probabilidad es una función matemática que nos ayuda a entender la posibilidad de que ocurra un resultado específico en un experimento aleatorio. En otras palabras, asigna una probabilidad a cada uno de los resultados posibles de una variable aleatoria.
Una variable aleatoria puede ser discreta, como el número de caras que salen al lanzar un dado, o continua, como el peso de una persona. La distribución de probabilidad nos permite conocer cuán probable es cada resultado posible de esa variable.
Definición formal
Para una variable aleatoria \(X\), la distribución de probabilidad se representa mediante una función:
Para variables discretas: \(P(X=x)\)
Para variables continuas: \(f(x)\), donde \(f\) es una función de densidad de probabilidad.
Ambas expresiones indican la probabilidad de que la variable aleatoria tome el valor \(x\).
Tipos de distribución de probabilidad
Hay dos grandes tipos de distribuciones de probabilidad: las discretas y las continuas. Vamos a explorar las más relevantes de cada categoría.
Distribuciones de probabilidad discretas
1. Distribución binomial
La distribución binomial se encarga de calcular la probabilidad de conseguir un número determinado de éxitos en un número fijo de ensayos independientes, donde cada ensayo solo puede resultar en dos posibles outcomes: éxito o fracaso. Ejemplo: Imagina lanzar una moneda 10 veces y contar cuántas veces sale cara.
Fórmula:
P(X=k)=(nk)pk(1−p)n−kP(X = k) = \binom{n}{k} p^k (1 – p)^{n-k}P(X=k)=(kn)pk(1−p)n−k
2. Distribución de poisson
Esta distribución modela la probabilidad de que ocurra un número determinado de eventos en un intervalo fijo de tiempo o espacio, dado que los eventos ocurren con una tasa promedio conocida y de manera independiente.
Ejemplo: Número de llamadas que recibe una central telefónica por minuto.
Fórmula:
P(X=k)=λke−λk!P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}P(X=k)=k!λke−λ
3. Distribución geométrica
La distribución geométrica representa la probabilidad de que el primer éxito ocurra en el kkk-ésimo intento.
Ejemplo: Número de intentos hasta acertar una respuesta correcta en un examen de opción múltiple al azar.
Distribuciones de probabilidad continuas
1. Distribución normal
También conocida como distribución gaussiana, es probablemente la más conocida de todas. Su gráfica tiene forma de campana y describe muchos fenómenos naturales.
Ejemplo: Altura de las personas, errores de medición, presión arterial, etc.
Fórmula de la función de densidad:
f(x)=1σ2πe−(x−μ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{ -\frac{(x – \mu)^2}{2\sigma^2} }f(x)=σ2π1e−2σ2(x−μ)2
Donde μ\muμ es la media y σ\sigmaσ la desviación estándar.
2. Distribución exponencial
La distribución exponencial se utiliza para modelar el tiempo entre eventos en un proceso de Poisson.
Ejemplo: Tiempo entre llegadas de autobuses o clientes a una tienda.
3. Distribución uniforme
En la distribución uniforme continua, todos los valores dentro de un intervalo tienen la misma probabilidad de ocurrencia.
Ejemplo: Generación de números aleatorios entre 0 y 1.
Representación gráfica de la distribución de probabilidad
Las distribuciones de probabilidad pueden representarse gráficamente para facilitar su análisis:
- Histograma (discretas): Muestra barras donde la altura indica la probabilidad de cada valor.
- Curva de densidad (continuas): Representa la función de densidad f(x)f(x)f(x). El área bajo la curva entre dos puntos representa la probabilidad de que la variable tome un valor dentro de ese intervalo.
Estas representaciones permiten visualizar la forma, la asimetría, la curtosis y otros atributos clave de la distribución.
Parámetros de una distribución
Toda distribución de probabilidad está definida por ciertos parámetros estadísticos que nos ayudan a describirla:
Asimetría: Mide qué tan simétrica es la distribución respecto a su media.
Media (μ\muμ): Promedio de todos los valores posibles. Representa el valor esperado.
Varianza (σ2\sigma^2σ2): Mide la dispersión de los valores con respecto a la media.
Desviación estándar (σ\sigmaσ): Raíz cuadrada de la varianza. También mide la dispersión.
Moda: Valor con mayor frecuencia.
Aplicaciones de la distribución de probabilidad
Las distribuciones de probabilidad son esenciales en diversos campos. Aquí algunas aplicaciones destacadas:
Estadística y análisis de datos
Permiten hacer inferencias, estimar parámetros, realizar pruebas de hipótesis y calcular intervalos de confianza.
Finanzas y economía
Modelan rendimientos de activos financieros, análisis de riesgo, pronósticos económicos, seguros y más.
Inteligencia artificial y machine learning
Se utilizan en modelos probabilísticos como redes bayesianas, regresión logística, clasificación probabilística, y aprendizaje no supervisado.
Ingeniería y calidad
Se aplican en el control de procesos, confiabilidad de sistemas, análisis de fallos y simulación de eventos.
Ciencias naturales y sociales
Ayudan a modelar fenómenos biológicos, químicos, físicos, sociológicos y psicológicos con comportamiento aleatorio.
Cómo elegir una distribución adecuada
Elegir la distribución de probabilidad correcta depende de:
Análisis exploratorio: Histogramas, boxplots y pruebas estadísticas pueden ayudar a determinar la mejor distribución.
Tipo de variable: Discreta o continua.
Forma de los datos: Simétrica, sesgada, campaniforme, etc.
Características del experimento: Independencia de eventos, número de ensayos, presencia de una tasa fija, etc.
Conclusión
La distribución de probabilidad es un pilar de la estadística y la probabilidad, y su dominio es fundamental para cualquier análisis de datos. Gracias a sus diferentes tipos y características, es posible modelar una amplia gama de fenómenos en todos los campos del conocimiento.
Ya sea que estés evaluando el riesgo de una inversión, diseñando un experimento científico o desarrollando un modelo de inteligencia artificial, entender cómo se comportan las variables aleatorias y cómo se distribuyen es esencial para tomar decisiones informadas y precisas.
FAQs
¿Qué es una variable aleatoria?
Es una variable cuyo valor depende del resultado de un experimento aleatorio. Puede ser discreta o continua, y está asociada a una distribución de probabilidad.
¿Qué representa la curva de una distribución normal?
Una campana simétrica donde la mayoría de los datos se agrupan alrededor de la media. Representa fenómenos naturales y mediciones humanas (altura, inteligencia, presión arterial, etc.).
¿Qué es el valor esperado en una distribución?
Es el promedio teórico de todos los resultados posibles, ponderado por sus probabilidades. Se conoce como media de la distribución.
¿Por qué es importante la distribución de probabilidad?
Porque permite modelar fenómenos aleatorios, hacer predicciones, evaluar riesgos y tomar decisiones informadas en diversas áreas como estadística, finanzas, ingeniería y ciencia de datos.
Fuentes
Investopedia
Universidad Autónoma de Querétaro
Universidad de Valencia
Universidad de Granada