Desigualdad de Chebychev

Txebixev_01.pngLa desigualdad de Bienaymé-Chebychev, comúnmente denominada sin más desigualdad de Chebychev, desigualdad de Tchebychev o desigualdad de Chebyshev, es una fórmula que proporciona una cota máxima para la probabilidad de que el valor de una variable aleatoria se sitúe mas allá de una distancia dada a partir de la media o  valor esperado de la variable, a partir únicamente de conocer el valor esperado y varianza de la distribución. Concretamente, para una variable aleatoria con varianza finita \(\sigma^2\) y un valor \(\epsilon>0\), la desigual de Chebychev establece que:

$$P[|X-\mu| \geq \epsilon] \leq \cfrac{\sigma^2}{\epsilon^2}$$

La desigualdad anterior establece un valor máximo para la probabilidad de las colas mas allá de una distancia \(\epsilon\) a partir de la media \(\mu\). Alternativamente, la fórmula puede modificarse para acotar la probabilidad de un intervalo central alrededor de la media:

$$P[\mu-\epsilon<X<\mu+\epsilon]=P[|X-\mu| < \epsilon] \geq 1-\cfrac{\sigma^2}{\epsilon^2}$$

Al requerir únicamente de la media y varianza de la distribución, la desigualdad de Chebychev es especialmente útil en el caso de que no se conozca la distribución exacta de la variable, pero sí su media y varianza. 

Formulación alternativa

Se suele utilizar también una formulación de la desigualdad que establece la distancia desde la media que define el intervalo como un número de desviaciones típicas. De este modo, haciendo \(\epsilon=k\sigma\), las fórmulas de la desigualdad de Chebychev quedan de la siguiente forma, para \(k>0\):

  • para la probabilidad de las colas:

$$P[|X-\mu| \geq k\sigma] \leq \cfrac{1}{k^2}$$

  • para la probabilidad del intervalo central:

$$P[|X-\mu|  < k\sigma] \geq 1-\cfrac{1}{k^2}$$

Ejemplos de aplicación

La producción diaria en una fábrica se distribuye según una ley de probabilidad desconocida, pero se ha estimado que una media de 100 toneladas y una desviación típica de 10 toneladas. Se desea calcular la probabilidad de que en un día la producción se encuentre entre 70 y 130 toneladas, con el objetivo de que controlar la situación del almacén.

El intervalo del que se quiere calcular la probabilidad es un intervalo central respecto a la media, con una distancia máxima \(de 30 unidades a la media. De esta forma:

$$P[70<X<130]=P[|X-\100| < 30] \geq 1-\cfrac{10^2}{30^2}=0.888$$

De este modo, puede afirmarse que la probabilidad de que la producción se encuentre en el intervalo 70-130 es mayor o igual a 0.888.


La temperatura media en un lugar para el mes de agosto se distribuye con un valor esperado de 15 grados y una desviación típica de 2 grados. Se desea determinar la probabilidad de que la temperatura se aleje de dicho valor esperado 4 desviaciones típicas.

El planteamiento del problema nos lleva a la utilización directa de la formulación de la desigualdad en términos del número de desviaciones típicas:

$$P[|X-\15| \geq 4\sigma] \leq \cfrac{1}{4^2}=0.0625$$

De esta forma la probabilidad pedida se puede asegurar que es inferior o igual a 0.0625.

Exactitud de la cota de Chebychev

Hay que subrayar que la probabilidad que proporciona la desigualdad de Cehbychev es una cota máxima o mínima, según se utilice la fórmula para las colas o para el intervalo central respectivsamente. Por ejemplo, si la probabilidad del intervalo central resulta mayor o igual que 0.75 aplicando la fórmula de Chebychev, esto quiere decir que la probabilidad exacta puede ser 0.75, 0.99 o incluso 1 dependiendo de la distribución exacta. 

A continuación, para ilustrar la aproximación de la cota de Chebychev a la probabilidad exacta de distribuciones concretas, se calcula la probabilidad para diferentes intervalos notables según la desigualdad de Chebychev, la distribución normal y la distribución uniforme entre 0 y 1:

Valor de k 

Cota de probabilidad

de Chebychev para las colas: 1/k2

Distribución normal Distribución uniforme U(0,1) 
1 ≥0 0.6827 0.5772
1.25 ≥0.36 0.7887 0.7215
1.5 ≥0.55 0.8664 0.8658
2 ≥0.75 0.9545 1
2.5 ≥0.84 0.9876 1
3 ≥0.889 0.9973 1
4 ≥0.9375 0.99994 1

 Como puede verse, para estas dos distribuciones la cota de Chebychev van siendo más exacta según se va incrementando la distancia en desviaciones típicas desde el valor esperado.

Puede interesarte también



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Desigualdad de Chebychev" (en línea)   Enlace al artículo
Última actualización: 24/12/2024

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Función de distribución

En teoría de probabilidades, la función de distribución, también llamada función de distribución acumulada o función de distribución acumulativa (FDA), es una función que proporciona, en el caso de una distribución de probabilidad unidimensional,  para un valor x dado, la probabilidad de que un...

Espacio muestral

Espacio muestral es el conjunto de los sucesos elementales o resultados simples asociados a la realización de un experimento aleatorio. Por ejemplo, lanzando un dado de seis caras, el espacio muestral asociado al resultado viene dado por la siguiente expresión:  $$\Omega=\{1,2,3,4,5,6\}$$ Los...

Distribución binomial negativa (distribución de Pascal)

La distribución binomial negativa o distribución de Pascal (Blaise Pascal, 1623-1662) es la distribución de probabilidad que representa, en una secuencia independiente de eventos binarios, denominados éxito y fracaso con probabilidades respectivas p y q=1-p, el número de fracasos hasta el acaecimien...