Media winsorizada

Una media winsorizada es aquel promedio que sustituye un porcentaje dado de datos en cada extremo de la distribución, transformándolos al valor inmediatamente anterior y posterior de los extremos inferior y superior respectivamente. Por ejemplo, si los datos son 4-20-22-24-26-28-30-32-34-36, la media winsorizada al 10% sustituye los datos 4 y 36, por 20 y 34; de esta forma la media winsorizada es 27, mientras que la media aritmética simple. Como se puede comprobar en el ejemplo anterior, la media winsorizada es especialmente adecuada en el caso de la existencia de datos atípicos, cuya influencia mitiga considerablemente: en el ejemplo el datos de valor 4 empuja la media hacia la izquierda, y la distorsiona en cierta medida, en perjuicio de su significado como medida de tendencia central, mientras que la media winsorizada proporciona un valor más ajustado al centro. Es, por tanto, un estadístico robusto.

Puede interesarte también



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Media winsorizada" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Cuál es la ventaja de utilizar una media winsorizada en lugar de una media aritmética simple?

Verónica

La ventaja principal de utilizar una media winsorizada es que puede mitigar la influencia de datos atípicos o outliers, lo que la hace más adecuada para medir la tendencia central en conjuntos de datos con valores extremos.

¿Cómo se determina el porcentaje de datos a sustituir en una media winsorizada?

Pol

No se especifica en el artículo, pero generalmente se puede determinar mediante un análisis previo del conjunto de datos para identificar el porcentaje óptimo que minimice la influencia de los outliers.

¿Pueden las medias winsorizadas ser utilizadas con otros métodos estadísticos robustos?

Omar

Sí, las medias winsorizadas pueden ser utilizadas junto con otros métodos estadísticos robustos, como el rango intercuartilico (IQR), para obtener medidas más precisas y confiables del centro

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Perturbación aleatoria

La perturbación aleatoria (en inglérs, random error, error term) es el componente no determinista en un modelo estadístico, no observable y que incluye de forma conjunta todos los factores no especificados en el modelo. Generalmente la perturbación aleatoria aparece en los modelos de regresión ...

Prueba de Chow

La prueba de Chow o contraste de Chow es una prueba estadística destinada a contrastar la igualdad de los coeficientes de regresión en dos grupos de datos. De esta forma, se utiliza para decidir si ha existido un cambio estructural al pasar de un conjunto de datos al otro. La prueba fue originalment...

Coeficiente Q de Yule

El coeficiente Q de Yule es una medida de asociación nominal y ordinal entre dos variables dicotómicas o binarias, calculado a partir de la tabla de contingencia 2x2 que forman los datos referidos a las dos variables. Dada la siguiente tabla de contingencia: Tabla de contingencia Totales...

Desigualdad de Markov

El teorema de Markov, comúnmente desigualdad de Markov, denominada también acotación de Markov o cota de Markov, proporciona una cota para la probabilidad de la cola superior de una variable aleatoria cuando se conoce exclusivamente la esperanza o media de dicha variable. Más concretamente, la desig...