Winsorización

En estadística, la winsorización es el proceso por el que se sustituye un porcentaje dado de valores extremos en una distribución de datos por los valores contiguos, con el objetivo de limitar la influencia de estos valores extremos en los estadísticos que resulten de la muestra (consulta el artículo sobre media winsorizada). En ultima instancia, la winsorización implica una censura de datos, que sustituye los valores inferiores o superiores a un valor concreto por dicho valor (por ejemplo cuando se supone que la edad a la muerte de las personas mayores de 100 años es exactamente 100 años).



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Winsorización" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Variable predictora

Una variable predictora, variable predictiva o simplemente predictor es una variable que se inserta en un modelo estadístico  y que en base al valor concreto que toma se utiliza para predecir el valor que tomará una variable explicada. Toma también la denominación de variable explicativa. ...

Lema de Neyman-Pearson

En inferencia estadística, el lema de Neyman-Pearson es una proposición que demuestra que un contraste o prueba de hipótesis óptimo dadas una hipótesis nula y una hipótesis alternativa paramétricas simples es aquel que tiene como estadístico de contraste la razón de verosimilitud de la muestra para ...

Aleatorización (diseño de experimentos)

En el diseño de experimentos, la aleatorización es la asignación aleatoria o al azar de las unidades experimentales a los diferentes tratamientos con el objetivo de que no se produzcan sesgos y que los diferentes grupos de unidades sean comparables únicamente debido  al tratamiento, diluyendo g...

Media winsorizada

Una media winsorizada es aquel promedio que sustituye un porcentaje dado de datos en cada extremo de la distribución, transformándolos al valor inmediatamente anterior y posterior de los extremos inferior y superior respectivamente. Por ejemplo, si los datos son 4-20-22-24-26-28-30-32-34-36, la medi...