Winsorización

En estadística, la winsorización es el proceso por el que se sustituye un porcentaje dado de valores extremos en una distribución de datos por los valores contiguos, con el objetivo de limitar la influencia de estos valores extremos en los estadísticos que resulten de la muestra (consulta el artículo sobre media winsorizada). En ultima instancia, la winsorización implica una censura de datos, que sustituye los valores inferiores o superiores a un valor concreto por dicho valor (por ejemplo cuando se supone que la edad a la muerte de las personas mayores de 100 años es exactamente 100 años).



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Winsorización" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Macrodatos

Los macrodatos son los datos que resultan de la agregación u otro tipo de operaciones con datos más simples, en último extremo de microdatos. Por ejemplo, las calificaciones medias por aula son macrodatos obtenidos a partir de las calificaciones individuales de los estudiantes....

Muestra estadística

Una muestra estadística es un subconjunto de elementos elegidos de una población que por considerarse representativa de esta se utiliza como base para inferir sus características. El criterio fundamental para considerar una muestra como representativa es que esta haya sido extraída al azar. Las razo...

Gráfico de cascada

Imagen: Gráfico de cascada que muestra el cambio de una magnitud de una variable (en azul) a través de los incrementod (en verde) y decrementos (en rojo) ocurridos a lo largo del periodo. Créditos: ExcelExpert1 - Commons. Un gráfico de cascada es un diagrama de barras que representa la evolución...

Matriz de correlación

En estadística, una matriz de correlación es una disposición ordenada en una matriz de los coeficientes de correlación entre pares de variables de un conjunto, de forma que la posición de cada coeficiente de correlación viene dada por las variables que corresponden a la fila y columna correspondient...