Winsorización

En estadística, la winsorización es el proceso por el que se sustituye un porcentaje dado de valores extremos en una distribución de datos por los valores contiguos, con el objetivo de limitar la influencia de estos valores extremos en los estadísticos que resulten de la muestra (consulta el artículo sobre media winsorizada). En ultima instancia, la winsorización implica una censura de datos, que sustituye los valores inferiores o superiores a un valor concreto por dicho valor (por ejemplo cuando se supone que la edad a la muerte de las personas mayores de 100 años es exactamente 100 años).



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Winsorización" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Series temporales

Una serie temporal o serie cronológica es la sucesión de valores ordenados en el tiempo referidos a una o más variables durante un periodo o intervalo de tiempo regular; por ejemplo, la temperatura máxima diaria en un lugar, las ventas semanales en un establecimiento comercial y el índice de preci...

Media geométrica

La media geométrica de una serie o conjunto de valores cuantitativos \(x-1,x_2,...,x_n\) se calcula a través de la siguiente fórmula:  $$G=(x_1 \cdot x_2 \cdot \cdots \cdot x_n)^{1/n}$$ Por ejemplo, la media geométrica de los valores 2 y 4 es: $$G=(2 \times 4)^{1/2}=2.828$$ En relación con ...

Autocorrelación (correlación serial)

La autocorrelación  o correlación serial es la correlación existente, medida a través del coeficiente de correlación lineal de Pearson, entre valores separados por un intervalo de timepo dado, denominado lag o retardo, en una serie temporal o señal. El conjunto de autocorrelaciones calculadas p...

Polígono de frecuencias

Un polígono de frecuencias es una representación visual de datos de una variable estadística continua, construida a partir del histograma, y con una interpretación análoga a este, formado por líneas que unen los puntos cartesianos formados por las marcas de clase o puntos medios de cada inter...