Datos estructurados y datos no estructurados

Datos estructurados son aquellos datos recogidos en un formato estándar, o según un modelo fijo determinado, generalmente de acuerdo a una tabla o base de datos, de forma que componen un conjunto homogéneo de datos de fácil acceso y listos a ser analizados. Por ejemplo, si en una colección de recetas están bien diferenciados el nombre de la receta, los ingredientes, el tiempo de preparación y la propia receta, de manera que se diferencien y analicen estas secciones, se dirá que los datos están estructurados. Los datos no estructurados, en cambio, son aquellos que no se presentan como tablas y por tanto no ofrecen directamente la posibilidad de análisis estadístico sin cambios de formato previo, como por ejemplo documentos pdf, imágenes y vídeos.

De toda la información disponible en el mundo, los datos estructurados no forman más que una pequeña parte. De hecho, se utiliza la metáfora del iceberg o iceberg para representar datos estructurados y no estructurados: los datos estructurados serían una pequeña parte visible del iceberg y los no estructurados la mayor parte de la superficie submarina.



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Datos estructurados y datos no estructurados" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Sesgo de un estimador (estimador sesgado)

En estadística, el sesgo de un estimador es el error promedio en el que incurre por utilizar dicho estimador para estimar el valor de un parámetro estadístico concreto. Más concretamente, para un estimador \(\hat{\theta}\) de un parámetro \(\theta\), el sesgo de dicho estimador se define de esta for...

Mediana de las desviaciones absolutas (desviación absoluta mediana)

La mediana de las desviaciones absolutas (MEDA) o desviación absoluta mediana (DAM) es una medida de dispersión absoluta de una variable estadística cuantitativa. Para su cálculo se parte de la mediana de los datos \(x_i\); a continuación se calculan las desviaciones absolutas respecto de dicha medi...

Escalas categóricas

Las escalas categóricas o escalas cualitativas son aquellas escalas de medida que asignan una categoría relativa a una característica de estudio y no una medida cuantitativa a cada uno de los elementos u objetos que forman un conjunto, muestra o población. Por ejemplo son escalas categóricas, el sex...

Exceso de curtosis

En una distribución estadística, el exceso de curtosis es la diferencia entre el valor de un coeficiente de curtosis correspondiente a dicha distribución y  el valor del mismo coeficiente para una distribución normal. Según el exceso de curtosis sea positivo o negativo, se concluirá que la dist...