Datos estructurados y datos no estructurados

Datos estructurados son aquellos datos recogidos en un formato estándar, o según un modelo fijo determinado, generalmente de acuerdo a una tabla o base de datos, de forma que componen un conjunto homogéneo de datos de fácil acceso y listos a ser analizados. Por ejemplo, si en una colección de recetas están bien diferenciados el nombre de la receta, los ingredientes, el tiempo de preparación y la propia receta, de manera que se diferencien y analicen estas secciones, se dirá que los datos están estructurados. Los datos no estructurados, en cambio, son aquellos que no se presentan como tablas y por tanto no ofrecen directamente la posibilidad de análisis estadístico sin cambios de formato previo, como por ejemplo documentos pdf, imágenes y vídeos.

De toda la información disponible en el mundo, los datos estructurados no forman más que una pequeña parte. De hecho, se utiliza la metáfora del iceberg o iceberg para representar datos estructurados y no estructurados: los datos estructurados serían una pequeña parte visible del iceberg y los no estructurados la mayor parte de la superficie submarina.



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Datos estructurados y datos no estructurados" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Autocorrelación (correlación serial)

La autocorrelación  o correlación serial es la correlación existente, medida a través del coeficiente de correlación lineal de Pearson, entre valores separados por un intervalo de timepo dado, denominado lag o retardo, en una serie temporal o señal. El conjunto de autocorrelaciones calculadas p...

Variable cualitativa (variable categórica)

Una variable estadística cualitativa o variable estadística categórica es una característica, rasgo o propiedad que se ha fijado  a través de su pertenencia a una serie de categorías o modalidades establecidas de antemano. A diferencia de las variables cuantitativas, en las que una característi...

Límites de confianza

En estadística, los límites de confianza son los valores míninos y máximos que se establecen para un parámetro desconocido con un nivel de confianza determinado, que suele ser del 90, 95 o 99%. Generalmente, los límites de confianza se establecen restando, para conseguir el valor mínimo, y sumando, ...

Estadísticos descriptivos

Los medidas estadísticas descriptivas son estadísticos muestrales que aplicados a una muestra o conjunto de datos proporcionan en forma resumida sus características más importantes, de forma que ofrecen una descripción del conjunto de datos. Entre estas medidas cabe destacar las medidas de centraliz...