NTC 5043
NTC 5043
NTC 5043
2010-05-19
INFORMACIÓN GEOGRÁFICA.
CONCEPTOS BÁSICOS DE LA CALIDAD DE
LOS DATOS GEOGRÁFICOS
E: GEOGRAPHIC INFORMATION BASIC CONCEPTS ON
GEOGRAPHICAL DATA QUALITY
CORRESPONDENCIA:
I.C.S.: 35.240.70
® ICONTEC 2019
Reservados todos los derechos. Ninguna parte de esta publicación puede ser reproducida o utilizada
en cualquier forma o por cualquier medio, electrónico o mecánico incluyendo fotocopiado y
microfilmación, sin permiso por escrito del editor.
Editada por ICONTEC. Apartado 14237 Bogotá, D.C. - Tel. (571) 6078888
Primera actualización
Prohibida su reproducción | Editada 2010-08-04
PRÓLOGO
ICONTEC es una entidad de carácter privado, sin ánimo de lucro, cuya Misión es fundamental
para brindar soporte y desarrollo al productor y protección al consumidor. Colabora con el
sector gubernamental y apoya al sector privado del país, para lograr ventajas competitivas en
los mercados interno y externo.
La NTC 5043 (Primera actualización) fue ratificada por el Consejo Directivo de 2010-05-19.
Esta norma está sujeta a ser actualizada permanentemente con el objeto de que responda en
todo momento a las necesidades y exigencias actuales.
ICONTEC cuenta con un Centro de Información que pone a disposición de los interesados
normas internacionales, regionales y nacionales y otros documentos relacionados.
DIRECCIÓN DE NORMALIZACIÓN
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
CONTENIDO
Página
0. INTRODUCCIÓN ....................................................................................................... 1
1. OBJETO .................................................................................................................... 1
Página
ANEXOS
ANEXO A (Normativo)
PRUEBAS DE CONFORMIDAD .......................................................................................... 11
ANEXO B (Informativo)
USO DE LOS CONCEPTOS DE LA CALIDAD DE LOS DATOS ........................................ 15
ANEXO C (Informativo)
BIBLIOGRAFÍA ................................................................................................................... 20
INFORMACIÓN GEOGRÁFICA.
CONCEPTOS BÁSICOS DE LA CALIDAD
DE LOS DATOS GEOGRÁFICOS
0. INTRODUCCIÓN
Los sistemas de información geográfica (SIG) facilitan el uso y el análisis de los datos
geográficos para diferentes disciplinas y dentro de muchas organizaciones. Gracias al papel de
la tecnología, la confianza de la sociedad en la información geográfica está aumentando. Como
consecuencia, el conjunto de datos geográficos se puede compartir, intercambiar y usar para
propósitos diversos, muchas veces más allá de la intención inicial de sus productores.
El propósito de describir la calidad de los datos geográficos es facilitar la selección del conjunto
de datos que mejor satisfaga las necesidades o requisitos de una aplicación específica. La
descripción completa de la calidad de un conjunto de datos hace posible diferenciarlo de otros
datos y activar el intercambio y el uso de los datos geográficos más apropiados, para una
aplicación particular. Un conjunto de datos geográficos se debe ver como un producto y la
información de la calidad de dicho conjunto de datos permite, que el productor o el vendedor
difundan sus productos y ayuda a que el usuario determine la aptitud de dicho producto para
ser usado de acuerdo con unos requisitos predeterminados.
1. OBJETO
1.1 Esta norma proporciona los conceptos básicos para describir la calidad de los datos
geográficos disponibles en formato digital y análogo; presenta un modelo conceptual que
facilita el manejo de la información sobre la calidad de dichos datos geográficos.
1 de 20
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
1.3 Esta norma no busca definir un nivel mínimo aceptable de la calidad de los datos
geográficos ni intenta definir guías para definir su aptitud de uso; ha sido escrita para identificar
y documentar la información de la calidad de un conjunto o subconjunto de datos geográficos.
1.4 Los valores de esta norma están expresados en unidades del sistema internacional,
según la NTC 1000.
1.5 Esta norma es aplicable a datos geográficos digitales, sin embargo, sus principios
pueden utilizarse en otras formas de datos geográficos tales como mapas topográficos y
temáticos, cartas de navegación y documentos textuales.
2. REFERENCIAS NORMATIVAS
Para los propósitos de esta norma se aplican los siguientes términos y definiciones:
3.1 Atributo. Característica propia e implícita que describe a cada uno de los tipos de objetos
geográficos, asignándole propiedades y comportamientos que toman valores particulares en
cada instancia de objeto.
NOTA Un atributo de un objeto tiene un nombre, un tipo de dato, un valor de dominio asociado con él. Un
atributo de objeto también tiene un valor de atributo tomado del tipo de valor de la calidad de datos.
EJEMPLO Un atributo llamado “longitud” puede tener un valor “82,4” que pertenece al tipo de dato "real".
3.2 Calidad. Conjunto de características de los datos geográficos que describen su capacidad
para satisfacer necesidades establecidas e implícitas.
3.4 Conjunto de datos. Grupo de datos geográficos relacionados, que han sido capturados o
generados según especificaciones técnicas previamente determinadas.
NOTA Los principios aplicables a conjuntos de datos pueden también aplicarse a series de conjuntos de datos y
a grupos informativos.
2
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
NOTA La aplicación de un elemento de la calidad a un conjunto de datos depende tanto del contenido de los
datos como de su especificación de producto. Todos los elementos de la calidad pueden no ser aplicables a todos
los conjuntos de datos.
3.6 Elemento de metadato. Cada uno de los componentes de una sección de metadato. Ítem
de datos cuya definición, identificación, representación y valores permisibles son especificados
por medio de un conjunto de atributos.
NOTA Los datos sobre el propósito, uso e historia de los datos de un grupo de datos constituyen información
cualitativa.
3.9 Exactitud. Cercanía de los valores de las observaciones realizadas aspecto a los valores
reales o a los valores aceptados como verdaderos.
3.10 Fecha de evaluación de la calidad. Fecha en la cual fue aplicada una medida de la
calidad de un conjunto de datos. Cuando sea aplicable también es el intervalo de fechas
durante el cual fue aplicada tal medida de la calidad.
3.11 Grupo informativo. Datos con características comunes que pertenecen a un subconjunto
de datos.
NOTA 1 Las características comunes pueden incluir la pertenencia a un tipo de objeto identificado, atributo o
relación entre objetos; compartimento de criterios de colección de datos; compartimento de la misma fuente original
de los datos; o estar dentro de una extensión geográfica y/o temporal especificada.
NOTA 2 Un grupo informativo puede ser tan pequeño como un objeto, un valor de atributo o una simple relación
entre objetos.
3.12 Indicador de la calidad de los datos. Tipo de prueba aplicada a un nivel de medición
específico para evaluar la calidad de datos geográficos.
NOTA Un indicador nombra y describe el tipo de prueba aplicada, incluidos los parámetros límites o de frontera.
EJEMPLO La prueba es "cumple / no cumple"; específicamente desviación estándar convertida a una distribución
circular equivalente; el valor del parámetro límite es un nivel de confiabilidad del 90 %.
3.15 Metadato. Datos acerca del contenido, calidad, condición u otras características de los
datos.
3.16 Nivel de medición de la calidad de los datos. Extensión o característica de los datos
para los cuales se evalúa y se reporta la información de la calidad.
3
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
NOTA El nivel de evaluación de la calidad puede ser la serie a la cual pertenece el conjunto de datos, el conjunto
de datos como tal o un grupo de datos debidamente identificado.
3.17 Relación. Interacción o vinculación entre miembros de un tipo de objeto o entre tipos de
objetos.
3.18 Sección de metadato. Categorizaciones del metadato geográfico que define una
colección de información relacionada.
3.19 Series de conjuntos de datos. Grupos de un conjunto de datos que comparten la misma
especificación de producto.
3.21 Tipo de valor de la calidad de datos. Unidad utilizada para reportar el resultado de la
calidad de datos.
3.22 Universo abstracto. Vista del mundo real o hipotético que incluye todos los objetos de
interés.
3.23 Variable booleana. Variable lógica cuyo dominio puede tomar dos tipos de valores, tales
como: sí, no; falso, verdadero; cumple, no cumple.
Puede aplicarse una descripción de la calidad a un conjunto de datos, a una serie de conjuntos
de datos o a un grupo informativo cuya calidad quiera ser evaluada.
Aunque los requisitos de esta norma se han escrito para identificar y recolectar la información
de la calidad de un conjunto de datos; sus principios pueden extenderse para aplicarse a series
de conjuntos de datos y grupos informativos.
4
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
Información Cualitativa
NTC 4611
Elementos generales Información Geográfica
de calidad Metedatos Geográficos
Información Cuantitativa
PNTC
Elementos y subelementos Evaluación de Calidad -
de calidad aplicables Procesos y Medidas
Descriptores de un
subelemento de la
calidad de los
datos
Alcance
Medida de la calidad
Procedimiento de
evaluación
Resultado
Tipo de valor
Unidad
Fecha
[Link] Totalidad
Describe el nivel de veracidad con el cual los elementos almacenados (capturados), sus
atributos y sus relaciones representan el universo abstracto definido en la especificación
técnica del producto. También describe la presencia y ausencia de objetos, atributos,
relaciones representadas en el conjunto de datos respecto a la especificación técnica del
producto y a una fuente de mayor exactitud.
Describe el grado de certidumbre con el cual un determinado conjunto de datos cumple las
especificaciones del producto, en lo relacionado con la estructura interna de los datos, reglas
topológicas, atributos y relaciones.
5
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
Describe el grado de realidad en la escala del tiempo, de los elementos existentes en la base
de datos y sus relaciones temporales respecto a las especificaciones del producto.
Describe el grado de fidelidad de los valores de los atributos asignados a los elementos en la
base de datos, respecto a su verdadera característica en el mundo real y la clasificación
correcta de los objetos y sus relaciones, de acuerdo con las especificaciones de producto.
Los siguientes subelementos se deben usar para describir la calidad de un conjunto de datos:
[Link] Totalidad
Consistencia de dominio: cercanía de los valores del conjunto de datos al valor de dominio
establecido para el producto geográfico, en conformidad con los parámetros establecidos en la
especificación técnica.
Consistencia de formato: grado en el cual los datos están almacenados, de acuerdo con la
estructura del conjunto de datos.
6
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
Exactitud relativa o interna: cercanía de las posiciones relativas de los objetos en un conjunto
de datos, respecto a las posiciones relativas aceptadas como verdaderas. La posición relativa o
interna se refiere a la posición de un elemento o conjunto de elementos respecto a la posición
de los demás elementos de este conjunto.
Validez temporal: validez de los datos respecto al tiempo (de acuerdo con la especificación de
producto).
Exactitud de un atributo cualitativo: diferencia de los valores dados a los atributos cualitativos
respecto a los valores verdaderos o considerados como verdaderos.
Exactitud del valor dado a un atributo cuantitativo: diferencia entre los valores dados a los
atributos cuantitativos respecto a los valores verdaderos o considerados como verdaderos.
La información de la calidad se debe reportar para cada subelemento de la calidad al cual sea
aplicable; el mecanismo para hacerlo debe ser por medio del uso de los siete (7) descriptores
obligatorios de un subelemento de la calidad:
- medida de la calidad;
7
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
4.4 PROPÓSITO
Registra los motivos por los cuales se creó el conjunto de datos y el uso previsto para dicho
conjunto de datos.
4.5 OBJETO
Describe los fundamentos para la creación de un conjunto de datos y contiene información
acerca de su uso.
4.6 USO
Documenta las aplicaciones en las cuales el productor o usuarios distintos, emplean o pueden
emplear el conjunto de datos.
NOTA El uso previsto de un conjunto de datos no es necesariamente el mismo que su uso actual. El uso actual
se reporta en el elemento uso.
Debe existir el recuento del ciclo de vida del conjunto de datos desde la colección y la
adquisición, hasta su compilación y derivación a su forma actual. La historia de los datos debe
contener dos componentes:
Algunos de los ítems de este numeral pueden ser no aplicables en todos los casos.
8
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
Se pueden nombrar y definir nuevos elementos de la calidad, si los que se encuentran incluidos
en esta norma no son suficientes para describir y medir la calidad de los datos. El nombre y la
definición del elemento de la calidad adicionado se deben incluir como parte del reporte de la
calidad del conjunto de datos.
Al menos un subelemento de la calidad se debe identificar como aplicable para cada elemento
de la calidad aplicable. No todos los subelementos de la calidad pueden ser aplicables a un tipo
particular de datos. La especificación de producto se debe usar para determinar su aplicación.
Cada subelemento de la calidad aplicable debe tener definido por lo menos un nivel de
medición. De esta manera, el alcance en la medición puede ser la serie a la que pertenece un
conjunto de datos, el conjunto de datos o un grupo informativo debidamente establecido.
Teniendo en cuenta que la calidad puede variar dentro de un conjunto de datos hay que
identificar de manera adecuada el alcance de medición, de acuerdo con:
- los tipos de ítems (listas de tipo de objetos, atributos y relaciones entre objetos) o ítems
específicos (instancia de objetos, valores de atributos e instancias de relaciones de
objetos);
- la extensión geográfica, y
Para cada nivel de medición se debe proporcionar una medida de la calidad. Dicha medida
debe nombrar y describir de manera breve el tipo de prueba que se aplica a los datos en un
nivel de medición incluyendo los parámetros límite o de frontera.
9
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
Se debe suministrar un tipo de valor para cada resultado de la calidad de datos. El tipo de valor
de la calidad puede tener como parámetro “cumple” o “no cumple”.
Se debe proporcionar la unidad del valor para cada resultado de la calidad de datos cuando
corresponda. Así, las unidades correspondientes a una incertidumbre posicional pueden ser:
metros (m), decímetros (dm), centímetros (cm), milímetros (mm).
El propósito, uso e historia de los datos se deben suministrar para cada conjunto de datos y
como tal, se debe informar. Si ese conjunto pertenece a una serie, el propósito, uso o historia
de los datos de la serie pueden igualmente proporcionarse.
La historia de los datos para grupos informativos dentro de un conjunto de datos puede ser
diferente de la historia del resto de datos del conjunto de datos y esta diferencia se debe
reportar.
10
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
6. REPORTE DE LA CALIDAD
La información cuantitativa de la calidad se debe reportar mediante uno de los reportes para la
evaluación de la calidad indicados en la NTC 5660.
11
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
ANEXO A
(Normativo)
PRUEBAS DE CONFORMIDAD
A.1.1 General
Todos los casos de prueba en el presente anexo son pruebas de tipo: Básico.
Examinar la descripción de la calidad y verificar que los elementos generales estén incluidos en
esta norma, o describen aspectos de la calidad cuando son adicionales no incluidos
previamente en esta norma.
12
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
NOTA La conformidad es válida si a pesar de no aplicar los subelementos de la calidad definidos, se definen
otros subelementos que describan la calidad cuantitativa de los datos. Sin embargo, que los subelementos de la
calidad no sean aplicables no implica generar nuevas pruebas de conformidad.
Propósito de la prueba: determinar la conformidad, para asegurar que los ítems adicionados en
la descripción de la calidad son exclusivos y que se proporciona suficiente información acerca
de la adición de nuevos elementos.
Método de evaluación: examinar los elementos de la calidad adicionados y garantizar que cada
componente cuantitativo de la calidad adicionado no es especificado ni descrito en esta norma.
Examinar todos los subelementos de la calidad adicionados y garantizar que cada componente
no está listado ni descrito en esta norma.
Examinar todos los elementos generales de la calidad adicionados y garantizar que cada uno
aborda un aspecto cualitativo de la calidad que no está específicamente enumerado ni descrito
en esta Norma Nacional.
Método de evaluación: comparar esta norma y el reporte de la calidad suministrado para cada
subelemento de la calidad, incluyendo los subelementos de la calidad adicionados y determinar
si las reglas de ocurrencia para el uso de los descriptores de los subelementos de la calidad se
han utilizado.
14
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
ANEXO B
(Informativo)
B.1 ANTECEDENTES
El conjunto de datos se define como una colección de los datos que se puede identificar; dicho
conjunto representa el universo abstracto. El universo abstracto es un subconjunto del mundo
real o hipotético que sirve como marco de referencia a un conjunto de datos que se caracteriza
por sus componentes espacial, temporal y temático. El conjunto ideal de datos resulta de
representar la totalidad de los elementos contenidos en el universo abstracto. Idealmente, la
calidad de un conjunto de datos se mide por su capacidad de representar dicho universo. Para
crear un conjunto de datos, un productor debe identificar un conjunto de parámetros que
definen la representación del universo abstracto en dicho conjunto de datos. Esto se hace
usualmente mediante una especificación de producto o descripción de proyecto.
Cuando un conjunto de datos no se produce para una aplicación específica, sino más bien para
un conjunto de aplicaciones, el concepto de la calidad permite evaluar la diferencia entre el
conjunto de datos producidos y el universo en discurso (que es el conjunto de datos perfecto
correspondiente a la especificación técnica del producto).
Los conceptos de la calidad de los datos suministran un marco de referencia para productores
y usuarios de datos. Al productor, le entrega elementos para medir qué tan bien la
representación usada para crear el conjunto de datos refleja su universo abstracto. De esta
forma los productores pueden validar el desempeño de sus productos con otros existentes en
el mercado. A los usuarios, el modelo conceptual les entrega elementos para evaluar un
conjunto de datos, conforme con los requisitos de una aplicación específica del usuario.
Igualmente los usuarios pueden evaluar la aptitud de uso y determinar si un conjunto de datos
satisface los requisitos de una aplicación (véase la Figura B.1).
Universo abstracto A
Universo
abstracto B
Universo
abstracto USUARIO
DE DATOS
PRODUCTOR Describe
DE DATOS Describe
Calidad
Especificación Calidad de los Requisitos
de producto de los datos del usuario
datos
Produce Selección
Conjunto de datos
Un conjunto de datos puede pertenecer a una serie. La calidad de todos los conjuntos de datos
que pertenecen a una serie es normalmente la misma. Los conceptos de la calidad reconocen
la serie del conjunto de datos y permiten evaluar y reportar la calidad del conjunto de datos
como la de la serie a la que pertenece.
Un conjunto de datos puede verse como un gran número de pequeños grupos de datos. Los
pequeños grupos de datos que tienen elementos comunes tales como pertenecer al mismo tipo
de objeto, atributos de objetos, relaciones entre objetos o que comparten criterios de colección
o comparten una misma extensión geográfica se conocen como grupos informativos. La calidad
de esos grupos informativos no se puede asumir como la misma del conjunto de datos al cual
pertenecen. Los conceptos de la calidad permiten reportar las diferencias de la calidad de los
diversos grupos informativos junto con la información general para todo el conjunto de datos.
NOTA Para un productor de datos, la verdadera calidad de un conjunto de datos es la fidelidad con que éste
representa su universo abstracto. Sin embargo, no hay un método completo para medir esa capacidad. Una
especificación de producto es una expresión escrita del universo abstracto, que contiene los requisitos para construir
un conjunto de datos.
Los conjuntos de datos se modifican, actualizan e integran continuamente, de manera tal, que
la calidad o un componente de la calidad de un conjunto de datos puede cambiar. La
información de la calidad de un conjunto de datos que suministra un productor, se puede ver
afectada por tres situaciones:
La primera condición de una modificación del conjunto de datos, ocurre con mucha frecuencia.
La mayoría de los conjuntos de datos no son estáticos. Los cambios en la tecnología y un
creciente énfasis en los estándares de transferencia de datos están conduciendo a un
incremento en el intercambio de información, al uso de conjunto de datos para múltiples
propósitos y a un refinamiento y actualización complementarios de los conjuntos de datos para
cumplir con múltiples propósitos. Si la calidad reportada de un conjunto de datos tiende a
cambiar con las modificaciones, el productor de los datos debe volver a evaluar la calidad de
éstos, una vez ocurran los cambios.
La tercera condición, un cambio del mundo real, se produce continuamente. El cambio puede
ser causado por fenómenos naturales como por los movimientos de la corteza de la tierra o la
erosión, pero la mayoría de las veces son resultado de la actividad humana.
Los cambios son a menudo bruscos, por este motivo, la fecha de recolección de los datos es
importante para juzgar la calidad de un conjunto de datos. En algunos casos, si se conoce,
incluso la tasa de cambio es de interés.
17
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
NOTA El tipo de valor que se utilizó para medir los resultados de la calidad de los datos en el ejemplo anterior es
“distancia”. La unidad de medida utilizada para medir los resultados de la calidad para el ejemplo anterior es “metro”.
Tabla B.1 Jerarquía para reportar la información cuantitativa de la calidad de los datos
Con el fin de reducir al mínimo el esfuerzo de crear, almacenar e interpretar los metadatos para
el ejemplo, se sugiere que la información de la calidad sea reportada como metadato
solamente para el conjunto de datos y los datos especificados por el alcance como caminos,
ferrocarriles y gasoductos. Debería eliminarse el reporte de la calidad para cuerpos de agua.
El principio jerárquico para la presentación de reportes también se puede aplicar entre tipos y
ocurrencias. Se sugiere la información cuantitativa de la calidad, para reportar las
características de una instancia cuando ésta difiere del conjunto de datos o se requiere evaluar
alguna relación particular del conjunto de datos.
La Figura B.2 ilustra el nivel jerárquico de un conjunto de datos para la información cuantitativa
de la calidad reportada como metadato y el método de reporte sugerido (como parte del archivo
de metadato o el repositorio o la atribución dentro de un conjunto de datos).
18
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
Serie de conjunto
de datos
Conjunto de datos
Reportado como un
atributo dentro de
un conjunto datos
Ocurrencia de una relación
Instancia del objeto Atributo de objeto
entre objetos
Reportado cuando la calidad difiere Reportado cuando la calidad difiere Reportado cuando la calidad difiere
de la calidad tipo de objeto padre, de la calidad tipo de atributo padre, de la calidad tipo de relación padre,
reportado para un grupo informativo reportado para un grupo informativo reportado para un grupo informativo
a) Aplicable únicamente cuando un conjunto de datos pertenece a una serie de conjunto de datos. La
información de la calidad para una serie de conjunto de datos se puede “sustituir” por la calidad de
información del respectivo conjunto de datos. Los metadatos de un conjunto de datos pueden hacer
referencia a la información de la calidad de su serie, o pueden utilizar la información de la calidad de la serie
como parte de su propio metadato.
b) La información de la calidad de un conjunto de datos se reporta si el conjunto de datos no pertenece a una
serie. Si un conjunto de datos pertenece a una serie y su calidad difiere de la serie padre, la información de
la calidad de dicho conjunto de datos debe reportarse necesariamente.
Figura B.2. Método sugerido para reportar información cuantitativa de la calidad como metadato
19
NORMA TÉCNICA COLOMBIANA NTC 5043 (Primera actualización)
ANEXO C
(Informativo)
BIBLIOGRAFÍA
20