0% encontró este documento útil (0 votos)
66 vistas145 páginas

Predicción del Riesgo Epidémico del Dengue

Este documento describe un modelo de predicción del riesgo epidémico de Dengue en Perú basado en la división del territorio en celdas de 100 km2. El modelo evalúa la vulnerabilidad de cada celda considerando factores como la población y la presencia de mosquitos, y predice mensualmente los niveles de riesgo de ocurrencia de Dengue en cada celda usando un árbol de decisión informado por datos históricos, relaciones entre celdas y variaciones de temperatura. El modelo busca mejorar la prevención y lucha

Cargado por

SERGIO
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
66 vistas145 páginas

Predicción del Riesgo Epidémico del Dengue

Este documento describe un modelo de predicción del riesgo epidémico de Dengue en Perú basado en la división del territorio en celdas de 100 km2. El modelo evalúa la vulnerabilidad de cada celda considerando factores como la población y la presencia de mosquitos, y predice mensualmente los niveles de riesgo de ocurrencia de Dengue en cada celda usando un árbol de decisión informado por datos históricos, relaciones entre celdas y variaciones de temperatura. El modelo busca mejorar la prevención y lucha

Cargado por

SERGIO
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

1

RESUMEN

El Dengue es una enfermedad humana de importancia a nivel

mundial por su incremento y expansión causada por la picadura del

mosquito Aedes aegypti; no existe vacuna contra esta enfermedad, la

única forma de lucha es la prevención. El modelo de predicción del riesgo

epidémico del Dengue esta basado en la división del territorio peruano en

superficies homogéneas de 100 km² denominadas ‘celdas’, sobre las

cuales se predicen niveles mensuales de riesgo. Los componentes del

riesgo son la vulnerabilidad y el peligro; la vulnerabilidad es una medición

basada en la propensión actual de la población a la enfermedad y el

espacio de ocupación del mosquito transmisor (Aedes aegypti); el peligro

es una predicción mensual de niveles de ocurrencia de Dengue (‘Libre’,

‘Bajo’, ‘Medio’, ‘Alto’ y ‘Muy alto’) determinado por un árbol de decisión

construido en base a información histórica de casos de Dengue, las

‘celdas’, relaciones de vecindad entre ‘celdas’, pertenencia a zonas

ecológicas y variaciones de la temperatura superficial del mar. La

medición de las variables, el fraccionamiento del territorio y

operacionalización se efectuó con ayuda de tecnologías de información

geográfica, bases de datos geográficas y herramientas de aprendizaje

automático.
2

INTRODUCCION

Hoy en día frente a la ocurrencia de enfermedades infecciosas, los

resultados de la modelización de epidemias están empezando a proponer

planes de prevención y estrategias de lucha contra enfermedades como el

Dengue. En el estudio de predicción de epidemias, los modelos

matemáticos, estocásticos y basados en la evolución individual de cada

agente ocupan el primer plano. Sin embargo, todavía es materia de

investigación las relaciones del hombre, los virus y los agentes de

transmisión; el abordaje del estudio sobre grupos pequeños de individuos,

viviendas, ciudades y regiones más grandes también es motivo de

investigación. Las tecnologías de información geográfica y de observación

de la tierra están comenzando a ser utilizados para el entendimiento de

esta complejidad y como herramienta de ayuda a la construcción de

modelos que integren el ‘espacio’ como parámetro de predicción.

En este contexto, esta investigación tiene una perspectiva global

del territorio peruano, sobre el supuesto de que existe una vinculación

entre el comportamiento de la epidemia del Dengue y el espacio donde se

manifiesta. Esta perspectiva del problema implica la aplicación de

métodos de medición, técnicas para construir modelos de predicción y el

tratamiento informático de grandes volúmenes de información geográfica.

Este reporte de investigación se compone de nueve capítulos, el

primero trata de la definición del problema, hipótesis y lineamientos de


3

investigación, el segundo trata del marco teórico donde se describen las

tecnologías de información geográfica y herramientas de aprendizaje

automático usadas para la investigación, el tercero describe el Dengue

desde el punto de vista clínico, entomológico y epidemiológico. El capítulo

cuatro trata sobre la presencia del Dengue en el Perú, las características

geográficas y ambientales vinculadas a la epidemia. El capítulo cinco trata

sobre las nociones y fundamentos del fraccionamiento del territorio como

método y el análisis de variables distribuidas en el espacio. El capítulo

seis trata sobre el modelo espacial del riesgo epidémico, las

consideraciones sobre la salud y el territorio, el fraccionamiento del

territorio, la técnica de medición de las variables, el modelo de

vulnerabilidad, el proceso de construcción del modelo de predicción del

peligro, el modelo de peligro, el árbol de decisión obtenido y el modelo de

riesgo.

El capítulo siete muestra la utilización de las tecnologías de

información, las bases de datos geográficas y herramientas de

aprendizaje automático en la investigación, este sistema informático

responde sólo a las necesidades de la investigación, la implementación y

uso del sistema no es el objetivo de la investigación. El capítulo ocho

muestra los resultados de la investigación y la prueba de las hipótesis,

muestra la medición de la vulnerabilidad, la predicción del peligro y riesgo.

El capítulo nueve esta dedicada a la discusión de los resultados, el

abordaje del estudio, los resultados de la vulnerabilidad, el modelo de

predicción del peligro y su importancia. Al final se dan las conclusiones y

recomendaciones.
4

CAPITULO I: PLANTEAMIENTO DEL PROBLEMA

PLANTEAMIENTLEMA

1.1. DEFINICIÓN DEL PROBLEMA

Durante las últimas décadas el mundo ha experimentado la


emergencia o la re-emergencia de varias enfermedades infecciosas
en relación con el cambio ambiental acelerado, crecimiento de la
población, migración humana y viajes internacionales [1]1. Una de
esas enfermedades es el Dengue cuya transmisión se realiza por la
picadura del mosquito doméstico Aedes aegypti.

El Dengue ha sido conocido desde finales del siglo XVIII, como un


síndrome benigno de gripe apareciendo esporádicamente, con
intervalos de 10 a 40 años. Durante las últimas décadas, la
expansión de estas enfermedades en el sureste de Asia y América
del Sur y el aumento de formas benignas y letales han sido
observadas. Las diferentes formas de dengue - dengues con fiebre
(DF), dengue hemorrágico con fiebre (DHF) y el síndrome dengue
con shock (DSS) - constituyen una de las importantes enfermedades

1
Vea la sección de referencias bibliográficas
5

tropicales emergentes al principio del siglo XXI. Se ha estimado que


50 a 100 millones de personas cada año padecen el dengue y la
mitad de dicha población vive en las áreas en riesgo [2]. El gráfico
1.1 muestra la presencia del mosquito Aedes aegypti en el mundo.

Gráfico 1.1: Mapa de distribución del Aedes aegypti en el


mundo, Fuente: Organización Panamericana de la
Salud (2 000)

El resurgimiento de DF epidémico y la emergencia de DHF/DSS


están vinculados a los cambios sociales como el crecimiento de la
población, urbanización y el transporte de personas infectadas y los
mosquitos vectores2. Además, las temperaturas crecientes y el
cambio del clima global, están llevando a la expansión del rango
Aedes aegypti en el tiempo y espacio, consecuentemente, la
exposición de la población a un periodo de transmisión más largo y
en las poblaciones inmunológicamente ingenuas al virus
recientemente introducido [3] [4] [5]. El gráfico 1.2 muestra la
evolución de la presencia del Dengue en América Latina desde el
año 1 930 al 2 004.

2
Vector: Agente transmisor, generalmente artrópodos que pueden transportar virus patógenos
de un huésped a otro, sin que el microorganismo se desarrolle en su interior.
6

El Dengue en el Perú ha estado presente desde el siglo XIX, sin


embargo el registro de casos se inició en 1 990 por algunas
direcciones de Salud, esta enfermedad tiene mayor presencia en la
costa norte y en la selva del Perú. En abril de 2 005 se registró un
brote epidémico en el distrito de Comas en Lima con más de 600
casos probables de Dengue. El gráfico 1.3 muestra la evolución del
Dengue desde el año 1 994 hasta abril de 2 005 indicando las
ciudades donde aparecieron brotes de la enfermedad, los nombres
en color verde son ciudades de selva y los de color amarillo son
ciudades de costa.

Presencia de Dengue en América Latina


1 930 1 970 2 001 2 004

Gráfico 1.2: Presencia de Dengue en América Latina, Fuente:


Organización Panamericana de la Salud
OMS/OPS

No se conoce con exactitud los mecanismos que facilitan la


presencia del Dengue ni la forma de propagación después de la
aparición en un determinado territorio, tampoco se conoce las
relaciones entre los actores en juego (contagiados, vectores y virus)
ni su dinámica. En la actualidad faltan muchos datos para responder
a estas interrogantes.
7

Gráfico 1.3: Evolución del Dengue en el Perú - número de


casos 1 994 - 2 005. Fuente: Oficina General de
Epidemiología (OGE) abril de 2 005

Las investigaciones sobre el Dengue se han centrado


principalmente en dos dominios: la búsqueda de una vacuna en el
campo médico y la lucha contra su propagación en el dominio
entomológico - epidémico, sin embargo se han realizado muy pocas
investigaciones considerando los factores geográficos como
unidades de espacio con características propias y las interacciones
que derivan de ello, los estudios a nivel de amplitud geográfica y
detalle (individuos, hogares, ciudades, países, etc.) también son
motivo de investigación.

Actualmente las investigaciones están integrando el “espacio”


como variable en los modelos epidémicos para la predicción de la
población de infectados y vectores de Dengue tomando como
información el registro de las bases de datos efectuada por los
sistemas de vigilancia epidémica de cada país, estas investigaciones
han estudiado la dinámica de la epidemia sobre pequeñas
poblaciones de individuos y hogares, lo cual a aportado al
entendimiento de la epidemia. Sin embargo cuando el tamaño del
8

espacio geográfico es más grande, las premisas y relevancia de las


variables varían, así como su medición y tratamiento.

En el Perú no se ha realizado ninguna investigación que


considere el espacio geográfico como variable de predicción del
Dengue, tampoco se ha medido el riesgo a nivel nacional a pesar de
su importancia para la salud de la población. Considerando este
hecho, la determinación de la vulnerabilidad de la población y el
peligro de la enfermedad que en conjunto constituyen el Riesgo, es
de mucha importancia para la prevención y para su control en el
aspecto de salud humana.

1.2. FORMULACIÓN DEL PROBLEMA

1.2.1. PROBLEMA GENERAL

¿Cómo predecir el riesgo epidémico del Dengue a una escala


nacional?

1.2.2. PROBLEMAS ESPECÍFICOS:

– ¿Qué porcentaje de la superficie del Perú es vulnerable al


Dengue?
– ¿Cómo predecir el peligro del Dengue?

1.3. JUSTIFICACIÓN

1.3.1. JUSTIFICACION TEORICA

El estudio del riesgo epidémico del Dengue desde el punto


de vista geográfico aportará al entendimiento de la dinámica
espacial de la enfermedad y creara un precedente para el
estudio de otras enfermedades causadas por arbovirus3.

3
Arbovirus: Virosis transmitida de un huésped a otro por medio de uno o más tipos de
artrópodos.
9

1.3.2. JUSTIFICACIÓN METODOLÓGICA

El estudio aplica un método de generalización y


homogenización de la medición de factores de riesgo basado
en el fraccionamiento del territorio en superficies homogéneas,
esta tarea es realizada con tecnologías de información
geográfica y aprendizaje automático desde el punto de vista
epidemiológico. Metodológicamente es de utilidad para el
tratamiento de datos de gran volumen, medición de factores
geográficos y de análisis de la realidad.

1.3.3. JUSTIFICACIÓN PRÁCTICA

El estudio proveerá de información sobre la vulnerabilidad al


dengue y predecirá el peligro de ocurrencia de la enfermedad
en todo el Perú. Ya que todavía no existe una vacuna contra
esta enfermedad esta información es de importancia para las
entidades de salud que ejecutan campañas de prevención y
control epidémico.

1.4. OBJETIVOS

1.4.1. GENERAL

Desarrollar un modelo espacial de predicción del riesgo


epidémico del dengue a una escala nacional

1.4.2. ESPECÍFICOS

• Determinar la superficie del Perú vulnerable al Dengue

• Desarrollar un modelo espacial de predicción del peligro


del Dengue
10

1.5. HIPÓTESIS

1.5.1. GENERAL
Las tecnologías de información geográfica y algoritmos de
clasificación permiten desarrollar un modelo espacial de
predicción del riesgo epidémico del Dengue a una escala
nacional

Variable Conceptualización Operacionalización


Arquitectura
Sistema de predicción
Independiente informática y bases de
del riesgo epidémico
datos
Mapas de
Riesgo epidémico del
Dependiente vulnerabilidad, peligro
Dengue
y riesgo epidémico

Tabla 1.1: Variables de la Hipótesis general y


operacionalización

1.5.2. ESPECÍFICAS

a) Más del 25 % del territorio peruano es vulnerable al Dengue

Variable Conceptualización Operacionalización


Bases de datos y
Variables poblacionales
Independiente Sistema de información
y socioeconómicas
geográfica
Dependiente Vulnerabilidad al dengue Mapas de vulnerabilidad

Tabla 1.2: Variables de la primera Hipótesis específica y


operacionalización

b) Las tecnologías de información geográfica y algoritmos de


clasificación predicen el peligro de ocurrencia del Dengue a partir
del registro histórico de variables relacionadas con la enfermedad
11

Variable Conceptualización Operacionalización


Modelo de predicción Bases de datos,
del peligro de algoritmo de predicción y
Independiente
ocurrencia de Sistema de información
Dengue geográfica
Mapas de peligro de
Dependiente Peligro de dengue
Dengue

Tabla 1.3: Variables de la segunda Hipótesis específica y


operacionalización

1.6. METODOLOGÍA DE LA INVESTIGACIÓN

1.6.1. TIPO DE INVESTIGACIÓN

– Investigación descriptiva para la determinación de la


vulnerabilidad y correlacional para la predicción del peligro
de ocurrencia de Dengue

1.6.2. DISEÑO
– Para la determinación de la vulnerabilidad se usará un
diseño no experimental transeccional descriptivo, para la
predicción de ocurrencia del Dengue, se usará un diseño no
experimental longitudinal panel.

1.6.3. METODOLOGÍA DE TRABAJO


[Link]. Recopilación de datos mediante:
– Tratamiento y estandarización de datos del Sistema de
vigilancia epidémica de la Oficina general de epidemiología
(OGE)
– Entrevistas
– Documentos y publicaciones científicas
[Link]. Desarrollo
– Asesoría Especializada
– Convenio para obtención de datos y materiales
12

[Link]. Equipos
– 01 Computadora con capacidad de procesamiento de datos
voluminosos
[Link]. Software
– GeoConcept Expert 5.5 para el manejo de información
geográfica
– PostgreSQL/Postgis: para el manejo de base de datos y
base de datos geográfica.
– WEKA: Para la aplicación de técnicas de aprendizaje
automático y construcción del modelo de predicción del
Peligro de ocurrencia del Dengue
– Scilab: para el tratamiento estadístico y validación del
modelo

1.7. LIMITACIONES

La determinación del riesgo implica la medición de la


vulnerabilidad y el peligro. La vulnerabilidad es una medición
que se determina principalmente por las características
poblacionales y socioeconómicas que indican propensión al
Dengue. El peligro es una predicción de ocurrencia de niveles
de Dengue; el Riesgo es considerado como un producto de la
Vulnerabilidad y el Peligro.
– La vulnerabilidad es una medición ‘del presente’
– El Peligro es una predicción mensual de la ocurrencia de
niveles de Dengue
– Para la medición de las variables necesarias para
determinar la vulnerabilidad y para predecir el peligro se
considera todo el territorio peruano dividido en áreas
homogéneas de 100 km² (cuadrados de 10 km x 10 km). La
determinación de esta superficie como unidad de análisis y
estudio es asumido de forma experimental.
13

– La aparición del Dengue en un nuevo territorio esta


condicionada a la presencia del vector (mosquito Aedes
aegypti) y generalmente por la llegada de una persona
infectada que transmite el virus al vector y este a otras
personas. La predicción de la llegada de una persona
infectada en un lugar con población ingenua a la
enfermedad es muy compleja y todavía es impredecible.
Por tanto el modelo de peligro considera los lugares donde
existió por lo menos un caso de Dengue en el pasado, no
predice la ocurrencia de Dengue en las zonas donde no
existe registro histórico de la enfermedad. El riesgo se
determina para cada mes, donde la vulnerabilidad
permanece constante y el peligro es una predicción
mensual.
14

CAPITULO II: MARCO TEORICO

CAPITULO 2. MARCO TEORICO

2.1. ANTECEDENTES

Hoy en día frente a la existencia de numerosas


enfermedades infecciosas (sean humanas, animales o
vegetales), las investigaciones teóricas sobre la modelización
permite abordar la epidemiología bajo un nuevo ángulo; los
resultados de estas investigaciones permiten mejorar las
estrategias de lucha; de control y quizá mañana la erradicación
de ciertos agentes infecciosos.

En el estudio de la transmisión de enfermedades


contagiosas emergentes, los modelos matemáticos estadísticos
e informáticos, basados sobre una división de la población en
categorías correspondientes al estado susceptible, infeccioso o
inmune de las personas, ocupan el primer plano. En la
actualidad tres formulaciones de modelos de predicción son
usados generalmente: 1) Determinista, basado sobre un
sistema de ecuaciones diferenciales ordinarias o parciales; 2)
Estocástica, basada sobre ecuaciones diferenciales
estocásticas o sobre una modelización markoviana por
15

procesos de salto; 3) Individuo centro, basado en una


descripción de reglas de evolución de cada individuo [6].

El desarrollo de modelos de la dinámica de una epidemia


esta condicionada principalmente a la escala de estudio, un
estudio a nivel de regiones (países), ciudades o en un centro
urbano específico requiere un tratamiento particular debido a
que la preponderancia de los factores de riesgo epidémico en
cada escala son diferentes.

Los 3 tipos de modelos citados anteriormente son


aplicados generalmente en viviendas o grupos reducidos donde
la dimensión espacial de la población es pequeña y el registro
de datos epidémicos es mucho más precisa: Los datos de
registro de las viviendas de un área urbana, los individuos
contagiados y la evolución del Dengue en un periodo de tiempo
es registrada de forma exacta. En el Perú un registro de
información al detalle, sólo puede hacerse cuando el estado o
alguna entidad dedicada a la investigación realizan el
levantamiento de información para un estudio de un brote
epidémico4 que ya sucedió. Si se considera todo el territorio
peruano como espacio de estudio es necesario optar por otro
tipo de tratamiento del problema.

Para el caso de la determinación del Riesgo epidémico para


un espacio geográfico grande como un país, existen
antecedentes de estudios, es el caso de Argentina [7]. Este es
un estudio descriptivo que consideró la población humana
susceptible, el arribo potencial de personas infectadas por los
medios de transporte y aeropuertos, la densidad del vector
Aedes y las condiciones para el desarrollo del agente patógeno
dentro del vector. No se hizo una división homogénea del

4
Brote: Se considera brote al aumento de la incidencia habitual de casos para el área y periodo
de estudio.
16

territorio ni se predice la ocurrencia de Dengue, tampoco se


consideró la información socioeconómica y poblacional.

Para el estudio de enfermedades emergentes desde el


punto de vista del espacio donde se manifiestan, se está
empezando a incluir el espacio de ocurrencia de las epidemias,
la medición de las variables, el tratamiento y la predicción es
apoyada por tecnologías de observación de la tierra,
teledetección y sistemas de información geográfica.

2.2. TELEDETECCION Y EPIDEMIOLOGÍA

2.2.1. TELEDETECCION

La teledetección es un conjunto de herramientas y métodos


para obtener información de fenómenos que ocurren en un
determinado lugar sin tener contacto directo con ellos, entre las
tecnologías relacionadas con la teledetección están los
satélites de observación de la tierra y su capacidad de obtener
información sobre fenómenos que suceden en nuestro planeta,
herramientas informáticas para el tratamiento de imágenes de
satélite, técnicas de reconocimiento de formas, interpretación
de imágenes, software de generación de modelos
tridimensionales del territorio, entre otras.

2.2.2. MEDIO AMBIENTE Y TELEDETECCION

Desde el lanzamiento de los primeros satélites civiles de


observación de la tierra en los años 70, las capacidades de los
captores de teledetección para caracterizar el medio ambiente
a diferentes escalas espaciales, temporales y espectrales, no
han cesado de crecer. Este desarrollo fue acompañado de los
índices y modelos permitiendo ligar la medida de la radiación
electromagnética efectuada con el captor a diferentes
17

parámetros ambientales, características del medio físico,


ecológico o social.

Poco a poco los captores de teledetección igualmente han


sido usados en epidemiología dando información sobre el
entorno pertinente para el estudio y la predicción de
enfermedades relacionadas con las condiciones ambientales.
Este acercamiento es particularmente en zonas intertropical
para las cuales las enfermedades transmisibles son numerosas
y causan graves problemas de salud pública.

La observación de la tierra mediante satélites permite tener


un registro temporal de fenómenos ambientales para ser
analizados en el transcurso del tiempo, para el caso de
epidemias estos datos pueden ser explotados para la
predicción de la ocurrencia temporal de riesgo de una
enfermedad. Por ejemplo se ha establecido una relación entre
la actividad del virus de la fiebre del Valle del Rift en Kenia y
las variaciones de temperatura de la superficie del mar y un
índice de vegetación derivada del captor AVHRR (Advanced
very High Resolution Radiometer, captor a bordo de los
satélites de la NOAA). Los mismos captores pueden
igualmente ser utilizados para la investigación de la ocurrencia
espacial de la enfermedad sobre territorios grandes [8].

2.2.3. INFORMACION OBTENIDA POR TELEDETECCION


[Link]. OCUPACIÓN DEL SUELO

La ocupación del suelo es un indicador esencial para los


estudios epidemiológicos y puede ser cartografiado a partir de
fotografías aéreas por fotointerpretación (interpretación de la
imagen) o a partir de imágenes multiespectrales con la ayuda
de técnicas de clasificación.
18

La clasificación de imágenes es un proceso basado en


características semejantes de la imagen (medida radiométrica,
índice de textura, etc.); los píxeles que representan
características semejantes son agrupados en una misma clase.
Por ejemplo se podría identificar la ocupación urbana,
ocupación agrícola, bosques, ríos, etc.

2.2.4. INDICES

Los índices no tienen un sentido físico claro, pero


constituyen indicadores confiables de fenómenos como el
índice de pluviometría que fue probado en los estudios
epidemiológicos Cold Cloud Duration (CCD) Index, derivado del
canal térmico de Meteosat [9]. Este índice estima el tiempo
durante el cual un píxel dado fue cubierto por nubes de lluvia,
nubes detectadas por el cambio de valor de temperatura de las
nubes derivada de la medida del canal infrarrojo térmico.

El índice de vegetación es el más utilizado, es un valor


numérico que pone en evidencia las reflectancias del canal
infrarrojo cercano y el rojo. Este índice es sensible a la
actividad clorofiliana [10]. Dependiendo de la región esta
también puede constituir igualmente un indicador de la
pluviometría o de la humedad.

2.3. TECNOLOGIAS DE INFORMACION GEOGRÁFICA

Las tecnologías de información geográfica son el conjunto de


herramientas y técnicas orientadas a la descripción, entendimiento y
modelamiento espacial de nuestro entorno. Comprende los campos
de teledetección, sistemas de información geográfica, herramientas
para desplegar mapas en Internet, modelización tridimensional del
espacio, simulación de sistemas en 2d, 3d y 4d, entre otras.
19

2.3.1. LOS SISTEMAS DE INFORMACION GEOGRAFICA

Un Sistema de información geográfica, SIG o GIS


(Geographic information System) es una herramienta
informática orientada a la adquisición, representación, análisis
y entendimiento de la realidad. Es decir que representa en el
espacio entidades con una coordenada geográfica. Permite
manipular y gestionar objetos geográficos de diferente
naturaleza. En particular la utilización de SIG facilita el análisis
de las relaciones entre el medio ambiente y los fenómenos que
ocurren sobre ella, en el caso de la Salud, permite gestionar
información epidemiológica, ayudar al entendimiento de las
enfermedades y modelizar su dinámica, pueden usarse
también de manera operacional para administrar planes de
control epidémico y de asistencia.

2.3.2. FUNCIONES QUE CUMPLEN LOS SISTEMAS DE


INFORMACIÓN GEOGRÁFICA

[Link]. Entrada

La información y la representación de los objetos que


componen la realidad deben ser representadas en un
formato numérico (digital). Es una de función elemental
del los SIG’s. Este proceso puede hacerse por diferentes
medios: 1) por dibujo de formas a partir de imágenes
escaneadas, 2) captación de datos a partir de
instrumentos GPS o transmisión de datos de
coordenadas vía satélite, 3) Por dibujo de formas en
forma directa sobre cartografía pre-existente y 4) por
interpretación y dibujo de formas a partir de imágenes de
satélite.
20

Esta información debe estar relacionada a un sistema


de coordenadas con un origen, una escala mínima de
entendimiento y unidades de medición.

[Link]. Manipulación

Asociada a la forma gráfica de la realidad, está, la


información descriptiva, un SIG debe permitir la
definición y modificación de los datos que componen la
realidad. Este ordenamiento de la información implica
también la definición de características de apariencia de
acuerdo a escalas de visualización, acceso a lugares
específicos, organización jerárquica de datos, entre
otras.

[Link]. Administración

Cuando la información manipulada es voluminosa, es


necesario administrar la información gráfica y descriptiva
con la ayuda de bases de datos relacionales y bases de
datos geográficas que poseen motores propios de
gestión de información geográfica. Las herramientas de
administración que proveen las bases de datos, la
gestión de usuarios, permisos de accesos de definición y
modificación de datos, privilegios, etc. pueden ser
aprovechadas por los sistemas de información
geográfica. Bajo este esquema puede existir una base
de datos centralizada que gestiona los permisos y
privilegios, un número determinado de clientes con SIG’s
en cada terminal que cumplen funciones diferentes.
21

[Link]. Consulta y Análisis

Los objetos de la realidad representados en un SIG


poseen propiedades derivadas de los datos descriptivos
y de las relaciones que se emergen con otros objetos.
Existen varias formas de representación estadística
espacial, basada en la forma visual, color, flujos de
movimiento de transporte, entre otras. Las principales
representaciones estadísticas espaciales son.

– Representación por rangos de color, es una


representación de un conjunto de colores, cada
color representa un rango, cada objeto de tipo
superficie se muestra del color al cual pertenece su
dato descriptivo analizado.
– Representación de símbolos cuyos tamaño, color y
aspecto depende del valor numérico de un dato
descriptivo.
– Representación de histogramas y sectores
circulares en base a sus datos descriptivos, la forma
gráfica se muestra sobre los objetos geográficos
– Cartografía de flujos que muestra el desplazamiento
y trayectoria de un movimiento de un móvil o un
traslado de algún objeto, esta representación
muestra una flecha con origen y destino,
opcionalmente el ancho de la flecha muestra el
volumen del desplazamiento.

Las relaciones entre objetos como la cercanía,


inclusión, exclusión, pertenencia, distancia, entre otras
pueden ser analizadas con ayuda de un SIG.
– Análisis de proximidad: es una búsqueda de objetos
que están a una distancia definida por el usuario con
respecto a objetos analizados
22

– Análisis de inclusión: es una búsqueda de objetos


cuya superficie interseca la superficie de otro objeto
– Análisis de exclusión: es una búsqueda de objetos
cuya superficie no interseca la superficie de otro
objeto
– Análisis de influencia: Es un análisis que determina
si la presencia de algún objeto tiene una correlación
con los valores descriptivos de otros objetos. Este
análisis es usado en marketing para entender las
relaciones de las ganancias con la localización de
los locales de venta, domicilios de clientes,
accesibilidad por medios de transporte, flujo de
personas y la competencia

[Link]. Reporte

El reporte es el resultado final de cualquier proceso


de generación de información para la toma de
decisiones, los SIG’s cumplen esta función generando
mapas de prospección de datos, análisis de influencia,
representación de índices, esta información es
enriquecida con leyendas, escalas y simbología de
mapas, este resultado se muestra en forma de mapa
impreso o en información visual sobre las computadoras,
los sistemas modernos permiten desplegar datos por
Internet, se integran a herramientas multimedia; de esta
manera se constituyen en una herramienta de
comunicación.

2.3.3. REPRESENTACION DE DATOS EN UN SISTEMA DE


INFORMACION GEOGRAFICA

Un SIG se diferencia de otros sistemas de información


porque se encarga de gestionar Información geográfica, por
23

ello necesita de un motor interno de gestión de las formas


gráficas de las entidades que representa, además de la
información tabular – relacional de representación clásica. Un
SIG debe gestionar para cada objeto su representación visual
además de las relaciones que surgen entre ellas como la
distancia, cercanía, intersecciones por ocupación de espacios
entre ellos, etc.

El manejo de datos en un SIG es por categorías, la


realidad es almacenada por tipos de entidades (Gráfico 2.1) se
puede acceder a la información de cada entidad y realizar
operaciones de búsqueda, representación de la apariencia,
análisis estadísticos entre otros.

Población infectada

Viviendas bajo estudio

Calles/Direcciones

Realidad

Gráfico 2.1: Representación de la realidad en un SIG

2.3.4. Modelos Vectoriales y Raster

Los GIS trabajan con 2 diferentes tipos


fundamentales de modelos de representación gráfica El
modelo “Vector” y el modelo “Raster” o imagen.
24

[Link]. Modelo Vectorial

Esta basado en el manejo visual de una entidad en


base a un conjunto de coordenadas, cuando se trata de
representar un punto se considera un para (x,y) la
apariencia, el color y el tamaño, en el caso de líneas se
considera un conjunto de (x,y), el color y el grosor; para
el caso de polígonos se considera un conjunto de (x,y),
el aspecto de la línea del borde y el aspecto del relleno
interno. Todos ellos se crean bajo un sistema de
coordenadas. El gráfico 2.2 muestra estos tres tipos
vectoriales.

Gráfico 2.2: Representación vectorial de entidades en


un SIG

Algunos ejemplos de representación de la realidad


en forma de puntos: medidores de agua y domicilios; en
forma de líneas: ríos, carreteras y recorridos; en forma
de polígonos: lagunas, distritos, manzanas, lotes, etc.
El modelo vector es extremadamente usual para
describir características discretas, pero menos usual
para describir características de variación continua
como tipos de suelo.

[Link].1 Modelo Raster o Imagen


Se ha desarrollado para representar características
continuas, una imagen es una matriz de píxeles donde
25

cada elemento contiene un valor de color RGB (rojo,


verde y azul) además cada celda de la matriz
corresponde a un área que representa la realidad, este
valor es conocido como resolución de la imagen, existen
imágenes de 500 m. adecuados para detectar cambios
en grandes superficies de la tierra hasta imágenes
menores a 1 m. de resolución adecuadas para
identificación de objetivos militares o delimitación
catastral previa. Todo dependiendo del satélite y la
capacidad de su captor.

2.4. ALGORITMOS DE APRENDIZAJE Y CLASIFICACION

Desde hace varias décadas se vienen desarrollando y utilizando


complejos algoritmos para la extracción de patrones útiles en
grandes conjuntos de datos. Sin embargo durante todo este tiempo,
las técnicas aplicadas fueron en su mayor parte dominio de las
administraciones públicas. El elevado coste asociado y los enormes
requisitos de almacenamiento, tiempo y memoria limitaron en gran
medida el enorme campo de aplicación actual. Esta escasa difusión
generó diversas nombres para una misma disciplina: knowledge
estraction, information discovery, information harvesting, data
archaelogy, software, data dredging, data processing y Data Mining.
Hoy en día el hardware ha dejado de ser el problema [11].

2.4.1. SISTEMAS DE APRENDIZAJE

Desprestigiada en sus orígenes por la estadística al moldear


suficientemente los datos hasta que los mismos confirmasen lo que
se quería postular, la minería de datos es un proceso que invierte la
dinámica del método científico: En el método científico, primero se
formula la hipótesis y luego se diseña el experimento para
coleccionar los datos que confirmen o refuten la hipótesis. Si esto se
hace con la formalidad adecuada (cuidando cuáles son las variables
26

controladas y cuáles son las experimentales), se obtiene un nuevo


conocimiento.

En la minería de datos, se coleccionan los datos y se espera que


de ellos emerjan hipótesis. Se quiere que los datos describan o
indiquen por qué son y como son. Las técnicas de validación
desarrolladas en la década de los 80 en el Aprendizaje Automático,
hacen posible que las inferencias de la Minería de Datos se validen
para obtener patrones realmente ciertos y no sólo reflejos de una
manipulación de los datos.

[Link]. MODO DE APRENDIZAJE

El primer grupo distingue dos claras tendencias dadas


por la psicología: el enfoque conductista y el enfoque
cognoscitivo. Esto marca diferentes actitudes de los
sistemas ante el proceso de aprendizaje, así como su
empleo en diferentes aplicaciones y el uso de diferentes
lenguajes para representar el conocimiento.

Los Sistemas conductictas: Según la psicología


conductista, el aprendizaje es la capacidad de experimentar
cambios adaptativos para mejorar el rendimiento, por lo que
un sistema de aprendizaje será como una caja negra capaz
de adecuar su comportamiento para que el rendimiento de
sus respuestas ante los datos de entrada aumente durante
el proceso de aprendizaje. Los sistemas de aprendizaje
conductistas hacen mayor énfasis en modelos de
comportamiento que en la representación interna del
conocimiento. Los lenguajes de descripción suelen ser
diferentes para los objetos y para el conocimiento: los
objetos se describen por vectores de características,
mientras que para el conocimiento se emplean parámetros o
tablas. Esta representación del conocimiento hace difícil su
27

traducción a reglas que expliquen de forma racional el


comportamiento del sistema. Entre los sistemas conductistas
de aprendizaje, hay que destacar los sistemas conexionistas
y los sistemas evolucionistas, que realizan inducción de
conocimiento.

Sistemas Cognoscitivos: Según el enfoque cognoscitivo,


el aprendizaje consiste en la construcción y modificación de la
representación del conocimiento. Durante el proceso de
aprendizaje se produce un incremento del conocimiento, que
supone un cambio cuantitativo y cualitativo. La calidad del
aprendizaje vendrá dada no sólo por el aumento de precisión
del conocimiento almacenado (en una base de conocimiento),
sino también por la utilidad del mismo para los objetivos del
usuario y por el nivel de abstracción empleado. Por tanto, la
representación del conocimiento jugará un papel principal en
los sistemas que sigan este enfoque.
Los lenguajes de descripción usados por estos sistemas
suelen coincidir para representar a los objetos y al
conocimiento. Están basados, normalmente, en la lógica (de
proposiciones o de predicados) o en representaciones
estructuradas (como los marcos). Las aplicaciones de los
sistemas de aprendizaje cognoscitivo dependen del tipo de
aprendizaje que realicen, siendo los más importantes los que
utilizan deducción (sistemas EBL, basados en explicaciones),
analogía (sistemas expertos basados en casos) o inducción
(adquisición y formación de conceptos).

[Link]. ESFUERZO EN EL APRENDIZAJE


En cualquier proceso de aprendizaje, el aprendiz aplica el
conocimiento poseído a la información que le llega, para
obtener nuevo conocimiento que es almacenado para poder
ser usado posteriormente. El esfuerzo requerido por el
aprendiz se traduce al número de inferencias que necesita
28

sobre la información que tiene disponible. Bajo este punto de


vista han sido identificadas varias estrategias, aunque en la
práctica, muchos procesos de aprendizaje aplican de forma
simultánea varias de ellas [12].

a) Aprendizaje por implantación directa (Rote Learning): Es


un caso extremo, en el que el aprendiz no ha de realizar
ningún tipo de inferencia sobre la información
suministrada, sino que la acepta directamente. Esta
estrategia incluye aprendizaje por programación y por
memorización.
b) Aprendizaje por instrucción: El sistema de aprendizaje
adquiere el nuevo conocimiento a través de la información
proporcionada por un maestro, pero no la copia
directamente en memoria, sino que selecciona los datos
más relevantes y/o los transforma a una forma de
representación más apropiada.
c) Aprendizaje por deducción: Partiendo del conocimiento
suministrado y/o poseído, se deduce el nuevo
conocimiento, es decir, se transforma el conocimiento
existente mediante una función preservadora de la
verdad.
d) Aprendizaje por analogía: Se adquiere un nuevo concepto
mediante la modificación de la definición ya conocida de
un concepto similar. El aprendizaje por analogía puede
ser entendido como una combinación de la inducción y la
deducción, ya que mediante la inferencia inductiva se
determinan características comunes a los dos conceptos
comparados, unificando la misma definición para ambos;
entonces se aplica la deducción para obtener las
características esperadas para el nuevo concepto. Este
tipo de aprendizaje es especialmente importante en la
resolución de problemas.
29

e) Aprendizaje por Inducción: El sistema de aprendizaje


aplica la inducción a los hechos u observaciones
suministradas, para obtener nuevo conocimiento. La
inferencia inductiva no preserva la verdad del
conocimiento, sólo su falsedad; es decir, si partimos de
hechos falsos, el conocimiento adquirido por inducción
será falso, pero si los hechos son verdaderos, el
conocimiento inducido será válido con cierta probabilidad
(y no con certeza absoluta, como ocurre con la
deducción). Hay dos tipos de aprendizaje inductivo:
• Aprendizaje con Ejemplos: el nuevo conocimiento es
inducido mediante la generalización a partir de una
serie de ejemplos y contraejemplos. Este método
también se conoce como adquisición de conceptos
de aprendizaje supervisado.
• Aprendizaje por observación y descubrimiento: el
sistema de aprendizaje analiza una serie de
entidades y determina características comunes, que
pueden ser agrupadas formando un concepto
previamente desconocido. Se conoce como
formación de conceptos o aprendizaje no
supervisado.

Aprendizaje
automático

Aprendizaje Aprendizaje Aprendizaje


inductivo evolutivo analítico

Redes neuronales EBL

Supervisado No Supervisado CBR

Analogía
Refuerzo Algoritmos
genéticos Macro Ops
Árboles de decisión

Gráfico 2.3: Clasificación de los sistemas de


aprendizaje
30

2.4.2. APRENDIZAJE INDUCTIVO MEDIANTE ÁRBOLES DE


DECISION

El objetivo del aprendizaje inductivo mediante árboles de


decisión es clasificar los ejemplos presentados en sus
respectivas clases o categorías, manteniendo un alto grado de
predicción sobre los ejemplos no presentados. En concreto, se
trata de obtener un árbol de decisión simple que clasifique
correctamente los ejemplos presentados y sea capaz de
predecir correctamente las clases de futuros ejemplos.

[Link]. ÁRBOLES DE DECISION

Un árbol de decisión es una estructura que posee dos


tipos de nodos:
• Nodo interno (o de decisión): Consiste en una pregunta o
test relativa al valor de un atributo. De cada nodo interno
parten tantas ramas como respuestas haya a la pregunta,
que normalmente equivale al número de posibles valores
que puede tener el atributo en cuestión.
• Nodos hoja: En cada nodo hoja sólo puede haber
instancias con un único valor de clase (aunque esto se
puede generalizar en presencia de ruido como se tratará
después).

Si Condición 4

Condición 2 No
Si
Condición 5

Condición 1
No Condición 6
Si

Condición 3 No

Condición 7

Gráfico 2.4: Esquema de un árbol de decisión


31

Con este planteamiento, el objetivo podría ser la


búsqueda exhaustiva de un árbol lo más simple y predictivo
posible. Sin embargo, este es un problema cuya solución
óptima no puede garantizarse para la mayoría de los casos,
dado que su complejidad es NP. Por ejemplo, para un
problema en el que los ejemplos estén descritos por n
atributos booleanos existirían 2n combinaciones posibles, lo
cual supondría 2 elevado a la 2n funciones posibles. Si el
número de atributos fuera 5 habría 4,3×109 funciones. Frente
a este problema, la gran ventaja de id3 y sus sucesores
(como el algoritmo C4.5) es que son capaces de obtener una
buena solución que considera ambas cuestiones, aunque el
algoritmo no garantice que la solución sea la óptima.

[Link]. ENTRADAS Y SALIDAS

Las entradas son un conjunto de ejemplos descritos


mediante una serie de pares atributo-valor. El conjunto de
atributos es igual para todos los ejemplos presentados y sus
valores pueden ser discretos o numéricos.
• Entradas:
o A, conjunto de atributos
o V, Conjunto de valores posibles de los
atributos
o C, Conjunto de clases
o E, Conjunto de instancias de entrenamiento
descritas en términos de A, V y C
• Salidas: un árbol de decisión que separa a los
ejemplos de acuerdo a las clases que pertenecen

En definitiva, el algoritmo responde a un esquema


clásico de clasificación en el que se distinguen dos
requisitos para las clases:
32

• Clases predefinidas: Se parte de un problema de


aprendizaje supervisado en el que el atributo que
hace las veces de clase está perfectamente
identificado de antemano.
• Clases discretas: Se exige que haya un conjunto
preciso y discreto de clases que sirven para
clasificar claramente todos los ejemplos
presentados.

La construcción de árboles de decisión sigue el


principio de “divide y vencerás”, que en este caso se centra
en la división recursiva del árbol en subárboles en los que
se busca una mayor homogeneidad en las clases
existentes, de tal forma que el proceso se realiza hasta que
cada partición contenga ejemplos que pertenezcan a un
única clase o hasta que no haya posibilidad de realizar
nuevas particiones.

[Link]. ESTRATEGIAS DE APRENDIZAJE

La búsqueda es un proceso recursivo basado en una


decisión, en la que se determina, en cada momento, cuál es
el atributo que origina subárboles más homogéneos;
entendiendo por homogeneidad la creación de grupos de
ejemplos que pertenezcan a una sola clase. El proceso de
búsqueda se puede definir como sigue:

• Conjunto de estados: cada estado es un árbol de decisión,


en el que los nodos intermedios son preguntas sobre
valores de los atributos, las ramas son los distintos
valores posibles de dichos atributos y los nodos hoja
identifican un único valor de clase.
33

• Conjunto de operadores: el único operador es “introducir


en un nodo la pregunta del atributo correspondiente”. Esto
origina la expansión de un nodo intermedio del árbol en
construcción en varios sucesores, uno por cada posible
valor del atributo. Este operador no se puede aplicar
cuando no hay ningún caso para analizar en dicho nodo o
cuando no quedan más atributos por seleccionar en la
rama correspondiente.
• Estado inicial: árbol de decisión vacío.
• Meta: árbol de decisión que separa los ejemplos de
entrenamiento dependiendo de su clase.
• Heurística: elegir en cada nodo de decisión aquel atributo
que tenga mayor capacidad de discriminación sobre los
ejemplos asociados al nodo. Más exactamente, aquél que
genere conjuntos disjuntos en los que se maximice la
homogeneidad (o minimice la variación) interna con
respecto a los valores de clase. Esta heurística tiene la
característica también de intentar encontrar el árbol de
decisión más pequeño (con menos nodos).

Para ello se utiliza una función básica de la teoría de la


información que mide el grado de desorden, o impureza, de
cada una de las particiones generadas. De forma genérica,
dicha función determina el contenido de información o
entropía de una fuente de información. Así, si se consideran
los mensajes generados por la fuente, la información
transmitida por un mensaje dado depende de su probabilidad
y puede medirse en bits mediante el logaritmo en base 2 de
su probabilidad. Por ejemplo, si hubiera 16 mensajes
equiprobables, la información transmitida por cualquiera de
ellos sería −log2( 1/16 ), lo que supone 4 bits de información.
Si la probabilidad de que un ejemplo cualquiera pertenezca a
una clase Ck viene dada por la expresión 1, la medida de
información Entropía realiza una suma ponderada de la
34

información transmitida por cada clase por la proporción de


los elementos de la misma, tal y como se concreta en la
expresión 2. En esta medida se refleja la variabilidad
existente, o el grado de desorden, en el conjunto de ejemplos
presentados frente a las diferentes particiones o clases
posibles.
nk
(1)
n

Donde nk es el número de ejemplos de la clase k y n es el


número total de ejemplos.
C
nijk
Entropía ( E , Ai, vj ) = −∑ nijk log 2( ) (2)
k =1 nij
Donde Entropía(E,Ai, vj) es la entropía de los ejemplos E
cuando el atributo Ai tiene el valor vj , nijk es el número de
ejemplos que tienen el valor vj del atributo Ai y pertenecen a
la clase ck, nij es el número de ejemplos que tienen el valor vj
del atributo Ai, y C es el número de clases.

A lo largo del proceso recursivo se elige, en cada nodo de


decisión, el atributo que mayor ganancia de información
aporte. Para ello, tomando como referencia la anterior medida
de entropía, se calcula, para cada atributo, la información
esperada requerida si se eligiera dicho atributo como nodo de
decisión. En otras palabras, se calcula la reducción en
entropía aportada al particionar los ejemplos utilizando los
valores del atributo correspondiente. Para ello se realiza una
suma ponderada de las entropías resultantes en cada una de
las particiones generadas por el atributo. La ponderación
considera la proporción de ejemplos de cada rama, tal y
como se refleja en la expresión (3).
nij
Ganancia( E , Ai ) = Entropía ( E ) − ∑
vj ∈Valores ( Ai ) n
⋅ Entropía ( E , Ai, vj ) (3)
35

Dado que se desea elegir el atributo para el que la


ganancia es máxima, y, en esta fórmula Entropía(E) es una
constante con respecto al atributo Ai, es suficiente con elegir
aquél atributo que minimice la fórmula de la expresión 4.
nij

vj ∈Valores ( Ai ) n
⋅ Entropía ( E , Ai, vj ) (4)

Para entender la variación de los valores de la entropía


pueden considerarse las situaciones en las que sólo hay dos
valores de clase. En estos casos, los ejemplos presentados
serían los ejemplos y contraejemplos del concepto buscado.
Cuando la proporción de ejemplos y contraejemplos sea la
misma, entonces la entropía medida por (1) tiene un valor
máximo igual a 1, dado que la probabilidad de ambas
opciones sería 0.5 y la incertidumbre sobre cuál podría
suceder sería máxima. Si sólo hubiera ejemplos de una clase,
la entropía tendría un valor mínimo igual a 0, dado que no
habría incertidumbre sobre el valor de clase.

[Link]. ALGORITMO DE CONSTRUCCION DE


ÁRBOLES DE DECISIÓN

El algoritmo ID3 realiza un proceso recursivo sobre todas


las ramas del árbol generado, tal y como se refleja en el
gráfico 2.5. Inicialmente, se le llama con el conjunto de
ejemplos, el de atributos, y el nodo raíz del árbol de decisión
que estará vacío. Como ya se ha comentado, el proceso se
realiza hasta que todos los ejemplos de la rama en cuestión
pertenecen a una única clase. Sin embargo, esto no siempre
es posible. En primer lugar, puede ocurrir que se hayan
agotado todos los atributos y, sin embargo, sigan existiendo
ejemplos con distintos valores de clase. De otra parte,
también puede suceder que, una vez elegido un atributo para
un nodo de decisión, no exista ningún ejemplo para una de
36

las ramas generadas por dicho atributo. En esos casos, se


etiqueta el nodo hoja con la clase mayoritaria. En los otros
casos, se selecciona un atributo de acuerdo a la heurística
definida anteriormente. Por cada valor del atributo escogido
se crea un nodo sucesor de N etiquetado con el valor
correspondiente del atributo, a través de la función crear-
nodo. Ese nodo se añade al conjunto de nodos sucesores del
nodo raíz N y, finalmente, se llama recursivamente a ID3.

Función ID3 ( E,A,N ):N


E : conjunto de ejemplos
A : conjunto de atributos con sus posibles valores
N : nodo raíz del árbol de decisión
Si( A: = 0) ó todos los ejemplos de E pertenecen a la misma clase
Entonces clase - nodo( N ) = clase - mayoritaria( E )
Si no Ai = mejor - atributo( A)
pregunta( N ) = Ai
para cada valor v de Ai
H = crear - nodo( Ai,v)
hijos( N ) = hijos( N ) + H
Ei = {e ∈ E | valor(e,Ai ) = v}
ID3( Ei,A-{Ai},H )
Devolver N
Gráfico 2.5: Algoritmo ID3

Desde el punto de vista de la búsqueda, el id3 busca


hipótesis en un espacio de búsqueda completo. En cada
momento, mantiene una hipótesis única, disyunción de
conjunciones, frente al espacio de versiones que mantiene un
conjunto. Esto le hace perder oportunidades, como, por
ejemplo, cómo seleccionar el siguiente ejemplo, pero le hace
ser más eficiente. Al utilizar escalada no realiza retroceso por
lo que se pueden alcanzar mínimos locales. Sin embargo, si
no se tiene ruido y se tienen todos los atributos relevantes, se
llega al mínimo. Por otro lado, la heurística se basa en la
37

estadística, lo que lo hace robusto al ruido: si un ejemplo es


incorrecto, la estadística suavizará el efecto. Por todas estas
características, ha sido uno de las técnicas más utilizadas en
las aplicaciones de análisis de datos (data mining) o de
aprendizaje automático aplicado a tareas tan diversas como
predicción de enfermedades, control de robots, o
caracterización de clientes en bancos o entidades de
seguros.
38

CAPITULO III: EL DENGUE

CAPITULO 3. PROBLEMÁTICA DEL TURISMO

3.1. GENERALIDADES

El Dengue es un arbovirus (enfermedad viral transmitida por un


artrópodo) transmitida al hombre por la picadura del mosquito
hembra del género Aedes aegypti. Este arbovirus humano está
presente en la mayoría de zonas tropicales y subtropicales. Puede
tomar una forma asintomática o manifestarse por una fuerte fiebre y
dolores diversos, en algunos casos puede complicarse con signos
hemorrágicos y llevar a la muerte. Tanto el Dengue clásico como el
Dengue hemorrágico son causados por el virus del dengue, existen
4 serotipos de Dengue (Dengue-1, Dengue-2, Dengue-3 y Dengue-
4) que presentan los mismos síntomas clínicos pero para las cuales
no existe inmunidad cruzada, lo que permite infecciones sucesivas
por cada serotipo en una misma persona. Hoy en día no existe
tratamiento específico ni una vacuna contra el Dengue, el único
medio de lucha es el control de la población de mosquitos vectores y
la reducción de los factores que facilitan su transmisión.
39

3.1.1. EL CICLO DEL DENGUE

El ciclo del dengue tiene lugar principalmente entre el


hombre y el mosquito de género Aedes aegypti, el principal
vector del Dengue. Para que la transmisión del virus tenga
lugar, un mosquito hembra susceptible debe picar a una
persona infectada en fase de viremia, este periodo dura por lo
general de 4 a 5 días. Después la picadura entra en una fase
de incubación (incubación extrínseca) de una duración de 8 a
12 días, el mosquito volverá a su actividad infectante y capaz
de transmitir el virus a otras personas por picaduras. La
incubación dentro del hombre (incubación intrínseca) puede
variar de 1 a 10 días; aunque generalmente es de 4 a 5 días.
Una vez infectado, el mosquito queda infectado toda su vida y
puede igualmente transmitir el virus directamente a su
descendencia (transmisión vertical) [13]. El gráfico 3.1 muestra
el ciclo del Dengue.

Huésped
Susceptible Infectado Infectante Resistente
Hombre
Periodo de Viremia
incubación
Transmisión
intrínseca Transmisión
horizontal
Vector- hombre horizontal
Hombre - Vector

Vector

Aedes aegypti
otros
Infectante Infectado Susceptible

Periodo de
Transmisión incubación
vertical extrínseca
Vector a su
descendencia

Gráfico 3.1: Representación esquemática del ciclo de


transmisión del Dengue
40

3.2. EL VECTOR Aedes aegypti

El Aedes aegypti, es una especie del subgénero Stegomya,


probablemente originada en África. Se cree que fue transportado del
viejo al nuevo mundo en barriles de agua que transportaban los
barcos durante las primeras exploraciones y colonizaciones. El
Aedes aegypti es comúnmente conocido como el “mosquito de la
fiebre amarilla” debido a que por siglos esta especie transmitió la
fiebre amarilla urbana.

Gráfico 3.2: Mosquito Aedes aegypti

El Aedes aegypti es principalmente una especie “doméstica”,


cuyas hembras se alimentan por lo general de sangre humana o de
animales domésticos. Infesta recipientes naturales o artificiales que
se encuentran en casas o cerca de poblados humanos. Raramente
se encuentra a más de 100 metros de una casa, aunque se han
reportado excepciones, debido a esta estrecha relación con el
hombre el Aedes aegypti es esencialmente un mosquito urbano. Sin
embargo, en Brasil, México y Colombia han reportado significativas
infestaciones rurales, en algunas oportunidades a muchos kilómetros
del centro urbano y cerca a la ruta vehicular. El Aedes aegypti
aparentemente invade áreas rurales en estadío de huevo o larva, a
través de recipientes domésticos pueden ser transportados a lugares
habitados de zonas rurales en depósitos de agua.
41

El Aedes aegypti es un mosquito que se encuentra en las


regiones tropicales y subtropicales de la tierra, generalmente dentro
de los límites de 35º de latitud sur, que corresponde más o menos a
una temperatura promedio de 10º C. Se les ha encontrado hasta 45º
de latitud norte, pero se ha asumido que se trata de invasiones que
ocurren durante la estación cálida, pues no sobreviven durante el
invierno. Se ha encontrado Aedes aegypti en esta área tropical
desde el nivel del mar hasta los 2200 msnm en Colombia, en un sitio
que la temperatura promedio era de 17º C [14].

3.3. LOS METODOS PARA DETERMINAR EL RIESGO


EPIDEMICO

Consiste en identificar los dos componentes del riesgo que son


el peligro y la vulnerabilidad. De manera muy general, el riesgo
corresponde a la probabilidad que una situación de peligro se
manifieste y cause daños a un conjunto de personas (población)
vulnerable, la vulnerabilidad puede ser definida como un defecto de
protección o de defensa natural.

Riesgo = [Link]

Peligro: Es el grado de probable ocurrencia de una enfermedad. El


ejemplo común en la literatura es la asociación del peligro a
la abundancia del vector y a la presencia de la enfermedad.

Vulnerabilidad: Es la propensión de la población a la enfermedad.


En el caso de enfermedades humanas, se hace
corresponder la vulnerabilidad a las zonas de
ocupación por el hombre y su intensidad. Para las
enfermedades de animales, las zonas de
vulnerabilidad corresponden a zonas de
frecuentación de las manadas [15].
42

La prevención intenta la anulación o la reducción de uno de


estos factores de riesgo (peligro y Vulnerabilidad).

3.4. FACTORES DE RIESGO EPIDEMICO DEL DENGUE

Los factores de riesgo mencionados son tomados de estudios


clínicos y epidemiológicos de diversas investigaciones, la lista de
factores de riesgo descrita a continuación fue tomada de las
publicaciones de la Oficina General de Epidemiología – Ministerio de
Salud [19].

3.4.1. Presencia de una masa crítica de población susceptible

Esta masa es la población que posee anticuerpos


heterólogos. En nuestro país ha estado circulando en
los últimos 10 años el serotipo 1, y desde hace 5 años
el serotipo 2. Por lo tanto, existe una masa de la
población que posee anticuerpos antiserotipo 1 y
antiserotipo 2. Algunas investigaciones efectuadas por
grupos de epidemiólogos y aún no publicadas señalan
que en algunas ciudades importantes de la selva
(Pucallpa, Tarapoto), la proporción de población que
posee anticuerpos contra el dengue llega a más del
50%.

3.4.2. Presencia de alta densidad del vector

La forma de calcular la importancia de la densidad


de infestación del Aedes aegypti, en un lugar
determinado, es hacerlo a través del llamado Índice
aédico5, que es una cantidad expresada en porcentaje.
Convencionalmente índices aédicos por debajo de 2%

5
Índice aédico: porcentaje de casas infestadas con larvas, pupas o ambas.
43

no significan riesgo de transmisión, pero por encima de


5% el riesgo de transmisión es inminente.
Los índices de infestación del Aedes aegypti en el
Perú, durante los últimos 10 años han sido siempre
variables, dependiendo de la estación y medidas de
control implementadas.

3.4.3. El serotipo que está circulando

El serotipo es de una importancia grande, pues


según la literatura quien mayor presencia relativa ha
tenido en la presentación de DH/SSD es el virus
Dengue 2, aunque con los otros serotipos también se
han descrito epidemias de dengue hemorrágico.

3.4.4. La virulencia de la cepa circulante

Para algunos autores, el factor de riesgo más


importante para la presentación de DH/SSD es la
patogenicidad o “virulencia” de la cepa [16], de tal
manera que las cepas originarias del Asia se han
asociado con grandes epidemias y algunas cepas
podrían tener la capacidad de causar enfermedad
hemorrágica, a diferencia de algunas cepas nativas
americanas cuya infección secundaria por dengue 2 no
causa DH/SSD según reporta Watts y colaboradores en
el Perú [17].

3.4.5. La edad de la población

Las personas de mayor edad tienen mayor riesgo,


los más vulnerables son generalmente personas por
debajo de los 15 años.
44

3.4.6. La Raza

La raza juega un papel importante, siendo los de


raza negra los que aparentemente están protegidos. En
una serie presentada en Cuba en el Hospital “William
Soler” se encontró que de 123 niños con DH/SSD
(grado III y IV), 86% fueron blancos y solo 6% negros.
Asimismo en los adultos el 81% fueron blancos.

3.4.7. Preexistencia de anticuerpos al virus del dengue

Como reportó Halstead, la preexistencia de


anticuerpos es factor de riesgo más importante para
DH/SSD y fue reiteradamente encontrado en los brotes
cubanos. El 98% de pacientes adultos y niños
exhibieron una respuesta serológica secundaria.

3.4.8. Presencia de enfermedad Crónicas

En Cuba se identificó que el asma, anemia de


células falciformes y posiblemente diabetes mellitus
como factores de riesgo del individuo para formas
severas de dengue. En Cuba la proporción de casos
fatales de DH/SSD en los pacientes con asma fue el
doble que los pacientes sin asma.

3.4.9. Estado nutricional

Los cubanos lograron demostrar con grupos


comparativos y análisis estadísticos que la presencia de
un buen estado nutricional facilitaría la presentación de
formas graves de la enfermedad.
45

3.4.10. Otros factores Poblacionales y sociales

Las características propias de la enfermedad del


Dengue generan una serie de factores de riesgo que,
más allá de la susceptibilidad individual, incluyen
factores sociales y culturales con implicancias en la
mayor probabilidad de que se reproduzca el vector y se
produzca un brote epidémico.
• Las características de la vivienda, como la falta de
acceso a sistema de agua potable, favorecen la
existencia de criaderos de Aedes aegypti al generar la
necesidad de almacenar el agua (generalmente en
condiciones inapropiadas).
• En las zonas periurbanas, las viviendas se encuentran
en permanente ampliación, con la exposición casi
permanente de materiales de construcción que, de
acumularse agua en ellos, pueden constituirse en
criaderos de este vector.
• La utilización de botellas rotas para dotar de seguridad
a los muros circundantes a las viviendas son también
espacios donde el agua se puede acumular, en zonas
de lluvia.
• Las prácticas de decoración de la casa, especialmente
la utilización de floreros y los patrones de alimentación
de las mascotas y animales de crianza doméstica, en lo
que refiere al recambio del agua de sus bebederos,
pueden generar, también, condiciones propicias para la
reproducción del vector.
• Asimismo, las prácticas de disposición de residuos
sólidos, así como la irregularidad del servicio en las
zonas periurbanas permite la acumulación de objetos
que pueden ser receptáculo de agua de lluvia,
convirtiéndose en criaderos potenciales de Aedes
aegypti.
46

Por otro lado, la migración hacia y desde zonas


endémicas y los circuitos de comercialización de
alimentos perecibles, aunados a la existencia del
vector, generan la posibilidad de expansión de la
enfermedad hacia nuevas zonas.

Todos estos factores, además, se ven potenciados


cuando la población no tiene conocimientos adecuados
acerca de la enfermedad y sus mecanismos de
transmisión; y cuando las prácticas propuestas por los
servicios oficiales de salud no son puestas en marcha.
Por ello, el dengue es un problema cuyo control se
basa en la mejora de las condiciones sanitarias de las
ciudades, abastecimiento de agua adecuado,
planificación urbana, educación en salud y participación
de la comunidad.
47

CAPITULO IV: EL PERÚ Y LA EPIDEMIA DEL DENGUE

CAPITULO 4. PROBLEMÁTICA DEL TURISMO

4.1. EL PERÚ

El Perú se sitúa en la costa Oeste de América del Sur. Limita con


Ecuador por el norte, con Colombia por el noroeste, con Brasil por el
este, con Bolivia por el sureste, con Chile por el sur y con el Océano
Pacífico por el oeste. Su superficie es de 1 285 215 Km² (El Anexo 1
muestra al Perú observado por el satélite LandSat). El Perú es
considerado uno de los 12 países con megadiversidad, posee tres
grandes regiones naturales.

4.1.1. La Costa

Es una estrecha franja desértica situada entre el Océano


Pacífico y la cordillera de los Andes, la cual es aproximadamente
paralela al litoral de noroeste a sureste. Hay poca fluctuación de
temperatura entre la noche y el día, cuyo promedio es una
temperatura primaveral de 19 a 20° C. La precipitación es muy
escasa, menor de 30 mm. por año en la costa central y sur, algo
mayor en el norte.
48

4.1.2. La Sierra

Representa el 30,5% de la superficie del país y su altura varía


desde los 800 hasta las cumbres de los Andes de 4 800 a 6 000
metros sobre el nivel del mar. Los Andes presentan diversos
ecosistemas con gran variedad de climas y temperaturas en los
valles interandinos. Tiene climas templados con temperaturas
promedio superiores a 20° C en los valles profundos; climas frío y
boreal con una media anual de 12° C en laderas y áreas
intermedias; clima frígido o de tundra cuya temperatura media es de
6° C en las colinas y mesetas entre 4 000 y 5 000 m. sobre el nivel
del mar; y clima gélido con temperaturas medias de 0° C o menores
en las cumbres.

4.1.3. La Selva

Cubre el 59% del territorio, con una superficie de 76 millones de


hectáreas. Es una llanura cuya elevación del terreno está entre 100
y 500 m. sobre el nivel del mar. Tiene temperaturas media anual de
alrededor de 25° C y está cubierta por bosques tropicales.

4.2. EL DENGUE EN EL PERÚ

El Perú tuvo, en el siglo XIX, gran parte de su territorio infestado


de Aedes aegypti. Sin embargo, el principal problema que se
presentó por la presencia de este mosquito fueron los varios brotes
de fiebre amarilla en diferentes ciudades, los cuales se presentaron
especialmente en la costa incluyéndose a Lima y el Callao.

En el año 1877 Leonardo Villar, estudioso médico peruano de la


época, realiza una publicación en la Gaceta Médica sobre una
epidemia que ocurría en Lima en ese año y que se pensaba que era
49

otra epidemia de fiebre amarilla, sin embargo luego de un análisis


exhaustivo de los síntomas concluye que se trata de Dengue.
Posteriormente el Doctor Julián Arce en una publicación aparecida
en 1919, en donde hace una revisión minuciosa de las epidemias de
fiebre amarilla del siglo pasado y las otras epidemias relacionadas,
llega a la misma conclusión de Leonardo Villar con relación a la
epidemia de dengue de 1877 y concluye que la epidemia descrita en
Lima y catalogada como epidemia de “fiebre ephemera” en 1818, era
también dengue. Esta epidemia fue caracterizada por el médico del
Virrey apellidado Tafur como “una enfermedad que causa fiebre,
malestar, hemorragias de nariz y útero que dejaba suma languidez
durante 15 días o más a aquellos que la sufrían”. Por lo tanto en el
siglo XIX Perú tuvo dos epidemias de dengue una en 1818 y otra en
1877.

No se tiene referencia de otra epidemia de dengue en el país, ni


en el siglo XIX ni en los siguientes 90 años del siglo XX. Una
referencia importante con relación a esta enfermedad es que durante
la década de los años 40, se inicia en el Perú una campaña de
erradicación del Aedes aegypti, en el año 1958, este mosquito se
había erradicado del territorio nacional, sin embargo, en octubre de
1984 el mosquito fue detectado por funcionarios del Ministerio de
Salud en la ciudad de Iquitos, departamento de Loreto ubicada en la
Amazonía Peruana. En 1985 solo 1 % de casas de esta ciudad
estaban infestadas con Aedes aegypti mientras que en 1988 se
encontró que 26% de las casas examinadas estaban infestadas, lo
cual es considerado muy alto.

El año 1998, el Ministerio de Salud realiza una publicación en


donde actualiza el mapa entomológico en el país y se mencionan las
posibles rutas que ha seguido el Aedes aegypti a través del territorio
nacional ingresando a través de la frontera con Brasil, Colombia y
Ecuador, en diferentes tiempos. Desde 1990 se han reportado brotes
dispersos en nuestro territorio, el primer brote documentado de
50

dengue en el Perú ocurrió entre marzo y julio de 1990 en la ciudad


de Iquitos, causado por Dengue-1, afectando aproximadamente 150
personas según estimaciones epidemiológicas. Simultáneamente
otro foco confirmado de dengue se presentó en la segunda semana
del mes de abril en la ciudad de Tarapoto, departamento de San
Martín (límite con el departamento de Loreto) con una magnitud
menor que en Iquitos.

Fuente: INS PNCMYOM DISA PIURA II, PIURA I


Loreto, 1998 Valle J.T. U.P.R. Palma

Gráfico 4.1: distribución del Aedes aegypti en el año


2000

En 1995 se presentó el primer reporte de dengue 2 en el Perú en


un brote ocurrido en Iquitos y Pucallpa y en 3 ciudades de la costa
norte (Tumbes, Máncora y Los Órganos). En ese año se describió el
primer virus Dengue-2, que fue obtenido de un brote en Iquitos
causado por los dos tipos de virus. Los resultados del análisis
filogenético de la secuencia de DNA mostraron que las cepas tenían
51

genotipos americanos nativos; estos datos indican que el virus


Dengue-2 aislado en Iquitos es diferente a cepas del Sudeste
Asiático, lo cual podría explicar la ausencia de DH/SSD [19]. El
gráfico 4.1 muestra la distribución del Aedes aegypti y la presencia
del Dengue en Perú en el año 2000.

Gráfico 4.2: Distribución geográfica del virus dengue, Perú –


2001

Los serotipos de Dengue oficialmente han aparecido de forma


secuencial desde el año 1 990. El gráfico 4.2 muestra la presencia
de los serotipos de Dengue en el año 2000 y la Tabla 4.1 muestra la
aparición de serotipos del virus de Dengue en Perú. En abril de
2005 ocurrió un brote de Dengue donde se notificaron 622 casos de
52

Dengue cuyo lugar de infección corresponde al ámbito de la DISA6


Lima Norte. El 90% de ellos tienen como lugar probable de infección
el distrito de Comas; el resto (13 casos confirmados), tienen como
lugar de infección los distritos de Independencia, Rímac, San Juan
de Lurigancho, Huaral y Los Olivos [20].

Secuencia de aparición de serotipos de Dengue en el Perú


Año serotipo Lugar del brote
Loreto (Iquitos), San Martín (Tarapoto), Ucayali
1990 Dengue 1
(Pucallpa, Yarinacocha)
1991 Dengue 1 Loreto, San Martín, Ucayali, Huanuco Junín
1992 Dengue 1 Loreto, San Martín, Ucayali, Junín, Tumbes, Amazonas
Loreto, San Martín, Ucayali, Junín, Tumbes, Amazonas,
1993 Dengue 1
Piura,
Loreto , San Martin, Ucayali, Junín, Tumbes,
1994 Dengue 1
Amazonas, Piura (Mancora y Los Organos), Bagua
Huánuco (Aucayacu, T. Maria), Loreto, San Martín.
1995 Dengue 1
Piura, Junín, Ucayali
1996 Dengue 2 Bagua, Tumbes, Pucallpa
1997 Dengue 1 Piura (Mancora, Los Organos)
Huánuco ([Link], Aucayacu), Amazonas, Loreto, San
1998 Dengue 2
Martín, Ucayali, Tumbes
Loreto, San Martín, Ucayali, Junín, Amazonas,
1999 Dengue 1
Huánuco
2000 Dengue 1 y 2 La Libertad, Piura II, Tumbes
Tumbes, Piura I, Piura II, Jaen, La Libertad,
Dengue 1 Lambayeque, Bagua Grande, Ucayali, Yurimagua,
Satipo,T. Maria
2001 Dengue 2 Tumbes, Piura II, Piura I, Yurimagua, Tarapoto
Dengue 3 Tumbes, Piura II, Piura I, Jaen, Bagua Grande
Dengue 4 Piura II
2002 Dengue 3 Loreto, Ucayali
Dengue 3 Loreto, Ucayali, Huanuco, Ancash, Piura II y Tumbes
2003
Dengue 2 Piura II, Jaen, Junin, San Martín y Ucayali
Tumbes, La Libertad, Lambayeque, Huanuco, Loreto,
2004 Dengue 3
Ucayali, Jaen, San Martín

Tabla 4.1: Antecedentes de los serotipos del virus de Dengue


Fuente: Laboratorio de Virología del INS

6
DISA: Dirección de Salud
53

4.3. FACTORES GEOGRÁFICOS Y CLIMÁTICOS


RELACIONADOS CON EL DENGUE

4.3.1. Los diversos análisis de las características particulares del


territorio peruano

Existe una gran variedad de planteamientos relativos al análisis


geográfico del Perú, presentando los especialistas diversos puntos
de vista. En función al criterio climático, según el criterio hidrológico,
se reconoce la existencia de un mar frío, un mar tropical y aguas
continentales. El criterio que toma en consideración los diversos
tipos de suelo, la clasicación de Weberbauer está en referencia a la
flora y establece la existencia de veinticinco formaciones vegetales y
tres florísticas. En tanto que Hueck, con el mismo criterio, halla
veintisiete formaciones vegetales. Otra clasificación se hace de
acuerdo a la fauna. Cabrera y Willink reconocen así dos regiones,
cuatro dominios y siete provincias. Estos mismos autores,
compartiendo los criterios referenciales a la flora y fauna, establecen
dos regiones, la neo tropical y la oceánica; cuatro dominios,
amazónico-chaqueño, andino-patagónico, oceánico-tropical y
oceánico peruano-chileno, además de ocho provincias.

Un sector de especialistas prefiere hablar de biorregiones.


Ceballos diferencia regiones, subregiones, provincias, subprovincias,
distritos, subdistritos, áreas, subáreas y tres zonas. Udvardi, por su
parte, reconoce ocho provincias biorregionales.

El criterio de pisos ecológicos, como queda dicho, tiene por


principal vocero a Javier Pulgar Vidal, quien cita las ocho regiones
naturales. Piso ecológico es el área geográfica con características y
patrones específicos de un ecosistema diferenciado por el piso
altitudinal que ocupa. Otra clasificación pertenece a Holdridge J.
Tosi, quien encuentra en nuestro territorio ochenta y cuatro zonas de
vida y diecisiete de carácter transicional, distribuidas en tres franjas
54

latitudinales. Una zona de vida es el espacio vital que ofrece a una


especie las condiciones que requiere para desarrollarse.

El INRENA (ex ONERN) elaboró en 1960 el Mapa Ecológico del


Perú. Las zonas de vida se distribuyen latitudinalmente: la región
latitudinal tropical, desde la línea ecuatorial hasta el paralelo 12 de
Latitud Sur, con 892,665 kilómetros cuadrados (69.5%); la región
latitudinal subtropical, entre los paralelos 12 y 17 de Latitud Sur, con
361,210 kilómetros cuadrados (28%) y la región latitudinal templada
cálida, desde el paralelo 17 hasta la frontera peruano-chilena, con
31,340 kilómetros cuadrados (2.5%). El Anexo 2 muestra el mapa de
ecorregiones elaborado por el INRENA, el cual es considerado para
el estudio del Dengue.

Los cambios climáticos ocurridos sobre el territorio peruano se


manifiestan de formas diversas en cada ecorregión, este
comportamiento dinámico de cada escenario es interesante para el
estudio de enfermedades infecciosas debido a que puede
observarse respuestas diferentes de la epidemia sobre cada zona
geográfica, parámetros como la población de los vectores, la
dinámica poblacional, costumbres urbanas y desplazamiento de
personas es propia de cada región.

4.3.2. La temperatura superficial del mar, el Fenómeno del Niño y su


influencia en la epidemia del Dengue

Se ha demostrado la influencia del fenómeno de El Niño en la


epidemiología de enfermedades como dengue [21], malaria [22] [23],
enfermedades diarreicas [24] [25]. El fenómeno El Niño es causado
por un complejo proceso de interacción entre el mar y la atmósfera.

Este fenómeno está caracterizado por el incremento de la


temperatura superficial del mar (TSM) en el Pacífico ecuatorial y su
desplazamiento hacia la costa oeste del Pacífico favorecido por una
55

inversión en las presiones atmosféricas sobre el Océano Pacífico


que impulsa entonces los vientos en dirección este-oeste [26]. El
evento de El Niño puede ser seguido y pronosticado empleando la
temperatura superficial del mar (TSM) y otros parámetros climáticos
[27] [28]. La TSM puede influenciar el clima de zonas en los
continentes sin margen costero a través del fenómeno conocido
como “teleconexión”.

La asociación entre enfermedades transmitidas por vectores y


cambios climáticos como los acontecidos durante un fenómeno de El
Niño se describen desde El Niño 1973-1974, donde se presentó la
expansión de la Encefalitis de Japón a zonas libres de esa
enfermedad hasta entonces, se describió una epidemia de Fiebre del
Río Ross en Australia y de Encefalitis del oeste del Nilo en Sud-
Africa, y en Brasil se describió por primera vez la Encefalitis Rocío;
nuevamente, en el Niño de 1992 – 1993, por lo menos veinte nuevas
enfermedades o su descripción en áreas nuevas fueron señaladas
[29] [30].

Un estudio realizado sobre la influencia del Fenómeno de El Niño


y la Bartonelosis (enfermedad arboviral conocida como Enfermedad
de Carrión o Verruga Peruana) halló una correlación entre los
valores de la TSM, las precipitaciones y el fenómeno de El Niño,
donde se comparó las medias de las tasas de incidencia7 de
Bartonelosis en los departamentos de Ancash y Cusco, y las
provincias de Urubamba y Carhuaz, respecto a la TSM
correspondiente y parámetros climáticos, durante los periodos pre-El
Niño (entre enero de 1996 a mayo de 1997), El Niño 1997-1998
(entre junio de 1997 y junio de 1998), y post- El Niño (entre julio de
1998 y diciembre de 1999). Se observó que las tasa de incidencia de
Bartonelosis a nivel regional como local en Ancash y Cusco, la TSM
en Chimbote y en la Región Niño 3, y la temperatura máxima media
mensual en Urubamba, mostraron diferencias significativas entre
7
Incidencia: Número de casos ocurridos; La incidencia de una enfermedad.
56

estos períodos. En el análisis de correlación cruzada, entre la tasa


de Bartonelosis y los parámetros climáticos analizados, sólo la TSM
mostró un coeficiente de correlación significativa tanto a nivel local
como regional [31].
57

CAPITULO V: NOCIONES SOBRE EL ANÁLISIS Y


MODELIZACION DEL ESPACIO

CAPITULO 5. ÁMBITO DEL ESTUDIO

5.1. EL ANÁLISIS ESPACIAL

El análisis espacial es una técnica de tratamiento


estadístico y topológico de objetos reales o virtuales que
constituyen el espacio. El análisis espacial tiene por objetivo el
descubrimiento de leyes o modelos que organizan
racionalmente los objetos que constituyen la realidad [32].

5.1.1. NOCIONES SOBRE LA LOGICA DEL ANÁLISIS ESPACIAL

El mapa es por principio la representación de objetos del


espacio que la geografía provee: Diseños de topografía, trazos
de carreteras, límites territoriales administrativos, símbolos de
superficie distintivas, los ríos y toda otra representación del
espacio compuesto; en suma es la imagen de la “realidad
representada”.
58

Es admisible que la imagen de la realidad tenga elementos


significantes y significados: Las significaciones existen para el
observador y de su interés de conocer la realidad de acuerdo a
su criterio. La imagen que se crea de los mapas otorga una
significación a los ojos del que las observa. Esta consideración
evidencia la correlación entre la distribución de las formas de
los objetos y el significado de los colores.

La teoría de la “forma” o gestalt psicológico (Koffka en 1935


y después de él Hering en 1905 para la teoría de colores)
analizó los principios de la percepción visual. Esta considera
que el individuo percibe el conjunto de objetos del espacio por
distinción espontánea. Es decir que el hombre no tiene
necesidad de experimentación precedente para proyectar una
significación de los objetos espaciales a los que se confronta.
Esta teoría se opone a la teoría tradicional que afirma según
David Kats [33], que para analizar la percepción de cualquier
interpretación es necesario tenerla. La psicología de la “forma”
demuestra que un individuo puede representar un objeto de
superficie redonda y si quiere representarla de costado la
representará como un óvalo. Entonces un individuo tiene las
facultades lógicas de análisis espacial en sus dimensiones
subjetivas y topológicas sin ser especialista de
representaciones.

Como ya se ha mencionado los Sistemas de información


geográfica tienen la capacidad de representar las formas
gráficas de la realidad y también almacenar la información de
los atributos, los análisis espaciales que se realizan son por
análisis matemático y análisis estadístico de sus atributos. El
gráfico 5.1 muestra la función elemental de la representación
de la densidad poblacional mediante una degradación de color
de 5 rangos creados para todo el conjunto de departamentos.
59

a) Representación gráfica b) Representación temática


de la densidad poblacional

c) Representación temática de la densidad poblacional con leyenda

Gráfico 5.1: Representación gráfica y temática de la


densidad poblacional

Esta representación muestra un color por cada rango de


densidad, si bien nuestro entendimiento es directo, la
representación de un color homogéneo en toda la superficie de
cada departamento llega a ser inexacto porque hace suponer
una densidad homogénea por cada departamento, es decir la
60

población dispersa de igual forma en toda la superficie


departamental, cuando sabemos que la población está
concentrada principalmente en las ciudades.

5.1.2. CARACTERISTICAS DEL SISTEMA DE ANÁLISIS


ESPACIAL

Para implementar los principios del análisis espacial, es


importante que no se limite a las funciones tradicionales de un
sistema cartográfico. El gráfico 5.2 muestra un modelo de
sistema de análisis espacial.

Información A Información B Información C

Estructura de representación
y de relación

Matriz

Funciones Matemáticas

Gráficos Imágenes Valores Textos

Gráfico 5.2: Modelo de sistema de análisis espacial

Un sistema de análisis espacial debe:


• Captar información de diversas fuentes
• Localizar la información en una estructura que las
represente y las relacione.
• Construir una topología matemática que establecerá
los vínculos geométricos y algebraicos entre las
61

unidades de localización con una lógica constante.


Esta topología generalmente es una matriz y debe
ser respetuosa de los principios métricos de los
objetos geográficos.
• Generar funciones matemáticas y modelos mediante
tratamientos estadísticos y topológicos.
• Restituir los tratamientos en forma de imágenes, de
gráficos, de valores numéricos y textos.

Estos principios fundamentales se integran de forma


simple gracias a la lógica de malla o matriz de superficie
cuadrada aparecida a finales de los años 60 en los
trabajos de cartografía automática de Jacques Bertin,
director del laboratorio de la Escuela de altos estudios,
con la primera aplicación cartográfica estadística
automática de Guy Albellot [34].

5.1.3. LA MATRIZ DE FRACCIONAMIENTO DEL TERRITORIO

Una matriz de fraccionamiento del territorio tiene la


capacidad de transformar objetos de representación de una
superficie cualquiera en unidades cuadradas. El nivel de
fraccionamiento de estas unidades debe ser definido por el
observador; para entender esta lógica y su importancia se
toma como ejemplo el análisis de la población del
departamento de Junín.

Si se tiene el propósito de analizar la aglomeración de la


población podría tomarse como referencia el valor de población
por provincia y en un detalle más fino la población de cada
distrito (Gráfico 5.3). Sin embargo, esta información asume una
62

aglomeración poblacional de forma homogénea dentro de cada


superficie de provincia y distrito.

a) Representación de niveles de población a nivel de provincia

b) Representación de niveles de población a nivel de distrito

Gráfico 5.3: representación de la población a nivel de


provincia y distrito

Un detalle importante a considerar es que a medida que se


analizan superficies de menor área, la precisión de la
representación espacial aumenta, esto se evidencia con los
niveles de población mostrados por las provincias y distritos
(Gráfico 5.4), las zonas marcadas de color rojo muestran el
63

aumento de la precisión a medida que se disminuye el área de


representación.

a) Representación de la población a nivel de provincia

b) Ganancia en precisión de la representación de la población

Gráfico 5.4: Aumento de la precisión de la representación


sobre el espacio

Aunque hubo una ganancia en la precisión de la


representación de la población esta información sigue siendo
inexacta porque los distritos siguen mostrando una
aglomeración de la población de forma homogénea dentro de
su superficie. Si se considera la presencia humana (Gráfico
64

5.5) sobre el territorio representado por los centros poblados8;


la representación espacial de la aglomeración de la población
aumentaría en precisión, sin embargo al considerar los centros
poblados se enfrenta nuevamente a un problema, estos son
numerosos y están representados por puntos, lo que dificulta
su representación y análisis individual, representar cada centro
poblado con un color proporcional a su población sería tedioso
y su representación visual sería incomprensible. Este problema
se agrava al considerar un espacio mucho más grande como el
territorio peruano (según información del INEI del año 2001
existen en el Perú más de 114 000 centros poblados sin
considerar las zonas urbanas consolidadas).

Gráfico 5.5: Representación de los centros poblados sobre el


territorio (puntos en color verde)

Es en este punto donde el fraccionamiento del territorio en


forma de matriz juega un papel importante al dividir el espacio
de estudio en celdas de superficie homogénea (Gráfico 5.6).

8
Centro poblado: Todo lugar o sitio del territorio nacional identificado mediante un nombre, en
el que viven con ánimo de permanencia varias familias vinculadas por
intereses comunes de carácter económico, social, cultural e histórico.
65

Con el nuevo muestreo homogéneo del territorio se puede


construir un nuevo mapa de población, donde se generaliza la
representación de centros poblados en forma de puntos hacia
una representación de superficie cuadrada con características
agregadas tomadas del conjunto de centros poblados que
intersecan la superficie de cada celda.

Gráfico 5.6: Matriz de análisis por división del territorio con


centros poblados (en forma de puntos)

Siguiendo con el ejemplo del Análisis espacial, se crea un


atributo común a todas ellas para guardar la sumatoria de los
centros poblados incluidas en cada celda (esta operación se
realiza generalmente mediante el uso de un sistema de
información geográfica o una base de datos geográfica); se
crea sobre el mapa una representación temática de color en
función al número de centros poblados de cada celda
agrupadas por rangos con un color respectivo (Gráfico 5.7).

La comparación de gráfico 5.3 con el 5.7 comprueba que la


precisión en la correspondencia espacial ha mejorado y el valor
de la población asociado al territorio es más representativo.
66

En este ejemplo se ha tomado el valor de la densidad


poblacional y se ha establecido las relaciones de
representación y valor que tiene en función a la ocupación
humana definida por los centros poblados, de igual modo se
puede analizar cualquier otra variable asociada a la población,
clima, geografía, morfología, o cualquier relación de objetos
puestos sobre el mapa, se pueden establecer relaciones de
sumatoria, exclusión, multiplicación, diferencia, o cualquier otra
función matemática propia de cada objeto o de un conjunto de
objetos.

Gráfico 5.7: Representación de la población por superficies


homogéneas basada en la sumatoria de la
población de cada centro poblado incluido en
cada celda
67

CAPITULO VI: EL MODELO ESPACIAL DE


PREDICCION DEL RIESGO EPIDEMICO DEL DENGUE

CAPITULO 6. ÁMBITO DEL ESTUDIO

6.1. CONSIDERACIONES SOBRE LA SALUD, EL ESPACIO


GEOGRAFICO Y LA INFORMACIÓN DISPONIBLE

El estado de salud de la población depende del ambiente


geográfico donde habitualmente vive. Por un lado, el clima que es
particular de cada zona geográfica, determina la mayor incidencia de
algunas enfermedades que de otras, por ejemplo las enfermedades
transmitidas por vectores alados, como malaria, dengue y otras,
tienen más ocurrencia en zonas tropicales. Pero no sólo el clima,
también es importante conocer el resto de las características del
ambiente: altitud sobre el nivel del mar, tipo de flora y fauna,
disponibilidad de agua para consumo, características de
edificaciones, nivel de ruralidad, entre otras más. Todas estas
características condicionan un determinado riesgo para la presencia
de algunas enfermedades, en tanto que alejaran la probabilidad de
otras [35].
68

Para realizar un estudio de la salud poblacional es importante


elegir la unidad poblacional del estudio. Existen muchas opciones
para esta selección. En el pasado se ha escogido desde unidades
muy agregadas como el país y los departamentos, hasta los últimos
esfuerzos de llegar hasta distritos. Se busca definir una unidad
poblacional para reducir al máximo la heterogeneidad entre las
personas que forman parte de ella, de forma que la medida central
que la representa se aproxime a cada uno de ellos. Grupos muy
agregados como el país o un departamento, resultan todo lo
contrario, con una gran heterogeneidad donde el promedio esconde
muchas brechas internas. Aún algunos distritos pueden ser un
espacio geográfico poco uniforme para asignarle un sólo grupo
poblacional.

Es importante resaltar la importancia de considerar el centro


poblado como unidad de análisis, puesto que permite extender
efectivamente muchas acciones de salud, en particular la de
poblaciones dispersas, que históricamente se escondían por el uso
de los promedios [36].

Otra consideración importante es el grado de la actualización de


los datos, el último censo a cargo del INEI fue realizado el año 1993,
los indicadores poblacionales actuales son estimaciones
estadísticas, los niveles de pobreza a nivel de distritos más recientes
fueron medidos el año 2001 por el Ministerio de Economía y
Finanzas, los centros poblados fueron actualizados por el INEI varias
veces en los últimos años, para esta investigación los centros
considerados son los registrados por el INEI el año 2002.

La información de la incidencia del Dengue en el Perú está a


cargo de la Oficina General de epidemiología, existe un registro de la
enfermedad desde el año 1995 de forma constante, los datos
considerados para esta investigación pertenecen al periodo de
enero de 1995 a julio de 2005.
69

La información geográfica sobre la delimitación departamental,


provincial y distrital considerada en el estudio fue tomada del INEI
(2002), la información de los medios de transporte fueron
actualizados por el Ministerio de transporte y comunicaciones
(2001), la información hidrográfica corresponde a la cartografía
producida por el Ministerio de Educación a partir de las cartas
nacionales del IGN (generado en el 2001 en base a las cartas del
IGN del año 1960-1980). La Tabla 6.1 muestra la cartografía usada
para el estudio:

Cartografía nacional preexistente usada en el estudio


Límites departamentales, provinciales y distritales
Hidrografía(Ríos principales, secundarios, lagos y lagunas)
Carreteras(asfaltadas, sin asfaltar y trochas)
Centros poblados
Mapa de pobreza distrital MEF – 2001
Mapa de la distribución de aeropuertos

Tabla 6.1: Listas de productos cartográficos usados en el estudio

6.2. EL MODELO CAUSAL DEL RIESGO EPIDÉMICO

El Anexo 13 muestra un diagrama causal del Dengue. Los


niveles que influyen negativamente están marcados en color azul y
son: Eficacia de campañas de prevención y educación y la Eficacia
de acciones de Control de la enfermedad. Estos niveles son
influenciados positivamente con la información de vulnerabilidad y
peligro del Dengue.
70

6.3. EL ESPACIO ESTUDIADO Y LA MATRIZ DE


FRACCIONAMIENTO

El espacio de estudio de forma rectangular está contenido en el


área de esquina superior izquierda (81º 43’ 28’’ Oeste, 0º Sur) y
esquina inferior derecha (68º 23’ 12’’ Oeste, 18º 20’ Sur). El Gráfico
6.1 muestra esta zona sobre una imagen de satélite de índice de
vegetación.

Gráfico 6.1: Área de estudio marcada en anaranjado sobre


Imagen de vegetación – MODIS

Todo el territorio peruano fue dividido mediante una matriz de


fraccionamiento con celdas de 100 km² (10 km. x 10 km.); cada
celda es una entidad de medición y análisis espacial, el Anexo 3
muestra el Perú con la matriz de fraccionamiento del territorio
mediante celdas; el Gráfico 6.2 muestra un recorte de este mapa.

Gráfico 6.2: Recorte del espacio de estudio basado en celdas


(Departamento de Piura y Tumbes)
71

La matriz de fraccionamiento del territorio toma la medición de


las variables para cada celda catalogada por la fila y columna (i,j), i
tiene valores de 1 hasta 145, j desde 1 hasta 254. La asignación de
los valores se muestra en el Gráfico 6.4:

10 km.
10 km.

Gráfico 6.3: Tamaño de la celda de estudio

Celda i=1,j=1 Celda i=145,j=1


i
j

Gráfico 6.4: Numeración de las filas y columnas de las


celdas

6.4. EL MÉTODO DE GENERALIZACIÓN Y MEDICIÓN DE

LAS VARIABLES

El Gráfico 6.5 esquematiza el principio de medición utilizado para


determinar la vulnerabilidad. Para cada celda se mide las
características poblacionales y socioeconómicas relacionadas al
conjunto de centros poblados pertenecientes a cada celda y de cada
distrito.
72

Matriz de fraccionamiento
del territorio

Medición del
presente
Distrito D
Espacio Distrito C
geográfico
Distrito B
Distrito A

Centro Poblado

Límite distrital

Gráfico 6.5: Medición y generalización de las características


poblacionales y socioeconómicas para la
determinación de la vulnerabilidad

La información poblacional de los centros poblados (cantidad de


centros poblados, nivel de urbanismo, etc.) se mide mediante
operaciones matemáticas (sumatoria, promedio, etc.) sobre los
centros poblados que intersecan la superficie de cada celda.

Para medir los valores de la información a nivel de distrito (nivel


de pobreza, densidad poblacional, etc.) se considera el principio de
inclusión, la celda toma el valor del atributo deseado, del distrito que
contiene su centroide en algún sitio de su superficie. Para la
medición de las variables relacionadas al peligro se realiza una
medición de las características geográficas del presente y la
incidencia de casos de Dengue ocurridas en el pasado, se considera
también la incidencia observada en las celdas vecinas. El gráfico 6.6
esquematiza esta medición.
73

Matriz de fraccionamiento
del territorio

Medición en
el tiempo
Espacio
Geográfico

Población infectada
con Dengue

Población
susceptible

Gráfico 6.6: Medición y generalización de las características


geográficas e incidencia de casos de Dengue para
la obtención de datos que generan el modelo de
predicción de ocurrencia de Dengue.

6.5. EL ESPACIO DE TRANSMISIÓN POTENCIAL DEL

DENGUE

El espacio de transmisión potencial del Dengue es la superficie


en donde es posible que el virus del Dengue pueda concluir su etapa
de incubación dentro del vector (periodo a partir del cual el mosquito
puede transmitir el virus a otras personas). La altitud promedio en
donde se puede manifestar el virus del Dengue es por debajo de los
1 200 metros, aunque se han registrado alturas de alrededor de los 2
400 msnm en África. En América la mayor altitud registrada
corresponde a una localidad de Colombia, con 2 200 msnm. [37].
74

Para la determinación de la vulnerabilidad se considera las


celdas con altitud igual o mayor a los 3 000 msnm para no
menospreciar las zonas que podrían ser afectadas por la expansión
de la zona de transmisión a causa del fenómeno del calentamiento
global, sin embargo se considera como espacio de transmisión
potencial a la superficie ocupada por las celdas que poseen en su
superficie una altura igual o menor que 2 200 msnm; el Anexo 4
muestra el mapa de la zona de transmisión potencial del Dengue.

6.6. EL ÁREA DE OCUPACIÓN DEL VECTOR Aedes aegypti

La presencia del vector Aedes aegypti ocupa gran parte del


territorio peruano. El anexo 4 Muestra el mapa del Perú con la
presencia del vector de acuerdo a información de la Oficina General
de Epidemiología – Ministerio de Salud. La superficie de ocupación
del vector es más pequeña que la superficie de transmisión
potencial, la tendencia de acuerdo a los fenómenos ambientales es
que el área de ocupación del vector aumente.

La intersección de la zona de transmisión potencial del Dengue y


la ocupación del vector representa una zona de más riesgo,
dependiendo de la población del mosquito Aedes aegypti, de las
condiciones ambientales propicias para su reproducción y malas
prácticas de la población.

6.7. LA VULNERABILIDAD

6.7.1. LAS VARIABLES DE VULNERABILIDAD

• Nivel de Presencia humana: calculada en base a la


cantidad de centros poblados incluidos en la superficie
cada celda. El Anexo 5 muestra el mapa del Perú con los
centros poblados; Anexo 6 muestra el mapa del Perú con
los niveles de centros poblados sobre las celdas. Los
valores asumidos se muestra en la tabla 6.2:
75

Número de centros poblados Valores


0 0
1–9 1
10 – 24 2
25 – 49 3
50 – 99 4
100 – más 5

Tabla 6.2: valores del nivel de presencia humana

• Existencia de aeropuertos: Es un indicador que indica que


si existe o no existe aeropuertos en la celda.

Existencia de aeropuertos Valores


Existe(n) 0
No existe(n) 1

Tabla 6.3: valores de la existencia de aeropuertos

• Nivel de la Cantidad de viviendas: calculada en base a la


sumatoria del atributo de número de viviendas de cada
centro poblado incluidos en la superficie de cada celda. El
Anexo 7 muestra el mapa del Perú del nivel de cantidad
de viviendas y los valores se muestra en la tabla 6.4.

Número de viviendas Valores


0 0
1 – 99 1
100 – 499 2
500 – 999 3
1 000 – 9 999 4
10 000 – 49 999 5
50 000 – más 6

Tabla 6.4: valores del nivel de presencia humana


76

• Nivel de Densidad poblacional: Es el valor de densidad


poblacional del distrito que contiene el centroide de cada
celda (El Anexo 8 muestra el mapa distrital de densidad
poblacional, Anexo 9 muestra el mapa de densidad en las
celdas). Los niveles de densidad se muestra en la tabla
6.5.

Densidad Poblacional Valores


0 0
1–4 1
5–9 2
10 – 49 3
50 – 99 4
100 – 500 5
500 – 1 000 6

Tabla 6.5: valores del nivel de densidad poblacional

• Nivel de Pobreza: Es el valor de pobreza del distrito que


contiene en su superficie el centroide de cada celda (El
Anexo 10 muestra el mapa distrital de pobreza, el Anexo
11 muestra el mapa de pobreza sobre las celdas). La
información de pobreza a nivel de distrito fue tomada del
estudio realizado por el Ministerio de economía y finanzas
el año 2001 (la última medición de la pobreza efectuada
por el estado).

Esta medición se realizó bajo el método de la Línea de


Pobreza que consiste en estimar la pobreza a través del
gasto per cápita de los hogares mediante líneas de
pobreza calculadas en base a canastas normativas de
consumo de los hogares. El método consistió en imputar
los gastos a los hogares del censo a través de una
relación funcional -regresión múltiple- estimada en base a
77

la información de la encuesta de hogares del IV trimestre


de 1997 (ENAHO 1997-IV) con variables que también son
comunes al censo de 1993. La regresión múltiple semilog
planteada arrojó un R² ajustado bastante alto (75% a nivel
nacional) [38]. El Anexo 14 muestra las variables que este
estudio para determinar la pobreza. La Tabla 6.6 Muestra
los valores de los niveles de pobreza.

Nivel de pobreza % Valores


0 0
1 – 20 1
21 - 40 2
41 – 60 3
61 - 80 4
81 - 100 5

Tabla 6.6: valores del nivel de pobreza

• Nivel de Urbanismo: Calculada en base a la cantidad de


centros poblados que tienen la categoría de urbanos que
están incluidos en cada celda. El Anexo 12 muestra el
mapa de nivel de urbanismo en las celdas.

Número de centros poblados urbanos Valores


0 0
1–8 1
9 – 16 2
17 – 24 3
25 – más 4

Tabla 6.7: valores del nivel de urbanismo


78

6.7.2. LA ECUACION DE VULNERABILIDAD (V )

La Vulnerabilidad es un indicador de las características


poblacionales y socioeconómicas de la población en base a las
variables mencionadas, el valor mas alto representa mayor
vulnerabilidad. Para nuestro estudio se consideró la Vulnerabilidad
como la sumatoria de las variables poblacionales medidas en cada
celda (i, j).

V(i,j) = H(i,j) + D(i,j) + NV(i,j) + NP(i,j) + U(i,j) + AE(i,j) , donde:


i = Fila de la celda
j = Columna de la celda
H = Nivel de presencia humana
D = Nivel de Densidad poblacional
NV= Nivel de la cantidad de viviendas
NP= Nivel de pobreza
U = Nivel de Urbanismo
AE= Existencia de aeropuertos

6.8. CONSTRUCCIÓN DEL MODELO DE PREDICCION DEL

DE PELIGRO DE OCURRENCIA DE DENGUE

6.8.1. LAS VARIABLES RELACIONADAS AL PELIGRO

[Link]. LA INCIDENCIA DE CASOS DE DENGUE

Partiendo de la ubicación de casos de Dengue con coordenadas


pertenecientes al centro poblado donde ocurrió, se analizó el
comportamiento en función del tiempo y características propias del
territorio. El proceso de obtención de las coordenadas de los casos
de Dengue se explica en el capítulo VII.
79

El Anexo 16 muestra la ocurrencia de al menos un caso de


Dengue sobre las celdas de estudio, los casos de Dengue están en
color rojo y los casos mostrados fuera del área de transmisión
potencial no son casos autóctonos, es decir son registros de
personas enfermas que contrajeron la enfermedad y recurrieron a un
centro de salud lejano al lugar de contagio.

La dinámica de la enfermedad en función al cambio de cada mes


se comprueba con la observación. Los gráficos 6.7 al 6.18 muestran
esta dinámica entre los departamentos de Piura, Cajamarca,
Amazonas y Lambayeque, los casos de Dengue aparecen en color
rojo.

Gráfico 6.7: Ocurrencia de casos de Dengue en enero de 2001


80

Gráfico 6.8: Ocurrencia de casos de Dengue en febrero de 2001

Gráfico 6.9: Ocurrencia de casos de Dengue en marzo de 2001


81

Gráfico 6.10: Ocurrencia de casos de Dengue en abril de 2001

Gráfico 6.11: Ocurrencia de casos de Dengue en mayo de 2001


82

Gráfico 6.12: Ocurrencia de casos de Dengue en junio de 2001

Gráfico 6.13: Ocurrencia de casos de Dengue en julio de 2001


83

Gráfico 6.14: Ocurrencia de casos de Dengue en agosto de 2001

Gráfico 6.15: Ocurrencia de casos de Dengue setiembre de 2001


84

Gráfico 6.16: Ocurrencia de casos de Dengue octubre de 2001

Gráfico 6.17: Ocurrencia de casos de Dengue noviembre de 2001


85

Gráfico 6.18: Ocurrencia de casos de Dengue diciembre de 2001

Se observó el número de ocurrencias mensuales de al


menos un caso de dengue. La Tabla 6.8 resume estas
observaciones.
Ocurrencias mensual de al menos un caso de Dengue en las celdas
Mes 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 Total
1 3 53 13 18 4 14 51 73 38 59 326
2 3 32 12 16 7 12 88 91 55 91 407
3 8 30 13 15 3 9 112 88 58 78 414
4 4 24 9 17 8 13 93 92 53 56 369
5 11 15 13 13 2 24 95 66 54 57 350
6 2 16 9 5 3 30 62 45 48 45 265
7 2 13 8 4 4 32 31 29 30 48 201
8 1 7 7 2 5 21 29 37 28 26 163
9 5 6 12 1 4 20 34 33 20 27 162
10 1 13 15 6 19 25 32 17 45 173
11 4 10 12 1 8 21 33 35 4 33 161
12 5 9 16 2 7 21 37 30 127
Total 49 228 139 94 61 236 690 651 405 565 3118

Tabla 6.8: Número de ocurrencias mensuales de al menos un


caso de dengue observada en las celdas
86

Frecuencia de ocurrencia de al menos un caso de Dengue


Cuenta de Ocurrencia
120

100

Año
80 1995
1996
1997
1998
60 1999
2000
2001
2002
40 2003
2004

20

0
1 2 3 4 5 6 Mes 7 8 9 10 11 12

Gráfico 6.19: Frecuencia de ocurrencias mensuales de al


menos un caso de dengue observada en las
celdas

Del gráfico se deduce que existe una relación entre el


mes, la estación del año y la ocurrencia de Dengue sobre las
celdas, los meses de enero a junio muestran mayores
frecuencias de ocurrencias.

Asumiendo que la ocurrencia de Dengue se propaga entre


las celdas y esa expansión dura algún tiempo, se observaron
por periodos mensuales a las celdas que presentaron al
menos un caso de Dengue y la ocurrencia de Dengue de su
vecindad en el mes anterior. La Tabla 6.7 muestra la
observación de las celdas vecinas distinguiendo su posición
con respecto a la celda observada.

De las observaciones y mediciones de incidencia de


Dengue se deduce que existe una relación de contagio de la
enfermedad entre celdas y la duración de la expansión de la
enfermedad de acuerdo a la estación del año.
87

Cantidad de observaciones de por lo menos un caso de Dengue en


el mes anterior ocurrida en las celdas vecinas de una celda con
Dengue
Izquierda Derecha Superior Inferior
Mes Cantidad % Cantidad % Cantidad % Cantidad %
1 19 5.83 21 6.44 23 7.06 14 4.29
2 50 12.29 43 10.57 53 13.02 44 10.81
3 65 15.70 69 16.67 73 17.63 77 18.60
4 59 15.99 57 15.45 66 17.89 65 17.62
5 52 14.86 51 14.57 51 14.57 58 16.57
6 47 17.74 47 17.74 43 16.23 40 15.09
7 29 14.43 37 18.41 17 8.46 29 14.43
8 22 13.50 20 12.27 11 6.75 14 8.59
9 19 11.73 14 8.64 15 9.26 11 6.79
10 15 8.67 20 11.56 17 9.83 16 9.25
11 20 12.42 22 13.66 23 14.29 16 9.94
12 12 9.45 14 11.02 8 6.30 13 10.24
Total 409 13.12 415 13.31 400 12.83 397 12.73

Tabla 6.9: Cantidad de observaciones de por lo menos un


caso de Dengue en el mes anterior ocurrida en las
celdas vecinas de una celda con Dengue.

[Link]. LAS VARIACIONES DE LA TEMPERATURA


SUPERFICIAL DEL MAR

Para el estudio no se efectuaron mediciones de las


variaciones de temperatura sobre las celdas, el dato
disponible del clima peruano es medido por las estaciones
meteorológicas del SENAMHI y otras instituciones, esta
medición es de tipo puntual, su accesibilidad tiene un costo
y aún cuando se disponga de esta información. La
generalización y expansión de los valores de temperatura
sobre las celdas necesitarían de un método adecuado a la
realidad peruana. Cómo ya se ha mencionado la variación
de la temperatura superficial del mar refleja cambios en la
temperatura en todo el territorio peruano (Capítulo IV). La
variación del clima del Perú considerada en el modelo es
una medición de la temperatura superficial del mar
efectuado por el satélite NOAA en la zona denominada
88

‘Niño 1+2’. El gráfico 6.20 muestra la localización


geográfica formada por las coordenadas de vértice superior
izquierdo (90º Oeste, 0º Sur) y vértice inferior derecho
(80º Oeste, 10º Sur).

Gráfico 6.20: Regiones observadas por el satélite NOAA [39]


Promedio mensual de casos de Dengue entre 1995 y 2004Promedio de c as os
600

500

400

300

200

100

0
1 2 3 4 5 6 7 8 9 10 11 12
Mes

Gráfico 6.21: promedio mensual de casos de Dengue

Promedio mensual de la temperatura superficial del mar entre 1995 y 2004


TSM promedio
28.00

27.00

26.00

25.00

24.00

23.00

22.00

21.00

20.00

19.00

18.00
1 2 3 4 5 6
Mes7 8 9 10 11 12

Gráfico 6.22: Promedio mensual de la Temperatura superficial


del mar (1995-2004) de la zona ‘Niño 1+2’
medido por el satélite NOAA
89

Existe una relación entre el valor promedio de la


temperatura superficial del mar de la zona ‘Niño 1+2’ y el valor
promedio de la incidencia de casos sobre todo el territorio
peruano observado mensualmente, el Gráfico 6.21 y 6.22
muestran esta relación. La información mensual de la TSM fue
asignada directamente a la base de datos de observaciones
mensuales de Dengue. Los datos usados fueron obtenidos de
la página Web del satélite NOAA [40].

[Link]. LAS ZONAS ECOLÓGICAS

Las ecorregiones (explicadas en el capítulo IV) establecen


condiciones ambientales relativamente homogéneas dentro de
su territorio. Se ha medido el número promedio mensual de
casos de Dengue entre 1995 y 2004 para cada zona ecológica,
las ecorregiones tropicales tienen una tendencia de aumento de
acuerdo a las variaciones de la temperatura superficial del mar.
Los gráficos 6.23 al 6.30 muestran este comportamiento.

60

50
Número de casos

40

30

20

10

0
1 2 3 4 5 6 7 8 9 10 11 12
Mes

Gráfico 6.23: Promedio mensual de casos en la zona


Amazónica Subtropical
90

160

140

120

Número de casos
100

80

60

40

20

0
1 2 3 4 5 6 7 8 9 10 11 12
Mes

Gráfico 6.24: Promedio mensual de casos en la zona


Amazónica Tropical

2.5

2
Número de casos

1.5

0.5

0
1 2 3 4 5 6 7 8 9 10 11 12
Mes

Gráfico 6.25: Promedio de casos observados en la zona de


los Andes meridionales tropicales

160

140

12 0
Número de casos

10 0

80

60

40

20

0
1 2 3 4 5 6 7 8 9 10 11 12
Mes

Gráfico 6.26: Promedio de casos observados en la zona de


los Bosques secos ecuatoriales
91

600

500

Número de casos
400

300

200

100

0
1 2 3 4 5 6 7 8 9 10 11 12
Mes

Gráfico 6.27: Promedio de casos observados en la zona del


desierto pacífico subtropical

400

350

300
Número de casos

250

200

150

100

50

0
1 2 3 4 5 6 7 8 9 10 11 12
Mes

Gráfico 6.28: Promedio de casos observados en la zona del


desierto pacífico Tropical

2.5

2
Número de casos

1.5

0.5

0
1 2 3 4 5 6 7 8 9 10 11 12
Mes

Gráfico 6.29: Promedio de casos en la zona de Puna


Tropical
92

200

180
160

Número de casos
140

120

100

80

60

40
20

0
1 2 3 4 5 6 7 8 9 10 11 12
Mes

Gráfico 6.30: Promedio de casos observados en la zona de


Yunga Tropical

Ecorregión Valores nominales


Amazonia Subtropical E1
Amazonia Tropical E2
Andes Meridionales Subtropicales E3
Andes Meridionales Templado Calido E4
Andes Meridionales Tropicales E5
Andes Septentrionales o Páramo E6
Bosque Seco Ecuatorial E7
Desierto Pacifico Subtropical E8
Desierto pacifico Templado Calido E9
Desierto Pacifico Tropical E10
Lago Titicaca E11
Puna Subtropical E12
Puna Templado Calido E13
Puna Tropical E14
Yunga Subtropical E15
Yunga Tropical E16

Tabla 6.10: valores nominales de las Ecorregiones

6.8.2. EL MODELO DE PELIGRO DE DENGUE

Las mediciones de las variables relacionadas al peligro sirvieron


para crear una base de datos con la información de 11 160 celdas
pertenecientes al área de transmisión potencial, las mediciones
mensuales de ocurrencia de casos de dengue desde el año 1 995 a
diciembre de 2 004 sirvieron para el aprendizaje de un árbol de
93

decisión de estimación de la ocurrencia de Dengue para el mes


siguiente. El Anexo 16 muestra la ocurrencia de al menos un caso
de Dengue desde 1995 a 2004 y los ocurridos entre enero y julio de
2005.

La base de datos generada para el aprendizaje contiene 31 839


registros de observaciones mensuales de todas las variables
relacionadas al peligro. Las Tablas 6.11 y 6.12 muestran la
estructura de los datos de aprendizaje y los valores de ocurrencia de
Dengue observados.

Los casos de Dengue se manifestaron en 541 celdas, entre 1995


y 2004. El Anexo 17 muestra la lista de estas celdas consideradas
en el modelo, se muestra también el año y el mes donde registró su
primer caso de Dengue y el número de mediciones realizadas (hasta
diciembre de 2004). El Anexo 18 muestra el mapa del Perú con las
celdas consideradas en el modelo y sobre las cuales se efectuará la
predicción del Peligro.

Para la creación del modelo se aplicaron técnicas de aprendizaje


automático y de construcción de árboles de decisión mediante el
software WEKA (vea el Capítulo VII), se probaron varios algoritmos
de clasificación con resultados muy parecidos, sin embargo se optó
por algoritmo J48. El árbol de decisión se muestra en el Anexo 19,
posee 309 niveles y un tamaño de 617.

La Tabla 6.13 muestra el resumen de precisión del árbol


generado mediante una validación cruzada de 4 particiones (dado un
número n se divide los datos en n partes y, por cada parte, se
construye el clasificador con las n-1 partes restantes y se prueba con
esa) con respecto a la misma muestra, la Tabla 6.14 muestra la
matriz de confusión y el porcentaje de aciertos.
94

Variables Atributos Valores


-Fila de la celda I 1 a 145
-Columna de la celda J 1 a 245
-Mes Mes 1 - 12
- Número de casos
celda misma, izquierda,
observados en el mes pasado
derecha , superior,
sobre las 9 celdas de las
inferior,
posiciones: de la celda misma,
superiorizquierda, Numérico
izquierda, derecha , superior,
superiorderecha,
inferior, superior izquierda,
inferiorizquierda e
superior derecha, inferior
inferiorderecha
izquierda e inferior derecha
Ecorregion con valores
-Ecorregión a la que pertenece 2, 16, 7 ,10,
nominales de la Tabla
la celda 14, 8,1, 5, 16
6.9
-Temperatura superficial del
TSMAnterior Número real
mes pasado
-Temperatura superficial del
TSM Número real
mar del mes

Tabla 6.11: Estructura de la base de datos de aprendizaje

Variable dependiente Atributo Valor nominal


L -> Libre de Dengue
B -> Bajo (1 caso)
Ocurrencia de Dengue en el
Ocurrencia M -> Medio (2 a 5 casos)
Mes
A -> Alto (6 a 9 casos)
T -> Muy Alto (más de 10)

Tabla 6.12: variable estimada por los datos de aprendizaje


95

Resumen de la prueba de validación cruzada de 4 particiones


Instancias correctamente clasificadas 28723 (90.2133 %)
Instancias incorrectamente clasificadas 3116 (9.7867 %)
Error medio absoluto 0.0631
Número total de instancias 31 839

Tabla 6.13: Resumen de la prueba de validación cruzada de 10


niveles efectuada sobre los datos de aprendizaje

Clasificado como- > L B M A T


Libre de Dengue: L 28 367 70 131 32 47
Bajo: B 1 374 29 39 4 20
Medio: M 771 41 90 25 81
Alto: A 151 14 27 15 41
Muy alto: T 144 24 52 28 222

Tabla 6.14: Matriz de confusión, la diagonal representa el


número de aciertos de clasificación

6.8.3. LA ECUACIÓN DE PELIGRO DE DENGUE

La función P es la función de predicción de peligro ocurrencia de


Dengue y N es la función del árbol de decisión que predice la
ocurrencia de Dengue para el tiempo t+1, la unidad de tiempo es
un mes, el valor resultante de la función N es un valor nominal ‘L’,
‘B’, ‘M’, ‘A’ o ‘T’.
P(i,j,t+1) = N(t, e(i,j), n(i,j,t), n(i+1,j,t), n(i-1,j,t), n(i,j-1,t), n(i,j+1,t), n(i-1,j-1,t) , n(i+1,j-1,t) ,
n(i-1,j+1,t) , n(i+1,j+1,t) , tsm(t), tsm(t+1)) donde:
N = Función de predicción del árbol de decisión
i = fila de cada celda
j = columna de cada celda
t = Tiempo, donde: t ∈ [1,12]
e(i,j) = Ecorregión a la que pertenece la celda i, j
n(i,j,t) = Casos de Dengue observado en celda i, j en el mes t
tsm(t) = Valor de la Temperatura superficial del mar del mes t
96

6.9. LA ECUACION DEL RIESGO EPIDEMICO DEL


DENGUE

La Ecuación del Riesgo es un producto de las funciones de


Vulnerabilidad y Peligro para cada celda:

R(i,j,t+1)= V(i, j). Val( P(i,j,t)) , donde:

1 , si x = ‘L’
2 , si x = ‘B’
Val(x) = 3 , si x = ‘M’
4 , si x = ‘A’
5 , si x = ‘T’
R = Riesgo epidémico
V = Función de Vulnerabilidad
P = Función de Peligro con valores numéricos
i = fila de cada celda
j = columna de cada celda
t = Tiempo, donde: t ∈ [1,12]

La función Val convierte los valores nominales de la función de


peligro a números, el valor del riesgo es un factor de la
vulnerabilidad determinado por el nivel numérico del peligro de cada
mes.
97

CAPITULO VII: EL SISTEMA INFORMATICO DE


PREDICCION DEL RIESGO EPIDEMICO

CAPITULO 7. ÁMBITO DEL ESTUDIO

7.1. NECESIDADES QUE CUBRIO EL SISTEMA

El Sistema informático cubrió sólo las necesidades derivadas de


la investigación, la integración de las bases de datos, información
geográfica, la aplicación de técnicas de aprendizaje automático,
pruebas y validación se usaron de acuerdo al avance del proyecto.
El sistema informático no es el objetivo de esta investigación, es sólo
una herramienta; a pesar de ello se hace una descripción de las
funcionalidades y se detallan algunas características que pueden ser
muy bien utilizadas como modelo informático para el tratamiento de
grandes volúmenes de información geográfica.

7.2. COMPONENTES DEL SISTEMA

El Sistema informático esta compuesto por un Sistema de


Información Geográfica orientado a objetos (GeoConcept Experto
5.5), una base de datos PostgreSQL/Postgis, el sistema de
98

aprendizaje automático (WEKA). La Tabla 7.1 muestra las funciones


que cumple cada uno:

Componente Funciones
• Producción cartográfica
• Análisis temáticos y estadísticos
Sistema de Información
• Producción de Mapas impresos
Geográfica:
• Medición y preparación de datos
GeoConcept
• Vinculo entre los datos predecidos y la base de
datos
• Cálculo de coordenadas de los casos de
Dengue
• Creación y manipulación de atributos de las
celdas
Base de Datos:
• Análisis espacial de las variables
PostgreSQL /
• Operaciones de consulta y cálculos topológicos
PostGis
y geográficos
• Almacenamiento y administración de la Base de
datos
• Implementación del modelo de árbol de decisión
Aprendizaje y • Aprendizaje del modelo de predicción
Predicción: • Construcción del modelo de árbol de decisión
WEKA • Análisis estadístico del aprendizaje
• Predicción de los niveles de Dengue

Tabla 7.1: Funciones de los componentes del Sistema

7.3. EL SISTEMA DE INFORMACION GEOGRÁFICA

Este componente se implementó con el programa GeoConcept


Experto 5.5 que es un Software orientado a objetos que permite
gestionar espacios geográficos cartografiados, administrar
información espacial en bases de datos, analizar estadísticamente el
territorio, producir cartografía y generar reportes [41].
99

7.3.1. EL ENTORNO DEL SISTEMA DE INFORMACION


GEOGRÁFICA

a) Mapa del Perú en celdas con b) Mapa del Perú con la ocurrencia
curva de nivel de 3000 m. de altitud de casos de Dengue
Gráfico 7.1: Entorno del SIG con diferentes vistas de mapas

Gráfico 7.2: Entorno del SIG con las conexiones a bases de


datos PostgreSQL/PostGis
100

7.4. LA BASE DE DATOS

Los sistemas de mantenimiento de Bases de Datos relacionales


tradicionales (DBMS’s) soportan un modelo de datos que consisten
en una colección de relaciones con nombre, que contienen atributos
de un tipo específico. En los sistemas comerciales actuales, los tipos
posibles incluyen numéricos de punto flotante, enteros, cadenas de
caracteres, cantidades monetarias y fechas. Está generalmente
reconocido que este modelo será inadecuado para las aplicaciones
futuras de procesado de datos.

El modelo relacional sustituyó modelos previos en parte por su


simplicidad que hace muy difícil la implementación de ciertas
aplicaciones. PostgreSQL ofrece una potencia adicional sustancial al
incorporar los siguientes cuatro conceptos adicionales básicos en
una vía en la que los usuarios pueden extender fácilmente el
sistema: Clases, herencias, tipos y funciones, otras características
que aportan potencia y flexibilidad adicional: Restricciones,
disparadores, reglas e integridad transaccional. Estas características
la colocan en la categoría de las Bases de Datos identificadas como
objeto-relacional. Nótese que éstas son diferentes de las referidas
como orientadas a objetos. PostgreSQL tiene algunas características
que son propias del mundo de las bases de datos orientadas a
objetos, algunas Bases de Datos comerciales han incorporado
recientemente características en las que PostgreSQL fue pionera
[42].

PostGIS es una extensión al sistema de base de datos objeto-


relacional PostgreSQL. Permite el uso de objetos GIS(Geographic
information systems). PostGIS incluye soporte para índices GiST
basados en R-Tree, y funciones básicas para el análisis de objetos
GIS. Esta creado por Refractions Research Inc, como un proyecto
de investigación de tecnologías de bases de datos espaciales. Es
publicado bajo licencia GNU. PostGIS puede usar todos los objetos
101

que aparecen en la especificación OpenGIS (Consorcio internacional


de compañías dedicado al establecimiento de estándares GIS
comunes) como puntos, líneas, polígonos, multilíneas, multipuntos, y
colecciones geométricas [43].

La base de datos usada por el Sistema es el PostgreSQL con la


extensión para el soporte de datos geográficos PostGis esta
herramienta permitió el cálculo de valores de variables asociadas a
la superficie de los distritos y para el cálculo de las coordenadas de
los casos de Dengue de la base de datos de la Oficina General de
Epidemiología. Las funciones que cumple este componente son:
• Cálculo de coordenadas de los casos de Dengue por
correspondencia del ubigeo (codificación oficial de unidades
administrativas dada por el INEI) de distritos y nombre de
localidad con la información geográfica de los centros
poblados. Esto permitió conocer el lugar donde ocurrieron los
casos de Dengue por periodos de tiempo.
• Creación de las celdas de fraccionamiento del territorio
• Medición del número de casos de Dengue mediante
operaciones topológicas de intersección de las celdas con las
coordenadas de los casos de Dengue
• Medición de los niveles de Dengue en base a rangos de
ocurrencia de casos
• Medición de las variables de Vulnerabilidad: Número de
centros poblados, número de viviendas, nivel de urbanismo
por intersección espacial de las celdas con las coordenadas
de los centros poblados. Nivel de pobreza y densidad
poblacional por intersección de la superficie de distritos con
las celdas.
• Determinación e inclusión de las celdas dentro de la zona de
transmisión potencial

Los gráficos 7.3 y 7.4 muestran un ejemplo del entorno


PostgreSQL.
102

Gráfico 7.3: Entorno de PostgreSQL/PostGis con información de


la tabla de las celdas

Gráfico 7.4: Entorno de PostgreSQL/PostGis con información de


la tabla de centros poblados
103

7.5. EL PROCESO DE PREPARACIÓN DE DATOS

La preparación de datos se inicia con la creación de un nuevo


Mapa mediante el Sistema de información geográfica, se creó la
estructura de datos (clases y subclases de objetos geográficos), la
definición de campos, importación y estandarización de la cartografía
existente. Se creó después la matriz de fraccionamiento del espacio
(celdas de 100 km²) con identificadores (i,j) y la geometría se
almacenó en la base de datos PostgreSQL/PostGis.

La primera variable medida para la determinación de la


Vulnerabilidad fue el nivel de presencia humana sobre cada celda,
esta operación se realizó en la base de datos PostGis mediante
operaciones de consultas topológicas de agrupación de centros
poblados incluidos en la superficie de cada celda, el valor de la
sumatoria fue asignado como atributo a la celda. De forma similar se
efectuó la medición de la presencia de aeropuertos.

Gráfico 7.6: Ficha de información de la celda (22,66) marcada


en color negro (cada celda tiene atributos
correspondientes a la medición de las variables de
la vulnerabilidad y estimaciones del peligro)
104

Para la medición de los niveles de pobreza y densidad


poblacional, se aplicó el criterio de inclusión de la celda y dentro del
distrito para el cálculo de atributos correspondientes a los distritos. El
cálculo de la Vulnerabilidad se efectuó sobre cada celda en la base
de datos.

Información Atributo(s)
- Coordenadas geográficas X,Y
- Ubigeo de distrito Ubigeo
- Nombre de distrito NombreDistrito
- Nombre del centro poblado NomCCPP
- Categoría(caserio, anexo,barrio, unidad Categoría
agropecuaria, etc.)
- Clasificación (urbano rural) Clasificacion
- Número de viviendas NumViviendas

Tabla 7.2: Estructura de datos de los centros poblados

Para el cálculo de las coordenadas geográficas de los casos a


partir de la base de datos proporcionada por la oficina general de
epidemiología se consideró la cartografía de centros poblados (INEI
2002). La Tabla 7.2 muestra la estructura de datos de los centros
poblados; la Tabla 7.3 muestra la estructura de datos de la
ocurrencia del Dengue.

Se usó el motor de consultas geográficas de PostGis para el


cálculo automático de las coordenadas de la ocurrencia de casos de
Dengue en todo el Perú mediante la correspondencia del nombre de
centro poblado y ubigeo de distrito con la base de datos de Dengue
de la Oficina General de Epidemiología (Gráfico 7.6).
105

Información proporcionada por la OGE


Semana del año
Diagnóstico de la enfermedad
Tipo de diagnóstico (Probable, confirmado o descartado)
Subregión de Salud
Ubigeo de Distrito
Nombre de la localidad
Edad del paciente
Sexo del paciente
Fecha de inicio de síntomas
Fecha de notificación
Establecimiento de Salud
Dirección
Fecha de intervención (en caso de estudio)
Fecha de defunción (en caso de muerte)

Tabla 7.3: Información epidémica proporcionada por la


OGE

Gráfico 7.5.a: Vista de Centros poblados sobre los


departamentos de Piura y Lambayeque
106

Gráfico 7.5.b: Localización de Casos de Dengue a


partir de las coordenadas de centros
poblados Piura y Lambayeque

Gráfico 7.5: Cálculo de coordenadas de casos de Dengue a


partir de las coordenadas de centros poblados

Para la creación del modelo de predicción se preparó sobre la


base de datos la tabla de observaciones de casos de Dengue desde
el año 1995 a 2004 de cada celda para intervalos mensuales (este
cálculo se efectúo mediante consultas topológicas de agrupación de
casos de casos de Dengue sobre cada celda), se integró las
mediciones de temperatura superficial del mar de cada mes, la
pertenencia a las ecorregiones, las mediciones de casos de dengue
de las celdas vecinas (derecha, izquierda, superior, inferior, superior
izquierda, superior derecha, inferior izquierda e inferior derecha), el
número total de registros de la muestra fue de 31 839 las que
sirvieron para el aprendizaje del modelo de peligro.
107

7.6. El COMPONENTE DE APRENDIZAJE DE ÁRBOLES DE


DECISION

Las iniciales WEKA responden a Waikato Environment for


Knowledge Analysis [44] [45]. Se trata de una herramienta de libre
distribución desarrollada en la Universidad de Waikato (Nueva
Zelanda), escrita en lenguaje java y que permite realizar multitud de
análisis.

La herramienta está aplicada a procesos de minería de datos,


por lo que agrupa diferentes técnicas: preprocesado, agrupamiento o
clustering, ajuste de clasificadores, generación de reglas de
asociación, etc. También incluye facilidades para la visualización de
los datos [46]. Existen múltiples modos de utilización de WEKA.

Gráfico 7.7: Programa WEKA

WEKA dispone de cuatro interfaces distintos:

• Interfaz en modo texto: permite la introducción de todo


tipo de comandos, pero no es posible realizar
108

representaciones gráficas (realmente, el interfaz en modo


texto permite instanciar las distintas clases java definidas
en el programa WEKA).

• Interfaz Explorer: es el interfaz gráfico básico. En él se


pueden mostrar gráficamente tanto las características de
los datos de partida como los resultados de los análisis.
Permite introducir los comandos con ayuda del ratón,
seleccionando los operadores adecuados en menús
desplegables.
• Interfaz Experimenter: se trata de un interfaz gráfico más
avanzado, en el que no sólo se pueden realizar análisis
sobre los datos, sino que además es posible comparar el
funcionamiento de diferentes algoritmos (por ejemplo,
diferentes clasificadores) o bien comparar distintos
ficheros de datos.
• Interfaz KnowledgeFlow: este último interfaz permite
representar como una red de operadores en cascada los
procesos a realizar sobre los datos (preprocesado,
selección de características, ajuste de un clasificador,
evaluación de los porcentajes de acierto esperables, etc.)

7.6.1. El ENTORNO WEKA

WEKA permite la edición y preparación de datos de


muestra para el aprendizaje, tiene un editor de datos y un
visualizador de datos donde se puede ordenar en los ejes X e
Y, las variables y elegir una tercera para ver su
comportamiento.
109

Gráfico 7.8: Programa WEKA y su editor de datos

Gráfico 7.9: Programa WEKA y el visualizador de datos


110

La Herramienta de clasificación permite la elección de la


variable a clasificar, el algoritmo de aprendizaje, definir los
modos de validación cruzada, basada en la misma muestra
de datos, o usando un juego de datos distinto, permite
también visualizar en modo texto el árbol de decisión, la
matriz de confusión de valores clasificados, los valores
observados e inferidos y estadísticas de error.

Gráfico 7.10: La herramienta de clasificación y análisis

Es posible guardar el modelo y el resultado de cada


ejecución de aprendizaje. También dispone de un
visualizador del árbol generado mostrando los valores
condicionales de cada nodo, un visualizador gráfico de
estadísticas de curvas de aprendizaje y errores.
111

Gráfico 7.11: Programa WEKA y el visualizador de árboles de


decisión

7.7. LA INTEGRACION FUTURA DE LOS COMPONENTES


DEL SISTEMA

Los componentes mencionados trabajarían de forma integrada


en el supuesto que este sistema sea adoptado por algún interesado.
El gráfico 7.11 muestra la interacción de estos componentes. Los
datos de ocurrencias de Dengue proporcionados por la Oficina
General de Epidemiología están en formato DBF (la Tabla 7.3
muestra la estructura de estos datos) contiene información necesaria
para localizar las coordenadas de la ocurrencia de Dengue mediante
el Sistema de Información geográfica. Este proceso debe realizarse
cada mes para la retroalimentación del Sistema. Esto implica realizar
el proceso de mapeo de casos de dengue, cálculos sobre las celdas
y actualización de las observaciones a la base de datos de
observaciones para generar el modelo de predicción.
112

El Sistema de información geográfica está enlazado a la base de


datos geográfica, existe una réplica de la toda la información
geográfica (cartografía) en la base de datos, la modificación de
cualquier elemento en la base de datos o en el SIG refleja un cambio
simultaneo en ambas partes. Para el proceso de actualización de
datos existe una configuración que permite importar, exportar y
actualizar la información desde la base de datos hacia el mapa.

El componente de aprendizaje y creación del árbol de decisión


accede a la tabla de muestras de la base de datos, esta sirve para
inferir el modelo de predicción que es retroalimentado con las
observaciones que se registran mes a mes. El árbol de decisión
construido genera las predicciones de ocurrencia de Dengue sobre
un archivo de texto que está vinculado al Sistema de información
geográfica. Se utiliza la coincidencia del identificador (i, j) para
realizar la actualización de datos.

Información
poblacional, cartografía
y datos estadísticos

Sistema de aprendizaje,
predicción y
retroalimentación del
modelo

Base de Datos
geográfica
Base de Datos
de casos de Sistema de información
Dengue geográfica

Mapas Vulnerabilidad,
peligro y de riesgo
epidémico

Gráfico 7.11: Esquema del sistema informático de predicción del


riesgo epidémico
113

CAPITULO VIII: RESULTADOS DEL MODELO Y


PRUEBA DE LA HIPÓTESIS

CAPITULO 8. ÁMBITO DEL EDIO

8.1. DETERMINACIÓN DE LA VULNERABILIDAD

Se calculó la vulnerabilidad al Dengue dentro de la zona de


transmisión potencial usando la ecuación de vulnerabilidad (vea la
sección 6.7.2), el mapa de vulnerabilidad se muestra en el Anexo 15.
Los valores obtenidos se muestran en el gráfico 8.1 y en la tabla 8.1.

4000
Frecuencia de valores de Vulnerabilidad

3430
3500

3000

2500

2000

1536
1500 1337

1000
723 725
644

500 396 343


246 274 249 190 153
103 85 47 15 6 1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Vulnerabilidad

Gráfico 8.1: Frecuencia de valores de Vulnerabilidad


114

Niveles de
Frecuencia
Vulnerabilidad
0 103
1 246
2 396
3 723
4 1536
5 3430
6 274
7 725
8 1337
9 644
10 343
11 249
12 190
13 153
14 85
15 47
16 15
17 6
18 1
Total 10 503

Tabla 8.1: Frecuencia de valores de Vulnerabilidad en las celdas

Los estadísticos de los valores de vulnerabilidad se resumen en


la Tabla 8.2

Estadístico Valor
Media 5.492
Varianza 7.786
Desviación estándar 2.790
Curtosis (leptocúrtica) 3.701
Mediana 9.000
Moda 5.000
Coeficiente de asimetría 0.783

Tabla 8.2: Estadísticos de la Vulnerabilidad

La Vulnerabilidad al Dengue con relación a las ecorregiones se


manifiesta con mayor intensidad en las ecorregiones: Amazonia
Tropical (E2), Yunga Tropical (E16), Yunga Subtropical (E15),
Desierto Pacífico Subtropical (E8), los menos vulnerables son los
Andes Meridionales Templado Cálido (E4) y los Andes
Septentrionales o Páramo. La Tabla 8.2 muestra los resultados de
115

las frecuencias de valores de Vulnerabilidad determinada para las


ecorregiones.

Vulne- Ecorregión
rabilidad E1 E2 E3 E4 E5 E6 E7 E8 E9 E10 E12 E14 E15 E16
0 103
1 78 65 1 3 4 16 70 9
2 101 120 18 2 13 64 37 12 22 7
3 107 208 26 5 10 100 63 87 1 81 35
4 59 933 10 2 7 1 20 24 43 76 1 6 80 274
5 55 2723 8 12 1 14 33 20 46 2 5 153 358
6 39 20 35 1 9 11 61 35 17 1 17 28
7 6 291 18 32 2 45 66 17 47 11 10 42 138
8 5 754 30 30 6 42 51 11 42 11 17 87 251
9 2 248 10 36 3 21 24 6 31 12 24 62 165
10 48 17 30 10 25 28 3 15 10 35 13 109
11 20 13 20 2 15 21 1 20 17 23 10 87
12 7 8 13 3 11 16 3 22 8 16 13 70
13 2 3 14 16 10 24 9 17 8 50
14 1 4 7 2 5 9 1 5 5 21 1 24
15 1 1 3 11 1 6 3 8 13
16 1 4 5 2 2 1
17 3 3
18 1
Total 452 5544 202 6 221 30 252 541 311 468 91 186 589 1610

Tabla 8.3: Frecuencia de Valores de Vulnerabilidad de las


ecorregiones

Ecorregión Valores nominales


Amazonia Subtropical E1
Amazonia Tropical E2
Andes Meridionales Subtropicales E3
Andes Meridionales Templado Calido E4
Andes Meridionales Tropicales E5
Andes Septentrionales o Páramo E6
Bosque Seco Ecuatorial E7
Desierto Pacifico Subtropical E8
Desierto pacifico Templado Calido E9
Desierto Pacifico Tropical E10
Lago Titicaca E11
Puna Subtropical E12
Puna Templado Calido E13
Puna Tropical E14
Yunga Subtropical E15
Yunga Tropical E16

Tabla 8.4: Valores nominales de las ecorregiones


116

La Vulnerabilidad con relación a los departamentos se resumen


en la Tabla 8.5, siendo los más vulnerables los departamentos de
Loreto, Cajamarca, Ucayali y Amazonas, San Martín y Piura.

Departamento Vulnerabilidad
Loreto 4649.45
Cajamarca 2936.55
Ucayali 2425.86
Amazonas 2161.11
San Martín 1771.60
Piura 1507.71
La Libertad 1395.00
Lima 1034.83
Ancash 933.05
Huanuco 817.41
Junín 765.61
Lambayeque 692.67
Cusco 651.96
Madre de Dios 571.00
Ica 481.50
Tumbes 470.00
Ayacucho 409.95
Apurimac 269.18
Arequipa 256.92
Moquegua 254.33
Tacna 249.43
Huancavelica 239.22
Pasco 223.94
Puno 216.92

Tabla 8.5: Vulnerabilidad promedio al Dengue en orden


descendente

8.2. LA PREDICCIÓN DEL PELIGRO

Mediante el Sistema de predicción del Peligro se estimó la


ocurrencia de Dengue para los primeros 6 meses de 2005 en todo el
Perú. Se realizaron 3 481 predicciones, el resumen de la predicción
se muestra en la Tabla 8.6; la Tabla 8.7 muestra la matriz de
confusión.
117

Resumen de la predicciones de los primeros 6 meses


Ocurrencias correctamente predecidas 3003 (86.2683 %)
Ocurrencias incorrectamente predecidas 478 (13.7317 %)
Error medio absoluto 0.0779
Número total de instancias 3 481

Tabla 8.6: Resumen de la predicción de los 6 primeros


meses de 2005

Clasificado como- > L B M A T


Libre de Dengue: L 2963 11 20 10 13
Bajo: B 191 6 8 0 2
Medio: M 119 8 14 9 5
Alto: A 18 2 10 3 4
Muy alto: T 25 3 14 6 17

Tabla 8.7: Matriz de confusión de predicción de los primeros


6 meses de 2005

El Anexo 21 contiene a modo de muestra los valores del archivo


de datos usados para la predicción conteniendo los 27 primeros
registros, el resultado de la predicción y los valores observados. El
Anexo 24.a muestra la predicción del peligro para el mes de enero
de 2005 en forma de mapas parciales de Loreto y el norte del Perú
con la representación temática de ocurrencias de Dengue
predecidos y observados en la realidad; el Anexo 24.b muestra el
mapa nacional de Riesgo para el mes de Enero de 2005.

El Anexo 24.c muestra la predicción del peligro en mapas


parciales de Ucayali, San Martín, Madre de Dios, costa noreste del
Perú y el departamento de Lima. El Anexo 24.d muestra el mapa
nacional de Riesgo para el mes de junio de 2005.

Los valores observados y predecidos por el modelo se muestra


en los gráficos 8.2, 8.3, 8.4, 8.5 y 8.6 para los niveles ‘Libre’, ‘Bajo’,
118

‘Medio’, ‘Alto’ y ‘Muy Alto’ respectivamente en forma de cluster; los


ejes XY están ordenados de acuerdo a la posición de las celdas de
la matriz de fraccionamiento, se ha considerado la zona donde están
ubicadas las celdas con ocurrencias de Dengue.

Los círculos de los gráficos 8.2, 8.3, 8.4, 8.5 y 8.6 representan
los niveles de Dengue observados en la realidad, las circunferencias
representan los niveles predecidos; para ambos, el radio equivale a
la cantidad de ocurrencias reales (para los círculos) y cantidad de
predicciones (para las circunferencias) de cada una en cada celda
en el periodo de enero a junio de 2005.

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140


30

40

50

60

70

80

90

10 0

11 0

12 0

13 0

140

Observado en la realidad Predecido por el modelo

Gráfico 8.2: Distribución de la cantidad de ocurrencias del


nivel ‘Libre de Dengue’ observado y predecido.
119

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140


30

40

50

60

70

80

90

10 0

11 0

12 0

13 0

14 0

Observado en la realidad Predecido por el modelo

Gráfico 8.3: Distribución de la cantidad de ocurrencias del


nivel ‘Bajo’ observado y predecido.

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140


30

40

50

60

70

80

90

100

110

120

130

140

Observado en la realidad Predecido por el modelo

Gráfico 8.4: Distribución de la cantidad de ocurrencias del


nivel ‘Medio’ observado y predecido.
120

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140


30

40

50

60

70

80

90

100

110

120

130

140

Observado en la realidad Predecido por el modelo


Gráfico 8.5: Distribución de la cantidad de ocurrencias del
nivel ‘Alto’ observado y predecido.

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140


30

40

50

60

70

80

90

100

110

120

130

140

Observado en la realidad Predecido por el modelo

Gráfico 8.4: Distribución de la cantidad de ocurrencias del


nivel ‘Muy Alto’ observado y predecido.
121

8.3. ESTIMACION DEL RIESGO EPIDEMICO

Mediante el Sistema de Información geográfica se calculó el


riesgo epidémico en base a la fórmula de riesgo (vea la sección 6.9)
usando los valores estimados de vulnerabilidad y peligro, el cálculo
se efectuó para los primeros 6 meses de 2005. El Anexo 24.a y 24.d
muestra los mapas nacionales de riesgo epidémico para los meses
febrero y junio de 2005 con las celdas consideradas en el modelo.

8.4. INFORMACION GENERADA POR EL SISTEMA DE


PREDICCIÓN

La Tabla 8.7 muestra la lista de información producida en el


estudio, el mapa de cada una se muestra en los Anexos.

Información producida a nivel nacional


- Casos de Dengue ocurridos en el Perú y registrados desde el
año 1995 (73.1 % del registro oficial de casos) con
coordenadas a nivel de centro poblado
- División del territorio Peruano en celdas homogéneas de 100
km² de superficie.
- Mapa de nivel de pobreza en celdas de 100 km²
- Mapa de nivel de urbanismo en celdas de 100 km²
- Mapa de ocupación humana en celdas de 100 km²
- Mapa de densidad poblacional en celdas de 100 km²
- Mapa de nivel de cantidad de viviendas en celdas de 100 km²
- Mapas de casos de Dengue en celdas de 100 km²
- Mapas de vulnerabilidad al Dengue
- Mapas de peligro de Dengue
- Mapas del riesgo epidémico del Dengue

Tabla 8.7: Información producida en el estudio


122

8.5. ANÁLISIS DE RESULTADOS

8.5.1. DETERMINACIÓN DE POBLACION


La población es todo el territorio peruano.

8.5.2. DETERMINACIÓN DE MUESTRA

La Tabla 8.8 resume la toma de muestras efectuadas en


cada celda, las variables marcadas con asterisco sirvieron para
crear el modelo de predicción del peligro y se midieron los
datos desde año 1995 al 2004. Para la validación del modelo
de peligro se consideró el registro de datos de la enfermedad
del periodo de enero a junio de 2005.

Variable Toma de muestra % Muestra

-Espacio del territorio Celdas espaciales de 100 km² de todo


100
peruano el Perú
Información del MEF (2001) a nivel de
-Nivel de pobreza 100
distrito
Localización con coordenadas de los
-Casos de Dengue* casos de Dengue a nivel de centro 73.1
poblado (fuente: OGE)
-Localización de
Información oficial de centros poblados
centros poblados del 100
del INEI año 2000
Perú*
Cartografía de ecorregiones a escala
-Ecorregiones del Perú 100
1:250 000 (INRENA)
Registro del promedio mensual de la
-Temperatura
zona ‘Niño 1-2’ tomado por el satélite 100
superficial del mar*
NOAA
-Zona de transmisión Curvas de nivel de 2200 m, 2500 m. y
100
potencial del Dengue 3000 m.
- Zona de ocupación
Información de Distritos identificados
del vector Aedes 100
por la OGE
aegypti *

Tabla 8.8: Muestras tomadas en el estudio


123

8.6. VERIFICACIÓN DE LA HIPÓTESIS

La hipótesis general: “Las tecnologías de información


geográfica y algoritmos de clasificación permiten desarrollar
un modelo espacial de predicción del riesgo epidémico del
Dengue a una escala nacional” tiene las hipótesis específicas:

a) Más del 25 % del territorio peruano es vulnerable al


Dengue

El Perú posee de acuerdo al INRENA (Instituto Nacional


de Recursos Naturales) una superficie de 1 285 215 km², la
zona de transmisión potencial del Dengue tiene una
superficie aproximada de 1 015 990 km² (Ver Anexo 4), la
superficie de ocupación del vector Aedes aegypti es de
aproximadamente 395 083 km², la intersección de las
zonas de transmisión potencial y la zona de ocupación del
vector representan la superficie del territorio más
vulnerable, se observa también que la zona de ocupación
del vector está incluida dentro de la zona de transmisión
potencial. Con estas consideraciones se establecen los
enunciados:

H1: Si la superficie de ocupación del vector Aedes aegypti


es mayor que el 25% de la superficie del Perú,
entonces: “Más del 25 % del territorio peruano es
vulnerable al Dengue”
H0: Si la superficie de ocupación del vector Aedes aegypti
es menor o igual que el 25% de la superficie del Perú,
entonces: “Igual o menos del 25 % del territorio
peruano es vulnerable al Dengue”

La Tabla 8.9 muestra el porcentaje de las superficies de


ocupación del vector y de transmisión potencial con
relación al territorio del Perú.
124

Superficie % con relación al


Territorio
en km² territorio del Perú
Perú 1 285 215 100,00
Zona de transmisión potencial 1 015 990 79,05
Zona de ocupación del vector
Aedes aegypti 395 083 30,70

Tabla 8.9: Territorio peruano vulnerable al Dengue

De acuerdo a la medición de las superficies, el


porcentaje del territorio peruano más vulnerable al Dengue
es al menos 30.7% del territorio peruano, por tanto esta
hipótesis específica es verdadera (Anexo 4). En el
supuesto de que el área de ocupación del vector Aedes
aegypti sea igual al área de transmisión potencial, los
niveles de vulnerabilidad se comprueban con las
mediciones de vulnerabilidad por departamentos y
ecorregiones. Las Tablas 8.1, 8.2, 8.3, 8.4, 8.5 muestran el
resultado de la determinación de la Vulnerabilidad; el
Anexo 20 muestra el mapa de vulnerabilidad del Perú, con
la zona de ocupación del vector Aedes y los aeropuertos
(posibles lugares de llegada de personas infectadas).

b) Las tecnologías de información geográfica y algoritmos de


clasificación predicen el peligro de ocurrencia del Dengue
a partir del registro histórico de variables relacionadas
con la enfermedad

Para verificar esta hipótesis se formula los enunciados:


H1: Si el resultado del modelo de predicción de peligro de
ocurrencia de Dengue si difiere de la ocurrencia real
de Dengue, entonces: “Las tecnologías de
información geográfica y algoritmos de
clasificación no predicen el peligro de ocurrencia
del Dengue a partir del registro histórico de
variables relacionadas con la enfermedad”
125

H0: Si el resultado del modelo de predicción de peligro de


ocurrencia de Dengue no difiere de la ocurrencia real
de Dengue, entonces: “Las tecnologías de
información geográfica y algoritmos de
clasificación predicen el peligro de ocurrencia del
Dengue a partir del registro histórico de variables
relacionadas con la enfermedad”

Si H1 es falsa, se aceptará H0 y también se aceptará la


hipótesis específica. Para verificar H1 se compara la
predicción de la ocurrencia de Dengue realizado por el
Sistema de predicción y la ocurrencia observada en la
realidad.

Los datos usados para el contraste de las hipótesis


corresponden a los primeros 6 meses de 2005 efectuados
sobre las 605 celdas consideradas en el modelo de
predicción.

Se contrastaron los 6 valores mensuales predecidos y


observados para cada celda aplicando la prueba Ji
cuadrada sobre los valores de ocurrencia ‘Libre’, ‘Bajo’,
’Medio’, ‘Alto’ y ‘Muy Alto’ con un nivel de confianza de
0,05 y 4 grados de libertad (5 niveles de Dengue contra 2
resultados (5-1).(2-1)=4) cuyo valor en la tabla 9,488.

La prueba efectuada sobre las celdas se muestra en el


Anexo 22; la columna ‘Difieren’ muestra ‘Si’ cuando se
cumple que el valor X² >9,488 y se comprueba que los
valores predecidos y observados en la realidad si difieren.
Las celdas cuyo valor X² demuestra que los niveles de
126

Dengue predecidos y observados si difieren se muestran


en la Tabla 8.10.

Niveles de Dengue Niveles de Dengue


Celda Prueba
observados predecidos Difieren

I J L B M A T L B M A T
14 39 0 1 5 0 0 3 1 0 1 1 10,000 Si
34 65 0 2 1 0 3 5 0 0 1 0 12,000 Si
35 66 0 2 1 0 3 5 0 0 1 0 12,000 Si

Tabla 8.10: Celdas que cumplen la hipótesis H1.

Si se excluyen las celdas de la tabla 8.10, se rechaza H1


y se acepta H0. Por tanto la hipótesis específica es
verdadera excepto para las celdas mostradas en la Tabla
8.10.

El modelo de peligro de ocurrencia del Dengue predice


niveles aceptables para el 99,5041% (602 de 605) de las
celdas consideradas en el modelo. El Anexo 23 Muestra el
mapa del Perú con las celdas para las cuales el modelo
predice y no predice niveles aceptables de Dengue.
127

CAPITULO IX: DISCUSIÓN

CAPITULO 9. ÁMBITO DEL

9.1. SOBRE EL ABORDAJE DEL ESTUDIO

El Modelo de predicción del Riesgo epidémico ha considerado


todo el territorio peruano. El análisis de la información y el método
se fundamenta en el fraccionamiento del territorio en superficies
homogéneas de 100 km² que fue asumido de forma experimental, se
consideraron todas las variables disponibles y asequibles a una
escala nacional. El modelo de riesgo basado en la vulnerabilidad y
peligro predecido a partir de un árbol de decisión es muy diferente a
las investigaciones epidemiológicas que generalmente optan por la
modelización de ecuaciones diferenciales, estocásticas o bajo reglas
de evolución (individuo centro). Sin embargo la ‘espacialización’ del
territorio, la generalización experimental de ocurrencia de Dengue
sobre superficies de 100 km² y parámetros indirectos de la variación
de temperatura sobre las ecorregiones ha demostrado ser válido
solamente para la predicción.

El método de fraccionamiento del territorio ha demostrado ser


efectivo en la homogenización de la medición y generalización de
128

variables relacionadas al Dengue efectuada para cada celda. Las


Tecnologías de información geográfica usadas han sido de mucha
ayuda para tratar un volumen de información geográfica grande
como el territorio peruano, tanto en su representación gráfica y en su
forma de base de datos.

9.2. LA DETERMINACIÓN DE LA VULNERABILIDAD

Para la determinación de la vulnerabilidad se ha medido los


factores poblacionales y socioeconómicos bajo un esquema de la
propensión de la población a la enfermedad, muchas de estas
mediciones fueron tomadas de fuentes oficiales, estas variables
fueron recalculadas sobre las celdas usando criterios de inclusión y
pertenencia. La Vulnerabilidad es una medición ‘del presente’ y por
ello la inclusión y/o omisión de algún factor que cambie de intensidad
en el tiempo deberá ser recalculado, las zonas de ocupación del
vector Aedes también está en aumento. El último Censo nacional
aportará con información para realizar una actualización de la
vulnerabilidad.

9.3. LA PREDICCIÓN DEL PELIGRO

El modelo de Peligro se abordó desde el punto de vista de la


presencia de la enfermedad, no se incluyeron todas las variables
relacionadas con la dinámica la población y su relación entre el
vector (Aedes aegypti) ni el virus. Sin embargo, a pesar de las
restricciones, el modelo predice la ocurrencia de Dengue que fueron
contrastados con ocurrencias reales e información de la OGE-
Ministerio de Salud.

Eventos inesperados como la ocurrencia de Dengue en zonas


ingenuas a la enfermedad no pueden ser predecidos por el modelo
de peligro, un ejemplo es el caso del brote de Dengue ocurrido en
129

abril de este año en Lima (Anexo 25), el modelo desarrollado no


puede predecir estos eventos, el modelo predice solamente en las
celdas con registro histórico de la enfermedad. De acuerdo a la
teoría de aprendizaje automático para la construcción de modelos de
predicción, mientras existan más registros de un fenómeno, los
modelos generados darán resultados mas precisos.

Un modelo de predicción en espacio y tiempo toma los valores


predecidos para un tiempo t para un determinado espacio y utiliza
esos valores para predecir su devenir en el tiempo t+1, t+2,…,t+n;
para cada paso de tiempo se toman los valores de estado del
sistema en el tiempo n-1, tal como lo muestra el gráfico 10.1.

P(i,j,tn)

Predicción para
el tiempo t2
P(i,j,t2)

Predicción para
el tiempo t1

P(i,j,t1) Función de predicción

Situación inicial
en el tiempo t0

Nivel de ocurrencia

Gráfico 10.1: Esquema de simulación y predicción del peligro


en función del tiempo
130

El esquema mostrado en el gráfico 10.1 no puede ser aplicado


en el modelo de predicción basado en árbol de decisión (Anexo 19)
para más de 1 mes; debido a la sensibilidad de las variables. La
variable que tiene más importancia en la decisión, es el nivel de
Dengue observado en la celda durante el mes, si es cero, la
predicción del mes siguiente también es cero, también existe un
comportamiento particular por la posición de las celdas con respecto
al territorio, la ocurrencia de sólo 1 caso de Dengue en algunas
celdas predicen una secuencia de ocurrencias bastante alta. Estas
características tienen mucha importancia con respecto a los
resultados, un error en la predicción de Dengue en un tiempo t
acarrea un error mucho más grande para el tiempo t+1. Este
comportamiento es comprensible porque la ocurrencia del Dengue
en una zona de expansión está condiciona a la compleja movilidad
de las personas que no ha sido considerada en este modelo.

Las variables relacionadas al vector y al virus tampoco fueron


consideradas en el modelo. De acuerdo a estudios entomológicos
realizados a escala pequeña, se otorga mucha importancia a la
población del vector como causante de la epidemia, sin embargo en
nuestro modelo no se incluyó por ejemplo los niveles de infestación
aédica porque no existe disponibilidad de esta información a nivel
nacional, en cambio se incluyó un indicador indirecto del cambio de
temperatura sobre el territorio del Perú (Temperatura superficial del
mar) que indica indirectamente también- la mejora de las
condiciones climáticas favorables para la reproducción del Aedes
aegypti.

La consideración de la Temperatura superficial del mar, las


ecorregiones que poseen características climáticas diferentes y las
relaciones espaciales de vecindad entre celdas, evidencia la
relevancia de las variables al estudiar la dinámica de la epidemia a
una escala local (entre viviendas), regional (entre ciudades) o global
(países). De esta observación se derivan varias interrogantes: ¿Qué
131

variables relacionadas al Dengue son más relevantes a escala


global, regional y local?, ¿Hasta que escala es válida la
consideración y la preponderancia de cada variable?

9.4. FENOMENOS POBLACIONALES Y AMBIENTALES


RELACIONADOS AL DENGUE

Varios fenómenos poblacionales y ambientales relacionados al


Dengue son observados en el territorio peruano. Una alta movilidad
de la población provoca la expansión del Dengue, esto se
comprueba mediante la observación en función del tiempo de casos
de Dengue en la trayectoria de la red de carreteras (Gráfico 10.2).
Este fenómeno conlleva a plantear preguntas como: ¿Cuál es la
capacidad de desplazamiento de la población hacia lugares
cercanos a su lugar de residencia?, ¿Existen tendencias
estacionales de desplazamiento?; estas interrogantes podrían ser
resueltas en investigaciones futuras, la información geográfica de la
movilidad potencial de la población podría condicionar el contagio de
Dengue de zonas cercanas desde los lugares que la padecen.

Otro fenómeno con consecuencias que todavía no son evidentes


es el calentamiento global, al aumentar la temperatura del ambiente,
mejoran también las condiciones para que el virus complete su ciclo
de incubación extrínseca dentro del vector (Aedes aegypti). Este
fenómeno provoca un aumento de superficie de la zona de
transmisión potencial del Dengue y la expansión del Aedes aegypti;
considerando este hecho, la población de los valles interandinos que
están por encima y cercanas a los 2 200 msnm. serían los primeros
afectados. El gráfico 10.3 muestra un mapa con los valores de
vulnerabilidad, la curva de nivel de 2 200 m de altitud (que delimita la
zona de transmisión potencial del Dengue) y la tendencia de su
expansión.
132

Pucallpa

Gráfico 10.2: Casos de Dengue en la trayectoria de carreteras y


en zonas más vulnerables

2 200 m de altitud
límite actual de la
zona de transmisión

3 000 m de altitud
Tendencia

Gráfico 10.3: Tendencia de aumento de la zona de transmisión


potencial causada por el fenómeno del
calentamiento global
133

9.5. IMPORTANCIA DEL MODELO

A pesar de que los modelos predictivos dan resultados válidos, la


aplicación de técnicas de aprendizaje automático, redes neuronales
y cualquier otra técnica de predicción que utilice datos registrados
históricamente sobre el comportamiento de un fenómeno en el
pasado, continúa siendo una caja negra que puede ser aplicable a
problemas de poca complejidad; en la modelización de sistemas
complejos como en Ecología o epidemiología, es necesario la
comprensión de la dinámica de los sistemas a una pequeña escala
(entre viviendas por ejemplo); para generalizar y desarrollar
modelos a una escala más grande (ciudades o regiones); en
cualquiera de los casos la importancia de la ‘espacialización’ del
problema es crucial como ya se ha demostrado en investigaciones
realizadas en epidemiología [47].

En nuestro caso, la predicción usando técnicas de aprendizaje


automático es aceptable para un mes en el futuro; pero no explica
las relaciones entre los factores involucrados, variables como la
movilidad de las personas, dinámica de los vectores o cambios
climáticos no han sido entendidos, conocer las relaciones exactas
podrían ayudar mucho a establecer planes de control más efectivos
y orientar los esfuerzos adecuadamente. En el caso peruano, ¿Qué
es mejor, comprensión o predicción?. En el caso peruano con alto
riesgo, mucha diversidad de ecosistemas, diversidad de culturas,
costumbres poblacionales diversas y escasa investigación de la
epidemia resulta más importante la predicción a corto plazo para
establecer planes de prevención; la comprensión con menos
urgencia para el adecuado control.
134

CONCLUSIONES

1. El Riesgo epidémico del Dengue se puede predecir aplicando el método

de fraccionamiento del territorio de superficies homogéneas de 100 Km²;

bajo este método se determina la vulnerabilidad de la población y el

peligro de ocurrencia de Dengue. La vulnerabilidad es una medición de

características poblacionales y socioeconómicas. El peligro de

ocurrencia de Dengue es la predicción mensual de un árbol de decisión

generado por el algoritmo de clasificación J48 que considera la

información histórica de la enfermedad y sus características territoriales

en función del tiempo. La información de vulnerabilidad y el peligro son

medidos con el uso de sistemas de información geográfica y bases de

datos.

2. El 30.7 % del territorio peruano está ocupado por el mosquito transmisor

del Dengue (vea el Anexo 20 – Mapa de vulnerabilidad). Esta zona es la

más vulnerable y el mosquito puede expandirse hasta ocupar el 79% de

la superficie del Perú limitada por 2 200 m de altitud.

3. El peligro de Dengue puede predecirse con un mes de anticipación a

partir de un modelo de predicción generado con el algoritmo de

clasificación J48 que considera observaciones mensuales de las

variables medidas con el método de fraccionamiento del territorio de

superficies homogéneas de 100 Km². Las variables medidas bajo este

esquema deben considerar la ocurrencia de casos de Dengue,

pertenencia a las ecorregiones, relaciones espaciales de vecindad y

variaciones de la temperatura superficial del mar.


135

4. Los Sistemas de información geográfica en combinación con la base de

datos PostgreSQL-PostGis son una herramienta útil para el

fraccionamiento del territorio, para la medición, tratamiento y análisis de

las condiciones poblacionales, geográficas y climáticas relacionadas con

las epidemias.

5. La herramienta WEKA es de gran utilidad para el estudio y construcción

de modelos predictivos basados en aprendizaje automático.


136

RECOMENDACIONES

1. Establecimiento de políticas de prevención por parte del Ministerio de

Salud para atender las zonas más riesgosas al Dengue en base a la

información producida por esta investigación.

2. Adopción del sistema de predicción del riesgo epidémico por parte del

Ministerio de Salud como herramienta de decisión para la vigilancia e

implementación de programas de prevención y asistencia.

3. Modificar el modelo de predicción considerando variables como

temperatura, precipitación, índices aédicos, movilidad potencial de la

población, humedad relativa, presencia de cementerios, saneamiento

básico, estanques de agua, y otros que no fueron considerados.

4. Desarrollar modelos espaciales más localizados en zonas endémicas con

celdas de superficie más pequeñas para determinar la relevancia de

variables relacionada con el Dengue u otras enfermedades transmitidas

por arbovirus como la Fiebre amarilla, Bartonelosis (Verruga peruana),

Leishmaniasis o Malaria.

5. Considerar el método de fraccionamiento del territorio y análisis espacial

para la determinación de la salud de la población.


137

REFERENCIAS BIBLIOGRÁFICAS
[1] Asian Conference on Remote Sensing, 5-9 November 2001, Singapore.

[2] Gibbons, R.V. and Vaughn, D.W. 2002. Dengue: an escalating problem.

British Medical Journal, 324: 1563-1566.

[3] Epstein, P.R., Diaz, H.F., Elias, S., Grabherr, G., Graham, N.E.,

Martens, W.J.M.,Mosley Thompson, E., and Sussking, J., 1998.

Biological and physical signs of climate change: Focus on mosquito-

borne diseases. Bulletin of the American Meteorological Society, 79:

409-417 (1998)

[4] Patz, J.A. and Reisen, W.K., 2001. Immunology, climate change and

vector-borne diseases. Trends in Immunology, 22: 171-172.

[5] Hales, S., de Wet, N., Maindonald, J. and Woodward, A., 2002.

Potential effect of population and climate changes on global

distribution of dengue fever: an empirical model. Lancet, 360: 830-

834

[6] Antoine Flahault. 2003. Surveillance : Modélisation Mathématique et

analyse contextuelle, Université Pierre et Marie Curie, pags.: 2-3.

[7] Anibal Carbajo; Nicolas S., Susana Curto; Alicia de G., Rúber B.

Dengue Transmisión risk maps of Argentine, Tropical Medicine and

healt Vol 6 Nº 3 pp 170-183 marzo 2001.

[8] Annelise, Tran. 2004. Télédetection et Épidémiologie - Modélisation de

la dynamique de populations d'insectes et application au contrôle de

maladies à transmission vectorielle pags. : 10.

[9] Hay, S. Tuckher, C. y Roger, D. 1998. Predicting malaria seasons in

Kenia using multitemporal meteorological satellite sensor data.


138

Transaction of the royal society of tropical medicine and hygiene,

92:12-20.

[10] Asrar, G. Myneni, R. Li, Y. y Kanemasu, E. 1989 Measuring and

modeling spectral characteristic of a tallgrass pariré. Remote sensing

of Environment, 27(2):143-155.

[11] Francisco, F. Jesús, Aguilar. Joaquín, P. 2000. Departamento de

Lenguajes y sistemas informáticos – Facultad Informática,

Datamining. Págs.: 5

[12] R.S. Michalski .1987. Concept Learning. Encyclopedia of Artificial

Intelligence, Ed. John Wiley & Sons, Págs.: 185-194

[13] Mcbryde, W. y Bielefeldt Ohmann, H. 2000. Dengue viral infections;

patogénesis and epidemiology. Microbes and Infection, 2(9): 1041-

1050

[14] Nelson Michael J. 1986. Aedes aegypti: Biología y Ecología.

Organización Panamericana de la salud. Washington, D. C.

[15] Annelise, Tran. 2004. Télédetection et Épidémiologie - Modélisation de

la dynamique de populations d'insectes et application au contrôle de

maladies à transmission vectorielle pp 15-16

[16] Guzmán G, Kourí G. 1997. Advances in the Molecular Epidemiology

Studies of Dengue Viruses. Archivos Venezolanos de Medicina

Tropical. Volumen 1.

[17] Watts D, Porter K, et al. 1999. Failure of secondary infection with

American genotype dengue 2 to cause dengue haemorrhagic fever.

Lancet. Vol. 354, October.

[18] Ministerio de Salud, Dirección general de la promoción de la salud,


139

Proyecto VIGIA. 2004. Conocimientos, Actitudes y Prácticas de la

población frente al dengue: Lima y Macro Región Norte del Perú.

Ministerio de Salud- Dirección General de Promoción de la Salud,

Proyecto Vigía. Págs.: 9

[19] Ministerio de Salud del Perú, Oficina General de Epidemiología,

Instituto Nacional de Salud. 2000. Dengue Clásico y Dengue

Hemorrágico Págs: 9

[20] Ministerio de Salud del Perú - Oficina General de Epidemiología. 2005.

Informe de Seguimiento Número 3 Brote de Dengue Clásico en

Comas DISA Lima Norte, 30 de Abril del 2005.

[21] Hales S, Weinstein P, Woodward A. Dengue fever epidemics in the

South Pacific: driven by El Niño Southern Oscillation?. The Lancet

1996; 348: 1665

[22] Bourna M, Dye C. . 1997. Cycles of malaria associated with El Niño in

Venezuela. JAMA 1997; 278:1772-1774

[23] Nicholls N. El Niño-Southern Oscillation and vectorborne disease. The

Lancet 1993; 342:1284-1285

[24] Colwell R. Global climate and infectious disease: the cholera paradigm.

Science 1996; 274:2025-2031

[25] Checkley W, Epstein L, Gilman R, y col. Effects of El Niño and ambient

temperature on hospital admissions for diarrheal diseases in Peruvian

children. The Lancet 2000; 355: 442-450

[26] Servicio Nacional de Meteorología e Hidrología (SENAMHI). 1999.

Estudio del Fenómeno “El Niño 1997/98”. Lima.

[27] Glantz MH. Once Burned. 2001. Twice Shy?. Lessons learned from
140

the 1997-1998 El Niño. The United Nations University. Printed in

Hong Kong. 294 pp.

[28] Ciclo de conferencias 1997-1998, Ediciones Congreso del Perú.1998.

Perú en los albores del siglo XXI : El Fenómeno El Niño y el Clima en

el Perú: Págs.:201- 242.

[29] Lozán J, Grabl H, Hopfer P. 2001. Climate of the 21st Century:

Changes and Risks. Edition 2001. Hamburg-Germany. 448 pp

[30] Burke D, Carmichael A, Focks D, Jay Grimes D, Harte J, y col. Under

the weather: Climate, ecosystems, and infectious disease. Emerg Inf

Dis 2001; 7(3): 606-608

[31] Huarcaya Castilla E, Chinga Alayo E, Chávez Paz J, Chauca

Carhuajulca J, Llanos Cuentas A, Maguiña Vargas C, Pachas

Chávez P, Gotuzzo Herencia E. 2004. Influencia del fenómeno de El

Niño en la epidemiología de la bartonelosis humana en los

departamentos de Ancash y Cusco entre 1996 y 1999, Rev Med

Hered 15 (1), 2004 5

[32] Phillipe Latour y Jacques Le Floch. 2001. Geomarketing – Principios,

Métodos y aplicaciones Págs: 97

[33] D. Kats. 1995. Introducción a la psicología de la forma, Ed. Rivière

[34] G. Arbellot. 1970. La Cartografía estadística aplicada a la historia,

Escuela de altos estudios de ciencias sociales - Francia.

[35] Ministerio de Salud. 2002. Guía para el análisis de los factores

condicionantes de la Salud (demográficos y socioeconómicos),

Págs:19

[36] Cubas Mejía, Carlos; Acosta Villar, Diodoro. 2000. Definiciones de las
141

categorías conceptuales de urbano, rural, centro poblado y Lima

Metropolitana. Instituto Nacional de Estadística e Informática.

Proyecto Mejoramiento de las Condiciones de Vida (MECOVI).

[37] Oficina General de Epidemiología- MINSA. Boletín Epidemiológico

Semanal, VOL. XIV – Nº 16 – 2005

[38] Ministerio de Economía y Finanzas. 2001. Hacia la búsqueda de un

nuevo instrumento de focalización para la asignación de recursos

destinados a la inversión social adicional en el marco de la lucha

contra la pobreza, Lima, Págs.: 11 - 15.

[39] Nacional Weather Service - Climate prediction Center [página web] .setiembre

2005 [accedido 09 setiembre 2005]. En:

[Link]

[40] Datos de índices capatados por el satélite NOAA [página FTP]

setiembre 2005 [accedido 15 setiembre 2005] En:

[Link]

[41] GeoConcept, Guía de uso – GeoConcept, Robert, Paris, 2001, 5 pp.

[42] Manual de PostgreSQL. 2005. [página web], [accedido 13 setiembre

2005]. En: [Link]

es/web/navegable/tutorial/[Link]

[43] Manual de PostGis [página web] 2005 [accedido 13 setiembre 2005]

En: [Link]

[44] Witten, I. H. and Frank, E.,. 2000. Data Mining. Morgan Kaufmann

Publishers

[45] Programa Weka,[página web] 2005 [accedido 15 agosto 2005] En:

[Link]/ml/weka

[46] C. Fernández, M. A. Vicente, A. Gil, L. M. Jiménez, R. Ñeco. 2004.


142

Integración de MatLab y WEKA para la docencia en asignaturas de

aprendizaje automático, Universidad Miguel Hernández Alicante.

[47] Marc Antoine Dubois. 2005. Modélisation en épidemiologie: Objectifs et

méthodes, Service de physique de l’état condensé – Comisariat à

l’Energie atomique – Saclay France


143

INDICE

RESUMEN...................................................................................................................... 1
INTRODUCCION............................................................................................................ 2
CAPITULO I: PLANTEAMIENTO DEL PROBLEMA ...................................................... 4
1.1. DEFINICIÓN DEL PROBLEMA ...................................................................... 4
1.2. FORMULACIÓN DEL PROBLEMA ................................................................ 8
1.2.1. PROBLEMA GENERAL .......................................................................... 8
1.2.2. PROBLEMAS ESPECÍFICOS:................................................................ 8
1.3. JUSTIFICACIÓN ............................................................................................. 8
1.3.1. JUSTIFICACION TEORICA .................................................................... 8
1.3.2. JUSTIFICACIÓN METODOLÓGICA....................................................... 9
1.3.3. JUSTIFICACIÓN PRÁCTICA.................................................................. 9
1.4. OBJETIVOS.................................................................................................... 9
1.4.1. GENERAL ............................................................................................... 9
1.4.2. ESPECÍFICOS ........................................................................................ 9
1.5. HIPÓTESIS................................................................................................... 10
1.5.1. GENERAL ............................................................................................. 10
1.5.2. ESPECÍFICAS ...................................................................................... 10
1.6. METODOLOGÍA DE LA INVESTIGACIÓN................................................... 11
1.6.1. TIPO DE INVESTIGACIÓN................................................................... 11
1.6.2. DISEÑO ................................................................................................ 11
1.6.3. METODOLOGÍA DE TRABAJO............................................................ 11
1.7. LIMITACIONES............................................................................................. 12
CAPITULO II: MARCO TEORICO ................................................................................ 14
2.1. ANTECEDENTES ......................................................................................... 14
2.2. TELEDETECCION Y EPIDEMIOLOGÍA ....................................................... 16
2.2.1. TELEDETECCION ................................................................................ 16
2.2.2. MEDIO AMBIENTE Y TELEDETECCION ............................................ 16
2.2.3. INFORMACION OBTENIDA POR TELEDETECCION ......................... 17
2.2.4. INDICES................................................................................................ 18
2.3. TECNOLOGIAS DE INFORMACION GEOGRÁFICA................................... 18
2.3.1. LOS SISTEMAS DE INFORMACION GEOGRAFICA .......................... 19
2.3.2. FUNCIONES QUE CUMPLEN LOS SISTEMAS DE INFORMACIÓN
GEOGRÁFICA....................................................................................................... 19
2.3.3. REPRESENTACION DE DATOS EN UN SISTEMA DE INFORMACION
GEOGRAFICA....................................................................................................... 22
2.3.4. Modelos Vectoriales y Raster ............................................................... 23
2.4. ALGORITMOS DE APRENDIZAJE Y CLASIFICACION .............................. 25
2.4.1. SISTEMAS DE APRENDIZAJE ............................................................ 25
2.4.2. APRENDIZAJE INDUCTIVO MEDIANTE ÁRBOLES DE DECISION... 30
CAPITULO III: EL DENGUE ......................................................................................... 38
3.1. GENERALIDADES ....................................................................................... 38
3.1.1. EL CICLO DEL DENGUE ..................................................................... 39
3.2. EL VECTOR Aedes aegypti.......................................................................... 40
3.3. LOS METODOS PARA DETERMINAR EL RIESGO EPIDEMICO.............. 41
3.4. FACTORES DE RIESGO EPIDEMICO DEL DENGUE ................................ 42
3.4.1. Presencia de una masa crítica de población susceptible ..................... 42
3.4.2. Presencia de alta densidad del vector .................................................. 42
3.4.3. El serotipo que está circulando ............................................................. 43
3.4.4. La virulencia de la cepa circulante ........................................................ 43
3.4.5. La edad de la población ........................................................................ 43
3.4.6. La Raza................................................................................................. 44
144

3.4.7. Preexistencia de anticuerpos al virus del dengue................................. 44


3.4.8. Presencia de enfermedad Crónicas...................................................... 44
3.4.9. Estado nutricional.................................................................................. 44
3.4.10. Otros factores Poblacionales y sociales ............................................... 45
CAPITULO IV: EL PERÚ Y LA EPIDEMIA DEL DENGUE........................................... 47
4.1. EL PERÚ....................................................................................................... 47
4.1.1. La Costa................................................................................................ 47
4.1.2. La Sierra................................................................................................ 48
4.1.3. La Selva ................................................................................................ 48
4.2. EL DENGUE EN EL PERÚ ........................................................................... 48
4.3. FACTORES GEOGRÁFICOS Y CLIMÁTICOS RELACIONADOS CON EL
DENGUE................................................................................................................... 53
4.3.1. Los diversos análisis de las características particulares del territorio
peruano 53
4.3.2. La temperatura superficial del mar, el Fenómeno del Niño y su
influencia en la epidemia del Dengue.................................................................... 54
CAPITULO V: NOCIONES SOBRE EL ANÁLISIS Y MODELIZACION DEL ESPACIO
...................................................................................................................................... 57
5.1. EL ANÁLISIS ESPACIAL.............................................................................. 57
5.1.1. NOCIONES SOBRE LA LOGICA DEL ANÁLISIS ESPACIAL.............. 57
5.1.2. CARACTERISTICAS DEL SISTEMA DE ANÁLISIS ESPACIAL .......... 60
5.1.3. LA MATRIZ DE FRACCIONAMIENTO DEL TERRITORIO .................. 61
CAPITULO VI: EL MODELO ESPACIAL DE PREDICCION DEL RIESGO EPIDEMICO
DEL DENGUE .............................................................................................................. 67
6.1. CONSIDERACIONES SOBRE LA SALUD, EL ESPACIO GEOGRAFICO Y
LA INFORMACIÓN DISPONIBLE............................................................................. 67
6.2. EL MODELO CAUSAL DEL RIESGO EPIDÉMICO...................................... 69
6.3. EL ESPACIO ESTUDIADO Y LA MATRIZ DE FRACCIONAMIENTO ......... 70
6.4. EL MÉTODO DE GENERALIZACIÓN Y MEDICIÓN DE LAS VARIABLES . 71
6.5. EL ESPACIO DE TRANSMISIÓN POTENCIAL DEL DENGUE ................... 73
6.6. EL ÁREA DE OCUPACIÓN DEL VECTOR Aedes aegypti .......................... 74
6.7. LA VULNERABILIDAD.................................................................................. 74
6.7.1. LAS VARIABLES DE VULNERABILIDAD ............................................ 74
6.7.2. LA ECUACION DE VULNERABILIDAD (V ) ......................................... 78
6.8. CONSTRUCCIÓN DEL MODELO DE PREDICCION DEL DE PELIGRO DE
OCURRENCIA DE DENGUE.................................................................................... 78
6.8.1. LAS VARIABLES RELACIONADAS AL PELIGRO............................... 78
6.8.2. EL MODELO DE PELIGRO DE DENGUE............................................ 92
6.8.3. LA ECUACIÓN DE PELIGRO DE DENGUE ........................................ 95
6.9. LA ECUACION DEL RIESGO EPIDEMICO DEL DENGUE ......................... 96
CAPITULO VII: EL SISTEMA INFORMATICO DE PREDICCION DEL RIESGO
EPIDEMICO.................................................................................................................. 97
7.1. NECESIDADES QUE CUBRIO EL SISTEMA .............................................. 97
7.2. COMPONENTES DEL SISTEMA ................................................................. 97
7.3. EL SISTEMA DE INFORMACION GEOGRÁFICA ....................................... 98
7.3.1. EL ENTORNO DEL SISTEMA DE INFORMACION GEOGRÁFICA..... 99
.................................................................................................................................. 99
7.4. LA BASE DE DATOS.................................................................................. 100
7.5. EL PROCESO DE PREPARACIÓN DE DATOS ........................................ 103
7.6. El COMPONENTE DE APRENDIZAJE DE ÁRBOLES DE DECISION ...... 107
7.6.1. El ENTORNO WEKA .......................................................................... 108
7.7. LA INTEGRACION FUTURA DE LOS COMPONENTES DEL SISTEMA .. 111
CAPITULO VIII: RESULTADOS DEL MODELO Y PRUEBA DE LA HIPÓTESIS...... 113
8.1. DETERMINACIÓN DE LA VULNERABILIDAD........................................... 113
8.2. LA PREDICCIÓN DEL PELIGRO ............................................................... 116
145

8.3. ESTIMACION DEL RIESGO EPIDEMICO.................................................. 121


8.4. INFORMACION GENERADA POR EL SISTEMA DE PREDICCIÓN......... 121
8.5. ANÁLISIS DE RESULTADOS .................................................................... 122
8.5.1. DETERMINACIÓN DE POBLACION .................................................. 122
8.5.2. DETERMINACIÓN DE MUESTRA ..................................................... 122
8.6. VERIFICACIÓN DE LA HIPÓTESIS ........................................................... 123
CAPITULO IX: DISCUSIÓN ....................................................................................... 127
9.1. SOBRE EL ABORDAJE DEL ESTUDIO..................................................... 127
9.2. LA DETERMINACIÓN DE LA VULNERABILIDAD ..................................... 128
9.3. LA PREDICCIÓN DEL PELIGRO ............................................................... 128
9.4. FENOMENOS POBLACIONALES Y AMBIENTALES RELACIONADOS AL
DENGUE................................................................................................................. 131
9.5. IMPORTANCIA DEL MODELO .................................................................. 133
CONCLUSIONES ....................................................................................................... 134
RECOMENDACIONES............................................................................................... 136
REFERENCIAS BIBLIOGRÁFICAS ........................................................................... 137

También podría gustarte