TALVEX
TALVEX
FACULTAD DE CIENCIAS
CARRERA DE ESTADÍSTICA
Trabajo de titulación
TIPO: Proyecto de investigación
AUTOR:
YUNGAICELA SAGÑAY VÍCTOR ANDRÉS
Riobamba – Ecuador
2022
ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO
FACULTAD DE CIENCIAS
CARRERA DE ESTADÍSTICA
Trabajo de titulación
TIPO: Proyecto de investigación
Riobamba – Ecuador
2022
© 2021, Yungaicela Sagñay Víctor Andrés
Se autoriza la reproducción total o parcial, con fines académicos, por cualquier medio o
procedimiento, incluyendo la cita bibliográfica del documento, siempre y cuando se reconozca el
derecho de Autor.
I
Yo, Víctor Andrés Yungaicela Sagñay, declaro que el presente trabajo de titulación es de mi
autoría y los resultados del mismo son auténticos. Los textos en el documento que provienen de
otras fuentes están debidamente citados y referenciados.
Como autor asumo la responsabilidad legal y académica de los contenidos de este trabajo de
titulación; el patrimonio intelectual pertenece a la Escuela Superior Politécnica de Chimborazo.
Riobamba,…………..de 2022
II
ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO
FACULTAD DE CIENCIAS
CARRERA DE ESTADÍSTICA
Firma Fecha
III
DEDICATORIA
IV
AGRADECIMIENTO
V
TABLA DE CONTENIDOS
VI
1.7.3 Efectos de la radiación en los ecosistemas ....................................................... 12
1.7.4 Radiación ionizante .......................................................................................... 12
1.7.5 Dosis absorbida ................................................................................................ 12
1.7.6 Dosis equivalente .............................................................................................. 13
1.7.7 Dosis efectiva .................................................................................................... 13
1.7.8 Límite de dosis .................................................................................................. 13
1.7.9 Síntomas inmediatos en la salud ....................................................................... 13
1.7.10 Detección de la radiación gamma .................................................................... 14
1.7.11 Interacciones de rayos Gamma con la materia ................................................ 15
1.7.12 Efectos biológicos de las radiaciones ionizantes .............................................. 15
1.7.13 Relación dosis-efecto ........................................................................................ 15
1.7.14 Efecto de la radiación a nivel celular ............................................................... 16
CAPITULO II ................................................................................................................. 16
2 MARCO METODOLÓGICO................................................................................. 16
2.1 Tipo de investigación ...................................................................................... 16
2.2 Diseño de la investigación no experimental ................................................... 16
2.2.1 Localización de estudio..................................................................................... 17
2.2.2 Población de estudio ......................................................................................... 17
2.2.3 Método de muestreo .......................................................................................... 18
2.2.4 Tamaño de la muestra ....................................................................................... 18
2.2.5 Técnica de recolección de datos ....................................................................... 18
2.2.6 Identificación de variables ................................................................................ 18
2.2.7 Modelo estadístico ............................................................................................ 18
2.2.8 Operacionalización de variables ...................................................................... 18
CAPITULO III ................................................................................................................ 19
3 MARCO DE RESULTADOS Y DISCUSIÓN DE RESULTADOS ..................... 19
3.1 Construcción de la base de datos .................................................................... 19
3.2 Selección de base y número de funciones ...................................................... 20
3.3 Calidad de ajuste ............................................................................................. 21
3.4 Determinación de outliers funcionales ........................................................... 24
3.4.1 Outliers funcionales de ALAUSI ....................................................................... 24
3.4.2 Outliers funcionales de CHAMBO .................................................................... 26
3.4.3 Outliers funcionales de CHUNCHI .................................................................. 27
3.4.4 Outliers funcionales de COLTA ........................................................................ 29
3.4.5 Outliers funcionales de CUMANDÁ ................................................................. 29
3.4.6 Outliers funcionales de GUANO....................................................................... 31
3.4.7 Outliers funcionales de PALLATANGA ............................................................ 33
3.4.8 Outliers funcionales de PENIPE....................................................................... 34
3.4.9 Outliers funcionales de RIOBAMBA................................................................. 36
VII
3.5 Análisis Descriptivo Funcional ....................................................................... 37
3.5.1 Media y desviación funcional de ALAUSÍ ........................................................ 37
3.5.2 Media y desviación funcional de CHAMBO ..................................................... 37
3.5.3 Media y desviación funcional de CHUNCHI .................................................... 38
3.5.4 Media y desviación funcional de COLTA ......................................................... 38
3.5.5 Media y desviación funcional de CUMANDÁ .................................................. 39
3.5.6 Media y desviación funcional de GUAMOTE................................................... 39
3.5.7 Media y desviación funcional de GUANO ........................................................ 40
3.5.8 Media y desviación funcional de PALLATANGA ............................................. 40
3.5.9 Media y desviación funcional de PENIPE ........................................................ 41
3.5.10 Media y desviación funcional de RIOBAMBA .................................................. 41
3.6 Remuestreo de Boostrap ................................................................................. 42
3.7 Análisis Clúster ............................................................................................... 44
3.7.1 Numero óptimo de clusters ............................................................................... 44
3.7.2 Composición de los clusters .............................................................................. 46
3.8 Caracterización dé los clusters ........................................................................ 47
3.8.1 Clúster 1 (Verde)............................................................................................... 48
3.8.2 Clúster 2 (Rojo)................................................................................................. 48
3.8.3 Clúster 3 (Negro) .............................................................................................. 48
3.8.4 La variable hora de inicio en el análisis de clusters ........................................ 48
CONCLUSIONES .......................................................................................................... 49
RECOMENDACIONES ................................................................................................. 51
BIBLIOGRAFIA ............................................................................................................ 52
ANEXOS ........................................................................................................................ 55
VIII
INDICE DE TABLAS
IX
ÍNDICE DE GRAFICOS
X
Gráfico 51-3: K-MEANS para todas las observaciones agrupadas en 4 clusters .......... 44
Gráfico 51-3: K-MEANS para todas las observaciones agrupadas en 3 clusters .......... 45
Gráfico 53-3: Numeración de las curvas en el Mapa Clúster de la provincia de
Chimborazo ..................................................................................................................... 45
Gráfico 55-3: Caracterización grafica de los clusters .................................................... 47
XI
ÍNDICE DE FIGURAS
Figura 1-1-1: Campo eléctrico y campo magnético ...................................................... 11
Figura 1-2-1: Muestra la emisión de rayos gamma a la cara del detector ..................... 14
XII
ÍNDICE DE ANEXOS
XIII
RESUMEN
El objetivo del estudio fue analizar el comportamiento de la dosis de radiación gamma en los 10
cantones de la provincia de Chimborazo, mediante análisis de datos funcionales haciendo uso de
la recolección de datos realizada por el Grupo de Investigación-Desarrollo para el ambiente y
Cambio Climático GIDAC de la Escuela Superior Politécnica de Chimborazo en el año 2021. Las
bases fueron ordenadas correctamente para la disposición de los datos. Se utilizó el análisis de
datos funcionales, una técnica estadística relativamente nueva, que se basa en la transformación
de los datos comunes en curvas. el RMS (root mean square) igual a 0.007 nos indica que existe
un buen ajuste en el modelo. A través de la función de optim.basis de R se identificó como optimo
el suavizado B-spline con 43 bases. Para la calidad de los resultados, se realizó un intenso análisis
de outliers o datos atípicos, a través de 4 distintos métodos: functional bagplot, rainbow plot,
HDR plot, y deph.trim.out. se identificó curvas atípicas en todos los cantones, a excepción de
Guamote. El análisis de clusters, mediante la función fun.fem(), del paquete fda.usc, tiene como
objetivo identificar características similares de cada cantón de la provincia. Se obtuvo 3 grupos
con patrones de comportamientos similares. La principal característica que hace que un grupo
difiera de otro, es el rango de absorción de dosis de radiación gamma. Colta, Guano, Pallatanga
y Riobamba presenta los niveles más altos de dosis de radiación gamma, entre 0,06 Sv a 0,09 Sv,
se encuentran al noroeste de la provincia de Chimborazo, con los cantones. Los niveles bajos de
dosis de radiación gamma, entre 0,02 Sv a 0,04 Sv, se presentaron los cantones de Cumandá y
Guamote. Las dosis de radiación gamma pueden producir en el ser humano desde síntomas leves
a incluso la muerte, en la provincia de Chimborazo se registran niveles seguros de este tipo de
fenómeno.
XIII
XIV
SUMMARY
XV
INTRODUCCIÓN
Muchas veces al escuchar la terminología “rayos gamma” se nos viene a la mente la palabra
peligro, debido a su relación con la energía nuclear y los lamentables accidentes que han ocurrido
a través de la historia, como uno de los ejemplos más sonados tenemos el de la central nuclear de
Chernóbil. Pero no olvidemos que nuestro planeta Tierra posee una radioactividad natural, y, sin
embargo, la raza humana ha emergido y ha prosperado como especie.
Para lograr estos objetivos, en el presente trabajo utilizamos el programa estadístico R. Esta
investigación está formada por cuatro capítulos: El capítulo I describe los antecedentes,
planteamientos y justificación del problema y los objetivos. Seguidamente en el capítulo II
muestra la fundamentación teórica de los rayos gamma y las técnicas y métodos estadísticos con
datos funcionales. El capítulo III detalla la metodología aplicada a los datos. El capítulo IV
muestra los resultados obtenidos. Y finalmente las conclusiones, recomendaciones, referencias
bibliográficas y Anexos.
CAPITULO I
1 MARCO REFERENCIAL
1.1 Antecedentes
El análisis funcional de datos, a pesar de que en las últimas dos décadas ha cobrado gran
importancia el campo científico, es una herramienta de la estadística relativamente nueva. Inició
sus pasos en los años 60 del siglo XX, y como muchas otras ciencias, se ha ido optimizando con
la velocidad y manejo de grandes volúmenes de datos proporcionados por las computadoras desde
la década de 1990, hasta la popularidad del Big Data en la actualidad. Los padres del análisis
funcional de datos, por así llamarlos, son los profesores Ramsey y Silverman (Ramsay &
Silverman, 2005). Introdujeron una nueva herramienta para el tratado de los datos en el análisis
multivariante, que consiste en dejar de utilizar las observaciones en forma de vectores, y a su vez
utilizarla en forma de una función. A su vez, adaptar técnicas de la estadística clásica y modelarlas
para su correcto funcionamiento con el manejo de las funciones (Giraldo, 2007). Como cualquier
otro instrumento estadístico, se busca una forma de representación de los datos que sea entendible,
tanto para el investigador y para el lector (Millán, 2017).
Existen muchos estudios utilizando análisis de datos funcionales, pero debemos destacar el de
(Giraldo, et al., 2010) que basó la aplicación del análisis funcional de datos relacionado con
ciencias ambientales, llegando a realizar una predicción basada en la correlación de curvas, en
estaciones meteorológicas a través de Canadá. (Peñafiel, 2021) realizó un estudio con la finalidad
de identificar el comportamiento de cultivos de quinua en la provincia de Chimborazo, con la
ayuda de imágenes satelitales, vio similitudes y encontró relaciones altamente proporcionales con
el clima de la zona y las distintas parcelas del cultivo, concluyendo que la planta se adapta mejor
a climas más húmedos.
(Escudero, et al., 2016) estudió los distintos comportamientos de los periodos climáticos en la
región interandina, a través de curvas funcionales, en el año 2011, donde a través de splines
cúbicos analiza la radiación solar global. Asimismo, recomienda la detección de outliers para una
mayor certera en los resultados del estudio.
El autor (Taguacundo, 2019) , aplica la metodología de datos funcionales con el fin de identificar
distintos comportamientos de la radiación solar, durante los años 2014 al 2017, donde a través de
un análisis de clúster encontró comportamientos similares en diferentes estaciones
meteorológicas.
En el análisis de datos funcionales, la unidad básica es el dato funcional, en general. Por ejemplo,
un conjunto de imágenes de alta resolución es un ejemplo de datos funcionales en un dominio de
dos dimensiones. En la práctica, estos sucesos son recogidos por máquinas que toman muestras
de una determinada variable en distintos puntos del continuo que se considere. (Ramsey J. and
Silverman B. 2013).
El otro estudio denominado como: “Aplicación del análisis estadístico de datos funcionales al
estudio del patrón de movimiento del raquis lumbar y de la pelvis durante la flexión y la extensión
del tronco en personas sanas” (Fuster, 2021) se estudia el patrón de movimiento lumbopélvico en
un grupo de personas a través del análisis funcional de datos.
Debido al alto costo de los equipos, la recolección de información sobre dosis de radiación no es
algo muy frecuente en el Ecuador, pero gracias a la ESPOCH y al Grupo de Investigación-
Desarrollo para el ambiente y Cambio Climático (GIDAC), se logró monitorear estos fenómenos
a lo largo de la provincia. La gran mayoría, al pensar en radiación gamma, asocia netamente a los
laboratorios y centros de salud que están preparados con sus respectivos equipos. Sin embargo,
existe la radiación gamma natural proveniente del espacio. No todos los lugares en la Tierra tienen
un mismo nivel de radioactividad. Un claro ejemplo es la India que la radioactividad es 10 veces
mayor que algunos países de Europa. Se considera que Los Alpes y zonas que se encuentren en
cordilleras presentan un nivel relativamente alto de radioactividad, por diversos factores, como la
composición de su suelo y granito. Como conocemos, el continente sudamericano posee una
cadena montañosa, la cual atraviesa 7 países distintos, entre uno de ellos Ecuador, denominada la
Cordillera de los Andes.
1.4 Justificación
1.5 Objetivos
En el análisis funcional de datos, sin importar haber aparecido a mediados del siglo pasado, ha
experimentado un gran desarrollo en la era actual. Los datos funcionales los consideramos la
unidad prima de información. En pocas palabras, cualquier tipo de observación que cambia
constantemente se la puede considerar como dato funcional. (Plazola, 2013, p. 19) La filosofía
básica del análisis funcional de datos es pensar en términos de datos observables. Las secuencias
de casos deben tratarse como entidades individuales que consisten en notas. El término significa
una función en relación con los datos observados. La estructura interna de los datos en lugar de
su forma explícita (Ramsay & Silverman, 2005, p. 38). La definición universal del análisis de
datos funcionales es un poco engañosa. Como definición más sencilla, decimos que es una de las
variables o unidades de importancia transformadas en un conjunto de datos, que se pueden
visualizar normalmente como una curva. Los datos funcionales se pueden considerar como un
análisis estadístico de curvas de muestra. (Kokoszka & Reimherr, 2017, p. 1)
Una variable de función aleatoria X es una variable aleatoria que tiene valores en un espacio
dimensional infinito. Los datos funcionales representan un conjunto de observaciones
{𝑋1 , … , 𝑋𝑛 } 𝑑𝑒 𝑋 según (Ferraty & Vieu, 2006, p. 6). También son conocidos como datos de
curva.
Una variable aleatoria X que toma valores en el espacio funcional 𝜀, se la conoce como variable
funcional. Comúnmente los datos funcionales se presentan de manera discreta en un conjunto de
observaciones no necesariamente equidistantes (Castillo, et al., 2015).
Como en el análisis descriptivo clásico, el análisis de datos funcionales debe detectar curvas
atípicas, aunque las técnicas de detección de outliers es un campo relativamente nuevo. Existen
varias formas para que se presenten outliers, como los errores de medición o la mala calibración
de los equipos usados. Las observaciones funcionales se pueden presentar como outliers aislados,
que se muestran de manera poco usual durante un breve momento, y como outliers persistentes,
que se comporta de manera inusual por un tiempo más extenso. (Fuster, 2021). También se
considera como datos atípicos funcionales aquellas puntuaciones “significativamente” pequeñas
en profundidad, que difieren en magnitud o forma del resto de las curvas. La mediana funcional
de la muestra de curvas, tiene el mayor valor de profundidad. Por esta razón, el análisis de
profundidad es uno de los métodos más eficaces para detectar atípicos. Actualmente existen
múltiples instrumentos para visualizar datos funcionales como el gráfico de arcoíris, bagplots y
boxplots, que sirven como métodos gráficos de análisis. Son muy útiles ya que facilitan el
hallazgo de características que podrían no ser vistos con el uso de estadísticos, como lo es la
detección de outliers funcionales con gran velocidad de cálculo y una gran precisión (Millán,
2017, pp. 49-53).
Para la representación de las principales características del conjunto de datos comenzamos con
un análisis descriptivo y exploratorio, algunos descriptores funcionales (Ramsay & Silverman,
2005, p. 22) se presentan a continuación.
Sea 𝑥𝑖 (𝑡) 𝑖 = 1,2, … . , 𝑁 un conjunto de curvas o datos funcionales, la media, varianza,
covarianza y correlación funcional están proporcionadas por las siguientes ecuaciones (Plazola,
2013, p. 32):
Media funcional:
𝑥̅ (𝑡)=𝑁 −1 ∑𝑖 𝑥𝑖 (𝑡),
Varianza funcional:
Función de covarianzas
𝐶𝑜𝑣(𝑡1 , 𝑡2 ) = (𝑁 − 1)−1 ∑ [(𝑥𝑖 (𝑡1 ) − 𝑥̅ (𝑡1 ))] [𝑥𝑖 (𝑡2 ) − 𝑥̅ (𝑡2 ))]
𝑖
Función de correlación:
𝐶𝑜𝑣𝑥 (𝑡1 , 𝑡2 )
𝐶𝑜𝑟𝑟𝑥 (𝑡1 , 𝑡2 ) = ,
√𝑉𝑎𝑟𝑥 (𝑡1 )𝑉𝑎𝑟𝑥 (𝑡2 )
Función de correlación cruzada:
𝐶𝑜𝑣𝑥,𝑦 (𝑡1, 𝑡2 )
𝐶𝑜𝑟𝑟𝑥,𝑦 (𝑡1 , 𝑡2 ) =
√𝑉𝑎𝑟𝑥 (𝑡1 )𝑉𝑎𝑟𝑥 (𝑡2 )
1.6.6 Bases
consiste en un conjunto de datos contiguos entre sí por segmentos de línea, pero esta estimación
puede volverse insuficiente, si se quiere obtener información de derivadas de funciones.
Las reglas de Fourier rara vez se usan, son funciones que se usan para estimar datos periódicos y
sus funciones base principales son funciones de seno y coseno. La serie de Fourier como función
periódica está definida por:
𝑓(𝑡) = 𝑐0 + 𝑐1 𝑠𝑒𝑛(𝑤𝑡) + 𝑐2 cos(𝑤𝑡) + 3𝑠𝑒𝑛 (2𝑤𝑡) + 4𝑐𝑜𝑠 (2𝑤𝑡) + ⋯
2𝜋
𝑤=
𝑇
Dónde: T define el periodo de oscilación
Por su estructura de adición se puede usar como una expansión de bases, definido como:
1
∅0 (𝑡) =
√𝑇 ′
1
∅2𝑟−1 (𝑡) = 𝑠𝑒𝑛(𝑟𝑤𝑡)
√𝑇
2
1
∅2𝑟 (𝑡) = cos(𝑟𝑤𝑡)
√𝑇/2
para 𝑟 = 1, … , 𝐿/2, donde 𝐿 es un entero par. La frecuencia señala el período y la duración del
intervalo |𝐽| = 2(𝑎𝑞𝑢𝑖 𝐽 = [0,1]es asumido por lo tanto |𝐽| = 1) La base de Fourier definida con
anterioridad es una base ortonormal. La gran popularidad de esta base se basa parcialmente en la
posibilidad de un cálculo veloz del coeficiente por el algoritmo de transformación de Fourier
rápida (Fast Fourier Transformation FFT).
𝐷𝑚 ∅0 (𝑡) = 0, 𝑚 ≥ 1
𝑚𝜋
𝐷𝑚 ∅2𝑟−1 (𝑡) = (𝑟𝑤)𝑚 𝑠𝑒𝑛 (𝑟𝑤𝑡 + ),𝑚 ≥ 0
2𝑤
𝑚𝜋
𝐷𝑚 ∅2𝑟 (𝑡) = (𝑟𝑤)𝑚 cos (𝑟𝑤𝑡 + ),𝑚 ≥ 0
2𝑤
Para 𝑟 = 1, … , 𝐿/2
1.6.8 Splines
La función Spline se usa muy a menudo cuando desea aproximar una serie de datos acíclicos.
Estas funciones polinómicas se organizan en un período de tiempo o espacio T. El primer paso
para definir un segmento es dividir el intervalo de tiempo en el que se aproxima la función de
interés en L sub intervalos separados por valores. Estos valores se denominan nudos. En cualquier
intervalo, la rebanada es un polinomio de grado m. (Plazola, 2013, p. 22)
De manera muy frecuente, una función Spline es explícita por el orden de los segmentos
polinomiales y el orden de la secuencia de los nodos 𝜏 (Ramsay & Silverman, 2005, p. 49).
La base más utilizada para aproximar funciones Spline es la B-Splines desarrollada por Boor.
Esta clases de bases están disponibles en una gran variedad de software incluyendo R, otras bases
de funciones Splines son las funciones potencias, de base truncada, M-Spline y Spline naturales.
(Boor , 2001, p. 34)
1.6.9 B-Splines
Según (Boor , 2001), el método recursivo para construir los B-Splines es el siguiente: al principio
iniciamos con una secuencia de nodos, es decir , una secuencia que no decrece t = (ti) de N+2
valores reales llamados “nodos” tal que:
𝑡0 ≤ 𝑡1 ≤ ⋯ ≤ 𝑡𝑁+1
Donde 𝑘 veces, donde 𝑘 señala el grado de la base B-Spline. El índice i de los nodos se pude
reajustar , desde el ultimo 𝑡−𝑘 , es cuando, los 𝑁 + 2(𝑘 + 1), los nodos auemntados 𝑡𝑖 son
identificados por 𝑖 = 0, … , 𝑁 + 2𝑘 + 1.
Aunque existan diversos métodos de suavización, este es el método más común, por lo que los
diferentes softwares de análisis de datos optan por implementarlo, tal como lo hace R, que
optimiza la técnica para el gran volumen de datos (Morillo, 2009, p. 10).
1.6.10 Suavizado
En este punto se desarrollarán los pasos básicos que se deben seguir para un correcto análisis
clúster. Lo primero que se debe hacer para llevar a cabo un correcto análisis clúster será realizar
una correcta elección de las variables que van a describir a los diferentes individuos (curvas). Una
de los temas importantes a tener en cuenta sobre la elección de variables es ver si realmente son
notables para el tipo de clasificación a la que se quiere llegar. Como se ha dicho anteriormente,
el analista no tiene ninguna información sobre los posibles grupos a formar. Por lo que es
provechoso saber de antemano que tipo de clasificación se quiere obtener como resultado e
intentar recopilar la información acorde a este. En el segundo paso se llevar a cabo la elección del
sistema de asociación entre individuos, es decir, una disposición que permita medir la proximidad
de los individuos. Generalmente esta medida de proximidad viene dada en requisitos de
distancias, aunque también se pueden utilizar medidas de similitud. En el siguiente punto se
desarrollarán con más detalle las medidas más utilizadas. El tercer paso consistirá en seleccionar
el análisis cluster adecuada para el estudio. Debido a la existencia de numerosos y diversos
métodos, es importante elegir un método acorde con los datos que tenemos para realizar el estudio.
Esta elección dependerá de la naturaleza de los datos y de los objetivos a los que se quiera llegar.
En la práctica, es conveniente no dedicarse solamente a un solo método, sino realizar el estudio
con varias posibilidades y de este modo poder contrastar los resultados y poder llegar a
conclusiones más fiables. Por último, habrá que validar e interpretar los resultados. Esta etapa
podría ser da las más importantes, ya que va a ser donde se expongan las conclusiones y
recomendaciones definitivas del análisis. Existen diferentes métodos para validar los resultados
dependiendo de los métodos llegados a cabo (Ibañez, 2018).
El software estadístico R es una herramienta computacional de software libre que se utiliza para
el análisis de datos a través de varias librerías y paquetes, que aporta cada miembro de la
comunidad sin ningún tipo de costo. La gran variedad de técnicas estadísticas hace de R, un
instrumento indispensable para el manejo de información en la actualidad, debido a la inmensa
cantidad de datos con los que se trabaja.
1.7 Bases conceptuales
1.7.1 Radiación
Desde principios de la década de 1960 se han realizado numerosos estudios sobre el efecto de la
radiación gamma en los ecosistemas. Estos estudios fueron impulsados por la carrera
armamentista entre la Unión Soviética y los Estados Unidos A mediados del siglo pasado se ha
popularizado los estudios sobre la radiación gamma y su efecto en los seres humanos y
ecosistemas. Una gran razón de este interés, fue la guerra fría y la necesidad de armas y nuevas
aplicaciones para el beneficio de cada potencia mundial. A través de diversos experimentos
realizados en zonas naturales, se vio el gran daño que puede ocasionar la radiación gamma en
distintos tipos de vegetación, y como es capaz de afectar las células vivas (Stalter & Howarth,
2012).
La radiación ionizante expulsa su energía por medio de ondas electromagnéticas con un mayor
alcance de frecuencia y una onda de longitud corta comparada con la no ionizante, siendo capaz
de romper enlaces covalentes en las distintas moléculas. La radiación gamma presenta un nivel
más alto de energía, debido a lo poco extensas que son sus ondas por lo que le es más fácil la
penetración en distintos elementos. Las radiaciones ionizantes se utilizan en gran parte del campo
de la medicina, principalmente en la medicina nuclear y laboratorios. (Rojas, 2009)
La espectrometría gamma es una técnica que consiste en la obtención del espectro de las
radiaciones gamma emitidas por los radionucleoides o isotopos radioactivos. Se basa en en la
respuesta de un tele detector, y tiene la ventaja de ser una técnica multielemental y no destructiva.
Entre las técnicas analíticas nucleares, la espectrometría gamma es de las más importantes, por
realizar un análisis simultaneo de muchos elementos y no secuencial como la absorción atómica.
(Rodríguez, et al., 2004)
Una vez que la radiación penetra un material, una cantidad de energía se invierte por cada electrón.
Si consideramos la energía con la que fue penetrado el material y a la vez lo que este haya
absorbido, lo denominamos dosis absorbida. La dosis absorbida se mide con Julio/Kilogramo.
(Carrasco, 2003)
1.7.7 Dosis equivalente
Cuando la irradiación afecta más a un órgano q a otro debido a los efectos radioinducidos,
hablamos de la dosis efectiva. Se denota con la letra H. Para su cálculo se multiplica la dosis
equivalente por un factor de ponderación de tejido. También se mide en Sv (Carrasco, 2003).
Los límites de dosis son medidas calculadas por profesionales de la radiología a lo largo de los
años, que recomiendan que nunca deben ser sobrepasados. Los límites de dosis están referidos al
periodo de un año oficial, y están contempladas tanto las personas expuestas constantemente y
los ciudadanos comunes.
Como en la estructura de la capa de electrones del átomo, el núcleo también se caracteriza por
niveles de energía discretos la transición entre estos niveles se puede realizar mediante la emisión
o absorción de radiación electromagnética de la energía correcta, es decir, con una energía igual
a la diferencia de energía entre los niveles que participan en la transición. Las energías de estos
fotones, que van desde unos pocos cientos de keV hasta unos pocos MeV, caracterizan la alta
energía de unípede los núcleos. Estos fotones de alta energía se han denominado por lo largo de
la historia, rayos gamma. Muestran líneas espectrales características del núcleo emisor. La
mayoría de fuentes gamma se colocan en estados excitados como resultado de la desintegración
beta, aunque los estados nucleares excitados a menudo también se crean en las reacciones
nucleares. La detección de rayos gamma es un proceso indirecto, los fotones de rayos gamma no
tienen carga intrínseca, por lo tanto, no crean ionización, por el que pasan directamente, la manera
de medir esos fotones es críticamente dependiente de hacer que el fotón experimente una
interacción donde transfiere todo o parte de su energía a un electrón en el material absorbente.
Los fotones incidentes crean primero electrones rápidos estos tendrán una energía máxima igual
a la energía de la misma manera que cualquier otro electrón rápido. Debido al hecho de que los
fotones son invisibles para el detector, un detector debe tener un par de funciones específicas, la
primera es actuar como un medio en el que se tendrá una muy alta probabilidad de que un rayo
gamma incidente interactúe dentro de ese medio, la segunda función es para detectar con mayor
precisión los electrones rápidos que se crean (Raya, 2021, p. 4).
Un rayo gamma puede interactuar con la materia en una de las tres siguientes formas: absorción
Fotoeléctrica, dispersión compton y producción de pares. Las diferentes interacciones cambian
su probabilidad de ocurrencia dependiendo de la energía del rayo gamma y el numero atómico
del material penetrado. Los rayos gamma son mucho más penetrantes en la materia que las
partículas cargadas (Raya, 2021, p. 5).
El efecto dañino de niveles reducidos de radiación en la salud humana ha sido estudiado por
mucho tiempo. Dependiendo de muchos parámetros complejos, cuando la radiación ionizante
transfiere energía a un sistema biológico, provocará uno o más resultados finales. La incidencia
general y/o la severidad del resultado final estarán relacionadas con la dosis absorbida por el
sistema. Para organismos complejos como el humano, hay dos tipos de efectos relacionados con
la dosis: somáticos y genéticos. El daño somático se refiere al daño ocurrido en los tejidos del
individuo irradiado, mientras que el daño genético se refiere al daño que afectará las generaciones
futuras (Nuñez, 2008, p. 1).
Los efectos somáticos: involucran primariamente a las células diploides. El efecto somático se
manifestará en el individuo que absorbe la dosis de radiación, pudiendo clasificarse en dos tipos:
efectos de relativa certeza (efectos determinísticos) y los que ocurren al azar o estocásticos
(efectos no determinísticos). Los efectos determinísticos involucran altas dosis sobre porciones
grandes del cuerpo. Los efectos determinísticos se pueden categorizar en efectos tempranos y
tardíos. Los efectos tempranos ocurren dentro del primer año de la exposición y están relacionados
con el número de células muertas, la reparación del daño producido y la tasa de recambio de la
línea celular irradiada. Algunos ejemplos incluyen el eritema, la caída del pelo, la neumonitis
rádica y la enfermedad de radiación. Los efectos determinísticos tempranos pueden ser alterados
fraccionando la dosis o administrándola en una infusión continua pero lentamente; en general un
tejido puede soportar una dosis mucho mayor si ésta es fraccionada. o Los efectos tardíos ocurren
luego del año de recibida la dosis, están relacionados con el daño inicial producido por la dosis y
el deterioro debido a los mecanismos de reparación. Algunos ejemplos incluyen la queratosis, la
fibrosis pulmonar y las cataratas. Los efectos determinísticos tardíos son menos influenciados por
fraccionamiento de la dosis y serán proporcionales a la dosis total. Los efectos no determinísticos
ocurren a niveles bajos de exposición a la radiación, en cuyo caso el daño será estocástico o
estadístico en naturaleza: es posible predecir la proporción de una población dada de personas
expuestas que será afectada, pero imposible predecir precisamente qué individuo en particular
sucumbirá. No existe una dosis umbral demostrable y el daño se presenta como un pequeño
incremento en la incidencia normal o espontánea y se expresa luego de un largo período de
latencia (Nuñez, 2008, p. 1).
La radio sensibilidad del tejido depende de varios factores. De acuerdo con los primeros
radiobiólogos, la respuesta del tejido a la radiación es función de: el número de células
indiferenciadas en el tejido, el número de células mitóticas activas, la cantidad de tiempo que las
células permanecen activas en proliferación. No está claro por qué la falta de diferenciación
celular resulta en radio sensibilidad. Ha sido demostrado que las células indiferenciadas o en
proceso de diferenciación son fácilmente destruidas por la radiación. Cuanto más tiempo las
células permanecen en proliferación activa, mayor es la sensibilidad a la radiación (Nuñez, 2008,
p. 2).
CAPITULO II
2 MARCO METODOLÓGICO
Según el tipo de investigación es cuantitativa debido a que se estudia las variable dosis de
radiación gamma y cómo se comporta en la provincia de Chimborazo, el objetivo de estudio es
aplicada ya que se centra en la solución de un problema en el ecosistema; los valores que se van
a manipular son no experimentales debido a que la matriz de información procede de una fuente
secundaria; dado el tipo de inferencia es inductiva ya que se utilizó un análisis de curvas
funcionales y según el periodo temporal es transversal dado que la medición fue por un tiempo
único.
El estudio se realizó con los datos de dosis de radiación gamma, recopilada a través de todas las
parroquias de los 10 cantones en la provincia de Chimborazo durante el año 2021.
2.2.3 Método de muestreo
Se aplicó el análisis de datos funcionales con las librerías disponibles en R, además se implementó
detección de outliers y comparación mediante: Estadísticas descriptivas y Análisis de clúster,
según los requerimientos del problema.
Con la información proporcionada por el GIDAC, primero se ordenó las bases de datos, ya que,
como toda tecnología recolectora de datos, presenta ciertos inconvenientes, que el investigador
es encargado de resolverlas. La base de datos consta de 7 variables cualitativas informativas que
son cantón, parroquia, coordenada X, coordenada Y, fecha, punto de muestreo, y la hora en que
se comenzó el proceso de muestreo. A continuación, los datos recolectados de la dosis de
radiación perteneciente a cada punto, con un total de 500 segundos. Se optó por esa cantidad de
segundos, porque desde ese punto la curva funcional ya nos brinda resultados fiables, además del
coste computacional y la rapidez de los cálculos en R.
La tabla 2-3 muestra un resumen general de los cantones y su totalidad de muestras tomadas en
cada uno de ellos.
El primer paso en el análisis funcional de datos es hallar el método de base funcional que mejor
se ajuste a las observaciones, y eliminar el ruido producido por la calibración de los equipos.
Gracias al paquete fda.usc, con la función optim.basis, del software R se pudo optimizar el número
de bases necesarias para el suavizado, el cual dio como resultado se obtuvo un total de 43 bases
funcionales. Para los datos de dosis de radiación gamma se utilizó las bases de funciones B-
splines, debido a que es uno de los métodos más eficaces a la hora de trabajar con grandes
cantidades de datos.
Gráfico 1-3: Número de Bases B-Spline óptimos
Realizado por: Yungaicela Vìctor,2022
Al contar ya con los datos funcionales, a través de un proceso por B-Spline, se procedió a aceptar
la calidad del ajuste obtenido. A través dela función plotfit.fd, se obtuvo el RMS (root mean
square), que es una medida de las diferencias entre los valores predichos por un modelo y las
observaciones. Esta medida tiene como característica que siempre va a presentar un valor positivo
y su ajuste perfecto es 0.
Con la ayuda de la función 𝑝𝑙𝑜𝑡𝑓𝑖𝑡. 𝑓𝑑( ) se puede observar algunos ejemplos RMS, con bspline
15,17,21,25,27,35,37,41, el mejor RMS sigue siendo el número de bases optimo igual a 43.
Para encontrar posibles curvas atípicas (outliers) se utilizaron distintos métodos gráficos, tales
como, functional bagplot, HDR boxplot, y plot arcoíris, se realizaron las tres gráficas para crear
una tabla comparativa. Se aplicó también una función de R no grafica titulada outliers.depth.trim.
En el plot arco iris se muestra en color negro la curva de la mediana, y en color magenta los
atípicos, en este caso la curva 76 pertenecientes al punto de muestreo 27, de la parroquia
GUASUNTOS, la curva 32 perteneciente al punto de muestreo 6, de la parroquia SEVILLA, y la
curva 41 perteneciente al punto de muestreo 3, de la parroquia SIBAMBE. En el functional
bagplot, se muestra en color negro la curva de la mediana, en distintos colores las curvas atípicas
halladas, tal como la curva 41 perteneciente al punto de muestreo 3, de la parroquia SIBAMBE,
la curva 49 perteneciente al punto de muestreo 2, de la parroquia MULTITUD, la curva 53
perteneciente al punto de muestreo 6, de la parroquia MULTITUD, la curva 68 perteneciente al
punto de muestreo 4, de la parroquia TOTORAS, la curva 69 perteneciente al punto de muestreo
2, de la parroquia TOTORAS, y la curva 72 perteneciente al punto de muestreo 45, de la parroquia
GUASUNTOS. En color silver se nota el resto de los datos funcionales. En el HDR boxplot se
visualiza en color negro la curva de la moda, en varios colores las curvas atípicas halladas, tales
como, la curva 41 perteneciente al punto de muestreo 3, de la parroquia SIBAMBE, la curva 49
perteneciente al punto de muestreo 2, de la parroquia MULTITUD, y la curva 53 perteneciente al
punto de muestreo 6, de la parroquia MULTITUD, la curva 69 perteneciente al punto de muestreo
2, de la parroquia TOTORAS, y la curva 72 perteneciente al punto de muestreo 45, de la parroquia
GUASUNTOS, en color silver el complemento de los datos funcionales. La función del software
R, outliers.depth.trim identifica como atípicos, la curva 49 perteneciente al punto de muestreo 2,
de la parroquia MULTITUD, la curva 53 perteneciente al punto de muestreo 6, de la parroquia
MULTITUD, la curva 46 perteneciente al punto de muestreo 1, de la parroquia MULTITUD, y
la curva 56 perteneciente a la parroquia MULTITUD. Se eliminó las curvas atípicas 49 y 53.
Tabla 2-3: Outliers encontrados con cada una de las técnicas en Chambo
CHAMBO
Functional Bagplot 14
Rainbow plot 6,9,14
HDR plot 14
deph.trim.out 4
Realizado por: Yungaicela, Víctor.2022
Tabla 3-3: Outliers encontrados con cada una de las técnicas en Chunchi
CHUNCHI
Functional Bagplot 22,30
Rainbow plot 29,5,30
HDR plot 4,30,22
deph.trim.out 22,30
Realizado por: Yungaicela, Víctor.2022
En el functional bagplot, no se presentaron atípicos. En el plot arco iris se muestra en color negro
la curva de la mediana, y en color magenta los atípicos, en este caso la curva 30 perteneciente al
punto de muestreo 87, de la parroquia COLTA, la curva 11 perteneciente al punto de muestreo
10, de la parroquia de COLUMBE, y la curva 13 perteneciente al punto de muestreo 1, de la
parroquia COLUMBE. En el HDR boxplot se visualiza en color negro la curva de la moda, en
varios colores las curvas atípicas halladas, tales como, la curva 11 perteneciente al punto de
muestreo 10, del cantón COLUMBE, la curva 24 perteneciente al punto de muestreo 22, de la
parroquia PANGOR, y la curva 31 perteneciente al punto de muestreo 5, de la parroquia
SANTIAGO DE QUITO, en color silver el complemento de los datos funcionales. La función del
software R, outliers.depth.trim identifica como atípicos, la curva 11 perteneciente al punto de
muestreo 10, de la parroquia de COLUMBE. Se eliminó la curva atípica 11.
En el functional bagplot se muestra en color negro la curva de la mediana, en distintos colores las
curvas atípicas halladas, tal como, la curva 6 perteneciente al punto 178, de la parroquia
CUMANDÁ, la curva 11 perteneciente al punto de muestreo 59, de la parroquia de CUMANDÁ.
En color silver se nota el resto de los datos funcionales. En el plot arco iris se muestra en color
negro la curva de la mediana, y en color magenta los atípicos, en este caso la curva 3 perteneciente
al punto de muestreo 65, de la parroquia CUMANDÁ, la curva 11 perteneciente al punto de
muestreo 59, de la parroquia de CUMANDÁ, la curva 9 perteneciente al punto de muestreo 125,
de la parroquia de CUMANDÁ. En el HDR boxplot se visualiza en color negro la curva de la
moda, en varios colores las curvas atípicas halladas, tales como, la curva 11 perteneciente al punto
de muestreo 59, de la parroquia de CUMANDÁ, en color silver el complemento de los datos
funcionales. La función del software R, outliers.depth.trim identifica como atípicos, la curva 11
perteneciente al punto de muestreo 59, de la parroquia de CUMANDÁ. Se eliminó la curva atípica
11.
Tabla 5-3: Outliers encontrados con cada una de las técnicas en Cumandá
CUMANDÁ
Functional Bagplot 6,11
Rainbow plot 3,9,11
HDR plot 11
deph.trim.out 11
Realizado por: Yungaicela, Víctor.2022
Tabla 6-3: Outliers encontrados con cada una de las técnicas en Guano
GUANO
Functional Bagplot 30,32
Rainbow plot 15,25,30
HDR plot 3,5,30,32
deph.trim.out -----------
Realizado por: Yungaicela, Víctor.2022
Gráfico 18-3: Functional Bagplot de Guano
Realizado por: Yungaicela, Víctor.2022
En el functional bagplot se muestra en color negro la curva de la mediana, en distintos colores las
curvas atípicas halladas, tal como, la curva 7 perteneciente al punto de muestreo 38, de la
parroquia PALLATANGA, y la curva 10 perteneciente al punto de muestreo 35, de la parroquia
PALLATANGA. En color silver se nota el resto de los datos funcionales. En el plot arco iris se
muestra en color negro la curva de la mediana, y en color magenta los atípicos, en este caso la
curva 11 perteneciente al punto de muestreo 42, de la parroquia PALLATANGA, la curva 2
perteneciente al punto de muestreo 6, de la parroquia de PALLATANGA, y la curva 10
perteneciente al punto de muestreo 35, de la parroquia PALLATANGA. En el HDR boxplot se
visualiza en color negro la curva de la moda, en varios colores las curvas atípicas halladas, tal
como, la curva 10 perteneciente al punto de muestreo 35, de la parroquia PALLATANGA. en
color silver el complemento de los datos funcionales. La función del software R,
outliers.depth.trim identifica como atípicos, la curva 4 perteneciente al punto de muestreo 24, de
la parroquia de PALLATANGA. Se eliminó la curva atípica 10.
Tabla 7-3: Outliers encontrados con cada una de las técnicas en Pallatanga
PALLATANGA
Functional Bagplot 7,10
Rainbow plot 11,2,10
HDR plot 10
deph.trim.out 4
Realizado por: Yungaicela, Víctor.2022
En el functional bagplot se muestra en color negro la curva de la mediana, en distintos colores las
curvas atípicas halladas, tal como, la curva 2 perteneciente al punto de muestreo 2, de la parroquia
MATUS, la curva 3 perteneciente al punto de muestreo 3, de la parroquia MATUS,la curva 16
perteneciente al punto de muestreo 5, de la parroquia BAYUSHIG, la curva 24 perteneciente al
punto de muestreo 7, de la parroquia PUELA, la curva 25 perteneciente al punto de muestreo 8,
de la parroquia PUELA, la curva 29 perteneciente al punto de muestreo 4, de la parroquia LA
CANDELARIA, y la curva 30 perteneciente al punto de muestreo 6, de la parroquia LA
CANDELARIA. En color silver se nota el resto de los datos funcionales. En el plot arco iris se
muestra en color negro la curva de la mediana, y en color magenta los atípicos, en este caso la
curva 38 perteneciente al punto de muestreo 11, de la parroquia EL ALTÁR, la curva 27
perteneciente al punto de muestreo 1, de la parroquia LA CANDELARIA, y la curva 3
perteneciente al punto de muestreo 3, de la parroquia MATUS. En el HDR boxplot se visualiza
en color negro la curva de la moda, en varios colores las curvas atípicas halladas, tal como, la
curva 2 perteneciente al punto de muestreo 2, de la parroquia MATUS, la curva 3 perteneciente
al punto de muestreo 3, de la parroquia MATUS, la curva 24 perteneciente al punto de muestreo
7, de la parroquia PUELA, y la curva 29 perteneciente al punto de muestreo 4, de la parroquia LA
CANDELARIA, en color silver el complemento de los datos funcionales. La función del software
R, outliers.depth.trim identifica como atípicos, la curva 4 perteneciente al punto de muestreo 7,
de la parroquia MATUS. Se eliminó la curva atípica 2,3,24 y 29.
Tabla 8-3: Outliers encontrados con cada una de las técnicas en Penipe
PENIPE
Functional Bagplot 2,3,16,24,25,29,30
Rainbow plot 38,27,3
HDR plot 2,3,24,29
deph.trim.out 4
Realizado por: Yungaicela, Víctor.2022
En el functional bagplot se muestra en color negro la curva de la mediana, en distintos colores las
curvas atípicas halladas, tal como, la curva 14 perteneciente al punto de muestreo 40, de la
parroquia QUIMIAG, la curva 17 perteneciente al punto de muestreo 31, de la parroquia
QUIMIAG, la curva 34 perteneciente al punto de muestreo 8, de la parroquia LICÁN, la curva 40
perteneciente al punto de muestreo 9, de la parroquia QUIMIAG, la curva 51 perteneciente al
punto de muestreo 39, de la parroquia PÚNGALA, la curva 67 perteneciente al punto de muestreo
56, de la parroquia LICTO, y la curva 92 perteneciente al punto de muestreo 47, de la parroquia
CALPI. En color silver se nota el resto de los datos funcionales. En el plot arco iris se muestra en
color negro la curva de la mediana, y en color magenta los atípicos, en este caso, la curva 79
perteneciente al punto de muestreo 5, de la parroquia CUBIJÍES, la curva 17 perteneciente al
punto de muestreo 31, de la parroquia QUIMIAG, la curva 89 perteneciente al punto de muestreo
36, de la parroquia SAN JUAN. En el HDR boxplot se visualiza en color negro la curva de la
moda, en varios colores las curvas atípicas halladas, tal como, la curva 14 perteneciente al punto
de muestreo 40, de la parroquia QUIMIAG, la curva 17 perteneciente al punto de muestreo 31,
de la parroquia QUIMIAG, la curva 34 perteneciente al punto de muestreo 8, de la parroquia
LICÁN, la curva 51 perteneciente al punto de muestreo 39, de la parroquia PÚNGALA, la curva
67 perteneciente al punto de muestreo 56, de la parroquia LICTO, la curva 88 perteneciente al
punto de muestreo 34, de la parroquia SAN JUAN, y la curva 92 perteneciente al punto de
muestreo 47, de la parroquia CALPI. en color silver el complemento de los datos funcionales. La
función del software R, outliers.depth.trim identifica como atípicos, la curva la curva 14
perteneciente al punto de muestreo 40, de la parroquia QUIMIAG, la curva 17 perteneciente al
punto de muestreo 31, de la parroquia QUIMIAG, la curva 51 perteneciente al punto de muestreo
39, de la parroquia PÚNGALA, la curva 40 perteneciente al punto de muestreo 9, de la parroquia
QUIMIAG . Se eliminó las curvas atípicas 14,17,51.
Tabla 10-3: Outliers encontrados con cada una de las técnicas en Riobamba
RIOBAMBA
Functional Bagplot 14,17,34,40,51,67,92
Rainbow plot 79,89,17
HDR plot 14,17,34,51,67,88,92
deph.trim.out 17,51,14,40
Realizado por: Yungaicela, Víctor.2022
Se observa los valores medios de la dosis de radiación gamma del cantón Alausí, presentan un
valor de dosis gamma promedio en el año 2021 de 0.06 Sv. El valor de dosis de radiación no se
incrementa, ni presenta cambios extraños. La desviación estándar funcional mostro variabilidad
al inicio del muestreo, debido a la calibración del equipo. Después se estabilizo. Presenta poca
variabilidad con un valor de 0.01 sd, es decir los valores de dosis de radiación están muy próximos
a la media.
Se observa los valores medios de la dosis de radiación gamma del cantón Chambo, presentan un
valor de dosis gamma promedio en el año 2021 de 0.04 Sv. El valor de dosis de radiación tiende
a variar entre 0.04 Sv y 0.05 Sv. La desviación estándar funcional mostro un poco de variabilidad,
el pico más alto se muestra a partir de los 150 segundos. Presenta variabilidad moderada con un
valor inferior a 0.1 sd.
Se observa los valores medios de la dosis de radiación gamma del cantón Chunchi, presentan un
valor de dosis gamma promedio en el año 2021 de 0.05 Sv. La desviación estándar funcional
mostro un poco de variabilidad, Presenta variabilidad moderada con un valor inferior a 0.1 sd. Al
principio presenta un comportamiento extraño debido a la calibración de los equipos.
En la gráfica se observa los valores medios de la dosis de radiación gamma para el cantón Colta,
la dosis promedio llega a 0,05 Sv. mientras que la desviación estándar funcional presenta poca
variabilidad con valores que oscilan alrededor de 0.01 sd.
Gráfico 30-3: Media y Desviación Funcional de Colta
Realizado por: Yungaicela, Víctor.2022
En la gráfica se observa los valores medios de la dosis de radiación gamma para el cantón
Cumandá, la dosis promedio llega a 0,03 Sv. mientras que la desviación estándar funcional
presenta poca variabilidad con valores que oscilan entre 0.005 sd y 0.01 sd.
En la gráfica se observa los valores medios de la dosis de radiación gamma para el cantón
Guamote, la dosis promedio llega a 0,06 Sv. mientras que la desviación estándar funcional
presenta gran variabilidad comparado con el resto de los cantones, con valores que oscilan entre
0.0 sd y 0.02 sd.
Gráfico 32-3: Media y Desviación Funcional de Guamote
Realizado por: Yungaicela, Víctor.2022
En la gráfica se observa los valores medios de la dosis de radiación gamma para el cantón
Cumandá, la dosis promedio llega a 0,06 Sv. mientras que la desviación estándar funcional
presenta poca variabilidad con respecto de la media, con valores que oscilan entre 0.01 sd y 0.015
sd.
En la gráfica se observa los valores medios de la dosis de radiación gamma para el cantón
Pallatanga, la dosis promedio llega a 0,04 Sv. mientras que la desviación estándar funcional
presenta mínima variabilidad con respecto de la media, con valores que oscilan alrededor de 0.01
sd. Se observa un repunte de variabilidad al final de los 500 segundos.
En la gráfica se observa los valores medios de la dosis de radiación gamma para el cantón Penipe,
la dosis promedio llega a 0,04 Sv. mientras que la desviación estándar funcional presenta mínima
variabilidad con respecto de la media, con valores que oscilan alrededor de 0.01 sd.
En la gráfica se observa los valores medios de la dosis de radiación gamma para el cantón
Riobamba, la dosis promedio llega a 0,06 Sv. mientras que la desviación estándar funcional
presenta mínima variabilidad con respecto de la media, con valores que oscilan alrededor de 0.01
sd. Observas una pequeña anomalía al comienzo del muestreo, debido a la calibración del
espectrómetro.
Para hallar la optimización adecuada del remuestreo de bootstrap para cada cantón de la provincia
de Chimborazo, se utilizó el paquete fda.usc del software R. A través del comando fdatabootstrap,
se obtuvo la banda de confianza de Bootstrap, un estimador de la media funcional y el porcentaje
total de absorción.
Gráfico 37-3: Banda de confianza del cantón Gráfico 38-3: Banda de confianza del cantón
Alausi Chambo
Realizado por: Yungaicela, Víctor.2022 Realizado por: Yungaicela, Víctor.2022
Gráfico 39-3: Banda de confianza del cantón Gráfico 40-3: Banda de confianza del cantón
Chunchi Colta
Realizado por: Yungaicela, Víctor.2022 Realizado por: Yungaicela, Víctor.2022
Gráfico 41-3: Banda de confianza del cantón Gráfico 42-3: Banda de confianza del cantón
Cumandá Guamote
Realizado por: Yungaicela, Víctor.2022 Realizado por: Yungaicela, Víctor.2022
Gráfico 43-3: Banda de confianza del cantón Gráfico 45-3: Banda de confianza del cantón
Guano Pallatanga
Realizado por: Yungaicela, Víctor.2022 Realizado por: Yungaicela, Víctor.2022
Gráfico 44-3: Banda de confianza del cantón Gráfico 46-3: Banda de confianza del cantón
Penipe Riobamba
Realizado por: Yungaicela, Víctor.2022 Realizado por: Yungaicela, Víctor.2022
3.7 Análisis Clúster
En este análisis, utilizamos el método gráfico, con el que encontramos conclusiones para hallar el
numero óptimo de clusters haciendo una comparativa con otros análisis gráficos llevados a cabo
con diferente número 𝑘. El gráfico 51-3 se realizó con 𝑘 = 4 clusters, Observamos como los datos
tienden a formar una recta, descartando cualquier tipo de agrupación, por lo que decidimos reducir
el número de clusters a 𝑘 = 3.
El gráfico 52-3 se realizó con 𝑘 = 3 clusters, Observamos como los clusters son más heterogéneos
entre ellos. Se hace evidente que es más coherente llevar a cabo el estudio del comportamiento
de las observaciones agrupándolas en tres clusters solamente, ya que quedan mejor explicadas.
Gráfico 48-3: K-MEANS para todas las observaciones agrupadas en 3 clusters
Realizado por: Yungaicela, Víctor.2022
A continuación, la tabla 10-3 muestra la composición de cada clúster, para ver si en un principio
los clusters discriminan teniendo en cuenta algún aspecto de las observaciones.
ALAUSI tiene sus observaciones divididas entre los clusters número 2 y 3, por esta razón se
puede afirmar que el comportamiento de Alausí es diferente a los cantones pertenecientes al
clúster 1.
CHAMBO tiene su gran mayoría de observaciones en el clúster 2, por esta razón se pude afirmar
que el comportamiento de Chambo es diferente a los cantones pertenecientes a los clusters 1 y 3.
CHUNCHI tiene sus observaciones divididas en los clusters 2 y 3, por esta razón se puede afirmar
que el comportamiento de Chunchi es diferente a los cantones que tiene un comportamiento de
clúster 1.
CUMANDÁ presenta un comportamiento dividido para los clusters 1 y 3, por esta razón se puede
afirmar que su comportamiento es diferente a los cantones que comparten el clúster 2.
GUAMOTE presenta un comportamiento dividido para los clusters 1 y 2, por esta razón se puede
afirmar que su comportamiento es diferente a los cantones que comparten el clúster 3.
GUANO en su mayoría presenta un comportamiento de clúster 3, por esta razón se puede afirmar
que el comportamiento de Guano es diferente a los cantones que tiene un comportamiento de los
clusters 1 y 2.
A través de la función FUNHDDC, del paquete fda.usc obtuvimos el Grafico 55-3. Para hallar
esta grafica necesitamos encontrar el mejor modelo. Para ello en el parámetro model, elegimos la
opción “All”, que lo que hace es buscarnos el modelo óptimo al cual se ajuste nuestros datos
funcionales. El modelo seleccionado fue el “ABQKDK”, k = 3.
El CLUSTER 1 presenta una característica, sus datos fueron en su mayoría tomados por la tarde,
le sigue en la mañana y la gran minoría al medio día.
El CLUSTER 2 y 3 presenta una característica, sus datos fueron tomados en menor cantidad en
el medio día, al contrario del Clúster 1 que su muestreo al medio día fue casi nulo.
CONCLUSIONES
Se define como dato funcional la dosis de radiación gamma recopilada por 8,33 segundos, es decir
durante 500 segundo. Mediante la función min.basis() de R, se identificó que el suavizado B-
spline es el óptimo para este estudio, dando así 43 bases B-spline cubico para el suavizado de
curvas Con un ajuste de calidad igual a 0,007 , gracias al RMS, vemos que el análisis es factible.
Los valores atípicos afectan la finalidad del estudio estadístico, y el análisis de datos funcionales
no está excepto. En consecuencia, es fundamental para el analista detectar ouliers para excluirlos
del estudio. Se halló curvas atípicas a través de cuatro métodos, para luego proceder a su
comparación y eliminar dependiendo de su mayor frecuencia, Se eliminó los outliers de todos los
cantones a excepción de Guamote que no presento ninguno. Penipe y Riobamba fueron los
cantones con más outliers de la provincia.
Aplicar una buena toma de datos, tener cuidado en los equipos de medición, ya que, por problemas
de calibración, se genera datos atípicos, lo que conlleva a dar interpretaciones erróneas de los
resultados.
Motivar a los estudiantes a utilizar nuevas técnicas estadísticas, como el análisis de datos
funcionales, ya que tiene herramientas muy eficaces para el procesamiento de los datos, y más
cuando hablamos de grandes cantidades de datos.
INEC. 2010. Instituto Nacional de Estadística y Censos. [En línea] 2010. [Citado el: 09
de 03 de 2022.] www.ecuadorencifras.gob.ec. .
CODIGO EN R
###################################
## DATOS FUNCIONALES DOSIS DE GAMMA ##
###################################
## LIBRERIAS NECESARIAS ##
library(readr)
library(fda)
##
## Attaching package: 'fda'
## -------------------------------------------------------------------
---------------
## Functional Data Analysis and Utilities for Statistical Computing
## fda.usc version 2.0.2 (built on 2020-02-17) is now loaded
## fda.usc is running sequentially usign foreach package
## Please, execute ops.fda.usc() once to run in local parallel mode
## Deprecated functions: min.basis, min.np, anova.hetero, anova.onefa
ctor, anova.RPm
## New functions: optim.basis, optim.np, fanova.hetero, fanova.onefac
tor, fanova.RPm
## -------------------------------------------------------------------
---------------
library(rainbow)
library(fdANOVA)
library(readxl)
data <- read_excel("C:/Users/59398/Documents/rgr/datos.xlsx")
datoschimborazo<-data.frame(lapply(data, as.numeric),stringsAsFactors
= FALSE)
FLEXTRK<-as.matrix(datoschimborazo)
##########################
## CALIDAD DEL AJUSTE ##
##########################
## CALIDAD DEL AJUSTE MEDIANTE FNS BASE B-SPLINES ##
for (i in 1:400) {
plotfit.fd(argvals=Tiempo_segundos,FLEXTRK[,i],fdobj=gammaChimborazo
[i],lty=1,lwd=1,col=2)
}
########################
## OUTLIERS ##
########################
## OBTENCIÓN DE OUTLIERS DE FORMA GRÁFICA ##
## LECTURA DE LOS DATOS PARA LOS GRÁFICOS
datosChimborazo2<-read_excel("C:/Users/59398/Documents/rgr/datos.xlsx"
)
datosChimborazo2<-data.frame(lapply(datosChimborazo2, as.numeric),stri
ngsAsFactors =
FALSE)
## RAINBOW ##
plot(datoschimborazofds,plot.type="depth",plotlegend=TRUE,ylab="Radiac
ión Gamma (Sv)",xlab="Tiempo (segundos)")
## FUNCTIONAL BAGPLOT ##
fboxplot(datoschimborazofds,plot.type="functional",type="bag",ylab="Ra
diación Gamma (Sv)",xlab="Tiempo (segundos)")
desvtipalausi=sd.fd(AFDALAU)
#Chambo
mediachambo=mean.fd(AFDCHAM)
desvtipchambo=sd.fd(AFDCHAM)
#Chunchi
mediachunchi=mean.fd(AFDCHU)
desvtipchunchi=sd.fd(AFDCHU)
#Colta
mediacolta=mean.fd(AFDCOL)
desvtipcolta=sd.fd(AFDCOL)
#Cumanda
mediacumanda=mean.fd(AFDCUM)
desvtipcumanda=sd.fd(AFDCUM)
#Guamote
mediaguamote=mean.fd(AFDGUA)
desvtipguamote=sd.fd(AFDGUA)
#Guano
mediaguano=mean.fd(AFDGUAN)
desvtipguano=sd.fd(AFDGUAN)
#PALLATANGA
mediapallatanga=mean.fd(AFDPAL)
desvtippallatanga=sd.fd(AFDPAL)
#PENIPE
mediapenipe=mean.fd(AFDPEN)
desvtipenipe=sd.fd(AFDPEN)
#RIOBAMBA
mediariobamba=mean.fd(AFDRIO)
desvtipriobamba=sd.fd(AFDRIO)
#
#######CLUSTER
library(funFEM)
par(mfrow=c(1,1))
par(mfrow=c(1,1))
res2 = funFEM(gammaChimborazo,K=res$K,model='AkjBk',init='user',Tinit=
res$P,
lambda=0.01,disp=TRUE)
library(funHDDC)
```
ANEXO B
ANEXO C