Visualización de Galaxias con Streamlit
Visualización de Galaxias con Streamlit
Máster en Física
Autor:
Daniel Pinilla García
Tutor:
Fernando Buitrago
1
AGRADECIMIENTOS
A mis padres por apoyarme y darme soporte durante todos los años de estudios y a mi tutor Fernando por
la actitud servicial y paciente que ha tenido durante el desarrollo del TFM. También agradecer a Ángel Faisán
por su ayuda en los primeros pasos de este proyecto. A todos se lo agradezco de verdad.
ÍNDICE
1. Introducción .................................................................................................................................................. 3
2. Desarrollo teórico .......................................................................................................................................... 3
2.1 Galaxias ................................................................................................................................................ 4
2.2 Medida de las distancias...................................................................................................................... 5
2.3 Morfología de las galaxias ................................................................................................................... 6
2.4 Parámetros de clasificación en la base de datos ................................................................................. 9
2.5 Truncaciones...................................................................................................................................... 16
2.6 CCD .................................................................................................................................................... 17
2.7 Filtros ................................................................................................................................................. 18
2.8 Análisis Big Data en Astronomía: ....................................................................................................... 19
3. Desarrollo experimental .............................................................................................................................. 20
3.1 Telescopio Hubble ............................................................................................................................. 20
3.2 Base de datos..................................................................................................................................... 21
3.3 Software desarrollado ....................................................................................................................... 23
3.4 Descripción de la aplicación creada................................................................................................... 23
3.5 Visualización de truncaciones............................................................................................................ 30
4. Conclusiones ................................................................................................................................................ 36
5. Referencias .................................................................................................................................................. 38
6. Anexos ......................................................................................................................................................... 39
Anexo A.................................................................................................................................................... 39
Anexo B .................................................................................................................................................... 41
2
ABSTRACT
This master's thesis aims to create an application that allows a first visual analysis of a database of galaxy
luminosity profiles. This application should be able to filter those based on various physical properties, such
as luminosity, stellar mass, axis ratio, redshift, and truncation radius. This study uses various advanced data
analysis and structure libraries within the Python programming lenguaje (one of the most widely use dones
in scientific programming) to obtain plots that reveal information about galaxies in a simple and flexible way.
The findings of this research will contribute to a better understanding of the structure and evolution of spiral
galaxies, providing a valuable tool for the Astronomy researcher.
1. Introducción
En la Astronomía moderna se aborda la necesidad de una nueva metodología científica para enfrentar los
desafíos que surgen en la gestión de grandes conjuntos de datos. La cantidad de datos de observacionales
que se recogen cada año aumenta de manera exponencial y se necesitan nuevas herramientas que permitan
navegar entre ellos. Para ello, se busca establecer una sinergia entre la ciencia habilitada
computacionalmente y la tecnología de la información impulsada por la ciencia.
El objetivo principal de este trabajo es el de visualizar las llamadas truncaciones dentro del perfil de brillo,
zonas en las galaxias donde se aprecia un descenso en su luminosidad a partir del cual se podría determinar
su límite y asignar a la galaxia un tamaño físicamente motivado, algo que no se ha conseguido hasta ahora.
A partir de esta truncación se puede relacionar diferentes características de las galaxias con su tamaño. Para
buscar visualizar estas truncaciones se trabaja con un banco de datos muy extenso (más de mil galaxias a
grandes distancias cósmicas) de observaciones recogidas por el telescopio Hubble.
2. Desarrollo teórico
Las galaxias son consideradas como el punto de partida central para la observación y estudio del universo, su
estudio permite medir aspectos del universo que no son posibles medir ni entender a partir de los
experimentos en entornos cercanos. Estos aspectos debidos a las grandes magnitudes con las que se trabaja
en Astronomía permiten comprender la estructura y evolución del universo a niveles más amplios, brindando
información desde la formación de galaxias y la distribución de la materia hasta la expansión del espacio a
escalas cósmicas.
Han sido muchos los proyectos que se han realizado para obtener datos de los espectros de las galaxias
durante el último siglo (que son los que en última instancia nos dan las distancias a ellas midiendo su
desplazamiento al rojo) generando bases de datos para su manejo y estructuración. Con ello se ha conseguido
realizar una descripción del cosmos como el mapa que se muestra en la primera figura.
3
Figura 1: Muestrario de galaxias del universo cercano en función del desplazamiento al rojo (redshift en inglés) en función de su
posición en el cielo (i.e. su ascensión recta).
En este TFM se va a trabajar con una base de datos que contiene perfiles de luminosidad de 1048 galaxias.
La base de datos consta de dos partes principales. La primera parte es un archivo con los identificadores de
las galaxias y una serie de parámetros relevantes de cada una de ellas. La segunda parte es un directorio con
los perfiles de brillo de cada una de las galaxias en los filtros que cada galaxia tenga disponibles.
Se iniciará el desarrollo con una breve introducción a conceptos teóricos sobre las galaxias. Seguidamente,
se describirán, tanto los parámetros con los que se trabaja, como lo que son los perfiles de brillo y los filtros.
Finalmente se mencionarán conceptos teóricos sobre las observaciones en Astronomía. Para la obtención de
distancias se ha asumido una cosmología concordante (𝐻0 = 70 𝑘𝑚𝑠 −1 𝑀𝑝𝑐 −1 , Ω0 = 0.3, Ω𝐴 = 0.7) .
2.1 Galaxias
Para comenzar el desarrollo teórico se define lo que es una galaxia como un sistema complejo formado por
un conjunto de estrellas, nubes de gas, planetas, polvo y materia oscura. Todos estos objetos celestes están
unidos por un potencial gravitatorio que tiene dos contribuciones: la debida a la materia Bariónica (bariones
y leptones) y la debida a la materia Oscura. Pero incluso puede haber galaxias que carecen de polvo y gas, o
en el extremo contrario, se han observado casos de galaxias compuestas exclusivamente por gas. Cabe hacer
la distinción entre una galaxia y un cúmulo globular, un conjunto esférico de estrellas que, por lo general,
orbita un núcleo galáctico. Estos carecen de un halo de materia oscura.
En la estructura de las galaxias se pueden diferenciar tres partes principales, el halo, el disco y el bulbo.
El halo es la zona más externa, una especie de esferoide donde la concentración de estrellas es muy baja,
siendo principalmente estrellas viejas. El halo se compone principalmente de gas interestelar poco denso y
contiene una gran cantidad de materia oscura. Sus límites son difusos y su simetría es esférica.
El disco tiene forma aplanada, ya que su diámetro es mucho más largo que su espesor y es la zona de la
galaxia en la que hay mayor cantidad de gas y donde tienen lugar procesos de formación estelar. Está
compuesto por estrellas jóvenes y el brillo de esta zona de la galaxia es muy intenso. Esta estructura puede
tener variantes, como la existencia de brazos espirales, barras, anillos...
Por su parte, el bulbo es la zona central de una galaxia, en la que la densidad de estrellas es mayor. Las
estrellas que conforman el bulbo son antiguas ya que se originaron en el primer brote de formación estelar
4
de la propia galaxia y tiene una simetría casi esférica. Existen dos categorías principales de bulbos, los bulbos
clásicos, con una forma más o menos esférica, y pseudobulbos, con propiedades parecidas a los discos. Se
cree que la mayoría de los bulbos galácticos albergan un agujero negro supermasivo en su centro. Tales
agujeros negros solo han sido observados directamente en nuestra propia galaxia y en M87, pero existen
muchas pruebas indirectas.
Otras estructuras formadas por dentro de las galaxias son los anillos, brazos, barras y conchas:
Anillos: estructuras con forma circular que se encuentran en el mismo plano del disco, y son concéntricos al
núcleo galáctico.
Brazos: lugar donde se encuentran las estrellas más jóvenes del disco, aparecen como prolongaciones del
disco o del bulbo, dado una morfología espiral a la galaxia
Barra: es una extensión del bulbo, donde se pueden anclar los brazos espirales. En la clasificación posterior
se llamarán barradas a las galaxias que contengan esta estructura.
Conchas: son estructuras formadas por fusión con galaxias menores, que presentan unos arcos alrededor de
la galaxia.
Como se ha visto en la definición de galaxia, a lo largo del trabajo se da como unidad de longitud el kiloparsec
[kpc]. El parsec es la unidad que se utiliza comúnmente en Astronomía para medir distancias, su nombre
deriva del inglés “parallax of one arc second”. Se define como la distancia a la que una unidad astronómica
(ua) subtiende un ángulo de un segundo de arco. Una estrella dista un parsec si su paralaje es igual a un
segundo de arco entre el Sol y la Tierra.
5
Figura 3: Diagrama geométrico de la definición del pársec.
De la figura 3 se deduce que un parsec es 3,2616 años luz, es decir, 3,0857 ∙ 1016 metros.
En 1926, el astrónomo Edwin Powell Hubble (Marshfield, 20 de noviembre de 1889 - San Marino, California;
28 de septiembre de 1953), propuso la primera clasificación de estos objetos, introduciendo su famoso
“diagrama de tenedor”, que se puede ver en la figura 4 (ampliado en la figura 5), en la que clasificaba a estas
en galaxias elípticas, espirales, lenticulares o irregulares.
- Galaxias elípticas: tienen un perfil de luz brillante en el centro y que decrece continuamente hacia el
exterior, con isofotas elípticas y ausencia de otras estructuras brillantes.
- Las galaxias espirales tienen un perfil de luz menos concentrado que las galaxias elípticas. Muestran
una componente central con propiedades parecidas a las galaxias elípticas, el bulbo, y una
componente extendida de forma plana llamada disco, donde se pueden encontrar varios brazos
espirales. Un ejemplo de galaxia espiral se puede ver en la figura 6.
6
- Galaxias lenticulares tienen un aspecto intermedio al de elípticas y galaxias de disco, lo que a veces
lleva a pensar que son estados intermedios en la evolución de un tipo de galaxia a otro, lo cual no
está probado. Podrían ser espirales que han perdido gran parte de la materia por interacciones con
otras galaxias (en cúmulos, por ejemplo) o elípticas que han agregado materia sin formación estelar
o resultado de una interacción. Las lenticulares tienen un disco y un bulbo, pero no presentan brazos
espirales y el bulbo suele ser bastante más prominente que el disco. Se puede ver una imagen de una
galaxia lenticular en la figura 7.
- Galaxias irregulares: Las galaxias irregulares carecen de simetría o regularidad. Algunas pueden
mostrar barras incipientes o signos vagos de brazos espirales. En la figura 8 se muestra un ejemplo
de galaxia irregular.
El astrónomo francés Gérard de Vaucouleurs (Paris, 25 de abril de 1918 – Austin, 7 de octubre de 1995) en
1959 extendió la secuencia de Hubble modificando la nomenclatura. En este nuevo esquema se denomina a
las galaxias espirales que no son barradas (con una banda central de estrellas brillantes que abarca de un
lado a otro de la galaxia) como tipo SA, también se da una nueva clase llamada SAB, denominada así debido
a que son débilmente barradas. Las galaxias lenticulares se lleva a cabo la misma división entre aquellas
barradas y las que no lo son. En la figura 5 se puede observar el diagrama ampliado:
En la clasificación de Vaucouleurs las galaxias elípticas se designan con la letra E seguida de un número n que
indica su elipticidad aparente. El grado de elipticidad se calcula haciendo uso de la siguiente fórmula:
𝑏
𝑛 = 10 ∙ (1 − 𝑎) 𝑒𝑐. 1
𝑏
Siendo a y b la longitud de sus ejes mayor y menor respectivamente ( 𝑎 el cociente de semiejes o axis ratio)
y valiendo n desde 0 hasta 7. Las galaxias lenticulares se designan como S0 o SB0, dependiendo de si son
7
barradas o no. Las galaxias espirales se designan como S, con una B si son barradas, seguida de las letras
minúsculas a, b o c que indican el tamaño del bulbo (de mayor a menor) y la apertura de los brazos (de más
juntos a menos).
Figuras 6 y 7: A laizquierda la imagen de la galaxia NGC 1300, una galaxia espiral barrada. A la derecha una imagen de la galaxia
lenticular IC 335 tomada por el telescopio Hubble.
También podemos encontrar galaxias con morfología denominada peculiar como las que no entran en ningún
tipo normal. Uno de los subtipos peculiares más importantes son las galaxias en interacción o en fusión. Se
puede observar una galaxia de fusión en la figura 9.
Figuras 8 y 9: a la izquierda una imagen de la galaxia irregular NGC 4449. A la derecha se puede ver una imagen del grupo NGC
4038, un conjunto de galaxias peculiares por estar en pleno proceso de colisión.
Para acabar, resaltar algunos aspectos importantes sobre la morfología. Su clasificación es visual, altamente
subjetiva y depende de la longitud de onda. También depende de la resolución espacial que tengamos y, por
tanto, de la distancia a la galaxia. Además, la clasificación depende de la orientación de la galaxia; por
ejemplo, una espiral de canto puede parecer una elíptica o lenticular. Por último, se indica que en el presente
trabajo solo se han analizado galaxias de bulbo espiral donde su truncación es más fácil de encontrar por
identificarse con el final de su disco.
8
2.4 Parámetros de clasificación en la base de datos
A continuación, se describe teóricamente los parámetros con los que se trabaja en la base de datos de una
muestra de 1048 galaxias de tipo disco. Además, se explicará en que consiste un perfil de luminosidad.
Para observar la estructura a gran escala del Universo, la única visión directa que tenemos del Universo es la
bidimensional que vemos sobre la esfera celeste cuando en realidad se tiene una estructura en 3D. Para
medir distancias de objetos cercanos se puede técnicas de triangulación como el citado paralaje, pero,
cuando las distancias son cosmológicas, el único método efectivo es medir el desplazamiento al rojo. En la
figura 10 se muestra la analogía del globo para dos instantes diferentes de la expansión del universo que
ayuda a entender la idea principal de este método para medir distancias.
Figura 10: Figura adaptada de Ned Wright's Cosmology Tutorial. Los puntos amarillos representan galaxias. Se puede observar la
analogía de las ondas de luz (en azul) estirándose debido a la expansión del universo (en rojo).
La luz de las galaxias no sigue una distribución uniforme en longitud de onda, sino que tiene diferentes
características espectrales propias de los átomos de los gases que componen sus estrellas. Cuando se
examinan estos espectros, se encuentran que están sus líneas espectrales de absorción y emisión
desplazadas hacia el extremo rojo del espectro de laboratorio de forma proporcional a la distancia que nos
separa (ley de Hubble-Lemaître), indicando que las galaxias se están alejando de la tierra a mayor velocidad
cuanto mayor es la distancia que se encuentran, como cabría esperar en un universo en expansión. La
proporción o velocidad de cambio en función de la distancia se conoce como el parámetro o constante de
Hubble 𝐻(𝑡). Se define mediante la siguiente fórmula:
𝑎̇ (𝑡)
𝐻(𝑡) = 𝑒𝑐. 2
𝑎(𝑡)
9
Siendo 𝑎(𝑡) un factor de escala adimensional para un universo en expansión, es decir, este factor rige la
dependencia de la distancia con el tiempo. El valor de 𝐻(𝑡)en el momento actual se designa como 𝐻0 y es
aproximadamente igual a 70 𝑘𝑚 𝑠 −1 𝑀 𝑝𝑐 −1 (con diversas mediciones ligeramente superiores e inferiores,
lo cual es uno de los grandes interrogantes de la Cosmología moderna). De la ecuación 2 se desprende la
relación entre la velocidad relativa entre los dos observadores y la distancia a la que se encuentran como se
puede ver en la ecuación 3 (Friedman, 1922).
𝑣 = 𝐻0 𝐷 𝑒𝑐. 3
Los desplazamientos al rojo medidos se expresan por lo general en términos del parámetro z. Es una práctica
común expresar esta velocidad como una fracción de la velocidad de la luz y usar el parámetro z definido por
la ecuación 4.
𝑣
∆𝜆 1+ 1+𝛽
𝑐
𝑧= 𝜆
=√ 𝑣 − 1 = √1−𝛽 − 1 𝑒𝑐. 4
1−
𝑐
Siendo 𝜆 la longitud de onda emitida y ∆𝜆 la diferencia entre la longitud de onda emitida y observada. El
cálculo de 𝑣/𝑐 a partir de esta expresión da:
𝑣 (𝑧+1)2 −1
𝛽 = 𝑐 = (𝑧+1)2+1 𝑒𝑐. 5
Se puede obtener el factor de escala R del universo en el momento en que la luz fue emitida por un
determinado objeto observado. El parámetro z está relacionado con R por la ecuación 6:
𝜆𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜
1+𝑧 = 𝜆𝑒𝑚𝑖𝑡𝑖𝑑𝑎
𝑒𝑐. 6
Teniendo en cuenta la ley de Hubble el cambio de la distancia en el viaje será proporcional al tiempo t de
𝑣
viaje de la luz, 𝑡 = 𝐷/𝑐 y el redshift será proporcional a 𝐷 = 𝐻 y despenando z de la ecuación 6 se obtiene
0
la ecuación 7.
𝜆𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 −𝜆𝑒𝑚𝑖𝑡𝑖𝑑𝑎 𝐻0
𝑧= 𝜆𝑒𝑚𝑖𝑡𝑖𝑑𝑎
= 𝑐
∙𝐷 𝑒𝑐. 7
En la figura 11 se muestra un esquema que da una idea del cómo se desplazan los picos del espectro en
función de la distancia a la que se encuentra la galaxia.
10
Figura 11: esquema del desplazamiento al rojo en función de la distancia de las líneas de absorción de un espectro.
Por lo tanto, con un espectro de absorción conocido de un suceso que se produzca en la galaxia es suficiente.
Como espectro conocido, o candela estándar, se utilizan las supernovas de tipo Ia ya que todas tienen la
misma luminosidad. Estas explosiones se producen en sistemas binarios cuando una enana blanca acumula
suficiente masa para alcanzar el límite de Chandrasekhar de 1,44 M☉ y colapsa, teniendo todas la misma
luminosidad. Es debido a ello que estas candelas estándar calibran nuestros desplazamientos al rojo, aunque
en un universo en expansión tiene más sentido hablar en términos de desplazamiento al rojo que de
distancias a las galaxias.
Figura 12: SN 2014J es una supernova tipo Ia en la Galaxia del Cigarro (Messier 82) descubierta a mediados de enero de 2014
Como se ha mencionado, en Cosmología es más adecuado hablar de desplazamiento al rojo que de distancia,
ya que la distancia expresada en las fórmulas no es la distancia a la que se encuentra la galaxia de nosotros,
ni cuando fue emitido el fotón, ni cuando observado por el telescopio, sino la distancia recorrida por el propio
fotón. Ello puede generar confusiones conceptuales y es preferible hablar de desplazamiento al rojo. Por
supuesto, la relación entre el redshift y dicha distancia depende de la cosmología asumida (principios
fundamentales y supuestos teóricos que se escojan como correctos).
11
Dos de los modelos más comunes utilizados en cosmología son el modelo de universo plano Lambda-CDM
(Cosmología del CDM con constante cosmológica Lambda) y el modelo de universo en expansión de Einstein-
de Sitter. El modelo utilizado en el presente trabajo es el modelo Lambda-CDM, ya que es el más ampliamente
aceptado y utilizado por la comunidad científica. Es capaz de explicar la existencia y estructura del fondo
cósmico de microondas, la estructura a gran escala de la distribución de galaxias, La expansión acelerada del
universo observado en distantes galaxias y supernovas y las abundancias de elementos primordiales. En este
modelo, en la actualidad, el 70% del universo estaría compuesto por energía oscura. Además, el modelo supone
un universo sin curvatura espacial.
2.4.2 Masa
La masa de una galaxia se mide en unidades de masas solares ( 𝑀☉ = 2 ∙ 1030 𝑘𝑔). Clasificar las galaxias según
su masa es común, teniendo tres categorías principales: galaxias enanas( 𝑀𝑒𝑠𝑡𝑒𝑙𝑎𝑟 < 109 𝑀☉ ), galaxias de masa
intermedia y galaxias masivas ( 𝑀𝑒𝑠𝑡𝑒𝑙𝑎𝑟 > 1011 𝑀☉ ).
La distribución de masa dentro de la galaxia dependerá, por supuesto, de su morfología, al igual que las
relaciones entre la distribución de masa de la galaxia y su perfil de luminosidad. Se debe indicar que la
contribución en masa de la materia oscura es, por lo general, muy superior a la de la materia bariónica (en
general con una proporción de 10 a 1).
La relación entre los ejes y la posición angular son dos medidas muy utilizadas para describir la forma y la
orientación de las galaxias, debido a que su proyección en el cielo es siempre una elipse.
𝑎
El cociente entre los ejes ( ) se refiere a la relación entre los semiejes mayor (a) y menor (b) de una galaxia,
𝑏
esto implica medir qué tan achatada o elongada es su forma. Una relación entre los ejes de 1 indicaría una
forma perfectamente redonda, por el contrario, un valor menor que 1 indica una forma más alargada.
Figura 13: Figura que ilustra los ejes de una galaxia y el “position angle”
Por otro lado, el ángulo de posición o position angle, se refiere a la orientación angular de un objeto en el
cielo, medida desde un punto de referencia. Se mide generalmente en grados, tomando como referencia el
norte celeste y midiendo en sentido horario. Una posición angular de 45 grados significaría, por tanto, que la
forma principal de la galaxia está orientada en dirección noroeste.
12
2.4.4 Luminosidad
Antes de comentar que es la luminosidad en el campo de la Astronomía, se puede definir el flujo de luz
medido por el telescopio como la energía o número de fotones capturados por este dividido por el área de
la apertura del telescopio. Conociendo el flujo, la distancia al objeto y suponiendo que este radia
isotrópicamente, podemos definir la luminosidad mediante la ley de la inversa del cuadrado de la distancia.
𝐿
𝐹 = 4∙𝜋∙𝑟 2 𝑒𝑐. 8
2.4.5 Magnitud
La magnitud o magnitud aparente es una medida que se utiliza para describir cuán brillante aparece un objeto
celeste, ya sea una estrella, un planeta, o galaxia u otro cuerpo astronómico, desde la perspectiva de un
observador en la Tierra. El origen etimológico de magnitud se le atribuye al astrónomo griego Hiparco de
Nicea en el siglo II a.C. debido a su clasificación de los objetos celestes según medidas algo subjetivas
realizadas a simple vista (véase la figura 19).
Hiparco observó el cielo y comenzó a catalogar las estrellas en función de su brillo aparente. En la categoría
de estrellas más brillantes, identificó las estrellas más brillantes como de magnitud 1, las siguientes más
brillantes como de magnitud 2 y así sucesivamente.
13
En 1856 Norman Pogson, Astronomo de Oxford propuso que una escala logarítmica de modo que cinco pasos
de magnitud correspondieran precisamente a un factor de 100 en brillo. Cada intervalo de una magnitud
equivale a una variación de brillo aproximadamente 2,512 veces. En consecuencia, una estrella de magnitud
1 es unas 2,5 veces más brillante que una estrella de magnitud 2, unas 2,52 veces más brillante que una
estrella de magnitud 3, unas 2,53 veces más brillante que una estrella de magnitud 4, y así sucesivamente.
Según la moderna escala logarítmica de magnitudes, dos objetos, uno de los cuales se utiliza como referencia
o línea de base, cuya Flujos (brillos) medidos desde la Tierra en unidades de potencia por unidad de superficie
son F1 y Fref, tendrán magnitudes m1 y mref relacionadas por la siguiente ecuación.
𝐹
𝑚1 − 𝑚𝑟𝑒𝑓 = −2.5 𝑙𝑜𝑔10 (𝐹 1 ) 𝑒𝑐. 9
𝑟𝑒𝑓
A menudo, los objetos de referencia son bien conocidos, y por tanto, se usan relaciones estándar que se llaman
zeropoint.
Es importante entender que la Luminosidad es un concepto diferente al del brillo o flujo; mientras que el
brillo depende fundamentalmente de la distancia a la que nos encontramos de un determinado objeto, la
luminosidad es una propiedad física intrínseca de la estrella.
A partir del perfil de brillo de una galaxia se puede saber cómo varía su brillo a medida que te alejas del
centro. Estos perfiles resultan de un promedio acimutal del ajuste de las isofotas de una galaxia mediante
elipses permitiendo, o no, variar la elipticidad y el ángulo de posición. Una vez realizadas las isofotas, se
promedia el flujo dentro de dichas isofotas elípticas concéntricas. Siguiendo la siguiente fórmula para la
obtención del brillo superficial:
𝑎𝑟𝑐𝑠𝑒𝑐
Siendo 𝐹̅ el flujo promedio y 𝑝𝑥 la escala del pixel en unidades de 𝑝𝑖𝑥 1
Esto no es un proceso simple, se deben aplicar diferentes técnicas para eliminar las galaxias vecinas, los
brazos espirales, las barras o regiones de intensa formación estelar, y permitir un mejor ajuste del disco.
1 Por lo tanto, el resultado final de esta fórmula vendrá dado en unidades de magarsec-2
14
Del perfil de brillo de una galaxia se pueden obtener muchas propiedades de ella. Por ejemplo, se puede
distinguir entre galaxias espirales y galaxias elípticas ya que el perfil de las galaxias elípticas tiene una
variación en su perfil de brillo más brusca, con una mayor concentración central de brillo. Ello dio lugar a las
leyes de de Vaucouleurs (1948) y de Freeman (1970).
También existen diferencias entre bulbos y elípticas. Aunque ambos se puedan ajustar por la misma ley, los
bulbos son menos densos y luminosos que las elípticas y, a igual luminosidad, el brillo superficial de los bulbos
es menor y su radio característico menor que el de las elípticas, por lo tanto, se da el caso que los perfiles de
luminosidad a lo largo del eje menor del bulbo se ajustan peor a una ley de de Vaucouleurs que se describirá
a continuación.
La Ley de de Vaucouleurs se ajusta bien al perfil de brillo de las galaxias elípticas o los bulbos de galaxias
espirales, también se llama ley del “radio a la ¼”.
1⁄
𝑟 4
𝜇(𝑟) = 𝜇𝑒 + 8.3268 [(𝑟 ) − 1] 𝑒𝑐. 12
𝑒
Donde µ es la magnitud superficial (en magnitudes por segundo de arco al cuadrado), µe es la magnitud a una
distancia re del centro, que a su vez es el radio que contiene la mitad de la luminosidad total. A esta cantidad
se le llama radio efectivo.
La Ley de Freeman se ajusta a los perfiles de luminosidad de las partes más externas de las galaxias espirales,
es decir, el disco.
𝑟
𝜇(𝑟) = 𝜇0 + 1,09 ( ) 𝑒𝑐. 13
𝑟0
Donde µ0 es la magnitud extrapolada al centro del disco y 𝑟0 la longitud de escala del disco.
Función de Sersic
La función de Sersic es una medida utilizada en Astronomía para describir la distribución de luz en una galaxia,
siendo la generalización de los perfiles de Vancouleurs y de Freeman. Fue propuesto por el astrónomo
argentino José Luis Sersic en 1968 ("The Contribution of Jose Luis Sersic to Celestial Mechanics," [Link],
2014) y es el parámetro que se utiliza de forma más común para caracterizar el perfil de brillo superficial de
las galaxias en la actualidad.
1
𝑅 ⁄𝑛
−𝑏𝑛 (( ) −1)
𝑅𝑒
𝐼(𝑅) = 𝐼𝑒 𝑒 𝑒𝑐. 14
15
Donde 𝐼𝑒 es la intensidad con el radio efectivo 𝑅𝑒 que envuelve la mitad de la luz total del modelo. La
constante 𝑏𝑛 está definida como 𝑏𝑛 = 2𝑛 − 0.324 , siendo la variable n un parámetro llamado índice de
Sérsic que describe la forma del perfil de luminosidad. En la siguiente figura se pueden perfiles brillo con
diferentes índices de Sersic.
Figura 15. Grafica de la ecuación 12 para diferentes valores de n (Haeuster ct al. 2007)
Observe que cuanto mayor es el valor del índice de Sérsic, más apuntado es el núcleo central y más extendido
el ala exterior. Una n baja tiene un núcleo más plano y un ala menos prominente. Los valores grandes del
índice Sérsic son muy sensibles a las incertidumbres en la determinación del nivel del fondo del cielo debido
a las alas extendidas.
Estos son los parámetros que caracterizan a las galaxias en la base de datos creada. El tipo morfológico se
correlaciona con multitud de propiedades de las galaxias como, por ejemplo, la tasa de formación estelar,
cantidad de gas, la relación masa luminosidad, el ratio, etc … , esto quiere decir que la evolución de cada tipo
debe ser parecida. A pesar de ello, las propiedades de las galaxias cubren un amplio rango y la dispersión de
los datos es considerable. Esto implica que los procesos evolutivos deben ser complejos y quizás se puede
obtener una galaxia de un determinado tipo de “varias formas”. Las leyes matemáticas que siguen los perfiles
de brillo nos ayudan a saber qué podemos esperar en las visualizaciones que llevemos a cabo en este TFM.
2.5 Truncaciones
Podemos considerar una truncación de una galaxia como su borde. Sin embargo, visualmente no es posible
determinar con precisión dónde se encuentra dicho límite, ya que una imagen u observación de una galaxia
puede ser afectada por objetos celestes adicionales y carecer de profundidad debido al tiempo de exposición
limitado o, incluso, puede no estar reducida adecuadamente. Además, no se puede identificar de antemano
un punto específico donde la galaxia deja de emitir, sino que la cantidad de estrellas disminuye, más o menos,
gradualmente. Por lo tanto, el enfoque principal para encontrar dicho límite es analizar el perfil de brillo de
la galaxia y determinar el punto donde hay una disminución significativa en el brillo. Estas áreas generalmente
tienen magnitudes muy bajas, lo que convierte la búsqueda de la truncación en un desafío relacionado con
el bajo brillo superficial. Para resolverlo adecuadamente, se requieren telescopios capaces de detectar brillos
cada vez más tenues.
16
Es importante saber que en las galaxias espirales Los discos a veces presentan truncaciones como cambios
de pendiente en sus perfiles de luminosidad, lo que hace necesario dos exponenciales para reproducir los
perfiles de brillo superficial. Las razones para la existencia de estos truncamientos no están claras, pero se
piensa que están relacionadas con la eficiencia de la formación estelar solo hasta un cierto radio determinado
por la densidad de gas en el momento en que ocurre el último estallido de formación estelar del disco.
2.6 CCD
En los últimos apartados del desarrollo teórico se hablarán sobre ámbitos propios de las observaciones como
son la CCD del telescopio y los filtros que se aplican para procesar la luz captada.
Una CCD (Charge-Coupled Device), o dispositivo de carga acoplada, es un circuito integrado sensible a la luz
que captura imágenes mediante la conversión de fotones a electrones por efecto fotoeléctrico que viene
dada por la siguiente expresión:
ℎ ∗ 𝑓 = Φ + 𝐸𝑘 𝑒𝑐. 15
donde h es la constante de Planck, f es la frecuencia de corte o frecuencia mínima de los fotones para que
tenga lugar el efecto fotoeléctrico, Φ es la función de trabajo, o mínima energía necesaria para llevar un
electrón del nivel de Fermi al exterior del material y Ek es la máxima energía cinética de los electrones que se
observa experimentalmente.
Una CCD está estructurada como una matriz bidimensional de píxeles fotosensibles que convierten la luz en
señales eléctricas. Estos píxeles son sensibles a diferentes longitudes de onda de la luz, lo que permite
capturar imágenes en distintos rangos espectrales. Cuando la luz incide sobre esta, los fotones son
absorbidos por los píxeles fotosensibles, generando electrones que se almacenan en cada píxel. Su gran uso
en Astronomía se debe a su alta sensibilidad, baja cantidad de ruido y capacidad para registrar imágenes de
alta resolución. Son especialmente útiles en la detección de objetos débiles en el cielo, como estrellas,
galaxias, nebulosas y otros fenómenos astronómicos.
En el caso de los detectores CCD, el material utilizado es generalmente silicio. Una vez que se libera un
electrón, se utiliza una estructura de potencial eléctrico en forma de pozos para atrapar y controlar el
movimiento de los electrones liberados. Los electrones generados por los fotones se desplazan a través de
una matriz bidimensional de píxeles del CCD, de un píxel al siguiente, mediante un proceso llamado
transferencia de carga acoplada. Esto se logra aplicando secuencias de voltajes a los electrodos presentes en
su estructura. Después de un período de exposición determinado se mide la cantidad de carga eléctrica
acumulada en cada píxel. Esta carga eléctrica capturada es proporcional a la cantidad de luz incidente en
cada píxel. Luego, la carga almacenada se convierte en una señal de voltaje analógica proporcional mediante
una etapa de lectura y se digitaliza utilizando un convertidor analógico-digital (ADC), lo que resulta en una
imagen digital.
Cuando se sobrepasa la carga que se puede acumular en el pozo de potencial el píxel se satura provocando
que la carga desborde a píxeles vecinos. El tratamiento de los pixeles saturados es fundamental en el estudio
de imágenes cosmológicas como veremos posteriormente. En la figura 16 se puede ver la CCD de Megacam,
la cámara de campo amplio montada en el Telescopio Canadá-Francia-Hawái,
17
Figura 16: Imagen de la CCD de la cámara Megacam
Uno de los parámetros que se utiliza para valorar la calidad de un CCD es la eficiencia cuántica refiriéndose
a la capacidad del CCD para convertir los fotones de luz incidente en carga eléctrica de manera eficiente. Es
una medida de la proporción de fotones que son detectados en comparación con el número total de fotones
incidentes. Puede variar con la longitud de onda de la luz (respuesta espectral del CCD). Por lo general, hay
diferentes tipos de CCD dependiendo del rango espectral que se quiera investigar, por ejemplo, en el
espectro visible, donde los fotones de luz tienen longitudes de onda entre aproximadamente 400 y 700
nanómetros. Los CCD modernos utilizados en telescopios astronómicos pueden tener eficiencias cuánticas
que van desde alrededor del 50% hasta más del 90% en la región visible del espectro.
2.7 Filtros
En Astronomía, se utilizan diversos filtros fotométricos para estudiar y caracterizar objetos celestes en
diferentes longitudes de onda. Estos filtros son dispositivos ópticos que permiten el paso selectivo de
determinadas longitudes de onda de la luz y bloquean otras. Al utilizar diferentes filtros, los astrónomos
pueden obtener información específica sobre las características y propiedades de los objetos observados
para un determinado rango de longitud de onda en particular. A continuación, se mencionan algunos de los
filtros de luminosidad más comunes utilizados en Astronomía:
2. Filtros de tipo Johnson - Cousins: los filtros fotométricos más comunes son los que corresponden a
los colores azul (B), verde (V) y rojo (R), con los que se pueden realizar imágenes a color RGB.
3. Filtro de banda ancha: ( Δ𝜆 > 100 𝑛𝑚) Estos filtros permiten el paso de una amplia banda de
longitudes de onda, abarcando varias regiones del espectro. Los filtros de banda ancha se utilizan
para obtener imágenes en colores ampliamente utilizados, como el azul, verde y rojo.
4. Filtro de infrarrojo cercano (NIR): Este tipo de filtro permite el paso de la luz en el rango del espectro
infrarrojo cercano. La observación en el infrarrojo cercano es útil para estudiar objetos celestes con
poblaciones estelares viejas y enrojecidas.
18
5. Filtro de ultravioleta (UV): Estos filtros permiten el paso de la luz ultravioleta. La observación en el
ultravioleta es útil para estudiar la radiación emitida por estrellas jóvenes.
Figura 17: Esquema de las transmitancias en función de la longitud de onda de cada uno de los filtros más usados del telescopio
espacial Hubble (HST de sus siglas en inglés).
Se estiman 2 billones de galaxias solamente en el universo observable. Los cartografiados de galaxias digitales
típicas generan aproximadamente 1 PB de datos, además de una cantidad comparable de productos de datos
derivados. Se espera que en un futuro cercano se generen conjuntos de datos del orden de los exabytes (por
ejemplo, el telescopio SKA). En la actualidad, la Astronomía cuenta con más de 100 PB de datos archivados y
genera más de 100 TB al día. Tanto los volúmenes de datos como las tasas de generación de datos crecen de
manera exponencial, con un tiempo de duplicación de aproximadamente 1.5 años. Sin embargo, aún más
importante es el crecimiento en la complejidad de los datos. Los cartografiados modernos del cielo obtienen
alrededor de 1015 − 1016 bytes de imágenes catalogan alrededor de 1016 objetos (estrellas, galaxias, etc.)
y realizan mediciones de alrededor de entre 100 y 1000 cantidades para cada objeto. Estas cifras representan
el impresionante volumen de datos recopilados en archivos tabulados, lo que demuestra la magnitud de la
información astronómica que se está generando y procesando en la actualidad. Hoy en día, incluso la teoría
se expresa en forma de datos provenientes de simulaciones numéricas, en lugar de limitarse a un conjunto
de ecuaciones. Esto destaca la creciente relevancia de los enfoques basados en datos para comprender y
validar teorías científicas en diversos campos de estudio.
Afortunadamente la evolución en las herramientas de tratado de datos y los lenguajes de programación han
crecido de forma paralela. Se han creado grandes bibliotecas por la comunidad en lenguajes de alto nivel
(fácil de interpretar por humanos) como puede ser Python. Crear un código eficiente para la interpretación
de datos en una biblioteca actual se puede realizar en poco tiempo para un físico con experiencia que se
mantenga actualizado en esta materia.
19
3. Desarrollo experimental
Se iniciará el desarrollo experimental describiendo el telescopio del que se han obtenido los datos y el banco
de datos utilizado. A continuación, se describirá el software desarrollado y se finalizará mostrando algunas
búsquedas y relaciones realizadas mediante la aplicación que ha sido generada.
El telescopio espacial Hubble fue lanzado en 1990 y es operado por la NASA y la Agencia Espacial Europea. El
Hubble ha sido diseñado para capturar imágenes y recopilar datos científicos en longitudes de onda que
abarcan desde el ultravioleta hasta el infrarrojo cercano y ha sido clave en numerosos descubrimientos
astronómicos, como el cálculo de la constante de Hubble.
Cuenta con un espejo principal de 2,4 metros de diámetro para recoger la luz que está hecho de vidrio
cerámico de baja expansión térmica recubierto con una delgada capa reflectante de aluminio. Además,
cuenta con un espejo secundario que ayuda a enfocar la luz. El espejo secundario es más pequeño, con un
diámetro de aproximadamente 0,3 metros. También está equipado con cámaras de alta resolución,
espectrógrafos para analizar la composición de la luz, y detectores de luz ultravioleta e infrarroja. Para
mantener su orientación de forma precisa en el espacio cuenta con giroscopios y paneles solares que
proporcionan la energía necesaria para su funcionamiento. También cuenta con sistemas de control térmico
para mantener las temperaturas estables y evitar que los componentes se calienten o enfríen en exceso.
Una de las principales ventajas de este tipo de telescopio es que opera en el espacio, donde no se ve afectado
por la atmósfera terrestre, lo que permite obtener imágenes más claras y detalladas que los telescopios
terrestres. O sea, su revolución espacial está solo limitada por difracción. Además, su órbita alrededor de la
Tierra le permite observar el Universo de manera continua y evitar la interferencia de la luz y la
contaminación atmosférica. En la siguiente imagen se puede observar cómo interacciona la atmosfera con la
radiación exterior modificando el espectro solar.
Figura 18: comparación entre el espectro que llega a la atmosfera (naranja) y el que llega a la superficie terrestre una vez
interaccionar con la atmosfera (en arcoíris y negro).
20
3.2 Base de datos
Como se ha mencionado anteriormente, las observaciones han sido realizadas con el telescopio Hubble. Con
sus cámaras ACS y WFC3. El lugar del universo donde hacia donde apunta el Hubble es decidido por equipos
de astrónomos tras realizar una propuesta experimental dentro de un proyecto. Después los datos recogidos
son también accesibles públicamente. Los datos utilizados en este trabajo fueron los obtenidos dentro del
proyecto CANDELS.
CANDELS es el cartografiado de galaxias (survey en inglés) más grande realizado con el Telescopio Hubble.
Dentro de este proyecto se han estado estudiando imágenes del Universo distante durante tres años y
recopilando datos de más de 250.000 galaxias.
En este trabajo se han escogido solo galaxias cuya masa solar o masa bariónica fuese mayor a 1010 M☉ y se
encontraran a un desplazamiento al rojo menor que 1.1. Uno de los motivos más destacables de haber
seleccionado este base de datos viene del buen equilibrio entre área observada y la profundidad de las
observaciones. Esto permite que las mediciones sean de calidad suficiente y el número de muestras
suficientemente grande. En la tabla 1 se muestran los filtros utilizados.
Tabla 1: Filtros con los que cuenta la base dedatos. Cada filtro tiene asociado un perfil de brillo correspondiente.
En esta nomenclatura F significa "filter" y W "wide" ya que son filtros anchos en comparación con los que
sólo miden líneas de emisión por transiciones atómicas como podría ser un filtro 𝐻𝛼 . Es común llamar a los
filtros con una única letra, viniendo el nombre de una clasificación de filtros llamada Jonhson-Cousins. Más
información de los filtros se puede encontrar en el repositorio Filter Profile Service dentro de la página web
del SVO (Spanish Virtual Observatory) cuya referencia se puede encontrar en la bibliografía.
Los campos o regiones de observación dentro del cartografiado CANDELS se describen en la siguiente tabla
junto con algunos datos relevantes de cada campo.
21
EGS 2013-May-23 / 2013- R.A. = 214.825, Dec. =
May-27 +52.825 (J2000)
De las 1048 galaxias iniciales 255 pertenecen al campo COSMOS, 196 al campo EGS, 287 al campo GOODS -
N, 159 al campo GOODS – S y 151 al campo UDS. Únicamente los campos GOODS – S tiene perfiles de brillo
en los seis filtros, el resto de campos no tienen perfiles de brillo ni en los filtros B e Y, por lo tanto, el número
total de perfiles de brillo en la base de datos es 4510.
El número de galaxias registradas en la base de datos era mucho mayor que el que se ha utilizado para este
trabajo. La selección de que galaxias era conveniente quitar o mantener en la base de datos ha sido realizada
por mi tutor de forma anterior. Los criterios utilizados se pueden encontrar en el artículo Strong size evolution
of disc galaxies since z=1 Readdressing galaxy growth using a physically-motivated size indicator en la sección
2 Data and sample selection criterio, cuya referencia se encuentra en la bibliografía, aunque, a continuación,
se van a hacer un breve comentario sobre dichos criterios.
Los criterios aplicados tienen la finalidad de obtener un conjunto de galaxias cuyas observaciones tuviesen
los perfiles de brillo suficientemente definidos como para poder aplicar un procesamiento efectivo. El primer
paso aplicado fue eliminar las galaxias cuyo ruido fuese grande en relación la señal obtenida. A continuación,
se descartaron las galaxias con masa menor a 1010 M☉ y cuyo desplazamiento al rojo fuese mayor que 1,1
quedándose únicamente con 2192 objetos, con ello se eliminaban galaxias pequeñas donde la distancia entre
el centro y la truncación es menor. Tras aplicar diferentes técnicas de machine-learning se seleccionaron
objetos donde predominara la estructura de disco, permaneciendo únicamente 1442 galaxias de disco.
Posteriormente se eliminaron 158 galaxias que estaban interactuando con otras galaxias, lo que generaba
unos bordes más difusos. Se eliminaron 101 galaxias por carecer de imágenes en F606W o bandas F814W.
Se descartaron otras 76 galaxias por contener imágenes ruidosas o estar ubicadas cerca de los límites del
estudio, otras 28 galaxias extremadamente compactas ya que tenían una extensión visual inferior a 5 kpc y,
cuyos perfiles de brillo superficial no permitían la identificación de un borde. Ya que el estudio está enfocado
a galaxias con estructura de disco, se eliminaron 17 identificadas como galaxias elípticas. Se eliminaron 5
galaxias con píxeles con valores extraños. Además, se descartaron los datos por considerarse como errores
en la base de datos de 4 estrellas identificadas como galaxias, 4 galaxias con colores no realistas y un defecto
en la imagen.
22
3.3 Software desarrollado
- Plotly: Para crear las gráficas se eligió inicialmente Matplotlib. Esta biblioteca muy potente y
perfectamente acoplada con Python y Numpy, esta dotada de una amplia variedad de posibilidades
para la visualización de los datos, customización de las gráficas y su uso es muy sencillo. Sin embargo,
su funcionamiento dentro de la aplicación junto a Streamlit no cumplió algunos de los objetivos,
especialmente las herramientas de navegación dentro de las gráficas. Debido a ello se buscaron y
probaron diferentes bibliotecas de generación de gráficas compatibles con Streamlit. De todas ellas
se eligió Plotly. Esta biblioteca creada en el año 2012 ofrece características similares a Matplotlib, sin
embargo, las herramientas de navegación dentro de Streamlit funcionan mucho mejor y las las
gráficas obtenidas aparecen notablemente más limpias, lo cual se hace indispensable en el análisis
visual de los perfiles de luminosidad.
Entre otras bibliotecas de procesamiento de datos utilizadas cabe destacar Astropy y SciPy. Astropy es una
biblioteca que contiene una serie de funciones muy útiles dentro de los campos de Astronomía y Astrofísica.
Spicy es una biblioteca que se utiliza para realizar cálculos científicos y técnicos. En concreto se ha utilizado
el módulo Optimize enfocado en problemas de optimización numérica, minimización y maximización de
funciones para realizar regresiones dentro de la página Regressions.
Para la visualización de las galaxias se ha desarrollado un programa que permite navegar por la base de
datos de forma rápida y sencilla. A continuación, se presenta el software y su funcionamiento.
23
Figura 19: Imagen de la página inicial de la aplicación. Desde el panel lateral de la izquierda se puede acceder a cada una de las
páginas.
3.4.2 Data
En ella se puede visualizar los principales datos cargados en la base de datos en una tabla como la que
aparece en la figura número 20.
Figura 20: Imagen de la página Data, en ella se puede realizar scroll por el fichero principal de la base de datos.
Esta tabla se visualizará en la parte superior de la mayor parte de las páginas de la aplicación. A
continuación se describe cada uno de los campos de la cabezera:
24
Campo Descripción
n Indice de sersic
Tabla 3: Tabla descriptiva con cada uno de los parámetros del fichero principal de la base de datos.
3.4.3 Search
En esta página se puede buscar de forma rápida si una determinada galaxia se encuentra en la base de
datos a partir de su número identificativo con el panel que se sencuentra en el lateral del la página y se
puede observar en la figura 20.
Figura 20 y 21: A la izquierda se puede ver una imagen del panel de búsqueda de la página Search. A la derecha panel desplegable
donde se pueden ajustar los ejes y seleccionar las unidades del eje de abscisas.
25
3.4.4 Regressions
En esta pagina puedes realizar diferentes tipos de regresiones pinchando en los puntos de las gráficas para
identificar mejor los cambios de pendiente en las partes extremas de las galaxias. Además de contar con un
panel como el mostrado en la figura 20 para seleccionar la galaxia, cuenta con un panel como el de la figura
22 Para elegir el tipo de regresión que se realiza.
Normal: Al elegir Normal en la configuración se realizará una regresión a los datos entre los datos
seleccionados en la gráfica. La forma de seleccionar los puntos será pinchando en la gráfica.
Double: Tras seleccionar tres puntos en la gráfica, pinchando en ella en tres sitios diferentes, se realizaran
dos regresiones, una entre el punto más a la izquierda y el punto del medio y ortra entre el punto del medio
y el punto más al punto de la derecha.
En ambos modos al pincha en la gráfica aparecerá una tabla en el panel lateral con los valores x e y de los
puntos seleccionados según se van pinchando.
Nada más seleccionar el número de punto necesarios aparecerá una gráfica acotada al intervalo
comprendido por dichos puntos. Si la opción lineal ha sido seleccionada apareceran las rectas de ajustes
lineales.
𝑦 =𝑎∙𝑥+𝑏 𝑒𝑐. 16
𝑦 = 𝑎 ∙ 𝑒 𝑏∙𝑥 + 𝑐 𝑒𝑐. 17
26
En ambos casos aparecerá una tabla en el panel lateral con los parametros de ajuste de las regresiones
seleccionadas. Para el ajuste lineal apareceran los valores a y b de la ecuación 16. Para el ajuste exponencial
apareceran los valores a, b y c de la ecuación 17. En caso de no seleccionar ninguna no apareceran los datos
unicamente.
El funcionamiento puede ser un poco confuso. Se puede ver un ejemplo de su funcionamiento en la sección
3.5.4
3.4.2 Filters
En esta página se pueden filtrar los datos de la base de datos según los siguientes parámetros explicados en
el desarrollo teórico. En la siguiente tabla se pueden ver dichos parámetros, una pequeña descripción y en
rango máximo por el que se pueden filtrar.
Tabla 4: Tabla descriptiva con cada uno de los parámetros que se pueden filtrar.
Los valores máximos y mínimos permitidos en los filtros no se han seleccionado según algún criterio concreto,
el código detecta automáticamente los valores máximos y mínimos encontrados entre los parámetros de
todas las galaxias del banco de datos. El paso entre los filtros es 0.01 y los valores de los extremos también
entran dentro del rango.
Se da la opción de visualizar las gráficas en diferentes disposiciones para poder realizar comparaciones de
una forma efectiva. A continuación, se muestra la pantalla y se describe brevemente sus características.
27
Figura 23: Imagen de la página Filters, página principal de la aplicación para el procesamiento de datos.
El panel de la izquierda hay cuatro paneles desplegables que permiten filtrar las galaxias y elegir la disposición
de las gráficas. En las imágenes que aparecen a continuación se muestran desplegados los paneles Fields y
Filters.
Figuras 24 y 25: Imágenes de los paneles desplegables de la página Filters, a la izquierda el panel que permite seleccionar los
campos de la base de datos. A la derecha panel que permite elegir los filtros que se quieren visualizar.
En el panel de la imagen 24 se pueden elegir los campos de la base de datos que se quieren elegir. En el panel
de la derecha se pueden seleccionar los filtros que se desean visualizar. En ambos paneles por defecto están
todas las opciones seleccionadas.
El panel desplegable inmediatamente debajo permite elegir entre los diferentes tipos de visualización,
permite elegir las unidades en que se representan en el eje de abscisas (segundos de arco o kiloparsec) y da
28
la opción de fijar unos límites de los ejes predeterminados de entrada por si no se quiere visualizar todos los
datos, lo cual puede ser de gran ayuda para eliminar datos donde predomina el ruido.
Figuras 26 y 27: imágenes del panel Plots layout, a la derecha el mismo panel con la barra de opciones Plots Type desplegada.
- Filters together: se grafican todos los filtros de cada galaxia juntos. Esto permite compararlos de una
forma visual.
- Galaxies together: se grafican por separado cada una de las gráficas al igual que en el caso anterior,
pero agrupa todos los filtros de cada galaxia seleccionada agrupados en una multiplot.
- Plot by filters: se realiza una gráfica de cada uno de los filtros seleccionados con los datos de todas
las galaxias que han sido filtradas.
Debajo de la tabla con los datos de la base de datos aparece otra tabla con el valor medio de cada una de las
columnas de valores numéricos. Dicho valor medio tiene en cuenta únicamente las columnas filtradas y se
calcula automáticamente al cambiar los parámetros de los filtros. He aquí un ejemplo.
Figura 28: Tabla con el valor medio de cada una de las columnas con parámetros numéricos
29
3.5 Visualización de truncaciones
En esta sección se expondrán gráficas de diferentes filtrados del base de datos y se compararán los
resultados, con ello se mostrará la utilidad de la aplicación para realizar análisis de datos.
Se expone como primer caso una sola galaxia. Se sabe que tiene un truncación bien definida (dicha galaxia
se identifica como 18389 GOODS N) y se conocen algunas de sus características. Para seleccionarla a ella sola,
se conoce que el ratio entre sus ejes es cercano a la unidad y que tiene un índice de Sersic muy elevado, es
decir, conocemos características de la curvatura de su perfil de luminosidad. Por todo ello se propone el
siguiente filtrado:
Con ello de las 1048 galaxias iniciales se ha conseguido filtrar todas hasta quedar únicamente la galaxia
buscada. Se elije que se muestren los datos de todos los seis filtros de luz disponible y se selecciona la opción
de mostrar todos los filtros juntos. En el eje x se elige que la distancia se muestre en kiloparsec [kpc].
Tras una primera inspección visual se decide restringir el radio del eje x (0-35 kpc) para eliminar la parte de
la gráfica donde solo se observa el ruido residual fuera de la galaxia. También se ajusta el eje y (17-31 mag)
ya que es el rango en el que se encuentran contenidos los valores. Como se puede observar en la figura 29
este procesamiento permite seleccionar la parte más relevante de las gráficas.
30
Figura 29: Gráfica con todos los filtros de la galaxia 18389 GOODS-N juntos (“V” en azul oscuro, “I” en azul claro, “J” en rojo, “H” en
verde). En el eje de abscisas la distancia [kpc], en el eje de ordenadas el brillo [mag/arcseg 2]. Las rectas verticales izquierda y
derecha muestran el radio efectivo y el radio de la truncación respectivamente.
Se puede observar en todos los filtros de forma bien definida la truncación, pero de forma más pronunciada
en el filtro V. Debido a ello se decide graficar por separado los datos de dicho filtro seleccionando la opción
Separated. El resultado se puede ver en la figura 30. Se puede observar que el eje de coordenadas está en
unidades de magnitudes y es por tanto logarítmico. O sea, pequeñas variaciones allí son en realidad grandes
variaciones de flujo.
Figura 30: Gráfica con únicamente el filtro V de la mismas galaxia de las figuras anteriores. En el eje de abscisas la distancia [kpc],
en el eje de ordenadas el brillo [mag/arcseg2].
31
En el anexo 1.A se muestran diferentes imágenes de esta misma galaxia generadas con el programa, Además
en dicho anexo se muestran las gráficas de las siguientes galaxias donde se han encontrado truncaciones muy
marcadas. Es importante destacar que para la determinación de las truncaciones no es suficiente con tener
únicamente los perfiles de luminosidad, sino que, además, se necesitan las imágenes (para tener una idea
intuitiva de la localización del disco), y los perfiles de color y de masa. (Chamba et al. 2022, Buitrago et. el.
2023 in press).
En el anexo B se pueden encontrar más ejemplos de perfiles de luminosidad con truncaciones claras a simple
vista generadas con esta aplicación.
En el siguiente ejemplo se busca encontrar una truncación que se vea claramente marcada a simple vista
entre galaxias que cumplan una serie de parámetros.
Se buscar una galaxia que tenga una relación entre los ejes cercana a la unidad y que su perfil de brillo venga
dado por un índice de Sersic entre 5 y 6. Además se busca que no sea una galaxia cercana. También se buscar
acotar un poco el rango del radio de las galaxias para que se puedan comparar mejor los perfiles, ello se
consigue ajustando el parámetro Radius interval. Por lo tanto se ajustan el rango de los filtros según se
propone a continuación:
Tras el filtrado solo permanecen 4 galaxias que cumplen dichas condiciones como se puede ver en la figura
31.
32
Figura 31: Resultado del filtrado resultando únicamente tres galaxias que se pueden ver en la tabla superior. En la tabla inferior se
puede ver el valor medio de los parámetros de las galaxias resultantes.
La disposición que se elige para comparar las galaxias y ver en cuál se aprecia mejor la truncación es Plot by
Filters. Se decide representar el eje x en arcosegundos de radio. Tras una primera visualización se decide
ajusta el eje x entre los valores 0 y 3 arcsec para eliminar la parte de las gráficas donde predomina el ruido.
También se decide ajustar el eje de ordenadas entre 20 y 30 mag ya que todo el rango de perfiles de
luminosidad se ve acotado por dichos valores y quitar los filtro Y y B ya que únicamente una galaxia contiene
datos en dichos filtros.
Los resultados se muestran en las figuras 32 y 33 (se muestran los filtros I e V ya que en los rangos de mayor
frecuencia es donde se aprecia mejor la truncación).
Figura 32: Gráfica con el perfil de brillo del filtro V de todas de las galaxias filtradas (“6379 GOODS-N” en azul oscuro, “9969
GOODS-N” en azul claro, “5960 GOOD-S” en rojo). En el eje de abscisas la distancia [kpc], en el eje de ordenadas el brillo
[mag/arcseg2].
33
Figura 33: Gráfica con el perfil de brillo del filtro I de todas de la galaxias filtradas (“6379 GOODS - N” azul oscuro, “9969 GOODS -
N” en azul claro, “5960 GOODS - S” en rojo). En el eje de abscisas la distancia [kpc], en el eje de ordenadas el brillo [mag/arcseg 2].
Del resultado se observa que la galaxia 9969 GOODS - N es la que tiene la truncación más marcada y se
muestra una gráfica de dicha galaxia con todos sus filtros.
Figura 34: Gráfica con todos los filtros de la galaxia 6379 GOODS - N juntos (“V” en azul oscuro, “I” en azul claro, “J” en rojo, “H” en
verde). En el eje de abscisas la distancia [kpc], en el eje de ordenadas el brillo [mag/arcseg 2]. Las rectas verticales izquierda y
derecha muestran el radio efectivo y el radio de la truncación respectivamente.
34
3.5.3 Galaxia 8221 UDS
A continuación, se mostrará el funcionamiento la página Regressions. Para ello se harán regresiones a los
datos del perfil de brillo del filtro V de la galaxia 88221 UDS antes y después de la truncación.
Utilizamos la página Seach para buscar directamente el perfil de brillo de la galaxia ya que es la que procesa
los cambios de forma más rápida. Se ajustan los ejes para obtener una gráfica del perfil de brillo se muestra
en la figura 35.
Figura 35: Gráfica del perfil de brillo en el filtro V de la galaxia 8221 UDS. En el eje de abscisas la distancia [kpc], en el eje de
ordenadas el brillo [mag/arcseg2].
A continuación, en la página Regressions se realizan dos regresiones lineales antes y después de la truncación
utilizando el modo Normal. La primera se ajustan los datos entre los puntos 𝑥 = 8,5 y 𝑥 = 14,5. El resultado
se muestra en la figura 36.
Figura 36 : Regresión lineal del perfil de brillo en el filtro V de la galaxia 8221 UDS entre los puntos x=[8,5 y 14,5]. En el eje de
abscisas la distancia [kpc], en el eje de ordenadas el brillo [mag/arcseg 2].
35
A continuación, se realiza otra regresión a partir de la truncación entre los puntos 𝑥 = 14,5 y 𝑥 = 29,5.
Figura 37: Regresión lineal del perfil de brillo en el filtro V de la galaxia 8221 UDS entre los puntos x=[14,5 y 29,5]. En el eje de
abscisas la distancia [kpc], en el eje de ordenadas el brillo [mag/arcseg 2].
Siendo los resultados de la regresión lineal antes de la trucación 𝑎 = 0.05 y 𝑏 = 27.26 y los resultados de la
regresión lineal después de la truncación 𝑎 = 3.04 𝑦 𝑏 = 21.23, viendo a y b dados según la ecuación 16.
Se puede observar un cambio claro en el parámetro a antes y después de la truncación, siendo después de
la truncación la pendiente mucho menos pronunciada.
4. Conclusiones
En este TFM se ha trabajado con 1048 galaxias lo que equivale a 4510 perfiles de brillo. Esta base de datos
no es muy grande en términos del campo de la Astronomía e, incluso así, el análisis de tal cantidad de datos
por medios convencionales se hace muy difícil.
Se hace necesario el Big Data como herramienta de gestión de estas grandes cantidades de datos
semiestructurados, siendo una de sus grandes ventajas la facilidad para acceder a ella por cualquier persona.
En este aspecto, Python se presenta como uno de los lenguajes de programación abiertos más potentes,
ofreciendo una serie de herramientas para realizar una aplicación para el análisis de datos de forma rápida.
La gran flexibilidad de Python y la gran cantidad de bibliotecas disponibles en la red es una ventaja a la hora
de personalizar las características necesarias para el estudio frente a los softwares comerciales ya
desarrollados. Además, la simplicidad de este lenguaje hace que no haga falta mucho tiempo de aprendizaje.
36
Por otro lado, esta misma flexibilidad y la gran cantidad de opciones disponibles, hace que sea necesario
realizar un estudio previo de las bibliotecas que mejor se ajustan al estudio, aunque, una vez elegidas, la
creación de la aplicación es muy rápida.
La aplicación creada ha cumplido de forma muy exitosa los objetivos propuestos al inicio del trabajo: el
filtrado de datos es eficaz, la generación de las gráficas es rápida y sencilla, la aplicación es de fácil uso, la
gama de posibilidades a la hora de presentar los datos en grande y una vez generadas las gráficas se puede
navegar por ellas de forma eficaz.
Otra de los puntos positivos en el presente trabajo ha sido la estructuración del código. Esta estructuración
del código permite una fácil escalabilidad de la aplicación abierta a trabajos futuros de otros estudiantes.
Entre las propuestas de mejora mencionar los siguientes puntos:
- Realizar una importación más abierta de los bancos de datos de forma que no se restrinja únicamente
a la base de datos con la que se ha trabajado en este TFM y permitir que la importación se realice
desde la propia aplicación.
- Generar nuevo código que realice cálculos, enfocados a trabajar con este tipo de bases de datos,
para la relacionar los parámetros de diferentes perfiles de Brillo. Ese código se podría estructurar
como un módulo externo que sería importado desde la aplicación.
- Hay muchos estilos de gráficas que se repiten en varias páginas, si se quiere cambiar algo del formato
o presentación de las gráficas se requiere cambiarlo en diferentes partes de diferentes Scripts,
llevando mucho tiempo y siendo muy tedioso. Creando un módulo externo con el formato de las
gráficas e importándolo en cada página se resolvería este problema.
- Desarrollo de nuevas páginas que permitan comparar los perfiles de brillo de un número de galaxias
elegido por el usuario que se busque a partir del nombre de dichas galaxias.
Me gustaría añadir apreciaciones personales surgidas la experiencia en su desarrollo que pueden ser de
ayuda en futuro a trabajos de esta índole.
- Ha sido una buena idea reescribir el código desde cero para ampliarlo. Con la reestructuración del
código pensando en las nuevas funcionalidades que se querían aportar se ha mejorado la velocidad
en la presentación de las gráficas y la limpieza de los scripts lo que facilita mucho su mantenimiento.
- A pesar de lo dicho en el punto anterior, he repetido el mismo error en las nuevas características
añadidas. En el tramo final del trabajo, cada cambio en la presentación de las gráficas llevaba mucho
tiempo, el código está muy enfocado a la base de datos utilizada y a las funcionalidades concretas
que se buscan. Todas las variables y funciones definidas o llamadas de forma directa lo considero un
error por lo comentado anteriormente, en su lugar, se deberían haber aplicadola técnica list
comprehension como se hizo al reescribir el código de forma general. Además, se debió crear un
módulo externo de funciones para representar las gráficas en el formato deseado para facilitar los
cambios en todas las páginas desde un solo archivo.
37
- Desde el punto de vista astrofísico comparar muchos filtros (o sea bandas fotométricas) y/o galaxias
a la vez, ayuda mucho a encontrar las truncaciones y en el futuro el código se ampliará para mostrar
imágenes de galaxias, perfiles de color y perfiles de masa.
Para finalizar, como última conclusión, quería añadir que este tipo de TFM, que engloba dos campos como
son la Astrofísica y Big Data me ha permitido poner en práctica y ampliar los conocimientos adquiridos en
diferentes asignaturas del máster, como son los conocimientos en programación y Big Data y los
conocimientos en Cosmología, dos asignaturas que he disfrutado enormemente durante el máster.
5. Referencias
38
6. Anexos
Anexo A
En este anexo semuestran fotos de diferentes galaxias tras determina el borde de las galaxias por el método
de las elipses.
18389 GOODS - N:
39
16245 COSMOS:
8221 UDS:
40
Anexo B
En este anexo se muestran perfiles de brillo obtenido con la aplicación donde se pueden observar las
truncaciones a simple vista.
41
19279 EGS: Filtro I
42