0% encontró este documento útil (0 votos)
391 vistas13 páginas

Uso de PopART en Genética de Poblaciones

Este documento describe un laboratorio sobre el uso del software PopART para construir redes de haplotipos a partir de un conjunto de datos poblacionales. El laboratorio incluye instrucciones para instalar PopART, seleccionar datos de una especie del NCBI, transformar los datos de formato FASTA a NEXUS, y utilizar PopART para generar redes de haplotipos usando diferentes métodos como Median Joining Network y TCS Network.

Cargado por

Dania B. Herrera
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

  • Descarga de datos,
  • Análisis filogenético,
  • Métodos de análisis filogenéti…,
  • Documentación de prácticas,
  • Configuración de software,
  • Investigación en genética,
  • Secuencias parciales,
  • Transformación de datos,
  • Investigación en ecología,
  • Métodos de análisis de datos
0% encontró este documento útil (0 votos)
391 vistas13 páginas

Uso de PopART en Genética de Poblaciones

Este documento describe un laboratorio sobre el uso del software PopART para construir redes de haplotipos a partir de un conjunto de datos poblacionales. El laboratorio incluye instrucciones para instalar PopART, seleccionar datos de una especie del NCBI, transformar los datos de formato FASTA a NEXUS, y utilizar PopART para generar redes de haplotipos usando diferentes métodos como Median Joining Network y TCS Network.

Cargado por

Dania B. Herrera
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

  • Descarga de datos,
  • Análisis filogenético,
  • Métodos de análisis filogenéti…,
  • Documentación de prácticas,
  • Configuración de software,
  • Investigación en genética,
  • Secuencias parciales,
  • Transformación de datos,
  • Investigación en ecología,
  • Métodos de análisis de datos

Laboratorio Genética de Poblaciones

Escuela de Biología – Universidad Industrial de Santander


Semestre 2023-1
Laboratorio semana 4

Laboratorio uso Software PopART


(Population Analysis with Reticulate Trees)

PopART (Análisis de población con árboles reticulados) es un software gratuito de genética de


poblaciones que se desarrolló como parte de la iniciativa del Centro Allan Wilson. Este es un
proyecto de colaboración que involucra a matemáticos y biólogos de cinco universidades e
institutos de investigación de Nueva Zelanda para desarrollar un mejor software para comprender
las relaciones evolutivas entre las poblaciones.

La desarrolladora principal de PopART es Jessica Leigh. Otros colaboradores son David Bryant y
Mike Steel, así como un grupo dedicado de probadores beta.

Tomado y modificad de: https://popart.maths.otago.ac.nz/download/ y https://www.mediafire.com/file/7y8w0x5j5f7vrmo/Lab_8_Red_de_haplotipos_PopArt.pdf/file

1. Instalación del programa:

Descargue e instale PopART ingresando al siguiente link y elija el instalador de acuerdo a su equipo
https://popart.maths.otago.ac.nz/download/
Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

2. Selección set de datos poblacionales:

• Ingrese a la página del NCBI en el link https://www.ncbi.nlm.nih.gov/ y realice la búsqueda


de datos poblacionales de la especie del Sethopaga striata, seleccionando primero todas las
bases de datos.

• Ingrese al set de datos poblacionales (PopSet) y seleccione del listado un grupo de


secuencias de interés en donde por lo menos cuente con 36, estas pueden ser secuencias
completas o secuencias parciales.
Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

• Si decide elegir secuencias parciales compare el tamaño de la secuencia con el tamaño del
gen completo con el fin de tener la mayor cantidad posible. Busque la especie con el gen
e identifique el tamaño de la secuencia completa y compárela con las que desea utilizar y
busque las de mayor tamaño posible para la práctica.

Secuencia de referencia gen completo (1042 pb):


Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

Secuencia de uso en la práctica (902 pb):

• Descargue el artículo donde se usan las secuencias y verifique que tenga una red de
haplotipos, si no esta en el inicio del PopSet ingrese a una de las secuencias del set de datos
y allí encontrará el título del artículo.
Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

Ejemplo: Ralston, J., FitzGerald, A. M., Burg, T. M., Starkloff, N. C., Warkentin, I. G., & Kirchman,
J. J. (2021). Comparative phylogeographic analysis suggests a shared history among eastern North
American boreal forest birds. The Auk, 138(3), ukab018

3. Metodología usando Popart:

• Lea el artículo científico en el que se realizó una red de haplotipos


(https://www.proquest.com/docview/2359378492?pq-origsite=gscholar&fromopenview=true).
• Ingrese al archivo en línea en la plataforma Moodle y diligencie la tabla donde: copie y
pegue el texto de la sección de la metodología en el que explican para qué y cómo fue
utilizado el programa con el que crearon la red, indicar la versión del programa, las
opciones seleccionadas por los autores y citar en el texto correctamente a los autores del
software, incluyendo al final la bibliografía.
• Identificar en el artículo en la sección de resultados la leyenda del análisis de la red de
haplotipos e inserte la gráfica de resultado y copiar y pegar el texto de la leyenda.

4. Descarga set de datos poblacionales:

• Previo a la descarga de los datos de fasta diligencie la tabla de Excel con los datos que les
servirán para crear los archivos de uso posterior en el software, el formato lo encontraran
en la plataforma Moodle denominado set_datos_Setophaga.excel, para proceder a
descargar los formatos fasta.
Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

• Descargue todas las secuencias en formato FASTA: Send to → File →Format → Fasta
→Create File → Guardarlo en el computador Nombre_especie.fasta

5. Transformación set de datos poblacionales de Fasta a Nexus

PopART lee formatos Nexus, Phylip, Fasta y rasgos o geo etiquetas (Traits) en formatos tabulares
(tabulación, espacio o delimitado por comas). Para la transformación del set de datos de fasta a
Nexus se pueden utilizar diferentes herramientas: Transformación en línea, usando Software o
crear el archivo. Es importante que comparen con el archivo de ejemplo con el generado por
ustedes.

Transformación a NEXUS en línea


• Conversión en línea: Ingrese al siguiente link:
https://www.hiv.lanl.gov/content/sequence/FORMAT_CONVERSION/form.html

• Puede ingresar las secuencias manualmente o cargar el archivo del NCBI.


Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

Transformación y/o alineamiento a NEXUS en MEGA X


• El software MEGAx lo pueden descargar en https://www.megasoftware.net/, este
software puede usarse para alinear y cortar las secuencias si estas difieren en tamaño.
• Es importante que revisen el archivo generado por los programas y compárelos entre sí
para identificar las diferencias, posteriormente compárelo con el documento de ejemplo
Setophaga_striata_2023_Popart.nex

6. Elaboración de red de haplotipos mediante PopART

• Abra el programa en la carpeta descargada previamente:

• Cargue el documento Nexus creado por ustedes:


File→Open →seleccionar el documento.
Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

• Revisar que las localidades correspondan a sus datos y que cuente con el número total de
las secuencias.

• Una vez revisadas las secuencias realice la red de haplotipos mediante la pestaña Network
primero debemos elegir el método de inferencia de red a usar.
Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

PopART utiliza 6 métodos:

1) Minimum Spanning: Las redes construidas utilizando este método contienen todas las aristas
que aparecen en un árbol de expansión mínimo de las secuencias, es decir, todas las redes que
contienen solo nodos que representan secuencias de entrada conectadas por aristas, sin ciclos con
la longitud total más corta posible (donde las longitudes de arista son iguales a distancias por
parejas entre secuencias) (Leigh y Bryant, 2015).

2) Median Joining Network: Este método utiliza algunas propiedades del espacio ajustado para la
matriz de distancia para sus secuencias para construir una red de haplotipos. Las distancias en la
red deben coincidir exactamente con sus distancias de secuencia (Bandelt H, 1999).

3) Ancestral MP Network: Este método muestra diferentes formas en que las secuencias de
haplotipos pueden conectarse a través de secuencias ancestrales inferidas por el criterio de
Máxima Parsimonia. Estas redes tienden a tener muchos bordes, porque a menudo hay mucha
incertidumbre en la inferencia de secuencias ancestrales. Esto se puede reducir un poco
aumentando el valor de "Frecuencia ancestral mínima" (Leigh y Bryant, 2015).

4) Integer NJ Net: Este método comienza con un árbol de unión de vecinos, pero establece las
longitudes de las ramas en valores enteros para que representen el número de mutaciones entre
las secuencias. Luego, para pares de haplotipos cuyas distancias en el árbol son más largas que las
distancias entre las secuencias, se agregan bordes para acortar la distancia. No se agregarán nuevos
bordes si crean distancias en la red que sean más cortas que las distancias entre secuencias. Si un
nuevo borde es más largo que la mejora producida por su adición (es decir, la diferencia entre la
distancia en la red y la distancia de secuencia), no se agregará. Puede aumentar la "Tolerancia de
reticulación" para permitir la adición de estos bordes si no son demasiado largos (Leigh y Bryant,
2015).

5) Tight Span Walker: Este método utiliza algunas propiedades del espacio ajustado para la matriz
de distancia de sus secuencias para construir una red de haplotipos. Las distancias en la red deben
coincidir exactamente con sus distancias de secuencia (Leigh y Bryant, 2015).

6) TCS Network: El TCS se ha utilizado con métodos tradicionales para estimar las relaciones
entre organismos que abarcan un amplio rango de divergencia (Crandall y Fitzpatrick 1996;
Benabib et al. 1997). El programa usa secuencias idénticas en haplotipos y calcula las frecuencias
de los haplotipos en la muestra. Estas frecuencias se usan para estimar las probabilidades de grupos
externos de haplotipos, que se correlacionan con la edad del haplotipo (Clement M, 2002)
Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

• Para elegir uno de estos, de click en “Network” y seleccione el método deseado, se sugiere
el uso del Median Joining Network o del TCS Network por ser lo más ampliamente usados.
Gráfique con mínimo dos algoritmos dos árboles y compárelos con el paper de referencia.

Colores de la gráfica y posición


Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

Ocultar las leyendas del árbol

• PopART permite modificar los colores y distribución de los puntos en la red en los
comandos señalados en rojo, modifique su gráfica y compárela con el paper de referencia.
Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

7. Interpretación y comparación de red de haplotipos

• Datos adicionales del Software


El software permite observar unos datos adicionales de acuerdo con las secuencias
vinculadas tome nota e inclúyalos en el documento final de la práctica.
Laboratorio Genética de Poblaciones
Escuela de Biología – Universidad Industrial de Santander
Semestre 2023-1
Laboratorio semana 4

• Datos obtenidos en la práctica del Software


En un documento editable, realice una tabla donde compare las tres gráficas obtenidas en
el desarrollo de la práctica y descríbalas.

Tabla entregable #2 práctica.

Red con el método Red con el método


Red del artículo
Median Joining Network TCS Network
Gráfica
Software
Configuración
utilizada
Datos
adicionales del
programa
Interpretación
de las gráficas y
de los análisis
obtenidos

EVIDENCIAS POR ENTREGAR EN LA PRÁCTICA

1. Revisar la sección 3. Metodología y completar la información de Excel en Moodle en la


práctica #4 en el link “2. Metodología PopART”.
2. Formato EXCEL de recopilación de datos set_datos_Setophaga.excel diligenciado.
3. Formato FASTA creado por ustedes en la práctica.
4. Formato Nexus creado por ustedes en la práctica.
5. Tabla con la descripción de las gráficas y estadísticos de los datos.

También podría gustarte