0% acharam este documento útil (0 voto)
72 visualizações19 páginas

Filogenia e Taxonomia: Relações Evolutivas

O documento discute a evolução molecular e a reconstrução filogenética. Explica que a sistemática é o estudo dos relacionamentos entre grupos de organismos e a classificação hierárquica em diferentes táxons. Também descreve a importância das árvores filogenéticas para representar a história evolutiva de espécies e grupos relacionados, inferindo seus ancestrais comuns.

Enviado por

Sônia Cordovil
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
72 visualizações19 páginas

Filogenia e Taxonomia: Relações Evolutivas

O documento discute a evolução molecular e a reconstrução filogenética. Explica que a sistemática é o estudo dos relacionamentos entre grupos de organismos e a classificação hierárquica em diferentes táxons. Também descreve a importância das árvores filogenéticas para representar a história evolutiva de espécies e grupos relacionados, inferindo seus ancestrais comuns.

Enviado por

Sônia Cordovil
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

Evolução molecular:

Reconstruções
Filogenéticas
Prof. Fabrício R Santos

Taxonomia e Classificação Hierárquica


Sistemática e Taxonomia
O sistema taxonômico desenvolvido inicialmente por
• Sistemática é o estudo dos relacionamentos entre Linnaeus tem duas características principais:
grupos de organismos e a classificação hierárquica i) a designação de um nome duplo (binômio) a cada
em diferentes táxons – é um antigo ramo da
biologia clássica. espécie, e ii) um sistema de agrupamento destas espécies.

 A Taxonomia é parte da Sistemática Um binômio (nome latino de 2 partes) é designado unicamente


e se refere à nomenclatura e para cada espécie, no qual o primeiro é o nome genérico, e os
dois nomes são ditos específicos.
identificação de espécies. Seus
princípios foram inicialmente Trichechus inunguis
estabelecidos por Carolus Linnaeus Homo sapiens
(1707-1778). Arabidopsis thaliana
Escherichia coli
Chromobacterium violaceum

O sistema de classificação das espécies segue uma hierarquia A Sistemática Filogenética conecta a
de categorias crescentes que formalizam o agrupamento de
diversidade biológica à história evolutiva
organismos, o qual deve ser feito a partir do reconhecimento
da história de ancestralidade comum das espécies.
Filogenia = A história evolutiva de uma espécie ou grupo de espécies
A nomenclatura binomial da espécie é a primeira relacionadas.
etapa no agrupamento: espécies derivadas do
Filogenia é geralmente representada como árvores filogenéticas
mesmo ancestral comum imediato são geralmente
que traçam relacionamentos evolutivos inferidos, revelando a
agrupadas no mesmo gênero.
história de ancestralidade comum entre espécies.
As demais categorias são mais amplas, isto é,
agrupam táxons de acordo com ancestrais comuns Sistemática = O estudo e classificação da diversidade biológica em um
mais e mais antigos: contexto evolutivo.
• Gêneros são agrupados em uma Família, pois A diversidade biológica reflete episódios passados de especiação
compartilham um ancestral comum recente. e macroevolução.
• Famílias são agrupadas em Ordens, que se
Taxonomia = Identificação , nomeação e classificação de espécies; é um
agrupam em Classes, que são agrupadas em Filos,
que se agrupam em Reinos e um dos 3 Domínios.
componente da sistemática.

1
Organismos podem ser
Que são árvores?
representados em um
diagrama (árvore) que
ilustra seus
relacionamentos
evolutivos.
Usando dados
morfológicos e
moleculares, podemos
estimar os ancestrais
comuns inferidos pelos
pontos de divergência
nas árvores
filogenéticas. Charles Darwin (1837)
Anotações sobre padrões de especiação nos Tentilhões de Galápagos

Árvore Filogenética
n1 OTU 1 Topologias equivalentes
n2

OTU 2
n3

OTU 3

n4

OTU 4

n5
raiz OTU 5

OTU 6
No de diferenças
8 7 6 5 4 3 2 1

antiga recente
tempo
n nó interno - ~ ancestral comum do passado
OTU unidade taxonômica operacional - populações, espécies ou grupos

Por quê árvores? • Evolução é divergência – espécies se modificam

Por quê representamos evolução como árvore e com o tempo - Transformacionismo


não outro tipo de gráfico? Darwin: “Descendência com modificação”

A B C D A B C D • Por várias razões, reticulação torna-se um


fenômeno raro com o tempo – provavelmente no
Pré-Cambriano as reticulações devido a
transferências gênicas horizontais, fusões de

D A células, etc, eram muito comuns.

Ciclo, reticulação • Reticulações são difíceis de se representar.


C B

2
Grou

Árvores reticuladas

Ex: espécies híbridas


de Paeonia sp.
Sang et al., 1997

Filogenia do grou Filogenia do grou


Grus sp japonensis
japonensis japonensis
americana leucogeranus antigone
americana americana
rubicanda
grus
grus grus
vipio
nigrocollis nigrocollis nigrocollis
paradisea
monachus monachus monachus
virgo
canadensis canadensis canadensis

bugeranus bugeranus japonensis bugeranus

virgo virgo Bugeranus virgo

paradisea paradisea paradisea


americana
leucogeranus canadensis leucogeranus
leucogeranus monachus grus
antigone nigricollis antigone
antigone
rubicanda rubicanda
rubicanda
vipio vipio
vipio

Cladograma Árvore UPGMA Árvore sem raiz Árvore UPGMA


Citocromo b (Mooers et al., 1999) Citocromo b (Mooers et al., 1999)

Árvore filogenética Conexão entre classificação e filogenia


para os tentilhões A natureza da ramificação de uma árvore evolutiva reflete o arranjo hierárquico de
de Galápagos. táxons (taxa). Esta árvore sugere as afinidades genealógicas entre táxons
subordinados à ordem Carnivora, ou seja, o padrão de especiação para este grupo.
Estas 13 espécies
habitam as Ilhas
Galápagos. Esta
árvore é baseada
em estudos
comparativos de
estruturas do corpo,
especialmente forma
e tamanho dos bicos,
e nos estudos de
campo sobre
isolamento
reprodutivo e
comportamento
alimentar.

3
Árvores filogenéticas baseadas em sistemática
Dois métodos, comparação de proteínas do sangue e hibridização DNA-DNA, foram Antiga controvérsia sobre afinidades entre
usados para construir esta árvore de espécies de ursos e procionídeos.
focas, leões marinhos e morsas

A relação filogenética entre


Phoecidae, Odobaenidae e
Otaridae já foi extremamente
discutida. Hoje é considerada
um grupo monofilético, a
família Pinnipedia, mas focas
já foram consideradas grupo
irmão de Lontras
(Mustelidae)

Classificação: Reinos e Domínios


Árvores filogenéticas podem nos
dar informações sobre o
passado remoto

Qual relação entre procariotos e eucariotos?

Qual a origem das mitocôndrias e dos cloroplastos?

Atualmente a sistemática filogenética reconhece 3 domínios

Origem dos 3 domínios da vida no Pré-Cambriano

4
Archaea Árvores nos informam sobre processos recentes de
Eucariotos
diversificação de populações e espécies

Riquétsias
Grupos irmãos de
ciclídeos do
Lago Tanganika na

Mitocôndrias
África oriental

Nature, 1998
Árvore MP C0I (E. Michel, 1999)
outras bactérias

Árvores filogenéticas e epidemiologia Reconstruções filogenéticas e


Conservação da Biodiversidade
paciente G-x
paciente G-y

paciente D-x
paciente D-y
paciente B-x
paciente B-y
paciente A-x

paciente C-x
paciente C-y

paciente A-y
paciente E-y
paciente E-x

paciente F-x
paciente F-y
Dentista X
Dentista-y

LC02-x
LC03-x
LC02-y

LC03-y

HIVLI

• Filogenética pode ser extremamente útil para estudos de


LC09
LC35

biodiversidade (inventariamento e classificação) e


estabelecimento de prioridades conservacionistas.

• Medidas de diversidade que utilizam filogenias de


sequências de DNA estão agora sendo usadas para
implementar planos de conservação de espécies, priorizar
unidades de conservação, definir unidades de manejo etc.
Dentista com HIV deu
origem a um surto
regional nos EUA
• Ex: filogenias (e filogeografia) são usadas para identificar
Freeman e Herron, 1998 ESUs (unidades evolutivamente significantes), as quais
representam populações importantes para manter a
Filogenias de agentes infecciosos permitem traçar surtos e pandemias, dinâmica evolutiva de uma espécie.
assim como auxiliam nas estratégias de controle de epidemias como da
gripe H1N1 ou para o desenvolvimento de vacinas da gripe comum.

Populações do clado III do


Filogenias dos peixes-bois (Trichechus sp) peixe-boi marinho
(Trichechus manatus)
possuem uma distribuição
restrita às Guianas e ao
marinho
Brasil, portanto são
marinho
unidades evolutivas
independentes (ESU) das
demais nesta espécie.
africano

africano
amazônico

Árvore sem raiz (rede MJ) da região


10-20 milhões de anos amazônico controle do DNAmt
Vianna et al 2006 Mol Ecol
Vianna et al 2006 Mol Ecol

5
Árvore NJ COI em
Thamnophilidae
B0665
99
D. ochropyga
Termos filogenéticos
B0663
B0655
99 B0653
B0654 D. ferruginea
B0656
99 B0369
B0367 R. ardesiaca
B0368
99 B0609
D. squamata
B0317
B0647
• Homologia
99 B0329
B0326
P. leucoptera
B0335

99
B0658
B0644
B0657
M. loricata • Analogia
99 B0677
B0678 T. major
• Convergência, Reversão
B0646
B0291
99
B0292
B0290
D. plumbeus
99 B0680
B0643 F. serrana
B0660
99 B0281
B0285 D. mentalis • Plesiomorfia – estado ancestral – “0”
(Simplesiomorfia)
99 B1189
B1301 H. atricapillus
B1188
B1296
99
B1186 S. cristatus
B1303

90
99 B0525
B0524
99 B0515
T. doliatus • Apomorfia – estado derivado – “1”
T. caerulescens
(Autapomorfia - Sinapomorfia)
99 B0511
90 B0513
82 B0528
99 B0535
91 B0562 T. ambiguus
99 B1148
B1147
B1150
T. pelzelni
Vilaça et al. 2006

Analogia
Homologia:
um caráter (ancestral ou derivado) compartilhado
entre duas ou mais espécies, o qual estava presente Espécies: 1 2 3 4
no ancestral comum destas. Estado do caráter:

Analogia:
caráter “compartilhado”, geralmente não-presente
no ancestral comum (i.e., o caráter evolui duas
vezes, independentemente): evolução convergente
(ou paralela) e reversão ao estado ancestral. A este estado ancestral
caráter recorrente damos o nome de Homoplasia.
Nas spp. 1 e 3 há uma analogia (caráter análogo) ou homoplasia;
Origem independente – evolução paralela ou convergente .

Homologia Ancestral (0) Homologia Derivada (1)

Espécies: 1 2 3 4 Espécies: 1 2 3 4
Estado do caráter: Estado do caráter:

estado ancestral estado ancestral

Nas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia); Nas spp. 1 e 2 aparece um caráter homólogo derivado
é ancestral porque está presente na base da árvore, no (sinapomorfia). Aconteceu uma transição do estado “basal” ou
ancestral comum de todas 4 spp atuais. primitivo no ancestral imediato destas duas spp ou OTUs.

6
Origem das Homoplasias Evolução Convergente = Aquisição de características
similares em espécies de diferentes linhas evolutivas,
Convergência: origem independente do devido ao compartilhamento de nichos ecológicos
caráter (i.e., duas linhagens fixam similares, sendo a seleção natural responsável por
paralelamente um “fenótipo” similar). moldar adaptações análogas.
Exemplos:
asas de pássaros e morcegos
Reversão: origem e subseqüente perda, ou bicos de aves e monotremados
mutação “de volta” ao caráter ancestral (i.e.,
reversão ao estado plesiomórfico). Evolução convergente também se dá no nível
molecular: sequências de DNA e proteínas podem
sofrer mudanças paralelas, reversões, etc

Evolução
Convergente e
Seleção Natural Um grupo monofilético:

Similaridades aparentes
é um grupo de táxons que inclui o
entre marsupiais ancestral comum e todos seus
australianos e mamíferos
placentários em outros descendentes
continentes.
Estas espécies ocupam
nichos parecidos nos
diferentes continentes.

Famílias monofiléticas
Exemplo de grupo Hyllobatidae Pongidae Hominidae

não-monofilético: Répteis
Peixes Anfíbios Tartarugas Mamíferos Lagartos Cobras Crocodilos Aves

O ancestral comum mais recente


dos répteis também deu origem
aos mamíferos e aves
Filogenia dos grandes símios sem cauda

7
Famílias parafiléticas
Hyllobatidae Pongidae Hominidae
Abordagens filogenéticas

Fenética
(Taxonomia numérica)

Esta classificação equivocada


Cladística
não representa a história
evolutiva das espécies
(Sistemática Filogenética)

Filogenia dos grandes símios sem cauda

MÉTODOS FENÉTICOS
Fenética
Análise de vários Matriz de Construção
• Abordagem Clássica (desde Linnaeus). caracteres dissimilaridade de árvore
(fenótipos, sítios polimórficos em base ao número filogenética
• Agrupa espécies baseada na similaridade de DNA, freq. alélicas, etc.) de diferenças
fenotípica (ou genotípica). A B C A B C Fenograma
A 0 A
• Usa todas características distinguíveis.
B 3 0 B
• Ex: métodos baseados em distâncias C 7 6 0 C
(UPGMA) Relações de
similaridade

Cladística Cladística
• Baseia-se no padrão de ancestralidade comum e
• A Teoria Evolutiva postula que grupos de
modificação das espécies e não em mera
organismos relacionados descendem de um
similaridade.
ancestral comum.
• Deve usar apenas caracteres derivados
• Sistemática Filogenética (Cladística) é um método
(apomórficos) compartilhados (sinapomórficos ou
de classificação taxonômica baseado na história
homólogos derivados).
evolutiva.
• Portanto, objetiva traçar a história evolutiva real, o
 Foi desenvolvido em 1950 por padrão de descendência com modificação.
Willi Hennig, um entomologista
• Ex: métodos baseados em caracteres (parcimônia).
alemão.

8
MÉTODOS CLADÍSTICOS
Caracteres utilizados
Construção
Análise de vários caracteres
com estados ancestrais (0) e de árvore filogenética
derivados (1) Analogias Homologias Homologias
Cladograma Ancestrais Derivadas
1
A B C D E 2 3
E
1
2 4 D
3
4 5 6 C Fenética Sim Sim Sim
5
6 B
7
7 8
8 A
Relações de Cladística Não Não Sim
ancestralidade comum

“Eventos Reais” Fenética Cladística

Cavalo Besouro Borboleta Cavalo Besouro Borboleta Cavalo Besouro Borboleta

“Eventos reais” Fenética Cladística

Lagarto Jacaré Ave Ave Lagarto Jacaré Lagarto Jacaré Ave

9
O objetivo da inferência filogenética é resolver a ordem de
Análise Filogenética ramificação das linhagens nas árvores evolutivas:

Não-resolvida Filogenia Completamente resolvida,


ou filogenia tipo “estrela” parcialmente resolvida filogenia bifurcada
• Dado um conjunto de dados A A A
(caracteres morfológicos,
alinhamento de múltiplas B C E
sequências de DNA e proteína, etc),
C E C

Tempo
pode-se determinar (ou inferir) o
relacionamento ancestral dentre as D B B
espécies.
E D D

Esp.1 Esp.2 Esp.3 Esp.4 Politomia ou multifurcação uma bifurcação

Há 3 possíveis árvores sem raiz para O número de árvores sem raiz aumenta
4 táxons (A, B, C, D) exponencialmente com o número de táxons
A B
árvore 1 árvore 2 árvore 3 # táxons # árvores sem raiz
A C A B A B C A C 3 1
4 3
5 15
B D 6 105
7 945
B D C D D C C D 8 10,935
A
9 135,135
10 2,027,025
Métodos de reconstrução (ou inferência) filogenética objetivam B E . .
descobrir qual das árvores é a “mais provável". . .
A C D . .
Espera-se que esta seja a “verdadeira” árvore biológica — aquela que . . 36
seguramente represente a história evolutiva dos táxons analisados – 30 -3,58 x 10
mas esta é formalmente chamada de árvore inferida a partir dos B F E
dados, cuja confiança pode ser testada por diferentes métodos.

Inferir relacionamentos evolutivos entre os O enraizamento em outra posição:


táxons requer enraizar a árvore:
B
B C
C
raiz
árvore sem raiz

Raiz D
D
árvore sem raiz
A
A Note que nesta árvore
A
A C
enraizada, o táxon A não
B D B
C D árvore enraizada
está mais estreitamente
relacionado ao táxon B Note que nesta árvore
árvore enraizada
enraizada, táxon A é mais
Raiz em relação a C ou D
raiz
estreitamente relacionado ao
como sugerido acima. táxon B, enquanto o C é mais
relacionado ao D.

10
Uma árvore sem raiz de 4 táxons pode ser enraizada em cinco lugares
distintos para produzir cinco árvores enraizadas diferentes Cada árvore sem raiz pode teoricamente ser enraizada
em qualquer lugar ao longo de qualquer de seus ramos
2 4
A C A C
1 5
árvore sem raiz: # táxons # árvores x # árvores
sem raiz # raízes = com raiz
B 3 D B D 3 1 3 3
4 3 5 15
C 5 15 7 105
árvore c/raiz árvore c/raiz árvore c/raiz árvore c/raiz árvore c/raiz
A D 6 105 9 945
1 2 3 4 5 7 945 11 10.395
B A A C D 8 10.395 13 135.135
B E 9 135.135 15 2.027.025
A B B D C . . . .
. . . .
C C C A A A C
D . . . .
. . 36
. . 38
D D D B B 30 ~3,58x10 57 ~2,04x10

Estas árvores representam cinco histórias evolutivas diferentes B F E


entre os táxons, dependendo de onde se coloca a raiz !

Árvores alternativas sobre relações Há dois modos principais de enraizar árvores:


evolutivas entre os três “grandes símios” Pelo grupo externo (outgroup ):
Usa táxons de referência (o “outgroup”)
que sabidamente se situam fora do grupo
de interesse (o “ingroup”). Requer
conhecimento a priori sobre
relacionamentos entre os táxons. O
H C G G C H C G H outgroup pode ser uma espécie (ex: aves
para enraizar uma árvore de mamíferos) ou
cópias de genes duplicados (ex: -globina outgroup
para enraizar -globinas).
Pelo ponto-médio ou distância:
enraiza a árvore no ponto médio entre os A
d (A,D) = 10 + 3 + 5 = 18
dois táxons mais distantes na árvore, tal Ponto-médio = 18 / 2 = 9
como determinado pelo tamanho dos 10 C
ramos. Pressupõe que os táxons evoluem 3 2
A árvore do meio é considerada a árvore científica “verdadeira” coordenadamente (evolução constante
2
entre linhagens). Esta suposição está B 5 D
para a história evolutiva destas três espécies
embutida em alguns métodos fenéticos de
construção de árvores tal como o UPGMA.

Todos estes rearranjos mostram o mesmo


relacionamento evolutivo entre táxons
A A
C
D
D
C
Reconstruções
árvore
B B
enraizada 1 B
C D
A
D C
filogenéticas com dados
C A A
B B
D B B moleculares
C D
D C
A A
Todas estas árvores são idênticas

11
Variabilidade genética Freqüências alélicas
Fenotípica
Freqüência de um dos alelos em cinco locos
Morfológica bialélicos (A-E) em 3 populações (pop1, 2, 3)
Funcional
POP1 POP2 POP3
Protéica
A - 0,4 A - 0,6 A - 0,3
DNA B - 0,2 B - 0,5 B - 0,2
Macromutações C - 0,9 C - 0,8 C - 0,9
D - 0,1 D - 0,3 D - 0,2
SNP’s – mutações de ponto E - 0,2 E - 0,1 E - 0,4
Inserções de retroposons
Microssatélites Frequências alélicas servem apenas para comparações fenéticas
intra-específicas.

Microssatélites SNPs ou mutações de ponto


AT
AT
AT são multi-alélicos
AT
Single Nucleotide Polymorphisms
AT

CA CA CA CA são geralmente bialélicos


CCG
CCG
CCG
CCG
alelo 0 ...AAGCGTTATAGC...
Alelo 3 CA CA CA
alelo 1 ...AAGTGTTATAGC...
Alelo 5 CA CA CA CA CA

Alelo 7 CA CA CA CA CA CA CA µ = 10-7 a 10-8 / locus / geração


µ = 10-4 a 10-3 / loco / geração
SNPs podem ser utilizados para comparações
Microssatélites servem geralmente apenas para comparações fenéticas intra-
específicas. cladísticas interespecíficas.

Analogia
SNPs em sequências de DNA
* * * ** * * * * * *
Espécies: 1 2 3 4
A aat tcg ctt cta gga atc tgc cta atc ctg
B ... ..a ..g ... .a. ... ... t.. ... ..a Estado do caráter: T C T C
C ... ..a ..c ..g ... ..t ... ... ... t.a
D ... ..a ..a ..g ..g ..t ... t.g ..t t..

Cada diferença de nucleotídio é um SNP e considerado


como um caráter na reconstrução filogenética
C estado ancestral
Obs:
Pontos (.) se referem a posições de caracteres inalterados em relação Nas spp. 1 e 3 há uma analogia (caráter análogo ou homoplasia); T
à primeira sequência (A) Origem independente – evolução paralela ou convergente
* Posições com caracteres variáveis entre estas sequências

12
Homologia Ancestral (0) Homologia Derivada (1)

Espécies: 1 2 3 4 Espécies: 1 2 3 4
Estado do caráter: C T C C Estado do caráter: T T C C

C estado ancestral C estado ancestral

Nas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia); C Nas spp. 1 e 2 possuem homólogos derivados (sinapomorfia) T
é ancestral porque está presente na raiz da árvore (ancestral (i.e., aconteceu uma transição do estado “basal” ou primitivo,
comum) como uma plesiomorfia. no ancestral comum imediato destas duas spp ou OTUs).

Similaridade vs. relacionamento evolutivo


Tipos de abordagens Similaridade e relacionamento evolutivo não são a mesma coisa,
filogenéticas utilizando mesmo que relacionamento evolutivo seja inferido de certos
tipos de similaridade.
moléculas
Similar: ser semelhante (uma observação)
Relacionado: geneticamente conectado (um fato histórico)
Dois táxons podem ser mais similares sem ser mais relacionados:
Fenética Cladística 1
6
Táxon B
1 O táxon C é mais similar ao A (d = 3)
3 Táxon C
Similaridade geral Sistemática filogenética
1
do que ao B (d = 7), mas C e B são
Táxon A
mais estreitamente relacionados: C e
5 B compartilham um ancestral comum
Táxon D
mais recente do que os dois com A.

Tipos de Similaridade
Métodos gerais de reconstrução filogenética
Similaridade observada entre duas OTUs pode ser por:

relacionamento evolutivo : C Seleciona a árvore que explica os


C
caracteres ancestrais compartilhados (‘simplesiomorfias’) C Parcimônia dados com o menor número de
A
caracteres derivados compartilhados (‘’sinapomorfias’) G
R substituições (eventos mutacionais fixados).
G Á
Homoplasia (evolução independente do mesmo caráter):
Eventos Convergentes (em OTUs relacionadas ou não), Eventos Paralelos (em
T Seleciona a árvore que tem a
OTUs relacionadas), Reversões (em OTUs relacionadas ou não) E Verossimilhança maior probabilidade de reproduzir
G C C R
os dados observados.
C G G
T G G Seleciona a árvore que melhor
G C C Distância representa as distâncias
Convergentes Paralelos Reversões
observadas entre os pares.
Métodos baseados em caracteres podem teoricamente discriminar
os tipos de similaridade e encontrar a “verdadeira” árvore
evolutiva .

13
Tipos de dados usados em inferência filogenética
Métodos baseados em caracteres : Usam diretamente os caracteres Estima-se primeiro qual árvore sem raiz seria
alinhados, tais como sequências de DNA ou proteína a mais “correta”
táxons caracteres
espécie A ATGGCTATTCTTATAGTACG
A C
espécie B ATCGCTAGTCTTATATTACA
espécie C TTCACTAGACCTGTGGTCCA
espécie D TTGACCAGACCTGTGGTCCG
espécie E TTGACCAGTTCTCTAGTTCG
B D
Métodos baseados em distâncias: Transformam os dados em distâncias
(dissimilaridades) par-a-par, e usam a matriz durante inferência da árvore. Alguns métodos produzem a árvore já com a raiz (UPGMA),
A B C D E outros podem fornecer árvores com raiz se os dados
M espécie A ---- 0,20 0,50 0,45 0,40 Exemplo 1:
A
espécie B 0,23 ---- 0,40 0,55 0,50 Distância “p”
possuem informação suficiente (Parcimônia,
T
R espécie C 0,87 0,59 ---- 0,15 0,40 (= percentagem Verossimilhança) e todos podem se utilizar ou necessitam
observada de
I espécie D 0,73 1,12 0,17 ---- 0,25 sequências obrigatoriamente de um grupo externo para produzir uma
Z espécie E 0,59 0,89 0,61 0,31 ---- diferentes)
árvore com raiz (Neighbor Joining - NJ)
Exemplo 2: distância Kimura 2-parâmetros
(estimativa do número real de substituições entre táxons)

Algoritmos baseados em distâncias Distâncias entre DNA


(agrupamento)
• distâncias entre pares de seqüências de DNA são relativamente
Usam distâncias para calcular árvores filogenéticas. Estas são
simples de computar como a soma de diferenças de bases entre as
baseadas somente no número relativo de similaridades e
diferenças entre um grupo de seqüências. duas seqüências.

– Este tipo de algoritmo somente funciona para pares de


– Começa com uma matriz de distâncias par-a-par sequências similares o bastante para serem alinhadas
– Estes métodos constróem uma árvore ligando os pares de • Geralmente todas alterações de bases são consideradas iguais
táxons menos distantes, sucessivamente ligando táxons
• Inserções/deleções geralmente possuem um peso maior do que
mais distantes.
substituições nucleotídicas (gap penalties).
– Ex: UPGMA (típico método fenético) e
• É também possível corrigir múltiplas substituições em um único sítio,
Neighbor joining (NJ) que considera diferentes taxas que é comum em relacionamentos filogenéticos distantes e para
evolutivas entre linhagens.
sítios de rápida evolução.

UPGMA Métodos de Distância


• O mais simples dos métodos de distância é o UPGMA (Unweighted
Pair Group Method using Arithmetic averages) e apenas reconstrói
fenogramas que representam meras relações de similaridade geral. dij a b c d
• Assume taxas evolutivas idênticas para todas as OTUs.
• Agrupa as distâncias menores e recalcula novas distâncias através a ACGA a 0
de médias aritméticas para novo agrupamento.
b ATGC b 0,5 0
• Os programas do pacote PHYLIP DNADIST and PROTDIST calculam
distâncias genéticas entre grupos de seqüências criando uma c GTGC c 0,75 0,25 0
matriz de dissimilaridades (distâncias).
• Então o programa NEIGHBOR (que também constrói árvores NJ) do d GCAA d 0,5 1,0 0,75 0
PHYLIP constrói a árvore UPGMA a partir da matriz.
• Esta árvore é visualizada em um programa apropriado (Ex:
TREEVIEW ou PTP).

14
Métodos de Distância Métodos de Distância

d
ij a b c d d a b c d
ij a b c d d c
a 0 a 0 b
b 0,5 0 b 0,5 0 a
c 0,75 0,25 0 c 0,75 0,25 0
d 0,5 1,0 0,75 0 d 0,5 1,0 0,75 0

Matriz Árvore UPGMA Matriz Árvore Neighbor-Joining


(mera similaridade) (similaridade e
taxas evolutivas diferenciais)

Máxima parcimônia Exemplo de Parcimônia


• Considere 4 táxons com as seqüências: a (ACGA),
• Parcimônia é o método mais popular de
reconstrução cladística dos relacionamentos por b (ATGC), c (GTGC), d (GCAA).
ancestralidade comum. • A parcimônia deve decidir qual das 3 possíveis árvores
• Parcimônia permite o uso de toda informação sem raiz (4 táxons), é a mais “correta” (parcimoniosa).
evolutiva conhecida para a construção da árvore.
• Posteriormente, se houver informações suficientes, deve-
– em contraste, métodos de distância resumem todas
diferenças entre pares de seqüências em um único se colocar a raiz, a qual polariza o padrão de ramificações
número, a percentagem de diferença ou distância sequenciais na árvore filogenética.
genética.

Exemplo de Parcimônia Exemplo de Parcimônia


a c 1 2 3 4 Aa c G 1 2 3 4
*
a A C G A a A C G A
árvore 1 árvore 1
b d b A T G C Ab d G b A T G C
a b c G T G C c G T G C

d G C A A * = 1 etapa de mutação d G C A A
árvore 2 Tot
c d
árvore 1 1
a b
árvore 2
árvore 3

d árvore 3 c

15
Exemplo de Parcimônia Exemplo de Parcimônia
C a * cT 1 2 3 4 Ga cG 1 2 3 4

* a A C G A * a A C G A
árvore 1 árvore 1
Tb d C b A T G C Gb dA b A T G C

c G T G C c G T G C

* = 2 etapas de mutação d G C A A * = 1 etapa de mutação d G C A A


Tot Tot
árvore 1 1 2 árvore 1 1 2 1
árvore 2 árvore 2
árvore 3 árvore 3

Exemplo de Parcimônia Exemplo de Parcimônia


Aa * cC 1 2 3 4 a c 1 2 3 4

* a A C G A a A C G A
árvore 1 árvore 1
Cb dA b A T G C b d b A T G C

c G T G C a b c G T G C

* = 2 etapas de mutação d G C A A d G C A A
Tot árvore 2 Tot
c d
árvore 1 1 2 1 2 6 árvore 1 1 2 1 2 6
a b
árvore 2 árvore 2 2 2 1 2 7
árvore 3 árvore 3 2 1 1 1 5

d árvore 3 c

Exemplo de Parcimônia Exemplo de Parcimônia


a b 1 2 3 4
Árvore sem raiz d a b c
a A C G A
escolhida pela análise 1 (A) 1 (A)
de parcimônia
árvore 3
b A T G C
d c 2 (T)
4 (C)
Neste caso temos informações adicionais de que táxon com
c G T G C
a sequência d possa funcionar como um grupo externo 3 (G) d G C A A
(outgroup), portanto a raiz estará entre d e os outros ( ).
d a b c
Árvore com raiz
escolhida usando d como A evolução dos caracteres apomórficos pode ser inferida a partir do
outgroup Cladograma. Assim, eventos paralelos (recorrentes) de mutação
podem ser identificados, os quais geram homoplasias

16
A análise de parcimônia
pode discriminar alguns tipos
de eventos paralelos. Máxima verossimilhança
Na figura ao lado, 4 seqüências Verossimilhança (L) é a probabilidade dos dados, dado o
alinhadas homólogas (a) de modelo de substituições nucleotídicos e uma hipótese de
distintos organismos foram topologia filogenética
utilizadas para construir uma
L = P (dados/árvore)
árvore de parcimônia (b).
Na árvore estão dispostas os
eventos de mutações Modelo evolutivo de substituições
(apomorfias), numerados de 1 Diferentes padrões de substituição nucleotídica específicos
a 8. No evento 2, o estado de cada conjunto homólogo de sequências de DNA.
alélico derivado (nucleotídio A) Transição
demonstrou ser um evento A G
paralelo, aparecendo
Transversão
independentemente na
seqüência do homem e do C T
milho

Jukes-Cantor Kimura 2P
(1 parâmetro) (2 parâmetros)

A frequência dos nucleotídios não é considerada A frequência dos nucleotídios não é considerada
Todas substituições têm a mesma taxa Transições e transversões têm diferentes taxas

GTR (General Time Reversible)


(6 parâmetros)
a
O modelo inapropriado de
substituições nucleotídicas
f pode levar a uma reconstrução
d e c filogenética incorreta.

b
A frequência dos nucleotídios é considerada
Transições e transversões têm diferentes taxas,
assim como os tipos de mudanças nucleotídicas

17
Dados reais:
Modeltest mudanças observadas e esperadas

• Comparação de sequências de chimpanzé e homem no


DNAmt (307/1333 sítios são diferentes)
• Modelos com mais parâmetros se aproximam mais do
padrão observado

O software permite selecionar o modelo de substituição mais plausível para


determinado conjunto de sequências, assim como outros parâmetros
necessários para a reconstrução filogenética.
Posada e Krandal

Máxima verossimilhança Problemas na reconstrução


Método baseado na avaliação probabilística de modelos evolutivos
filogenética
que melhor explicam um conjunto de dados de forma que este reflita
a história evolutiva mais próxima da realidade
As taxas evolutivas são diferentes para cada gene ou
LT = L (1) x L (2) x L (3) x L (4) x..x L (N) = L (i)
segmento anônimo de DNA.
C A A A
1 2 3 4 5 6 7 L(5) = Prob C G
+
Táxon a A A G A C T T C A
Árvores filogenéticas contam a história do caráter, mas
A C
Táxon b A G C C C T T Prob
C G
+ não necessariamente da espécie.
Táxon c A G A T A T C
C C T A
Táxon d A G A G G T C
Prob C G
+
a c a b a c
Prob ... +
b d c d d b C N N A
Prob +
C G

Taxas de mutação/evolução Árvores de genes e de espécies


• A história evolutiva de genes reflete aquela
das espécies que os carregam, exceto
quando:
– Transferência horizontal = transferência gênica entre
espécies (ex. entre bactérias, mitocôndrias em híbridos)
– Duplicação gênica : ortologia/ paralogia

Incongruência
entre árvores de
genes e espécies

18
Associações históricas Eventos entre gene (associado) e a
espécie (host)

Page e Charleston, 1998 Page e Charleston, 1998

Reconstrução da filogenia de espécies:


artefatos devido à paralogia

especiação GNS1 GNS2


duplicação

GNS1 GNS1 GNS1 GNS2 GNS2 GNS2 GNS GNS GNS


Hamster Rat Mouse Rat Mouse Hamster Hamster Mouse Rat

Árvore obtida com amostragem parcial


Árvore verdadeira
de genes homólogos, mas parálogos
Perda de genes pode acontecer durante a Evolução: mesmo sequências com
genomas completos pode ser difícil detectar paralogia

19

Você também pode gostar