0% acharam este documento útil (0 voto)
110 visualizações5 páginas

Métodos de Alinhamento e Análise Genética

Os programas de bootstrap e jackknife subdividem a amostra em grupos menores para calcular estatísticas em cada grupo e fazer uma média. O bootstrap cria pseudorréplicas do alinhamento original para testar a robustez da árvore, enquanto o jackknife elimina colunas para criar pseudorréplicas mais curtas.

Enviado por

Inês Magalhães
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
110 visualizações5 páginas

Métodos de Alinhamento e Análise Genética

Os programas de bootstrap e jackknife subdividem a amostra em grupos menores para calcular estatísticas em cada grupo e fazer uma média. O bootstrap cria pseudorréplicas do alinhamento original para testar a robustez da árvore, enquanto o jackknife elimina colunas para criar pseudorréplicas mais curtas.

Enviado por

Inês Magalhães
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

Professor Paolo:

1. O que fazem os programas de bootstrap e jackknife e quais as diferenças entre os


dois?
Subdividem a amostra em grupos mais pequenos, faz-se uma estatística em cada
grupo e faz-se uma média de cada grupo
bootstrap: criação de pseudorréplicas do mesmo alinhamento para ver a robustez da
árvore final. A Partir de várias colunas do alinhamento inicial são criadas
pseudorréplicas das quais será feita uma árvore. O resultado final de todas as
árvores servirá para concluir a robustez da árvore inicial. CONTUDO, duplica todos
os dados iniciais e é muito mais lento
jackkinifing: cria também pseudoréplicas, mas desta vez serão eliminadas colunas
para a formação das pseudorréplicas. Desta forma, os alinhamentos são mais curtos
e haverá menos árvores. CONTUDO, este método desperdiça muita informação

2. Porquê, para alinhar sequências de gene de RNA ribossomal, não se precisa de se


usar programas como o Revtrans?

O RevTrans não irá utilizar sequências de genes de RNA ribossomal porque, neste
caso, a sequência já se encontra traduzida. Este programa utiliza um conjunto de
sequências de DNA, traduzindo-as, virtualmente, alinhando as sequências
peptídicas e utiliza o alinhamento como suporte para a construção do alinhamento
múltiplo correspondente do DNA

3. “Os 2 genes estudados apresentam 63% de homologia”. Esta frase está errada.
Corrija substituindo a palavra “homologia” e explique.
A frase estaria correta assim: “Os 2 genes estudados apresentam 63% de
identidade”
A homologia existe ou não existe entre dois genes (ou proteínas). No caso de existir,
significa que, provavelmente, têm um antepassado em comum. Esta suposição é
baseada no grau de identidade que apresentam.
A identidade entre 2 sequências de AN refere quantas bases iguais existe depois do
alinhamento

4. Em que casos concretos usa cada um dos programas blastn, blastp e blastx?
(função)
blatsn- compara a sequência em questão de AN com as bases de dados de ANs.
blatsp- compara a sequência em questão de proteínas com as bases de dados de
proteínas
blastx: inicialmente, faz uma tradução da sequência de AN em questão, nas 6
frames possíveis e posteriormente compara esta tradução com as bases de dados
de proteínas.

5. O que é expressed sequence tag (EST, ou STS)?


São segmentos de sequência utilizados como referência para o gene em questão.
Extremamente importante para estudos de expressão genética.
6. Porque em bioinformática se usa a palavra indel em vez de “inserção” ou “deleção”?
Na existência de um GAP, num alinhamento, não sabemos se este provém de uma
inserção numa das sequências ou se é um caso de deleção. Desta forma, usa-se,
em bioinf, a denominação “indel” porque não se pode especificar o que realmente
sucedeu.

7. As matrizes de correspondência (ou de substituição ou scoring matrices) PAM e


BLOSSUM são chamada “empíricas”; porquê? Em geral, para que serve uma matriz
de correspondência?

Matriz de correspondência é usada para ácidos nucleicos e depende do valor que


damos a cada match, mismatch e gap. Podem denominar-se de empíricas, isto é,
baseadas na experiência porque irão calcular um o score de proteínas tendo por
base a frequência de troca de um aminoácido por outro entre as proteínas com a
mesma função.

8. O que é a pontuação(score) de cada alinhamento num resultado de uma pesquisa


Blast entre proteinas? Como é calculada?

O score de um alinhamento determina a qualidade do alinhamento. Scores altos


significam muita identidade e similaridade, apenas no caso de sequência proteicas,
e poucos gaps. O scores é o cálculo entre a quantidade de matches menos a
quantidade de gaps

9. Cladograma:​ apenas mostram a topologia, a relação entre os taxa


Filograma:​ para além disso, mostra também a distância evolutiva entre os elementos

Perguntas professor Tiago

1.Explique a utilidade de diagramas na articulação de equipas multiprofissionais de saúde

Os diagramas, na articulação entre equipas multiprofissionais, são utilizados como


ferramentas para a comunicação estruturada em termos de análise funcional, como forma
de minimizar gaps na comunicação entre as equipas e obter organização dentro dela de
forma a beneficiar o doente e facilitar todo o processo . Também nos proporcionam uma
representação objetiva de problemas que poderão surgir e são possuem uma linguagem
consistente, clara e sem qualquer modelação.

2.Explique a importância da adesão às normas UML para elaboração de um diagrama

A Adesão às normas UML para a elaboração de diagramas tornou-se importante porque


permitiu que fosse possível representar o sistema de forma padronizada, isto é, tem como
objetivo construir um vocabulário ou uma linguagem que conseguisse relacionar a literatura
biomédica com as observações sobre o paciente.
3. Explique de que modo diferem os diagramas de fluxo dos diagramas de estado

Um Diagrama de Fluxo de Dados tem como intuito mapear o fluxo de informações que um
sistema possuiu. São utilizados para analisar um sistema existente ou modular um novo.
Detalham de forma progressiva o modo como os dados são ou irão ser manuseados
oferecendo uma maneira mais visual para a explicação do processo.

O Diagrama de Estados é uma representação do próprio estado ou situação em que um


objeto se pode encontrar no decorrer de uma execução de processos, de um sistema. Têm
como utilidade o facto de conseguirem descrever o comportamento de um “objeto” através
de vários casos de uso, isto é, conseguimos compreender todo o percurso da ação desde o
estado inicial até ao final.

4. Explique qual a importância da codificação dos registos clínicos e indique 4 catálogos de


codificação médica que conheça, bem como o propósito de cada um deles

A Codificação é a forma de garantir compreensão de, não só a linguagem, como também de


termos médicos entre profissionais e sistemas informáticos, não ocorrendo perdas de
informação ou significado.

● International Classification of Disease, que pode ser quer o ICD9 e o ICD10, é


utilizado para a codificação do Diagnóstico e Procedimentos Médicos.
● Medical Subject Headings é utilizado para a codificação da indexação de Artigos
Científicos.
● SNOMED Clinical Terms é utilizado para a codificação de conceitos médicos, as
suas relações, termos e sinónimos, abrangendo globalmente as entidades no âmbito
da saúde​.

5. Defina o conceito de interoperabilidade entre sistemas e ecplique a sua importância no


ambito da saúde

A Interoperabilidade, em termos da Informática Médica, tem a ver com a capacidade de os


diversos sistemas de informação, não só comunicarem, como também trocarem dados, e
também, utilizarem as informações trocadas, com outros aplicativos de software. Este
conceito é importante porque aumenta a segurança do paciente, por permitir que haja o
acesso e a disponibilidade dos dados clínicos destes.

6. Explique a diferença entre Source Medical Record e Problem Oriented Record

Source Oriented Medical Record é uma forma de registo médico onde os dados são
organizados de acordo com os seus fornecedores ou a sua fonte. As fontes podem ser
indivíduos, tais como médicos ou enfermeiros, que prestam assistência utilizando um
formato de papel: acontecendo um registo administrativo, notas clínicas dos profissionais de
saúde, registo de requisições, de resultados e, por último, especificam o plano de
tratamento.
Problem Oriented Medical Record é uma abordagem abrangente para registar e dar acesso
aos dados médicos do paciente, isto é, apresentam uma orientação aos problemas,
informações socioeconómicas, familiares e antecedentes. Também registam as notas do
progresso, incluindo problemas (ativos, inativos ou resolvidos), requisições e resultados e
prescrições. Neste sistema, é utilizado um formato direcionado para a conformação SOAP
(S- Subjetivo; O-Objetivo; A- Avaliação; P- Plano).

7. Explique a utilidade do armazenamento de registos em bases de dados normalizadas

A normalização das bases de dados, utilizam a normalização da informação, para um uso


transacional onde acontece a criação ou atualização, ou ainda, a modificação de múltiplas
linhas em simultâneo. Garantem que exista apenas uma fonte de verdade onde a
atualização da informação seja facilitada: aumentando a consistência e diminuindo a
redundância dos dados.

8. Explique em que medidas os níveis de evidência e a força de recomendação podem


sustentar o processo de decisão médica

Os níveis de evidência são importantes na decisão médica, no sentido em que, juntamente


com a experiência de um clínico e os valores e as preferências do paciente, irão conseguir
ajudar na decisão sobre os cuidados de saúde a tomar, isto é, estes níveis vão ajudar no
desenvolvimento, implementação e avaliação dos programas de ajuda clínica
fundamentadas nas evidências de pesquisa com melhores resultados.
A força de recomendação aborda a qualidade, quantidade e, também, a consistência das
evidências permitindo que os tratamentos clínicos sejam classificados. Assim sendo,
podemos aferir que esta se baseia num conjunto de evidências que irão ser classificadas
mediante a sua consistência e coerência como um todo, bem como a sua relação entre
benefícios, danos e custos sendo assim importante para a prática clínica.

10. Explique por que motivos as árvores de decisão e os modelos gráficos probabilisticos
são frequentemente usados no apoio à decisão médica

As ​árvores de decisão são abordagens de modelagem usadas para que se consiga passar
de observações sobre um item, que irá ser representado nos ramos, a conclusões sobre um
valor alvo deste item (representado nas folhas). Tem como vantagens o facto de possuir
interpretação e compressão simples; é capaz de utilizar dados quer numéricos, quer
categóricos. Para além do mais, requer pouca preparação dos dados a ser estudados,
apresenta um bom desempenho quando se utilizam conjuntos de dados de elevado
tamanho. Por estas razões podemos aferir que irão ser usados no apoio à decisão médica.

Os ​Modelos Gráficos Probabilísticos são modelos, nos quais, um grafo representa uma
estrutura de dependência condicional entre variáveis aleatórias, isto é, proporcionam uma
estrutura intuitiva para situações que envolvam aleatoriedade ou incerteza. É utilizado para
o apoio à decisão médica porque acarreta matrizes de julgamento e acaba por criar uma
escala de valores para cada ponto de vista fundamental, mediante o tratamento clínico.
Resumo dos Diagramas:

Os ​Diagramas de Sequência são diagramas em que acontece uma interação entre diversos
interlocutores sendo que cada tarefa, executada por eles, irá apresentar um tempo e as
relações, entre elas, serão contempladas. São, também, denominados por Diagramas de
Eventos.

Um ​Diagrama de Entidade relaciona “entidades” per se, onde estas se relacionam entre si,
dentro de um sistema. Incidem sobre as relações dos elementos, dentro das entidades, em
vez de relações entre as próprias entidades, podendo ter relações de pertença ou 1-1, 1-n e
n-n.

Os ​Diagramas de Processo (Activity) demonstram, em detalhe, as tarefas de um processo,


que pode ser constituído por um subprocesso (que irá ser representado num outro
diagrama), ou atividade (as tarefas, pontos de decisão, join e forks). Este Diagrama ajuda
na identificação e no entendimento das atividades principais atividades do processo.)

Notas:

1) Algoritmo utilizado no BLAST:


BLAST utiliza um algoritmo heurístico, simples e local.

2) O ​E-value é utilizado como uma medida de credibilidade, onde se alivia se o


nosso resultado se deve ao acaso ou se não tem um significado biológico
real, sendo que se avalia de 0 (não se deve ao acaso) a 1 (se deve ao
acaso).

3) O ​Bioedit utiliza o programa de Pairwise alignment porque gera todos os


alinhamentos possíveis, entre duas sequências, e escolhe o alinhamento que
nos dá um score mais elevado. O programa de BLAST utiliza um programa
heurístico caracterizado por “sacrificar a precisão em nome da rapidez, isto é,
procura rapidamente zonas de emparelhamento, mesmo não sendo perfeito,
e tenta estender o emparelhamento para os lados destas zonas.

Você também pode gostar