0% ont trouvé ce document utile (0 vote)

459 vues23 pages

Bioinformatique et Biomolécules

Ce document présente une introduction à la bioinformatique en décrivant son historique, ses objectifs et les principales ressources bioinformatiques telles que les bases de données de séquences. Le document détaille les différents types de bases de données comme les banques généralistes et spécialisées ainsi que leurs caractéristiques.

Transféré par

line

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

459 vues23 pages

Bioinformatique et Biomolécules

Transféré par

line

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Master Agroalimentaire S2

Techniques d’analyses des biomolecules :

Bioinformatique
Cours 1
P RO F MAU R ADY AM AL
D É PARTE ME N T D E S SC I E N CE S D E L A V I E
FST T - UAE : 2020-2021
Historique
Les apports de la Bioinformatique sont multiples et permettent de :
• Compiler et organiser les données (bases de données).
• Réaliser un traitement systématique des séquences permettant la
caractérisation des fonction biologiques.
• Elaborer des stratégies pour apporter des connaissances (ex : matrices
de substitution pour les acides aminés).

2
Introduction
 La bioinformatique : L’organisation de séquences et information biologiques
dans des bases de données facilement accessibles.
 Le développement de la bioinformatique s’est fait en parallèle avec les
sciences « omics » qui requières des technologies à haut-débit ne recherchant
pas la précision/qualité, mais plutôt le nombre de résultats
 L’information stocké et analysé dans des bases de données est sous forme de :
 Acide DéxoxyriboNucléique
 Acide RiboNucléique
 messagerADN
 ARNm
 Protéine (structure ou enzyme)

3
Bioinformatique
La Bio-Informatique s’applique à tout type de données biologiques, en particulier moléculaires :
 Les séquences d’ADN et de protéines
 Les structures d’ARN et de protéines
 Les contenus en gènes des génomes
 Les puces à ADN (microarrays)
 Les réseaux d’interactions entre protéines
 Les réseaux métaboliques
 Les arbres de phylogénie

4
Objectifs de la Bioinformatique
 Faire avancer les connaissances dans le domaine de :
 Biologie,
 Génétique humaine,
 Théorie de l’évolution…
 « Drug design »la conception de médicaments
 Etudier les maladies complexes..

5
Objectifs de la Bioinformatique
 Décoder l’information contenue dans les séquences d’ADN et de protéines
 Trouver des gènes
 Différencier entre introns et exons
 Analyser les répétitions dans l’ADN
 Identifier les sites des facteurs de transcription
 Étudier l’évolution des génomes
 Génomique structurale:
 Modéliser les structures 3D des protéines et des ARN structurels
 Déterminer la relation entre structure et fonction

 Génomique fonctionnelle
 Étudier la régulation des gènes
 Déterminer les réseaux d’interaction entre les protéines

6
Séquence sont de différentes natures :
 Nucléotides (ADN/ARN)
 Acide aminées (Protéines)
 Elles peuvent être complète ou non Génomique
 Les études à réaliser sont les suivantes :
 Étude des génomes, donc de l’ADN structurale et fonctionnelle
 Transcriptomique:
 Étude des ARNm d’un tissu
 Protéomique: Étude des protéines d’un tissu
 Génomique : Étude de l’ensemble des génomes ou des séquences dans un
échantillon biologique (eau, sol, tissu)

7
Informations recherchés
 Questions pour un biologiste?

 Rechercher l’Unité fonctionnelle ARNm

 Préservation de l’information ADN

 Compare un tissu malade

 Chercher une séquence d’une Protéine et la comparer à une autre

 Chercher un gène

 Chercher des mutations

 Etc ….

8
Objectifs :
 Identifier une séquence par rapport à une base de données
 Déterminer le degré de similitudes entre deux séquences (intérêt en
taxonomie)
 Repérer des motifs structuraux pour les protéines
 Repérer pour un nucléotide
◦ Gènes,
◦ Promoteurs,
◦ etc.
 Repérer des zone de repliement pour un polypeptide
 site actif, etc.

9
Origine des données Bioinformatiques
 A partir des données de séquençage classique : depuis 1975

Amplification de fragment d’ADN prédé[Link] séquence un fragment à la fois.

 A partir des données de séquençage de nouvelle génération : depuis 2005

Les taux d’erreurs sont en moyenne 10 fois plus élevés que les méthodes de séquençage en
capillaires le type d’erreur varie selon la plate-forme

 la grande quantité de séquences offre la possibilité de générer de l’information de séquence à

très grande échelle de réduire énormément le les taux d’erreur

10
Historique de la Bioinformatique
La bioinformatique a différents objectifs et différentes applications :
1-Collecter et stocker des informations dans des bases de données, accessibles
en ligne.
Explosion de la quantité de données biologiques nécessitant des outils de
stockage adaptés
2-Fournir des outils de comparaison de séquences (protéiques ou
nucléotidiques).
 Séquence de référence
 Analyse des Séquences :
 Identification des séquences ?
 Points communs entre les séquences ?
. 11
Ressources bioinformatique
Bases de données bio-informatique contiennent :

 Ensemble de données relatives à un domaine, organisées par traitement

informatique, accessibles en ligne et à distance

 Souvent, les données sont stockées sous la forme d’un fichier texte formaté
(respectant une disposition particulière)

Nous avons besoin de trouver sinon de développer des logiciels spécifiques pour
interroger les données contenues dans ces banques

12
Historique des banques de données de séquences

Fin 1960 : Margaret Dayhoff : «Atlas of protein sequences »

1984 : création de PIR (Protein Identification Ressource)
1979 : création de GenBank au NCBI (National Center for Biotechnology
Information)
1980 : création de EMBL (European Molecular Biology Laboratory) EBI
1984 : création de DDBJ (DNA Databank of Japan)
1986 : création de SwissProt

13
Les Banques Généralistes
 Caractéristiques des banques de données généralistes :

 Ces banques contiennent des données hétérogènes

 Collecte la plus exhaustive possible

 Banques de séquences nucléiques

 Banques de séquences protéiques

 Banques de structure 3D de macromolécules

 Banques d’articles scientifiques

 Avantage : on peu consulter plusieurs volets de l’information recherché en

une fois

 Inconvénients : difficiles à maintenir, difficiles à interroger 14

Les Banques Généralistes
Ces banques contiennent l’ensemble des séquences publiées car les
numéros d’enregistrement (accession number) des séquences sont
exigés par les éditeurs lors de la publication. Problèmes :

• Redondance

• Erreurs de séquencage

• Fautes de frappe

• Présence de fragments de vecteurs dans les séquences

15
Les banques de données spécialisées
 Ces banques contiennent des données homogènes
 les données Collecté sont autour d’une thématique particulière
 Avantages : facilité pour mettre à jour les données, vérifier leur intégrité,
offrir une interface adaptée, …
 Inconvénients : ne cible pas toujours ce que l’on veut et on a encore besoin de
crée plusieurs banques spécialisées
 Exemples :
 banques spécialisées pour un génome,
 banques de séquences d'immunologies,
 banques sur des séquences validées, …

16
Les banques de séquences nucléiques
 Origine des données : des données de Séquençage d’ADN et d’ARN

 Les données stockées sont : séquences + annotations et peuvent être des :

 Des Fragments de génomes : un ou plusieurs gènes, un bout de gène, séquence

inter génique, …

 Des Génomes complets

 Des sequences ARNm, ARNt, ARNr, … (fragments ou entiers)

17
Les banques de séquences protéiques
Origine des données de séquençage proteiques :
 Traduction de séquences d’ADN
 Séquençage de protéines
 Protéine dont le géne est séquencé
Protéines dont la structure 3D est connue
 Les données stockées sont des séquences + annotations
 Protéines entières
 Fragments de protéines

18
Une Banque bibliographique, PubMed
Cette banque de données Contient :
 Journaux concernant la biologie et la médecine
 Articles indexés par des experts à l’aide des termes MeSH
 Termes MeSH : vocabulaire contrôlé de termes biomédicaux et de molécules chimiques
Hiérarchisé
 Dictionnaire de synonymes
 termes médicaux, termes chimiques
Subheadings : sous-titres qui décrivent un aspect particulier des termes MeSH
 Elle est Mise à jour régulièrement

19
Les bases de données bioinformatiques :
 Base de données NCBI ( National Center for Biotechnology Information)
Site web : [Link]
 GenBank: Séquences d’ADN (3 billion de paires de bases)
 Site alignement de séquence avec le logiciel de BLAST
 PubMed: Permet la recherche bibliographique
 COGs: pour chercher des Familles de gènes orthologues …

Base de données EMBL (The European Molecular Biology Laboratory)

Site web : [Link]
EMBL-EBI : L’institut européen de bio-informatique EBI
[Link]

20
Les bases de données bioinformatiques :
 DDBJ : ce centre fournit des services de partage et d'analyse pour les données
issues des recherches en sciences de la vie et des avancées scientifiques
Site web : [Link]
 Est une base de donnée créée en 1984 au Japon.

21
Les bases de données bioinformatiques :
 L’ensemble de ces 3 banques ont un format unique : « DDBJ/EMBL/GenBank Feature
Table » et un contenu quasi identiquede données de séquensage.

 Elles fait partie du consortium international : International Nucleotide Sequence

Database.

22
23

Vous aimerez peut-être aussi

Bioinformatique 3ème Licence Microbiologie 27 05 2018
Pas encore d'évaluation
Bioinformatique 3ème Licence Microbiologie 27 05 2018
15 pages
Introduction à la Bioinformatique
Pas encore d'évaluation
Introduction à la Bioinformatique
37 pages
Polycopié de Bioinformatique Déposé
Pas encore d'évaluation
Polycopié de Bioinformatique Déposé
109 pages
Expose Bioinformatique
100% (1)
Expose Bioinformatique
10 pages
Cours Bases de Donnes 04 Bio Info
Pas encore d'évaluation
Cours Bases de Donnes 04 Bio Info
58 pages
Cours - Bioinformatique S1 1
Pas encore d'évaluation
Cours - Bioinformatique S1 1
26 pages
Introduction à la Bioinformatique
Pas encore d'évaluation
Introduction à la Bioinformatique
8 pages
Introduction à la bioinformatique et ses applications
Pas encore d'évaluation
Introduction à la bioinformatique et ses applications
79 pages
Introduction au Master en Bioinformatique
Pas encore d'évaluation
Introduction au Master en Bioinformatique
140 pages
1-Bioinfo de Base Introduction L3 Microbio 05 05 2022
Pas encore d'évaluation
1-Bioinfo de Base Introduction L3 Microbio 05 05 2022
21 pages
Nouveau Cours Bioinformatique PDF
100% (2)
Nouveau Cours Bioinformatique PDF
51 pages
Cours 1 BioInfo
100% (4)
Cours 1 BioInfo
20 pages
Cours 1 Bioinformatique
100% (3)
Cours 1 Bioinformatique
55 pages
Bioinformatique Structurale sous Linux
Pas encore d'évaluation
Bioinformatique Structurale sous Linux
36 pages
Cours 1
100% (1)
Cours 1
6 pages
Cours Bioinformatique 04 03 2020
Pas encore d'évaluation
Cours Bioinformatique 04 03 2020
69 pages
Cours2 Base de Données Et Séquences Version Complète4X4w
Pas encore d'évaluation
Cours2 Base de Données Et Séquences Version Complète4X4w
19 pages
Chapitre II Les Banques de Données
Pas encore d'évaluation
Chapitre II Les Banques de Données
12 pages
Bioinfo et Modélisation pour Débutants
Pas encore d'évaluation
Bioinfo et Modélisation pour Débutants
58 pages
Cours 2-Alignement de Sequence 2019
Pas encore d'évaluation
Cours 2-Alignement de Sequence 2019
19 pages
Banques de Séquences et Alignement Bioinformatique
Pas encore d'évaluation
Banques de Séquences et Alignement Bioinformatique
40 pages
TD Bioinformatique
Pas encore d'évaluation
TD Bioinformatique
11 pages
Analyse de Séquence avec R : Guide Pratique
100% (1)
Analyse de Séquence avec R : Guide Pratique
8 pages
Bioinfo: Analyse de Séquences et R
Pas encore d'évaluation
Bioinfo: Analyse de Séquences et R
11 pages
TP - 01
Pas encore d'évaluation
TP - 01
2 pages
BIOINFORMATIQUE Cours4 Blast
Pas encore d'évaluation
BIOINFORMATIQUE Cours4 Blast
31 pages
TP Bioinformatique Mai 2021
Pas encore d'évaluation
TP Bioinformatique Mai 2021
2 pages
Cours1 Introduction A La Bioinfo2021-SV3-SVT34x4
Pas encore d'évaluation
Cours1 Introduction A La Bioinfo2021-SV3-SVT34x4
12 pages
Introduction à la Bioinformatique
Pas encore d'évaluation
Introduction à la Bioinformatique
22 pages
Compte Rendu TP Bioinformatique
Pas encore d'évaluation
Compte Rendu TP Bioinformatique
7 pages
Bioinformatique : Exercices et Concepts Clés
Pas encore d'évaluation
Bioinformatique : Exercices et Concepts Clés
10 pages
TP 2 (Introduction À La Bioinformatique) (B)
Pas encore d'évaluation
TP 2 (Introduction À La Bioinformatique) (B)
2 pages
1 - Introduction À La Génomique
100% (1)
1 - Introduction À La Génomique
22 pages
Blast
Pas encore d'évaluation
Blast
9 pages
TD Design Amorces PCR Diagnostic PCR de Staphylococcus Aureus BLOG
Pas encore d'évaluation
TD Design Amorces PCR Diagnostic PCR de Staphylococcus Aureus BLOG
2 pages
Cladistique et Phylogénie Moléculaire
Pas encore d'évaluation
Cladistique et Phylogénie Moléculaire
29 pages
Logiciels d'analyse en bioinformatique
Pas encore d'évaluation
Logiciels d'analyse en bioinformatique
17 pages
Bioinformatique Master
Pas encore d'évaluation
Bioinformatique Master
46 pages
TP Les Bases de Données Biologiques M1 Microbiologie Appliquée
100% (2)
TP Les Bases de Données Biologiques M1 Microbiologie Appliquée
2 pages
Correction D'exam Bio-Informatique 2021-2022
Pas encore d'évaluation
Correction D'exam Bio-Informatique 2021-2022
6 pages
Exercices Alignement
100% (1)
Exercices Alignement
2 pages
Generalites Bioinformatique
100% (1)
Generalites Bioinformatique
42 pages
Bioinformatique et Modélisation 3D
Pas encore d'évaluation
Bioinformatique et Modélisation 3D
45 pages
Cours 1 Bioinfo Toxico
Pas encore d'évaluation
Cours 1 Bioinfo Toxico
27 pages
TP Bioinformatique : Exploration de RefSeq
Pas encore d'évaluation
TP Bioinformatique : Exploration de RefSeq
1 page
Ib2021-22 2 Alignement TP
Pas encore d'évaluation
Ib2021-22 2 Alignement TP
10 pages
Bio Informatique
100% (2)
Bio Informatique
199 pages
Design Amorces
100% (1)
Design Amorces
22 pages
Analyse Génomique
Pas encore d'évaluation
Analyse Génomique
31 pages
Comparaison Des Sequences
Pas encore d'évaluation
Comparaison Des Sequences
81 pages
COURS 9 Séquençage
Pas encore d'évaluation
COURS 9 Séquençage
109 pages
Introduction à la bioinformatique
Pas encore d'évaluation
Introduction à la bioinformatique
19 pages
Enzyme Utilisee en Biologie Moleculaire
Pas encore d'évaluation
Enzyme Utilisee en Biologie Moleculaire
28 pages
TD - 1 - L3 - Genomique - PPTX - Filename - UTF-8''TD (1) L3 Genomique
Pas encore d'évaluation
TD - 1 - L3 - Genomique - PPTX - Filename - UTF-8''TD (1) L3 Genomique
31 pages
Travaux Dirigés de Biologie Moléculaire
Pas encore d'évaluation
Travaux Dirigés de Biologie Moléculaire
3 pages
Biologie Moleculaire Et Bio Informatique Sujet 23 24
Pas encore d'évaluation
Biologie Moleculaire Et Bio Informatique Sujet 23 24
124 pages
PR Ése Ntation 1
Pas encore d'évaluation
PR Ése Ntation 1
49 pages
Cour1 Bioinfo
Pas encore d'évaluation
Cour1 Bioinfo
20 pages
A Envoyer Bioinformatique Master 2024-25
Pas encore d'évaluation
A Envoyer Bioinformatique Master 2024-25
60 pages
Bases de données en bioinformatique
Pas encore d'évaluation
Bases de données en bioinformatique
9 pages
La Grenouille et le Bœuf : Leçon de Vie
Pas encore d'évaluation
La Grenouille et le Bœuf : Leçon de Vie
3 pages
Facture Téléviseur LED RueDuCommerce
Pas encore d'évaluation
Facture Téléviseur LED RueDuCommerce
2 pages
Rapport de Stage SAHNOUNEs
Pas encore d'évaluation
Rapport de Stage SAHNOUNEs
13 pages
CORRIGÉ SERIE 1 Analyse Math
Pas encore d'évaluation
CORRIGÉ SERIE 1 Analyse Math
11 pages
Michael Jackson Black or White PDF Preview
Pas encore d'évaluation
Michael Jackson Black or White PDF Preview
14 pages
Carte Point Gachette
Pas encore d'évaluation
Carte Point Gachette
26 pages
Restructuration du RGIE en 2020
Pas encore d'évaluation
Restructuration du RGIE en 2020
11 pages
Method Part 1
100% (2)
Method Part 1
50 pages
CV Chaouch Rachid
Pas encore d'évaluation
CV Chaouch Rachid
2 pages
Inscription à la formation immobilière
Pas encore d'évaluation
Inscription à la formation immobilière
1 page
4TPN° - 04 - Générer Un Rapport de Vente Dans Power BI
Pas encore d'évaluation
4TPN° - 04 - Générer Un Rapport de Vente Dans Power BI
16 pages
Bronchiolites PR LAALAOUI
Pas encore d'évaluation
Bronchiolites PR LAALAOUI
26 pages
5 Dqe
Pas encore d'évaluation
5 Dqe
7 pages
Poèmes sur les étoiles et la nuit
Pas encore d'évaluation
Poèmes sur les étoiles et la nuit
10 pages
Ebook Etsy
Pas encore d'évaluation
Ebook Etsy
16 pages
Figures Turbomoteurs Avions
100% (1)
Figures Turbomoteurs Avions
110 pages
Diagnostic de 14 Startups à Banga-Njombe
Pas encore d'évaluation
Diagnostic de 14 Startups à Banga-Njombe
2 pages
KoBoToolbox dans le projet PPAT&RD
Pas encore d'évaluation
KoBoToolbox dans le projet PPAT&RD
68 pages
Les Mérovingiens
Pas encore d'évaluation
Les Mérovingiens
20 pages
THERAPEUTIQUE2
100% (2)
THERAPEUTIQUE2
15 pages
Bertholet, Guilhem - Lang, Thomas - Muletier, Clément-La Gamification - Ou L'art D'utiliser Les Mécaniques Du Jeu Dans Votre Business-Eyrolles (2014)
Pas encore d'évaluation
Bertholet, Guilhem - Lang, Thomas - Muletier, Clément-La Gamification - Ou L'art D'utiliser Les Mécaniques Du Jeu Dans Votre Business-Eyrolles (2014)
201 pages
Cours de Sante Publique Adrien
Pas encore d'évaluation
Cours de Sante Publique Adrien
243 pages
TS Latin
Pas encore d'évaluation
TS Latin
1 page
15-02-2024 - DS Rappro Bancaire
Pas encore d'évaluation
15-02-2024 - DS Rappro Bancaire
4 pages
Rapport TP
Pas encore d'évaluation
Rapport TP
17 pages
Cours de Français Ana - Google Docs
Pas encore d'évaluation
Cours de Français Ana - Google Docs
14 pages
Format Cegid pour Import/Export Comptable
Pas encore d'évaluation
Format Cegid pour Import/Export Comptable
13 pages
Impact de l'IA Sur Le Marché Économique.
Pas encore d'évaluation
Impact de l'IA Sur Le Marché Économique.
1 page
Jonsered CS 2141
Pas encore d'évaluation
Jonsered CS 2141
60 pages
A Cause de Leur Incrédulité
Pas encore d'évaluation
A Cause de Leur Incrédulité
5 pages