0% found this document useful (0 votes)

31 views4 pages

Protein Sequence Databases

The document outlines the distinction between primary and secondary protein sequence databases. Primary databases, such as UniProt and NCBI Protein, store experimentally determined sequences, while secondary databases, like Pfam and InterPro, analyze and classify these sequences for additional insights. This structured approach aids researchers in accessing raw data and enriched information for various applications in genomics and proteomics.

Uploaded by

asdfj7505

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

31 views4 pages

Protein Sequence Databases

Uploaded by

asdfj7505

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

Protein Sequence Databases: Primary and Secondary

1. Primary Databases

Primary databases store experimentally determined protein
sequences and associated metadata. They serve as
repositories for raw data submitted by researchers, often
including annotations like source organism, function, and
references. Key examples include:

- UniProt (Universal Protein Resource):

- **Swiss-Prot**: Manually curated entries with detailed
annotations, including function, structure, and post-
translational modifications.
- **TrEMBL**: Automatically annotated entries awaiting
curation, derived from EMBL-Bank/GenBank/DDBJ
translations.
- **UniProtKB**: Combines Swiss-Prot and TrEMBL,
offering comprehensive coverage.

- NCBI Protein: Part of the Entrez system, aggregating

data from GenBank, RefSeq, and PDB. RefSeq provides non-
redundant, curated sequences.
- **DDBJ** (DNA Data Bank of Japan): Collaborates with
GenBank and ENA to archive nucleotide sequences, with
protein translations available.

- PIR (Protein Information Resource): Now part of

UniProt, historically focused on protein classification.

2. Secondary Databases

Secondary databases analyze, classify, or predict features
from primary data, adding value through computational or
manual curation. They focus on domains, families,
structures, or functional annotations. Examples include:

- Pfam: Protein family database using hidden Markov

models (HMMs) to identify domains and families.
- **PROSITE**: Catalogs protein domains, families, and
functional sites using patterns and profiles.
- **InterPro**: Integrates multiple databases (Pfam,
PROSITE, PRINTS, etc.) to provide comprehensive protein
signature analysis.
- **PRINTS**: Fingerprint database for protein motif
identification.
- **SMART**: Focuses on domain architectures, particularly
in signaling and extracellular proteins.
- **CDD** (Conserved Domain Database): Annotates
conserved domains using tools like RPS-BLAST.

Structural and Functional Secondary Databases:

- **SCOP** (Structural Classification of Proteins) &
**CATH**: Classify protein structures into hierarchies (e.g.,
folds, superfamilies).
- **KEGG**: Maps proteins to metabolic pathways and
functional networks.
- **STRING**: Predicts protein-protein interactions based on
genomic context and experimental data.

**Key Differences**:
- **Primary**: Store raw sequences (e.g., UniProt).
- **Secondary**: Provide derived information (e.g., Pfam for
families, SCOP for structural classification).
**Applications**:
- **Primary**: Direct access to sequence data for research
like cloning or phylogenetics.
- **Secondary**: Facilitate functional annotation,
evolutionary studies, and structural predictions.

Integration: Tools like BLAST use primary databases for

sequence alignment, while secondary databases enhance
interpretation (e.g., identifying domains in BLAST results via
InterPro).

This structured approach ensures researchers can access

both raw data and enriched insights, driving advancements
in genomics and proteomics.

DATAbases 1 KD
No ratings yet
DATAbases 1 KD
5 pages
Unit II Major Databases in Bioinformatics
No ratings yet
Unit II Major Databases in Bioinformatics
54 pages
Protein Database Overview
No ratings yet
Protein Database Overview
13 pages
Databases - Final
No ratings yet
Databases - Final
50 pages
Protein Database
No ratings yet
Protein Database
3 pages
Biological Data Bases
No ratings yet
Biological Data Bases
36 pages
PDP
No ratings yet
PDP
2 pages
Presentation 11
No ratings yet
Presentation 11
20 pages
Lecture Topic: Protein Databases: Topics Covered
No ratings yet
Lecture Topic: Protein Databases: Topics Covered
67 pages
Protein Databases
No ratings yet
Protein Databases
12 pages
Module 2 Biodata
No ratings yet
Module 2 Biodata
36 pages
Overview of Sequence Databases
No ratings yet
Overview of Sequence Databases
135 pages
Expasy Links-1
No ratings yet
Expasy Links-1
4 pages
BCH 505 Bioinformatics 3 (2 2) Databases
No ratings yet
BCH 505 Bioinformatics 3 (2 2) Databases
17 pages
Biologicaldatabase 190402034501
No ratings yet
Biologicaldatabase 190402034501
26 pages
Module 2 (Bioinformatics)
No ratings yet
Module 2 (Bioinformatics)
81 pages
Rese Rach
No ratings yet
Rese Rach
37 pages
Bim3014 Protein Structure Analysis
No ratings yet
Bim3014 Protein Structure Analysis
13 pages
DBS 6202 - Advanced Database Systems Individual Assignment Iii
No ratings yet
DBS 6202 - Advanced Database Systems Individual Assignment Iii
16 pages
Serves List
100% (1)
Serves List
34 pages
Bio Informatics Notesss
No ratings yet
Bio Informatics Notesss
12 pages
Data Mining Proteomes
No ratings yet
Data Mining Proteomes
4 pages
Protein Databases
No ratings yet
Protein Databases
49 pages
Database 2
No ratings yet
Database 2
15 pages
Unit Ii
No ratings yet
Unit Ii
23 pages
BINC Syllabus All
No ratings yet
BINC Syllabus All
14 pages
Protein Databases
No ratings yet
Protein Databases
13 pages
Sequence and Structure Retrieval
No ratings yet
Sequence and Structure Retrieval
9 pages
Binc Syllabus For Paper-Iii Binc Bioinformatics Syllabus - Basic
No ratings yet
Binc Syllabus For Paper-Iii Binc Bioinformatics Syllabus - Basic
7 pages
Databases 2025
No ratings yet
Databases 2025
50 pages
Introduction To Databases
No ratings yet
Introduction To Databases
21 pages
Protein Databases 1
No ratings yet
Protein Databases 1
13 pages
? Bioinformatics Study Note
No ratings yet
? Bioinformatics Study Note
4 pages
Databases Class Work
No ratings yet
Databases Class Work
48 pages
Abasyn University Peshawar: Name: Ihsan Ullah Depart: BS Medical Lab Technology
No ratings yet
Abasyn University Peshawar: Name: Ihsan Ullah Depart: BS Medical Lab Technology
8 pages
Biological Database1
No ratings yet
Biological Database1
4 pages
Databases 2 KD
No ratings yet
Databases 2 KD
4 pages
Bioinformatics Biological Database
No ratings yet
Bioinformatics Biological Database
31 pages
Bioinformatics
No ratings yet
Bioinformatics
47 pages
Biological Databases
No ratings yet
Biological Databases
19 pages
Biological - Databases Class Work 60
No ratings yet
Biological - Databases Class Work 60
60 pages
Protein & Bioinformatics Databases Guide
No ratings yet
Protein & Bioinformatics Databases Guide
85 pages
Nucleic Acid Databases
No ratings yet
Nucleic Acid Databases
37 pages
Bioinformatics (Final)
No ratings yet
Bioinformatics (Final)
41 pages
L-5 Protein Database and Secondary Databases
No ratings yet
L-5 Protein Database and Secondary Databases
24 pages
Biological Database1
No ratings yet
Biological Database1
4 pages
Biological Information On Artificial Intelligence
No ratings yet
Biological Information On Artificial Intelligence
20 pages
Bioinformatic Databases 2
No ratings yet
Bioinformatic Databases 2
28 pages
Mids Notes
No ratings yet
Mids Notes
11 pages
BIOINFORMATICS
No ratings yet
BIOINFORMATICS
13 pages
Bioinformatics for Plant Scientists
No ratings yet
Bioinformatics for Plant Scientists
28 pages
Sec1 Introduction To Bioinformatics
No ratings yet
Sec1 Introduction To Bioinformatics
20 pages
Biological Databases
No ratings yet
Biological Databases
17 pages
Proteomics A2
No ratings yet
Proteomics A2
3 pages
6.1 Bioinformatics Databases and Tools - Introduction: Lecture 6: December, 28, 2001
No ratings yet
6.1 Bioinformatics Databases and Tools - Introduction: Lecture 6: December, 28, 2001
31 pages
Protein Databases
No ratings yet
Protein Databases
23 pages
Professional Thesis Writing Help
100% (3)
Professional Thesis Writing Help
8 pages
Seminario 06-Raf - Recruitment - To - Membrane-Science
No ratings yet
Seminario 06-Raf - Recruitment - To - Membrane-Science
7 pages
Biology Investigatory
No ratings yet
Biology Investigatory
12 pages
Synthetic Seed Production
No ratings yet
Synthetic Seed Production
3 pages
Understanding the Human Reproductive System
No ratings yet
Understanding the Human Reproductive System
35 pages
Biology Igsce Topic 4 - 0610
No ratings yet
Biology Igsce Topic 4 - 0610
3 pages
Full Real Exam Reading
No ratings yet
Full Real Exam Reading
12 pages
Piner High School Ste A M Certificate Level 1
No ratings yet
Piner High School Ste A M Certificate Level 1
3 pages
11TH - Fill in The Blanks Biology
No ratings yet
11TH - Fill in The Blanks Biology
50 pages
MCQ Sin Plant Physiology
No ratings yet
MCQ Sin Plant Physiology
9 pages
30 Second Zoology The 50 Most Fundamental Categories and Concepts From The Study of Animal Life 1st Edition Mark Fellowes Instant Download
No ratings yet
30 Second Zoology The 50 Most Fundamental Categories and Concepts From The Study of Animal Life 1st Edition Mark Fellowes Instant Download
32 pages
EURO-ECO Prez Biotech
No ratings yet
EURO-ECO Prez Biotech
35 pages
Spanish Reading Practice
No ratings yet
Spanish Reading Practice
6 pages
General Biology 1: Quarter 1 Module 6
No ratings yet
General Biology 1: Quarter 1 Module 6
28 pages
Ministry of Education
100% (1)
Ministry of Education
20 pages
ERD Concepts and Relationships Quiz
No ratings yet
ERD Concepts and Relationships Quiz
2 pages
Genomics Final
100% (1)
Genomics Final
105 pages
Kumar 2020 Revisao Ligninases
No ratings yet
Kumar 2020 Revisao Ligninases
18 pages
Sexual Reproduction Assignment
No ratings yet
Sexual Reproduction Assignment
3 pages
Mobilizing Mutations Human Genetics in The Age of Patient Advocacy Research PDF Download
100% (16)
Mobilizing Mutations Human Genetics in The Age of Patient Advocacy Research PDF Download
16 pages
Botany - Plant Cells - Plant Cytology
No ratings yet
Botany - Plant Cells - Plant Cytology
18 pages
Lecture 1
No ratings yet
Lecture 1
46 pages
Biofertilizers and Biopesticides
No ratings yet
Biofertilizers and Biopesticides
27 pages
Correa Et Al. 2022
No ratings yet
Correa Et Al. 2022
12 pages
FUNGI
No ratings yet
FUNGI
13 pages
Understanding Methemoglobinemia
No ratings yet
Understanding Methemoglobinemia
64 pages
Soil Microbial Ecology Postdoc Jobs
No ratings yet
Soil Microbial Ecology Postdoc Jobs
1 page
Clinical Genetics: Inheritance & Disorders
No ratings yet
Clinical Genetics: Inheritance & Disorders
15 pages
The Biology of Beauty The Science Behind Human Attractiveness Rachelle M Smith Instant Download
No ratings yet
The Biology of Beauty The Science Behind Human Attractiveness Rachelle M Smith Instant Download
152 pages
Concise Paediatric Book
100% (1)
Concise Paediatric Book
561 pages

Protein Sequence Databases

Uploaded by

Protein Sequence Databases

Uploaded by

**Protein Sequence Databases: Primary and Secondary**

**1. Primary Databases**

- **UniProt** (Universal Protein Resource):

- **NCBI Protein**: Part of the Entrez system, aggregating

- **PIR** (Protein Information Resource): Now part of

**2. Secondary Databases**

- **Pfam**: Protein family database using hidden Markov

**Structural and Functional Secondary Databases**:

**Integration**: Tools like BLAST use primary databases for

This structured approach ensures researchers can access

You might also like

Protein Sequence Databases: Primary and Secondary

1. Primary Databases

- UniProt (Universal Protein Resource):

- NCBI Protein: Part of the Entrez system, aggregating

- PIR (Protein Information Resource): Now part of

2. Secondary Databases

- Pfam: Protein family database using hidden Markov

Structural and Functional Secondary Databases:

Integration: Tools like BLAST use primary databases for