IPC Assignment 2

The document outlines an assignment focused on parallel processing of genome sequence alignment using OpenMP, specifically for analyzing large genomic datasets in FASTA format. It requires the implementation of a C/C++ program that computes a similarity matrix for pairwise sequence alignments and includes a performance analysis comparing single-threaded and parallel implementations. Additionally, it provides guidelines for dataset preparation and a separate task to parallelize a binary tree traversal using various OpenMP directives.

Uploaded by

Nikhil Ruhela

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

22 views3 pages

IPC Assignment 2

Uploaded by

Nikhil Ruhela

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

28/01/2025

IPC ASSIGNMENT 2

Problem Statement
Title: Parallel Processing of Genome Sequence Alignment Using OpenMP

Description: Genome alignment is a critical computational task in bioinformatics used to

compare DNA sequences, identify similarities, and detect mutations or evolutionary
relationships. Given the growing availability of genomic data from sequencing projects,
analyzing large genome datasets (e.g., multi-gigabyte FASTA files) is computationally expensive
and time-consuming.

Your task is to design and implement a parallel solution using OpenMP to perform
pairwise sequence alignment on genome data stored in FASTA files. The alignment should
compute a similarity score for each pair of sequences using a scoring scheme (e.g.,
match/mismatch penalties and gap penalties).

Objectives:
1. Input: A FASTA file containing genome sequences, each ranging from 1 MB to 10 MB
in size.
2. Output: A similarity matrix containing scores for all pairwise sequence alignments.

Constraints:
1. Scoring scheme for alignment will be based on any relevant algorithm of your choice.
2. The program should utilize OpenMP to parallelize the computation across multiple cores.

Deliverables:
1. An OpenMP-enabled C/C++ program that reads FASTA files, performs sequence
alignment, and outputs the similarity matrix to a file.
2. A performance analysis report comparing single-threaded and parallel implementations,
highlighting the speedup achieved using OpenMP.
3. Documentation explaining the approach, the OpenMP directives used, and any
optimization techniques employed.
Dataset help:-

 To work on the problem of parallel processing of genome sequence alignment using

OpenMP, you'll need access to large genomic datasets in FASTA format real genomic
data (composed of A, T, G, C).
. The reputable source where you can download such data:
 NCBI Datasets: The National Center for Biotechnology Information (NCBI) provides a
command-line tool to download large genome data packages. Link-
https://www.ncbi.nlm.nih.gov/

When selecting or creating FASTA files for your OpenMP-based genome sequence alignment,
the characteristics of the data should align with the specific goals and challenges you want to
address. Refer below on how to prepare the appropriate dataset:

a. Genome sequences should share high similarity but still have significant variations
b. Similar Species Dataset:
o Human (Homo sapiens) and Neanderthal genome sequences.
o Human (Homo sapiens) vs. Chimpanzee (Pan troglodytes), or different strains of
the same bacterium (e.g., Escherichia coli K-12 vs. O157:H7).
c. Dataset Size
o Small-scale testing: 10–100 sequences of 1–2 MB each.

Make sure the sequences vary in length, as this introduces computational challenges
Problem Statement

1. Parallelize a Binary Tree Traversal using tasks.

2. Write separate code for the following directives and explain its use in
various applications during viva

#pragma omp atomic

#pragma omp barrier
#pragma omp critical
#pragma omp flush
#pragma omp for
#pragma omp master
#pragma omp ordered
#pragma omp parallel
#pragma omp parallel for
#pragma omp parallel sections
#pragma omp section
#pragma omp sections
#pragma omp single
#pragma omp task
#pragma omp taskwait
#pragma omp taskyield
#pragma omp task priority(pvalue)
#pragma omp threadprivate

Batch 17
No ratings yet
Batch 17
30 pages
String Matching: Intel Threading Challenge 2009
No ratings yet
String Matching: Intel Threading Challenge 2009
5 pages
Lectures 9-12
No ratings yet
Lectures 9-12
39 pages
Bi183 HW2
No ratings yet
Bi183 HW2
4 pages
02 00 PMBIO Module02 Inputs
No ratings yet
02 00 PMBIO Module02 Inputs
32 pages
Bibm49941 2020 9313429
No ratings yet
Bibm49941 2020 9313429
8 pages
RNA-seq Analysis on HPRC Grace
No ratings yet
RNA-seq Analysis on HPRC Grace
58 pages
Daa Assignment 10 Aryan Project
No ratings yet
Daa Assignment 10 Aryan Project
11 pages
Sequence Alignment Thesis
100% (2)
Sequence Alignment Thesis
6 pages
Computational and Systems Biology Assignment Help
100% (1)
Computational and Systems Biology Assignment Help
15 pages
Genomic Sequence Comparison Benchmark
No ratings yet
Genomic Sequence Comparison Benchmark
40 pages
Titanic: Mohit Kothari Roger Tanuatmadja Gautam Akiwate
No ratings yet
Titanic: Mohit Kothari Roger Tanuatmadja Gautam Akiwate
18 pages
Batch 17
No ratings yet
Batch 17
51 pages
Algorithms For Biological Sequence Analysis: Class Presentation
No ratings yet
Algorithms For Biological Sequence Analysis: Class Presentation
40 pages
Minor
No ratings yet
Minor
37 pages
Whole Genome Alignment Tools Survey
No ratings yet
Whole Genome Alignment Tools Survey
6 pages
Module 3 Session.2 Practical Assignment-Lucy Nakabazzi
No ratings yet
Module 3 Session.2 Practical Assignment-Lucy Nakabazzi
4 pages
Bioinformatics Resources Overview
No ratings yet
Bioinformatics Resources Overview
55 pages
ATPESC 2022 Track 2a Talk 1 Mattson Openmp
No ratings yet
ATPESC 2022 Track 2a Talk 1 Mattson Openmp
287 pages
Project Report (Parallel SM - NW) PDF
No ratings yet
Project Report (Parallel SM - NW) PDF
21 pages
Accelerating DNA Pairwise Sequence Alignment Using FPGA and A Customized Convolutional Neural Network - ScienceDirect
No ratings yet
Accelerating DNA Pairwise Sequence Alignment Using FPGA and A Customized Convolutional Neural Network - ScienceDirect
9 pages
Minor 1
No ratings yet
Minor 1
36 pages
Module5 Session1 Prac
No ratings yet
Module5 Session1 Prac
3 pages
Bioinfo FR 4
No ratings yet
Bioinfo FR 4
5 pages
OpenMP Binary Tree Traversal Lab
No ratings yet
OpenMP Binary Tree Traversal Lab
10 pages
CC Lab Manual
No ratings yet
CC Lab Manual
39 pages
Hardware Acceleration in Genomic Sequencing
No ratings yet
Hardware Acceleration in Genomic Sequencing
5 pages
Coding For Biologists
No ratings yet
Coding For Biologists
3 pages
Sequence Alignments: Felix Sappelt Irina Wagner
100% (1)
Sequence Alignments: Felix Sappelt Irina Wagner
34 pages
Blast N Fasta
No ratings yet
Blast N Fasta
55 pages
BTT302 - Ktu Qbank
No ratings yet
BTT302 - Ktu Qbank
6 pages
CUDA ClustalW: Fast GPU Sequence Alignment
No ratings yet
CUDA ClustalW: Fast GPU Sequence Alignment
7 pages
Bioprocess Kinetics
No ratings yet
Bioprocess Kinetics
9 pages
Project Details and Deliverables
No ratings yet
Project Details and Deliverables
2 pages
Asm 3 G10
No ratings yet
Asm 3 G10
8 pages
Genome Parsergenome Parsergenome Parsergenome Parser
No ratings yet
Genome Parsergenome Parsergenome Parsergenome Parser
165 pages
Manual Get Homologues-Est
No ratings yet
Manual Get Homologues-Est
42 pages
Bioinformatics
No ratings yet
Bioinformatics
22 pages
ACMbiopy
No ratings yet
ACMbiopy
9 pages
Diploma - Practical
No ratings yet
Diploma - Practical
11 pages
Batch 17 Final
No ratings yet
Batch 17 Final
38 pages
Application in Establishing Epidemiology and Variability: Genome & Protein " Sequence Analysis Programs"
100% (3)
Application in Establishing Epidemiology and Variability: Genome & Protein " Sequence Analysis Programs"
23 pages
Ngs Papers
No ratings yet
Ngs Papers
3 pages
Bioinformatics Tools for Omicron Study
No ratings yet
Bioinformatics Tools for Omicron Study
63 pages
Clu Stal
No ratings yet
Clu Stal
6 pages
Bioinformatics Lab Manual: HLA-B Analysis
No ratings yet
Bioinformatics Lab Manual: HLA-B Analysis
62 pages
Kandy Essay Submission Guidelines
100% (1)
Kandy Essay Submission Guidelines
14 pages
Sequence Similarity Searching: WWW - Med.nyu - edu/rcr/rcr/course/PPT/similarity
No ratings yet
Sequence Similarity Searching: WWW - Med.nyu - edu/rcr/rcr/course/PPT/similarity
57 pages
Sequence Alignment and Motif Detection Guide
No ratings yet
Sequence Alignment and Motif Detection Guide
2 pages
Sequence Similarity Search with BLAST
No ratings yet
Sequence Similarity Search with BLAST
19 pages
Bioinformatics
No ratings yet
Bioinformatics
55 pages
Uniroma1 Bioinformatics pcs2 2021 Ichatz Talk10
No ratings yet
Uniroma1 Bioinformatics pcs2 2021 Ichatz Talk10
5 pages
Lesson 4.3 Fast Blast
No ratings yet
Lesson 4.3 Fast Blast
45 pages
MPI Parallelization for Bioinformatics
No ratings yet
MPI Parallelization for Bioinformatics
4 pages
Balamurugan
No ratings yet
Balamurugan
17 pages
Bioinformatics Assingment - B8.Docx Alex Presly-37
No ratings yet
Bioinformatics Assingment - B8.Docx Alex Presly-37
10 pages
Exam Programming Exercises
No ratings yet
Exam Programming Exercises
7 pages
OpenCL Smith-Waterman for GPUs
No ratings yet
OpenCL Smith-Waterman for GPUs
1 page
High Performance Computing For Computational Mechanics: ISCM-10
No ratings yet
High Performance Computing For Computational Mechanics: ISCM-10
63 pages
Laplace Transform in Circuit Analysis
No ratings yet
Laplace Transform in Circuit Analysis
11 pages
Math Exam Paper Analysis
No ratings yet
Math Exam Paper Analysis
3 pages
JPB WORKING PAPER Politics of Identity, Autonomy and Tribal Question in Assam
No ratings yet
JPB WORKING PAPER Politics of Identity, Autonomy and Tribal Question in Assam
9 pages
2 - Reviewer For PMLS1
No ratings yet
2 - Reviewer For PMLS1
2 pages
Mona - Soil-Structure Interaction Report (4) v.0.0
No ratings yet
Mona - Soil-Structure Interaction Report (4) v.0.0
21 pages
Marketing Environment Notes Class 11 CBSE
No ratings yet
Marketing Environment Notes Class 11 CBSE
5 pages
Redox Titration
No ratings yet
Redox Titration
27 pages
Practical Strategiesfor Writingin Plain Language
No ratings yet
Practical Strategiesfor Writingin Plain Language
3 pages
Writing An Analysis Thesis Statement
100% (3)
Writing An Analysis Thesis Statement
6 pages
Arab COOs Shaping 2024 Business
No ratings yet
Arab COOs Shaping 2024 Business
40 pages
Olevel Physics Revised Edition 2016
No ratings yet
Olevel Physics Revised Edition 2016
426 pages
Educational Philosophies Compared
No ratings yet
Educational Philosophies Compared
7 pages
EE221A Problem Set 1 Overview
100% (1)
EE221A Problem Set 1 Overview
45 pages
Luyện Tập Trắc Nghiệm 1-5
No ratings yet
Luyện Tập Trắc Nghiệm 1-5
8 pages
Adaptations To Wind Dispersal and Their Bioinspiration
No ratings yet
Adaptations To Wind Dispersal and Their Bioinspiration
36 pages
Psychological Well-Being in Adult Life Ryff 1995
100% (1)
Psychological Well-Being in Adult Life Ryff 1995
7 pages
3rd Quarter - Identifying Bias For or Against
No ratings yet
3rd Quarter - Identifying Bias For or Against
29 pages
2019 Volkmann
No ratings yet
2019 Volkmann
9 pages
L1 - AE11 Managerial Economics
No ratings yet
L1 - AE11 Managerial Economics
9 pages
10 Science 2
No ratings yet
10 Science 2
3 pages
Sustainability for Students
No ratings yet
Sustainability for Students
64 pages
Energy Management - Fundamentals
No ratings yet
Energy Management - Fundamentals
8 pages
Understanding Tag Questions in English
No ratings yet
Understanding Tag Questions in English
4 pages
Canagarajah - 1999 - Resisting Linguistic Imperialism
No ratings yet
Canagarajah - 1999 - Resisting Linguistic Imperialism
29 pages
1 Ophthalmoscopes
No ratings yet
1 Ophthalmoscopes
24 pages
Short Answers
No ratings yet
Short Answers
2 pages
2.3 - Ultimate Strength Stage
No ratings yet
2.3 - Ultimate Strength Stage
12 pages
Numerology by Daniel Heydon 1986
100% (4)
Numerology by Daniel Heydon 1986
100 pages
BiHom Zinbiel
No ratings yet
BiHom Zinbiel
20 pages
2019 Grade 6 ATP-1
No ratings yet
2019 Grade 6 ATP-1
13 pages

IPC Assignment 2

Uploaded by

IPC Assignment 2

Uploaded by

28/01/2025

Description: Genome alignment is a critical computational task in bioinformatics used to

 To work on the problem of parallel processing of genome sequence alignment using

1. Parallelize a Binary Tree Traversal using tasks.

#pragma omp atomic

You might also like