0% found this document useful (0 votes)

11 views7 pages

Parallel Computer Models - A Comprehensive Overview

The document provides a comprehensive overview of parallel computer models, discussing various types of parallelism such as Instruction-Level, Data-Level, Thread-Level, and Task-Level Parallelism. It also covers Flynn's Taxonomy for classifying computer architectures, semantic attributes of parallel programs, performance metrics, and theoretical models like PRAM and BSP. Key considerations include memory requirements, algorithm compatibility, and the importance of turnaround time over mere speedup.

Uploaded by

chzuhaib68

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views7 pages

Parallel Computer Models - A Comprehensive Overview

Uploaded by

chzuhaib68

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

PARALLEL COMPUTER MODELS

A Comprehensive Overview: Theoretical Concepts and Practical

Considerations

   
Architecture Parallelism Performance Models
Types of Parallelism

 ILP  DLP
Instruction-Level Parallelism Data-Level Parallelism
 Multiple instructions per CPU  Same operation, multiple data

 Pipelining  Vector processors

 Superscalar processors  SIMD units in GPUs/CPUs

EXAMPLE EXAMPLE
Modern Intel/AMD CPUs Adding arrays element-wise

 TLP  Task-Level
Thread/Process-Level Parallelism Task-Level Parallelism
 Independent threads/processes  Split problem into tasks

 Multiple cores required  Different operations per task

 Distributed systems  Heterogeneous processing

EXAMPLE EXAMPLE
Web server handling clients Compiler: lexical, syntax, optimization
Flynn's Taxonomy

Classification based on instruction and data streams:

 SISD  SIMD
Single Instruction, Single Data Single Instruction, Multiple Data
 Sequential execution  Same instruction, multiple data

 No parallelism  Data-parallel tasks

 Traditional von Neumann  Vector processing

EXAMPLE EXAMPLE
Old uniprocessors GPUs, vector processors

 MISD  MIMD
Multiple Instruction, Single Data Multiple Instruction, Multiple Data
 Multiple instructions, same data  Multiple instructions, multiple data

 Rare in practice  Most flexible model

 Fault-tolerant systems  Widely used today

EXAMPLE EXAMPLE
Space shuttle flight control Modern clusters, multi-core CPUs
Semantic Attributes

How parallel programs behave and interact with the system:

 Communication  Granularity

 Shared Memory: Common memory access  Fine-grain: Small tasks

 Message Passing: Private memory + messages  Coarse-grain: Large tasks

 Communication frequency varies

 Synchronization  Determinism  Concurrency Control

 Task coordination  Deterministic: Same result always  Prevents race conditions

 Methods: barriers, locks, semaphores  Non-deterministic: Results may vary  Tools: critical sections, mutex, monitors

 Message Passing

 Explicit
communication
 Each process has
private memory
Performance Attributes

Key metrics for evaluating parallel systems:

 Execution Time  Speedup % Efficiency

 Time to complete task  Tserial/Tparallel  Speedup/Processors
 Most fundamental metric  Ideal: linear with processors  Max: 1 (100%)

 Scalability  Throughput  Latency

 Maintain efficiency  Tasks per unit time  Task start/finish delay
 Strong vs. weak scaling  Batch processing focus  Critical for real-time

Speedup vs. Processors  Speedup Formula

S = Tserial / Tparallel
 Ratio of serial to parallel execution time

% Efficiency Formula

E=S/N
 Ratio of speedup to number of processors
Abstract Machine Models

Theoretical models for studying parallel computing:

 PRAM  LogP
Parallel Random Access Machine Realistic Communication Model

 Unlimited processors  Distributed memory

 Shared memory  Network characteristics

 Idealized model  Communication overhead

VARIANTS PARAMETERS
 EREW: Exclusive read, exclusive L: Latency o: Overhead g: Gap P: Processors
write
 CREW: Concurrent read, exclusive
write
 CRCW: Concurrent read,
concurrent write

 BSP  Dataflow
Bulk Synchronous Parallel Data-Driven Execution

 Superstep execution  Data availability driven

 Local computation  Not program order

 Barrier synchronization  Natural parallelism

SUPERSTEPS APPLICATIONS
 1. Local computation  Functional programming
 2. Communication  Streaming systems
 3. Barrier synchronization  Dataflow architectures
Summary

 Key Concepts  Practical Considerations

 Memory Requirements can be complicated by data

 Parallelism Types  Flynn's Taxonomy Semantic replication and additional arrays

Attributes
ILP DLP TLP SISD SIMD MISD  Algorithm Compatibility varies across architectures
Granularity
Task-Level MIMD
 Turnaround Time is more important to users than just
Communication
speedup
Synchronization
 Benchmarking Challenges include workload variations
Determinism and hardware limitations

Performance  Abstract Models  Key Formulas


Metrics
PRAM LogP BSP S = Ts/Tp E = S/N
Speedup Efficiency
Dataflow Amdahl's Law
Scalability Throughput
Gustafson's Law

"Time to solution is more important than linear speedup

for most users"

Parallel Programming Course Overview
No ratings yet
Parallel Programming Course Overview
36 pages
24-25 - Parallel Processing PDF
No ratings yet
24-25 - Parallel Processing PDF
36 pages
Lec7 PDF
No ratings yet
Lec7 PDF
16 pages
Parallel Computing Essentials
No ratings yet
Parallel Computing Essentials
40 pages
Introduction to Parallel Computing
No ratings yet
Introduction to Parallel Computing
28 pages
Parallel Programming Module 1
No ratings yet
Parallel Programming Module 1
71 pages
Parallel Computing
No ratings yet
Parallel Computing
19 pages
BDS Session 2
No ratings yet
BDS Session 2
56 pages
CICS 504 Computer Organization
No ratings yet
CICS 504 Computer Organization
35 pages
LP V Theory and Practical Explanation: o o o o
No ratings yet
LP V Theory and Practical Explanation: o o o o
96 pages
Lecture #1 - Class-1
No ratings yet
Lecture #1 - Class-1
17 pages
Parallel & Distributed Computing
No ratings yet
Parallel & Distributed Computing
6 pages
Chapter 1
No ratings yet
Chapter 1
25 pages
L1.3a HPC Concepts
No ratings yet
L1.3a HPC Concepts
43 pages
Parallel Computing
No ratings yet
Parallel Computing
32 pages
Aca
No ratings yet
Aca
13 pages
BDS Session 2
No ratings yet
BDS Session 2
59 pages
Multithreading Algorithms
No ratings yet
Multithreading Algorithms
36 pages
BDS Session 2
No ratings yet
BDS Session 2
58 pages
PDC Complete Course File
No ratings yet
PDC Complete Course File
422 pages
Multiprocessor Basics & Performance
No ratings yet
Multiprocessor Basics & Performance
52 pages
Unit 5
No ratings yet
Unit 5
96 pages
HPC Parallel
No ratings yet
HPC Parallel
122 pages
Coa Chapter 5
No ratings yet
Coa Chapter 5
96 pages
CS213 Parallel Processing Syllabus
No ratings yet
CS213 Parallel Processing Syllabus
26 pages
Week1 Parallel and Distributed Computing
No ratings yet
Week1 Parallel and Distributed Computing
55 pages
Parallel Computing Concepts Explained
No ratings yet
Parallel Computing Concepts Explained
90 pages
Levels of Parallelism in Computing
No ratings yet
Levels of Parallelism in Computing
70 pages
Introduction To Parallel Programming: Linda Woodard CAC 19 May 2010
100% (1)
Introduction To Parallel Programming: Linda Woodard CAC 19 May 2010
38 pages
CS 213: Parallel Processing Syllabus
No ratings yet
CS 213: Parallel Processing Syllabus
26 pages
Module 3
No ratings yet
Module 3
104 pages
Chapter 02 - Asynchronous and Parallel Programming in
No ratings yet
Chapter 02 - Asynchronous and Parallel Programming in
55 pages
Unit1 2 and 3
No ratings yet
Unit1 2 and 3
76 pages
Lecture 2 General Parallelism Terms
No ratings yet
Lecture 2 General Parallelism Terms
22 pages
Coa PPT-2
No ratings yet
Coa PPT-2
16 pages
Cloud Computing CS 15-319: Programming Models-Part I Lecture 4, Jan 25, 2012
No ratings yet
Cloud Computing CS 15-319: Programming Models-Part I Lecture 4, Jan 25, 2012
40 pages
Lecture Notes On Parallel Computation
No ratings yet
Lecture Notes On Parallel Computation
30 pages
Lecture 2
No ratings yet
Lecture 2
21 pages
HPC Lecture 2 Points
No ratings yet
HPC Lecture 2 Points
7 pages
L2 Parallel Computing Models
No ratings yet
L2 Parallel Computing Models
31 pages
Parallel Computers Architecture and Programming V. Rajaraman
No ratings yet
Parallel Computers Architecture and Programming V. Rajaraman
56 pages
Parallel Computing Essentials
No ratings yet
Parallel Computing Essentials
43 pages
Introduction to Parallel Computing
No ratings yet
Introduction to Parallel Computing
34 pages
Arch13 Multiprocessors Afterlecture
No ratings yet
Arch13 Multiprocessors Afterlecture
70 pages
CS3006 Parallel Computing Course Overview
100% (1)
CS3006 Parallel Computing Course Overview
46 pages
HPC Module 4
No ratings yet
HPC Module 4
18 pages
Unit 5
No ratings yet
Unit 5
96 pages
Parallel Computing
No ratings yet
Parallel Computing
24 pages
Materi 3
No ratings yet
Materi 3
26 pages
Parallel Computer Structures
No ratings yet
Parallel Computer Structures
23 pages
Parallel Computing Essentials
No ratings yet
Parallel Computing Essentials
32 pages
BDS Session 2
No ratings yet
BDS Session 2
58 pages
Unit V
No ratings yet
Unit V
95 pages
MESI Protocol in Multi-Processor Systems
No ratings yet
MESI Protocol in Multi-Processor Systems
84 pages
Classification of Parallel Computers
No ratings yet
Classification of Parallel Computers
16 pages
Java Multithreading Module Guide
No ratings yet
Java Multithreading Module Guide
209 pages
Process Management
No ratings yet
Process Management
10 pages
Mastering Blockchain: Chapter 5, Consensus Algorithms
No ratings yet
Mastering Blockchain: Chapter 5, Consensus Algorithms
22 pages
Lot Up 3 B
No ratings yet
Lot Up 3 B
2 pages
Process Management
No ratings yet
Process Management
17 pages
HDFS - Rackawareness
No ratings yet
HDFS - Rackawareness
21 pages
Parallel Processing Overview
No ratings yet
Parallel Processing Overview
150 pages
Types of Consistency in DSM
No ratings yet
Types of Consistency in DSM
2 pages
Week 5 Lec 5 Software Architecture
No ratings yet
Week 5 Lec 5 Software Architecture
29 pages
Scheduling Algorithms Guide
No ratings yet
Scheduling Algorithms Guide
8 pages
2024 12 02 - 12 17 12.2857 - 0500 8f671351
No ratings yet
2024 12 02 - 12 17 12.2857 - 0500 8f671351
17 pages
Synchronization Techniques in Java
No ratings yet
Synchronization Techniques in Java
1 page
Understanding GPU Architecture and Evolution
No ratings yet
Understanding GPU Architecture and Evolution
2 pages
Question Bank - Operating System
100% (1)
Question Bank - Operating System
4 pages
Chapter 6 Process Synchronization
No ratings yet
Chapter 6 Process Synchronization
67 pages
Data Dependence in Automatic Parallelization
No ratings yet
Data Dependence in Automatic Parallelization
30 pages
Rtos QP 2
No ratings yet
Rtos QP 2
2 pages
CPU Scheduling for CSE Students
No ratings yet
CPU Scheduling for CSE Students
2 pages
Concurrency in Processes & Threads
No ratings yet
Concurrency in Processes & Threads
24 pages
Java Multithreading Guide
100% (1)
Java Multithreading Guide
8 pages
Unit 2 Process Management 2 KGV
No ratings yet
Unit 2 Process Management 2 KGV
38 pages
CUDA Programming for Engineers
No ratings yet
CUDA Programming for Engineers
17 pages
Process Management Essentials
No ratings yet
Process Management Essentials
15 pages
Algorithm Psudo Code For Scheduling Algorithm PDF
No ratings yet
Algorithm Psudo Code For Scheduling Algorithm PDF
7 pages
06 CH6 Synchronization Tools
No ratings yet
06 CH6 Synchronization Tools
18 pages
Experiment 4 Assignment CN
No ratings yet
Experiment 4 Assignment CN
8 pages
DeadLock Vs Spinlock
No ratings yet
DeadLock Vs Spinlock
3 pages
U20it402 Os Model Exam Important Questions
No ratings yet
U20it402 Os Model Exam Important Questions
2 pages
Process Synchronization23
No ratings yet
Process Synchronization23
50 pages

Parallel Computer Models - A Comprehensive Overview

Uploaded by

Parallel Computer Models - A Comprehensive Overview

Uploaded by

PARALLEL COMPUTER MODELS

A Comprehensive Overview: Theoretical Concepts and Practical

 Pipelining  Vector processors

 Superscalar processors  SIMD units in GPUs/CPUs

 Multiple cores required  Different operations per task

 Distributed systems  Heterogeneous processing

Classification based on instruction and data streams:

 No parallelism  Data-parallel tasks

 Traditional von Neumann  Vector processing

 Rare in practice  Most flexible model

 Fault-tolerant systems  Widely used today

How parallel programs behave and interact with the system:

 Shared Memory: Common memory access  Fine-grain: Small tasks

 Message Passing: Private memory + messages  Coarse-grain: Large tasks

 Communication frequency varies

 Synchronization  Determinism  Concurrency Control

 Task coordination  Deterministic: Same result always  Prevents race conditions

Key metrics for evaluating parallel systems:

 Execution Time  Speedup % Efficiency

 Scalability  Throughput  Latency

Speedup vs. Processors  Speedup Formula

Theoretical models for studying parallel computing:

 Unlimited processors  Distributed memory

 Shared memory  Network characteristics

 Idealized model  Communication overhead

 Superstep execution  Data availability driven

 Local computation  Not program order

 Barrier synchronization  Natural parallelism

 Key Concepts  Practical Considerations

 Memory Requirements can be complicated by data

Performance  Abstract Models  Key Formulas

"Time to solution is more important than linear speedup

You might also like