0% found this document useful (0 votes)

14 views2 pages

006 - Data Model of Big Data Systems

The data model of Big Data systems accommodates diverse data types and rapid changes by utilizing flexible schemas and various storage formats. It includes schema-on-read and schema-on-write approaches, supports structured, semi-structured, and unstructured data, and employs batch, stream, and hybrid processing models. This adaptability allows organizations to efficiently manage and analyze large datasets regardless of their structure or origin.

Uploaded by

Samrat

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views2 pages

006 - Data Model of Big Data Systems

Uploaded by

Samrat

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

### Data Model of Big Data Systems

The data model of Big Data systems defines how data is structured, stored, and
accessed. Unlike traditional data models that rely on strict schemas (like
relational databases), Big Data systems often embrace a more flexible and varied
approach due to the volume, velocity, and variety of data. Below are the key
aspects of the data model in Big Data systems:

---

### 1. Schema-on-Read vs. Schema-on-Write

- **Schema-on-Read**:
- **Definition**: The data schema is applied when data is read, rather than when
it is written.
- **Characteristics**:
- Allows for greater flexibility, as data can be ingested in various formats
without a predefined schema.
- Suitable for unstructured and semi-structured data, like JSON, XML, and text
files.
- **Examples**: NoSQL databases (like MongoDB, Cassandra) and data lakes.

- **Schema-on-Write**:
- **Definition**: The schema is defined and enforced when data is written to the
database.
- **Characteristics**:
- Provides consistency and integrity for structured data.
- Suitable for use cases where data types and relationships are well
understood.
- **Examples**: Traditional relational databases (like MySQL, PostgreSQL).

---

### 2. Data Formats

Big Data systems support a variety of data formats, including:

- **Structured Data**: Typically stored in tables (e.g., CSV files, SQL databases).
- **Semi-Structured Data**: Often in formats like JSON, XML, or Avro, which have
tags or markers but do not require a rigid schema.
- **Unstructured Data**: Includes text files, images, audio, and video, where data
does not follow a specific format or structure.

---

### 3. Data Storage Models

Different storage models are used in Big Data systems:

- Distributed File Systems:

- Designed to store large datasets across multiple machines.
- **Example**: Hadoop Distributed File System (HDFS).

- **NoSQL Databases**:
- Designed for horizontal scalability and to handle unstructured or semi-
structured data.
- **Examples**:
- Document stores (MongoDB, Couchbase).
- Key-value stores (Redis, DynamoDB).
- Column-family stores (Cassandra, HBase).

- **Data Lakes**:
- Centralized repositories that store raw data in its native format until needed
for analysis.
- They support various data types and structures.

---

### 4. Data Processing Models

Data processing in Big Data systems can occur in several ways:

- **Batch Processing**:
- Large volumes of data are processed at once.
- Suitable for periodic analysis and large data aggregations.
- **Example**: Apache Hadoop MapReduce.

- **Stream Processing**:
- Data is processed in real-time as it flows in, allowing for immediate insights.
- Suitable for applications that require low latency.
- **Example**: Apache Kafka, Apache Flink, Apache Spark Streaming.

- **Hybrid Processing**:
- Combines batch and stream processing to handle both historical and real-time
data.
- **Example**: Apache Beam.

---

### 5. Data Access and Query Models

Big Data systems support various access and query methods:

- **SQL-like Queries**:
- Some Big Data tools provide SQL-like query capabilities for ease of use.
- **Examples**: Apache Hive, Apache Drill.

- APIs and SDKs:

- Allow developers to interact with data programmatically.
- Useful for integrating Big Data solutions with applications.

- Graph Query Languages:

- For graph databases, specific query languages (like Gremlin or Cypher) are used
to traverse and analyze data relationships.

---

### Summary

The data model of Big Data systems is designed to accommodate the vast, varied, and
rapidly changing landscape of data. By leveraging flexible schemas, diverse storage
formats, and a mix of processing models, these systems provide the scalability and
adaptability needed to extract insights from massive datasets. This model enables
organizations to effectively manage and analyze their data, regardless of its
structure or origin.

TIE - 21CS71 SIMP With Key Answers
No ratings yet
TIE - 21CS71 SIMP With Key Answers
19 pages
007.2 - Big Data Systems Components
No ratings yet
007.2 - Big Data Systems Components
2 pages
Big Data Tools and Its Framework
No ratings yet
Big Data Tools and Its Framework
5 pages
BD by Maaz
No ratings yet
BD by Maaz
19 pages
Unit 1 B Tech 3 Year BD
No ratings yet
Unit 1 B Tech 3 Year BD
10 pages
Big Data and Hadoop Architecture Guide
No ratings yet
Big Data and Hadoop Architecture Guide
18 pages
Big Data Basics - Simple Notes
No ratings yet
Big Data Basics - Simple Notes
4 pages
Data - Models For Computer Science Students
No ratings yet
Data - Models For Computer Science Students
15 pages
Big Data One Shot
No ratings yet
Big Data One Shot
45 pages
BDA Simple 1 To 4
No ratings yet
BDA Simple 1 To 4
11 pages
Understanding Big Data and Hadoop Basics
No ratings yet
Understanding Big Data and Hadoop Basics
17 pages
Big Data Imp-1
No ratings yet
Big Data Imp-1
16 pages
Master Spark Concepts
No ratings yet
Master Spark Concepts
112 pages
Harteg Notes
No ratings yet
Harteg Notes
4 pages
Big Data
No ratings yet
Big Data
27 pages
IET Udaipur BDA Unit-1
No ratings yet
IET Udaipur BDA Unit-1
10 pages
007 - Big Data Architecture Style
No ratings yet
007 - Big Data Architecture Style
3 pages
Bda 123
No ratings yet
Bda 123
36 pages
Big Data
No ratings yet
Big Data
4 pages
Top Big Data Platforms & Use Cases
No ratings yet
Top Big Data Platforms & Use Cases
9 pages
BIGDATAUNIT1 AKTUpdf
No ratings yet
BIGDATAUNIT1 AKTUpdf
33 pages
T 8 TVIV3 SFX
No ratings yet
T 8 TVIV3 SFX
2 pages
Bda Ans
No ratings yet
Bda Ans
18 pages
Big Data Computing Notes
No ratings yet
Big Data Computing Notes
17 pages
Big Data Assignment Notes
No ratings yet
Big Data Assignment Notes
13 pages
Unit 1
No ratings yet
Unit 1
51 pages
Big Data SV Publication
No ratings yet
Big Data SV Publication
142 pages
BG
No ratings yet
BG
4 pages
Hadoop for Scalable Data Management
No ratings yet
Hadoop for Scalable Data Management
58 pages
BIG DATA Notes
No ratings yet
BIG DATA Notes
11 pages
Last Min Preparation - Big Data
No ratings yet
Last Min Preparation - Big Data
5 pages
Big Data Concepts With Spacing
No ratings yet
Big Data Concepts With Spacing
6 pages
Unit 1 Big Data Analysis
No ratings yet
Unit 1 Big Data Analysis
2 pages
07 BigData DataAnalysis
No ratings yet
07 BigData DataAnalysis
66 pages
Comprehensive Data Engineer Guide
No ratings yet
Comprehensive Data Engineer Guide
6 pages
Big Data All Unit by Study4sub
No ratings yet
Big Data All Unit by Study4sub
161 pages
Bigdata
No ratings yet
Bigdata
23 pages
Big Data Analytics Unit Wise Short Note
No ratings yet
Big Data Analytics Unit Wise Short Note
6 pages
Self Prepared
No ratings yet
Self Prepared
147 pages
Unit 4 - Class Notes
No ratings yet
Unit 4 - Class Notes
6 pages
Uc PDF
No ratings yet
Uc PDF
10 pages
Big Data 1
No ratings yet
Big Data 1
28 pages
Detailed Big Data and Hadoop Notes
No ratings yet
Detailed Big Data and Hadoop Notes
3 pages
Big Data Analytics 18CS72 - Module 1
No ratings yet
Big Data Analytics 18CS72 - Module 1
84 pages
IOT and Comp - Architecture
No ratings yet
IOT and Comp - Architecture
17 pages
2 Emerging
No ratings yet
2 Emerging
10 pages
Big Data Analysis BDA IMP QNA Openinapp
No ratings yet
Big Data Analysis BDA IMP QNA Openinapp
33 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
Topic 1 Big Data Technologies
No ratings yet
Topic 1 Big Data Technologies
5 pages
Data Science
No ratings yet
Data Science
12 pages
Unit 1 BDA
No ratings yet
Unit 1 BDA
3 pages
1 Introduction To Big Data Management and Processing
No ratings yet
1 Introduction To Big Data Management and Processing
42 pages
BDA IA1 New
No ratings yet
BDA IA1 New
21 pages
BD Imp Ques 1
100% (1)
BD Imp Ques 1
22 pages
BDA Unit 2
No ratings yet
BDA Unit 2
8 pages
Big Data Module1 Answers Elaborated (1) (IA1)
No ratings yet
Big Data Module1 Answers Elaborated (1) (IA1)
4 pages
Big Data Notes With Diagrams
No ratings yet
Big Data Notes With Diagrams
3 pages
Big Data - Simple Notes
No ratings yet
Big Data - Simple Notes
3 pages
020.08 - Kafka Producers and Consumers
No ratings yet
020.08 - Kafka Producers and Consumers
4 pages
017.2 - ZooKeeper Internals
No ratings yet
017.2 - ZooKeeper Internals
6 pages
020.05 - Kafka Topics
No ratings yet
020.05 - Kafka Topics
3 pages
018 - Features of Real-Time Architecture
No ratings yet
018 - Features of Real-Time Architecture
2 pages
019.2 - Data Delivery Semantic
No ratings yet
019.2 - Data Delivery Semantic
3 pages
016.21 - Split Brain Problem
No ratings yet
016.21 - Split Brain Problem
2 pages
011.5 - Streaming Data System Architecture Components - Delivery Tier
No ratings yet
011.5 - Streaming Data System Architecture Components - Delivery Tier
2 pages
017 - Apache ZooKeeper
No ratings yet
017 - Apache ZooKeeper
4 pages
010.4 - Streaming Data Sources
No ratings yet
010.4 - Streaming Data Sources
2 pages
012.2 - Pros and Cons of Lambda Architecture
No ratings yet
012.2 - Pros and Cons of Lambda Architecture
2 pages
011.2 - Streaming Data System Architecture Components - Data Flow Tier
No ratings yet
011.2 - Streaming Data System Architecture Components - Data Flow Tier
2 pages
011.3 - Streaming Data System Architecture Components - Processing Tier
No ratings yet
011.3 - Streaming Data System Architecture Components - Processing Tier
3 pages
016.2 - Distributed State Management
No ratings yet
016.2 - Distributed State Management
3 pages
006.1 - Properties of Data
No ratings yet
006.1 - Properties of Data
2 pages
009.1 - Why Is Stream Processing Needed
No ratings yet
009.1 - Why Is Stream Processing Needed
2 pages
009.4 - Traditional Vs Streaming Systems Data Models
No ratings yet
009.4 - Traditional Vs Streaming Systems Data Models
3 pages
008 - Classification of Real Time Systems
No ratings yet
008 - Classification of Real Time Systems
2 pages
006.2 - Fact Based Model For Data
No ratings yet
006.2 - Fact Based Model For Data
2 pages
008.2 - Real-Time and Streaming Systems
No ratings yet
008.2 - Real-Time and Streaming Systems
2 pages
003.3 - Maintainability
No ratings yet
003.3 - Maintainability
2 pages
CS 11 Securing and Testing Scalable Services
No ratings yet
CS 11 Securing and Testing Scalable Services
34 pages
003.1 - Reliability
No ratings yet
003.1 - Reliability
2 pages
003.2 - Scalability
No ratings yet
003.2 - Scalability
3 pages
CS 10 Designing Reliable Microservice
No ratings yet
CS 10 Designing Reliable Microservice
40 pages
EC2 Makeup Old
No ratings yet
EC2 Makeup Old
10 pages
Ec2 2025
No ratings yet
Ec2 2025
1 page
Ec2 Regular Old
No ratings yet
Ec2 Regular Old
14 pages
CS 07 Communication and Transaction Management
No ratings yet
CS 07 Communication and Transaction Management
39 pages
CS 12 Deploying Microservices
No ratings yet
CS 12 Deploying Microservices
19 pages
C7-JAV-11V End Assessment Question Paper
No ratings yet
C7-JAV-11V End Assessment Question Paper
5 pages
Beginner's Guide to Data Mining
0% (1)
Beginner's Guide to Data Mining
5 pages
BMSCE Campus Portal Overview
No ratings yet
BMSCE Campus Portal Overview
1 page
Building An AI-First Company
100% (1)
Building An AI-First Company
29 pages
IT Disaster Recovery Guide
100% (1)
IT Disaster Recovery Guide
34 pages
Student Record Keeping System Database: Team Members
No ratings yet
Student Record Keeping System Database: Team Members
27 pages
ISM-22 (DBMS - Normalization)
No ratings yet
ISM-22 (DBMS - Normalization)
34 pages
Mizu VOIP Server Installation Guide
No ratings yet
Mizu VOIP Server Installation Guide
2 pages
D-PDM-DY-23 (85 Questions)
No ratings yet
D-PDM-DY-23 (85 Questions)
6 pages
IT-PREBOARD - Practice Paper
No ratings yet
IT-PREBOARD - Practice Paper
11 pages
Information Protection For Office 365
No ratings yet
Information Protection For Office 365
1 page
Employability and Skills Quiz
No ratings yet
Employability and Skills Quiz
4 pages
BusinessObjects vs Power BI Comparison
No ratings yet
BusinessObjects vs Power BI Comparison
11 pages
Access MySQL with PHP PDO Guide
No ratings yet
Access MySQL with PHP PDO Guide
28 pages
Software Architecture Overview and Patterns
No ratings yet
Software Architecture Overview and Patterns
51 pages
Anil Kumar Andra-Profile
No ratings yet
Anil Kumar Andra-Profile
6 pages
Salesforce Interview Q&A Guide
No ratings yet
Salesforce Interview Q&A Guide
28 pages
NTA UGC-NET 2020 Computer Science Syllabus
No ratings yet
NTA UGC-NET 2020 Computer Science Syllabus
24 pages
Internal Mark Register
No ratings yet
Internal Mark Register
68 pages
Deswik.CAD: Advanced Mining Design Tools
100% (3)
Deswik.CAD: Advanced Mining Design Tools
6 pages
Project Title Super Mart Billing System
No ratings yet
Project Title Super Mart Billing System
5 pages
Enhancing Data Management: An Integrated Solution For Database Backup, Recovery, Conversion, and Encryption Capabilities
No ratings yet
Enhancing Data Management: An Integrated Solution For Database Backup, Recovery, Conversion, and Encryption Capabilities
15 pages
IP Guidelines 22-2-23
No ratings yet
IP Guidelines 22-2-23
6 pages
Student Management System Project Report
100% (2)
Student Management System Project Report
60 pages
Zabbix 4 ZCS Day 1 v0.7
No ratings yet
Zabbix 4 ZCS Day 1 v0.7
100 pages
MIS 850 Try Questions-1
No ratings yet
MIS 850 Try Questions-1
60 pages
IAT-I Question Paper With Solution of 18CS823 Nosql Database May-2021-Poonam Tijare
100% (1)
IAT-I Question Paper With Solution of 18CS823 Nosql Database May-2021-Poonam Tijare
12 pages
New Project
No ratings yet
New Project
28 pages
Gravimetric Blenders: The World's Most Popular Blender Range With Close To
No ratings yet
Gravimetric Blenders: The World's Most Popular Blender Range With Close To
20 pages
ServiceNow CMDB - Key Concepts and Interview Q&A
No ratings yet
ServiceNow CMDB - Key Concepts and Interview Q&A
4 pages

006 - Data Model of Big Data Systems

Uploaded by

006 - Data Model of Big Data Systems

Uploaded by

### Data Model of Big Data Systems

### 1. **Schema-on-Read vs. Schema-on-Write**

### 2. **Data Formats**

Big Data systems support a variety of data formats, including:

### 3. **Data Storage Models**

Different storage models are used in Big Data systems:

- **Distributed File Systems**:

### 4. **Data Processing Models**

Data processing in Big Data systems can occur in several ways:

### 5. **Data Access and Query Models**

Big Data systems support various access and query methods:

- **APIs and SDKs**:

- **Graph Query Languages**:

You might also like

### 1. Schema-on-Read vs. Schema-on-Write

### 2. Data Formats

### 3. Data Storage Models

- Distributed File Systems:

### 4. Data Processing Models

### 5. Data Access and Query Models

- APIs and SDKs:

- Graph Query Languages: