Data Science Lab Presentation

The document outlines the objectives and outcomes of a Data Science Laboratory course led by Dr. Pradnya Kamble, focusing on libraries like pandas and Numpy, as well as machine learning algorithms. It highlights the role of data science in AI, its real-world applications across various sectors, and includes details on assessment methods and tools used in the lab. The document also describes the experiment execution process and specific data processing techniques such as PCA and text preprocessing.

Uploaded by

23VIIIAAditya Kamble

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views15 pages

Data Science Lab Presentation

Uploaded by

23VIIIAAditya Kamble

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

Data Science Laboratory

PCEL102
by
Dr. Pradnya Kamble
Lab Objectives
Lab Prerequisite 1. To study the pandas and Numpy Library.
1. Python programming, 2. To study supervised and unsupervised learning
2. R programming algorithms.
3. MATLAB 3. To learn complete data analysis
4. .To learn mathematical methods used in
data science.

Lab Outcomes
1. Apply quantitative modelling and data analysis techniques to the solution of real-
world business problems, communicate findings, and effectively present results
using data visualization techniques.
2. Implement exploratory data analysis.
3. Evaluate the performance of machine learning algorithms.
4. Apply principles of Data Science to the analysis of business problems.
5. Implement statistical methods used in data science applications.
6. Apply ethical principles like timeliness and adhere to the rules of the laboratory.
Role of Data Science in Artificial Intelligence (AI)

 Data Collection & Cleaning – Prepares raw data into usable formats for AI.
 Feature Engineering – Extracts and selects important features from datasets for
AI models.
 Exploratory Data Analysis (EDA) – Identifies trends, patterns, and insights to guide
AI modeling.
 Statistical Foundations – Provides probability, statistics, and linear algebra
concepts essential for AI.
 Model Training & Optimization – Supplies methods and tools to train and
evaluate AI/ML models.
 Data-Driven Decision Making – Ensures AI systems make reliable, evidence-
based predictions.
 Bias & Quality Control – Reduces errors by ensuring AI learns from unbiased,
high- quality data.
 Continuous Monitoring & Updating – Uses data science to track AI performance
and retrain models.
 Visualization & Interpretation – Translates AI outputs into understandable insights
for humans.
Applications of Data Science in the real world

 Healthcare – Disease prediction, drug discovery, medical image analysis, patient

monitoring.
 Finance – Fraud detection, credit scoring, risk analysis, algorithmic trading.
 Retail & E-commerce – Customer segmentation, recommendation systems, inventory
optimization.
 Marketing – Targeted advertising, customer behavior analysis, sentiment analysis.
 Transportation – Traffic prediction, route optimization, autonomous vehicles.
 Manufacturing – Predictive maintenance, quality control, supply chain optimization.
 Social Media & Entertainment – Personalized content recommendations (Netflix,
YouTube), trend analysis.
 Cybersecurity – Intrusion detection, anomaly detection, phishing/fraud prevention.
 Agriculture – Crop yield prediction, soil analysis, precision farming.
 Energy Sector – Smart grids, energy consumption forecasting, renewable energy
optimization.
 Government & Public Policy – Crime prediction, disaster management, urban planning.
 Education – Adaptive learning systems, student performance prediction, personalized
tutoring.
Assessment & Term Work
• Minimum 8 experiments required
• Assignments on data science foundations
• Evaluation:
• Experiments: 15 Marks
• Attendance: 5 Marks
• Assignments: 5 Marks
- Oral/Practical exam based on lab work
Tools Used in Laboratory

• Google Colab:
 Cloud-based Python environment
 Free CPU/GPU access for ML
 Collaboration & sharing

• MATLAB:
 Mathematical computation & modeling
 Data analysis & simulations

• R Programming:
 Strong statistical analysis & visualization
 Data wrangling and plotting
Experiment Execution Process

1. Define objective of experiment

2. Study prerequisites/theory
3. Design methodology/flowchart
4. Implement code
5. Execute and test
6. Analyze results/outputs
7. Document steps & observations
8. Write conclusion
9. Submit for evaluation
Start Split Data

Import Libraries
Train Model

Create Dataset Make

Prediction

Visualize Data Evaluate Model

Start
Start
Convert Text to Numerical Features (Count Vectorizer)

Load Dataset (NLTK Movie Reviews)

Train Model (Naïve Bayes Classifier)

Data Processing
–Tokenization
-Stop word Removal- Evaluate Model-Classification Report
- join words -Confusion Matrix

Split Data into Train and Test Sets Test on Custom Sentences

End
Start

Reconstruct Matrix A' = U × Σ × Vt

Define Input Matrix A
(e.g., 2×3 matrix)

Perform SVD using Compare A and A' Check if np.allclose(A,A') Rec

U, S, Vt = np.linalg.svd(A)

Display Results: Display Reconstructed A and Verification Resul

- U (Left Singular Vectors)
- S (Singular Values)
- Vt (Right Singular Vectors)

End
Construct Sigma Matrix Σ
(diagonal matrix of S)
Start

Visualize PCA Results]

Import Libraries - Plot first 2 principal components
- Color-code by class labels
- Add legend, labels, grid, title

Load Dataset]
- Load Iris dataset Analyze Explained Variance]
- Separate features (X) and labels (y) - Print explained variance ratio for each component
- Print original shape of data - Print total variance explained by 2 components

Standardize Data]
- Apply StandardScaler
- Transform features to zero mean & unit
End
variance

Apply PCA]
Reduce dimensions (n_components=2)
- Fit PCA on scaled data
Transform data to principal components
- Print reduced data shape
Start

Input Text Sentence Assign POS tags to each token (e.g., Noun, Ve

Text Preprocessing
- Tokenization (split into words) Display Tagged Output
- Tokens with POS tags
- Compare NLTK & spaCy

Apply POS Tagging Algorithm

- Using NLTK POS Tagger End
- Using spaCy NLP Model

Machine Learning Lab Assignment Overview
No ratings yet
Machine Learning Lab Assignment Overview
35 pages
BCA507
No ratings yet
BCA507
2 pages
Ai Full Stack
No ratings yet
Ai Full Stack
15 pages
Data Science Student Schedule
No ratings yet
Data Science Student Schedule
7 pages
ML Lab Syllabus for Students
No ratings yet
ML Lab Syllabus for Students
90 pages
Data Scientist Roadmap 2024 Guide
No ratings yet
Data Scientist Roadmap 2024 Guide
12 pages
AI & ML Exam Model Answers Sep 2023
No ratings yet
AI & ML Exam Model Answers Sep 2023
21 pages
Ai and ML qp1 Solved
No ratings yet
Ai and ML qp1 Solved
20 pages
Machine Learning Lab Assignment Overview
No ratings yet
Machine Learning Lab Assignment Overview
38 pages
Data Science With Python-Sasmita PDF
67% (3)
Data Science With Python-Sasmita PDF
9 pages
Module 1 Applied Data Science 1.1 and 1.2
No ratings yet
Module 1 Applied Data Science 1.1 and 1.2
104 pages
1DataScience MachineLearning AI Syllabus.-1.PDF 20240118 174213 0000
No ratings yet
1DataScience MachineLearning AI Syllabus.-1.PDF 20240118 174213 0000
9 pages
Unit I - Notes
No ratings yet
Unit I - Notes
15 pages
Diploma in Data Science: Integrating AI, Mathematics, Python, and Machine Learning
No ratings yet
Diploma in Data Science: Integrating AI, Mathematics, Python, and Machine Learning
12 pages
T1 Scheme 24 25
No ratings yet
T1 Scheme 24 25
5 pages
Sample Template - Advance Data Science Students
No ratings yet
Sample Template - Advance Data Science Students
3 pages
Data Science Bootcamp Curriculum Overview
No ratings yet
Data Science Bootcamp Curriculum Overview
9 pages
AI and Deep Learning Course Guide
No ratings yet
AI and Deep Learning Course Guide
17 pages
EE353 - 769 00 Course Introduction
No ratings yet
EE353 - 769 00 Course Introduction
28 pages
Data Science
No ratings yet
Data Science
14 pages
AI Content
No ratings yet
AI Content
8 pages
NNDL Manual Final
No ratings yet
NNDL Manual Final
75 pages
Ai Python
No ratings yet
Ai Python
7 pages
Lab Syllabus
No ratings yet
Lab Syllabus
4 pages
Inspire Ai Data Science Syllabus PDF
No ratings yet
Inspire Ai Data Science Syllabus PDF
8 pages
AI - ML Resource Sheet
100% (1)
AI - ML Resource Sheet
10 pages
Data Science Bootcamp for Beginners
No ratings yet
Data Science Bootcamp for Beginners
21 pages
Dhaapps Datascience With Gen AI-1
No ratings yet
Dhaapps Datascience With Gen AI-1
23 pages
Data Science: Process and Applications
No ratings yet
Data Science: Process and Applications
11 pages
P3 Practical
No ratings yet
P3 Practical
20 pages
DS Module 1
No ratings yet
DS Module 1
112 pages
Data Science Curriculum PDF
No ratings yet
Data Science Curriculum PDF
19 pages
Data Science Syllabus From Beginner To Advanced
No ratings yet
Data Science Syllabus From Beginner To Advanced
7 pages
Data Science 7th Sem AIML ITE Notes Complete LONG
No ratings yet
Data Science 7th Sem AIML ITE Notes Complete LONG
106 pages
Master Data Science, Data Analytics and Machine Learning Using Python
No ratings yet
Master Data Science, Data Analytics and Machine Learning Using Python
16 pages
DS Tools&Techniques
No ratings yet
DS Tools&Techniques
36 pages
Ai PDF
No ratings yet
Ai PDF
13 pages
INF442 DataScienceBooklet
No ratings yet
INF442 DataScienceBooklet
248 pages
Ail411 DL Lab Syllubus
No ratings yet
Ail411 DL Lab Syllubus
4 pages
Introduction To Data Science Course Outline
No ratings yet
Introduction To Data Science Course Outline
5 pages
Session 1
No ratings yet
Session 1
16 pages
Data Science for Engineers Course
No ratings yet
Data Science for Engineers Course
8 pages
Dnyaneshwar Ds
No ratings yet
Dnyaneshwar Ds
2 pages
Become An AI Engineer - Baap of All Jobs
No ratings yet
Become An AI Engineer - Baap of All Jobs
29 pages
Machine Learning Record
No ratings yet
Machine Learning Record
52 pages
Week 12 Intro To DS and ML
No ratings yet
Week 12 Intro To DS and ML
67 pages
CSR 304 Syllabus
No ratings yet
CSR 304 Syllabus
3 pages
Data Science & AI Essentials
100% (1)
Data Science & AI Essentials
20 pages
AI & Deep Learning Certification Course
No ratings yet
AI & Deep Learning Certification Course
12 pages
Math For ALL
No ratings yet
Math For ALL
14 pages
CourseCurriculum EML
No ratings yet
CourseCurriculum EML
3 pages
Data Science I: Lesson #01 - Outline Presentation
No ratings yet
Data Science I: Lesson #01 - Outline Presentation
20 pages
Machine Learning Overview and Techniques
No ratings yet
Machine Learning Overview and Techniques
43 pages
Data Driven AI Systems Course Overview
No ratings yet
Data Driven AI Systems Course Overview
34 pages
Notes For Data Science
No ratings yet
Notes For Data Science
6 pages
Python For Data Science and Machine Learning
100% (3)
Python For Data Science and Machine Learning
31 pages
AI - ML Resource Sheet
No ratings yet
AI - ML Resource Sheet
9 pages
Data Science Basics with Python
100% (1)
Data Science Basics with Python
25 pages
About Coaxial Cable
No ratings yet
About Coaxial Cable
5 pages
New IB BM Book (Dragged)
No ratings yet
New IB BM Book (Dragged)
1 page
Dairy Notes
100% (1)
Dairy Notes
49 pages
Makerere University Makerere University Business School: Task
No ratings yet
Makerere University Makerere University Business School: Task
7 pages
Tanzania Drug Registration Summary 2019
No ratings yet
Tanzania Drug Registration Summary 2019
24 pages
Jennifer Gabrys - Program Earth
No ratings yet
Jennifer Gabrys - Program Earth
376 pages
Understanding A Restaurant Cash Flow Statement
No ratings yet
Understanding A Restaurant Cash Flow Statement
6 pages
Timothy G. Flanagan: Employment History
No ratings yet
Timothy G. Flanagan: Employment History
2 pages
IoT Tools and Platforms Assignment by Anuwar
No ratings yet
IoT Tools and Platforms Assignment by Anuwar
2 pages
Bolt Torque Calculation Guide
100% (4)
Bolt Torque Calculation Guide
3 pages
Learning To Read
No ratings yet
Learning To Read
4 pages
About Infra - Market AAC Blocks Application Areas: SR No. Description Specification Grade I Grade II Unit
No ratings yet
About Infra - Market AAC Blocks Application Areas: SR No. Description Specification Grade I Grade II Unit
2 pages
UBL Standalone Financial Statements 2021 With DR Report
No ratings yet
UBL Standalone Financial Statements 2021 With DR Report
122 pages
Humankind Game Manual
No ratings yet
Humankind Game Manual
17 pages
Swinburne OOP 8.1P
No ratings yet
Swinburne OOP 8.1P
3 pages
World-Class Warehousing and Material Handling Second Edition Frazelle Ready To Read
No ratings yet
World-Class Warehousing and Material Handling Second Edition Frazelle Ready To Read
66 pages
Application Form
No ratings yet
Application Form
6 pages
Catalog SKY2000 C2H4 Gas Detectors
No ratings yet
Catalog SKY2000 C2H4 Gas Detectors
5 pages
Electrical Materials Exam - Winter 2021
No ratings yet
Electrical Materials Exam - Winter 2021
1 page
Reader's Digest - October 2016
No ratings yet
Reader's Digest - October 2016
130 pages
Turing Machine Basics
No ratings yet
Turing Machine Basics
112 pages
FPC CEO's Guide to Purpose-Centricity
No ratings yet
FPC CEO's Guide to Purpose-Centricity
32 pages
NISM-5a Chapter1
No ratings yet
NISM-5a Chapter1
36 pages
Practical Database Programming with Visual Basic NET 1st Edition Ying Bai ebook newly updated full text
100% (1)
Practical Database Programming with Visual Basic NET 1st Edition Ying Bai ebook newly updated full text
85 pages
Theming Animal Farm 2025
No ratings yet
Theming Animal Farm 2025
19 pages
Machine Tools: Driving Mechanisms Explained
No ratings yet
Machine Tools: Driving Mechanisms Explained
12 pages
Arduino VU Meter
No ratings yet
Arduino VU Meter
7 pages
Actilyse®: Alteplase
No ratings yet
Actilyse®: Alteplase
13 pages
High School Internship Guide
No ratings yet
High School Internship Guide
10 pages
4-CET-MCQs-Computer-Software-Internet Basics
No ratings yet
4-CET-MCQs-Computer-Software-Internet Basics
22 pages