0% found this document useful (0 votes)

69 views4 pages

Air Quality Project

The document outlines a project focused on predicting Air Quality Index (AQI) using machine learning, highlighting the problem of air pollution and the limitations of traditional monitoring systems. The project includes objectives such as developing a robust ML model, comparing algorithms, and visualizing data trends, with a structured workflow from data collection to model evaluation. Key findings indicate strong correlations between AQI and pollutants like PM2.5, with Random Forest being the most effective algorithm based on evaluation metrics.

Uploaded by

shinfana89

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

69 views4 pages

Air Quality Project

Uploaded by

shinfana89

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

Phase-2 Submission: Air Quality

Prediction Project
**Student Name:**
K. SRITHIKA
A. SHIFANA
P. SWETHA
B. SUBASHINI
J. SHOBANA

**Register Number:**
621123205053
621123205051
621123205055
621123205054
621123205052

Institution: Idhaya Engineering College for Women

Department: B.Tech Information Technology

Date of Submission: [Insert Date]

GitHub Repository Link: [Insert Link]

1. Problem Statement
Air pollution severely affects environmental and human health. Traditional air quality
monitoring systems lack predictive capabilities and often don't offer actionable early
warnings. This project aims to build a regression-based machine learning model to predict
Air Quality Index (AQI) using real-time environmental and pollutant data. Predictive
insights will empower citizens and governments to make proactive decisions to mitigate
health risks and environmental impact.

2. Project Objectives
- Develop a robust ML model to predict AQI levels based on environmental features.
- Compare performance of multiple algorithms (Linear Regression, Random Forest,
XGBoost).
- Identify key pollutants influencing AQI.
- Visualize trends and patterns in air quality data.
- Create a user-friendly dashboard or tool (optional deployment).
- Adjust project goals post-EDA for improved performance and interpretability.
3. Flowchart of the Project Workflow
1. Data Collection
2. Data Cleaning & Preprocessing
3. Exploratory Data Analysis
4. Feature Engineering
5. Model Building
6. Model Evaluation
7. Visualization & Insights
8. (Optional) Deployment

4. Data Description
- Dataset: Delhi Air Quality Dataset
- Source: Kaggle (https://www.kaggle.com/datasets)
- Type: Structured, time-series
- Features: PM2.5, PM10, NO2, CO, SO2, O3, temperature, humidity, wind speed
- Target Variable: AQI
- Records: ~30,000 rows, 15+ features
- Nature: Static dataset with potential for real-time API extension

5. Data Preprocessing
- Handled missing values using forward-fill and interpolation.
- Removed duplicate entries.
- Converted date columns to datetime format.
- Standardized pollutant values to common units.
- One-hot encoded categorical weather descriptions.
- Normalized numerical columns using Min-Max Scaling.
- Final cleaned dataset saved for modeling.

6. Exploratory Data Analysis (EDA)

Univariate Analysis:
- PM2.5 and PM10 show right-skewed distributions.
- AQI ranges mostly from 100 to 350 (Moderate to Hazardous).

Bivariate Analysis:
- Strong correlation between AQI and PM2.5 (r = 0.87).
- Seasonal variation: AQI increases during winter.

Insights:
- PM2.5, PM10, and NO2 are the most influential pollutants.
- Weekends show slightly lower pollution levels.
- AQI is affected by temperature and humidity to some extent.
7. Feature Engineering
- Created new feature: Pollution Category (Good, Moderate, Poor, etc.).
- Extracted datetime components: hour, weekday, month.
- Combined PM2.5 and PM10 as a composite feature.
- Removed redundant columns (e.g., city names if constant).
- Considered polynomial features (PM2.5^2) for non-linear models.

8. Model Building
Algorithms Tried:
- Linear Regression
- Random Forest Regressor
- XGBoost Regressor

Why These?
- Linear Regression for baseline
- Random Forest for robustness and interpretability
- XGBoost for performance in structured data

Data Split: 80% training, 20% test using stratified sampling where applicable

Evaluation Metrics:
- MAE: ~28
- RMSE: ~35
- R² Score: ~0.85 (Random Forest best)

9. Visualization of Results & Model Insights

- Feature Importance Plot: PM2.5 and NO2 most significant
- Residual Plots: Random Forest shows least error residuals
- AQI Prediction vs Actual: Close alignment in most data segments
- Confusion in Categories: Misclassification mainly in borderline cases (e.g., Moderate vs
Poor)

10. Tools and Technologies Used

- Language: Python
- IDE: Google Colab
- Libraries: pandas, numpy, scikit-learn, seaborn, matplotlib, xgboost
- Visualization: Plotly, seaborn
- Version Control: GitHub
- (Optional): Streamlit for interface

11. Team Members and Contributions

| Name | Contribution |
|--------------|----------------------------------|
| K. Srithika | Data Collection & Integration |
| A. Shifana | Data Cleaning & Preprocessing |
| P. Swetha | EDA & Feature Engineering |
| B. Subashini | Model Training & Evaluation |
| J. Shobana | Documentation & Visualization |

Styled Air Quality Project
No ratings yet
Styled Air Quality Project
3 pages
Phase-2 DS File
No ratings yet
Phase-2 DS File
5 pages
Team Project 2
No ratings yet
Team Project 2
9 pages
Phase 3
No ratings yet
Phase 3
23 pages
Air Quality Prediction Project
No ratings yet
Air Quality Prediction Project
3 pages
Detailed Project Report
No ratings yet
Detailed Project Report
14 pages
ICT Report
No ratings yet
ICT Report
21 pages
DAP Report (1) (1) - Merged
No ratings yet
DAP Report (1) (1) - Merged
15 pages
Project Progress and Achievements
No ratings yet
Project Progress and Achievements
1 page
WA0005. - Compressed
No ratings yet
WA0005. - Compressed
4 pages
Gautam Intern
No ratings yet
Gautam Intern
18 pages
NMHK
No ratings yet
NMHK
13 pages
Umer
No ratings yet
Umer
11 pages
IEEE Research Paper With Charts
No ratings yet
IEEE Research Paper With Charts
4 pages
Ctproject 1
No ratings yet
Ctproject 1
15 pages
Air Quality Analysis Using Machine Learning
No ratings yet
Air Quality Analysis Using Machine Learning
3 pages
AQI Report
No ratings yet
AQI Report
17 pages
Temperature and Pollution Prediction Model
No ratings yet
Temperature and Pollution Prediction Model
7 pages
Air Quality: & Pollution
No ratings yet
Air Quality: & Pollution
25 pages
Week 4 AQI Group CD
No ratings yet
Week 4 AQI Group CD
2 pages
Batch 10
No ratings yet
Batch 10
17 pages
Project
No ratings yet
Project
14 pages
PM2.5 Air Pollution Forecasting Project
No ratings yet
PM2.5 Air Pollution Forecasting Project
9 pages
ICACE 2024: AQI Forecasting Study
No ratings yet
ICACE 2024: AQI Forecasting Study
8 pages
AQI Presentation3
No ratings yet
AQI Presentation3
13 pages
Exp 4
No ratings yet
Exp 4
6 pages
Air Pollution
No ratings yet
Air Pollution
10 pages
Mudhal
No ratings yet
Mudhal
19 pages
Smt. Devkiba Mohansinhji Chauhan College of Commerce & Science. Silvassa
No ratings yet
Smt. Devkiba Mohansinhji Chauhan College of Commerce & Science. Silvassa
13 pages
Air Quality Prediction Case Study
No ratings yet
Air Quality Prediction Case Study
2 pages
Air Quality Prediction Model in India
No ratings yet
Air Quality Prediction Model in India
8 pages
Air Quality Prediction
No ratings yet
Air Quality Prediction
12 pages
Sayantan Final Print Project Report
No ratings yet
Sayantan Final Print Project Report
22 pages
Batch 9
No ratings yet
Batch 9
15 pages
Synopsis
No ratings yet
Synopsis
11 pages
Sample Template File For Project
No ratings yet
Sample Template File For Project
8 pages
02 Manuscript Group# DRAFT
No ratings yet
02 Manuscript Group# DRAFT
8 pages
FULLTEXT02
No ratings yet
FULLTEXT02
41 pages
Forecast Air Pollution Synopsis
No ratings yet
Forecast Air Pollution Synopsis
13 pages
Development of A Machine Learning Driven Air Quality Prediction and Monitoring System AQPS
No ratings yet
Development of A Machine Learning Driven Air Quality Prediction and Monitoring System AQPS
6 pages
Visual Analytics Presentation
No ratings yet
Visual Analytics Presentation
22 pages
Enhancing Chemical Risk Prediction With ConvLSTM and Machine Learning Application To Environmental Impact
No ratings yet
Enhancing Chemical Risk Prediction With ConvLSTM and Machine Learning Application To Environmental Impact
30 pages
Prediction of Air Pollution Using Artificial Intelligence: A Case Study of Delhi NCT
No ratings yet
Prediction of Air Pollution Using Artificial Intelligence: A Case Study of Delhi NCT
24 pages
Import Pandas As PD
No ratings yet
Import Pandas As PD
5 pages
Breathe AI
No ratings yet
Breathe AI
13 pages
Đ I
No ratings yet
Đ I
3 pages
Machine Learning for AQI Prediction
No ratings yet
Machine Learning for AQI Prediction
16 pages
IoT Air Quality Presentation-1
No ratings yet
IoT Air Quality Presentation-1
18 pages
Environmental Pollution Prediction Analysis
No ratings yet
Environmental Pollution Prediction Analysis
14 pages
Air Quality Index Analysis
No ratings yet
Air Quality Index Analysis
5 pages
Air Quality Prediction Report
No ratings yet
Air Quality Prediction Report
63 pages
IOT Phase-2
No ratings yet
IOT Phase-2
3 pages
Review Paper... BBBBBBB
No ratings yet
Review Paper... BBBBBBB
7 pages
Air Quality Prediction with ML Techniques
No ratings yet
Air Quality Prediction with ML Techniques
70 pages
Project Proposal
No ratings yet
Project Proposal
4 pages
Machine Learning in Air Quality Prediction
No ratings yet
Machine Learning in Air Quality Prediction
6 pages
Brainstorming
No ratings yet
Brainstorming
2 pages
Applications of Nanomaterials in Engineering
No ratings yet
Applications of Nanomaterials in Engineering
10 pages
CCS335-CC Unit-I
No ratings yet
CCS335-CC Unit-I
38 pages
Unit 1
No ratings yet
Unit 1
85 pages
Unit 1
No ratings yet
Unit 1
18 pages
CN Osi Model
No ratings yet
CN Osi Model
22 pages
Hydrochoc Water Hammer Surge Vessel
100% (1)
Hydrochoc Water Hammer Surge Vessel
1 page
Concepts of Signal
No ratings yet
Concepts of Signal
4 pages
Flexi-D: by V.Karunanidhi Denvik Technology
No ratings yet
Flexi-D: by V.Karunanidhi Denvik Technology
7 pages
ZX890LCH 6 Brochure 1 PDF
No ratings yet
ZX890LCH 6 Brochure 1 PDF
32 pages
Uppcl Bill
No ratings yet
Uppcl Bill
1 page
Manual Servicio Mack
100% (12)
Manual Servicio Mack
90 pages
Wiresize
No ratings yet
Wiresize
10 pages
Photography Basics: Start Chart Guide
No ratings yet
Photography Basics: Start Chart Guide
1 page
Tapo C500 1.0&1.8 Datasheet
No ratings yet
Tapo C500 1.0&1.8 Datasheet
8 pages
Allegra Kitchen Appliances Price List
No ratings yet
Allegra Kitchen Appliances Price List
8 pages
Jammu Power Distribution Company LTD (JPDCL) : Approval of Feasibility
No ratings yet
Jammu Power Distribution Company LTD (JPDCL) : Approval of Feasibility
1 page
MSEC Electronics Engineering Syllabus 2024
No ratings yet
MSEC Electronics Engineering Syllabus 2024
68 pages
Maths 8
100% (1)
Maths 8
3 pages
Fin Tab RTM 2024 25 129 79006161
No ratings yet
Fin Tab RTM 2024 25 129 79006161
1 page
Gen Bio 1 Module 1
100% (2)
Gen Bio 1 Module 1
30 pages
KASPL Plumbing Measurement Sheet
No ratings yet
KASPL Plumbing Measurement Sheet
2 pages
Tech Use Across Generations
No ratings yet
Tech Use Across Generations
3 pages
Gerdelan Anton - Professional Programming Tools For C and C++ (2020)
No ratings yet
Gerdelan Anton - Professional Programming Tools For C and C++ (2020)
152 pages
Reporters (+KEY) 2
No ratings yet
Reporters (+KEY) 2
2 pages
Data Visualization Tools Overview
No ratings yet
Data Visualization Tools Overview
6 pages
02 - Decision Constructs Loops
No ratings yet
02 - Decision Constructs Loops
45 pages
Content Beyond Syllabus For DSD
No ratings yet
Content Beyond Syllabus For DSD
4 pages
AMAIA - Project OPEN Punchlist - Update - As of 07nov2024
No ratings yet
AMAIA - Project OPEN Punchlist - Update - As of 07nov2024
40 pages
Split-Type AC Service Manual
No ratings yet
Split-Type AC Service Manual
28 pages
HowToUpgradeOrRestore8100V5 6
No ratings yet
HowToUpgradeOrRestore8100V5 6
8 pages
Erba XL-200 Brochure WEB
No ratings yet
Erba XL-200 Brochure WEB
6 pages
Analytical Skills for Managers
No ratings yet
Analytical Skills for Managers
9 pages
Hindustan Times 27-11-2025
No ratings yet
Hindustan Times 27-11-2025
28 pages
OBS Setup Screen Monitoring Students
No ratings yet
OBS Setup Screen Monitoring Students
7 pages
PTM Pada Remaja - Posyandu Remaja
No ratings yet
PTM Pada Remaja - Posyandu Remaja
48 pages

Air Quality Project

Uploaded by

Air Quality Project

Uploaded by

Phase-2 Submission: Air Quality

**Institution:** Idhaya Engineering College for Women

**Department:** B.Tech Information Technology

**Date of Submission:** [Insert Date]

**GitHub Repository Link:** [Insert Link]

6. Exploratory Data Analysis (EDA)

9. Visualization of Results & Model Insights

10. Tools and Technologies Used

11. Team Members and Contributions

You might also like

Institution: Idhaya Engineering College for Women

Department: B.Tech Information Technology

Date of Submission: [Insert Date]

GitHub Repository Link: [Insert Link]