0% found this document useful (0 votes)

27 views6 pages

Python Data Analytics GenAI Course Plan

The document outlines a comprehensive course plan covering Python, Data Analytics, and Generative AI over 20 sessions. Each session includes key topics, practical focuses, and hands-on activities designed to build skills in data analysis, machine learning, and the integration of SQL with generative AI tools. The course culminates in building a CSV analytics tool and a RAG-based chatbot, emphasizing real-world applications and advanced features.

Uploaded by

adityasrivastava.kiitecell

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views6 pages

Python Data Analytics GenAI Course Plan

Uploaded by

adityasrivastava.kiitecell

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

Course Plan: Python, Data Analytics, and Generative AI

Session 1: Python Refresher

Topics

- Python essentials (data types, loops, conditionals)

- Functions and modules

- File handling (CSV/Excel)

- Pythonic coding practices

Practical Focus

- Write a function to load a CSV file and summarize basic statistics.

Session 2: Data Analysis with pandas and NumPy

Topics

- pandas DataFrame basics: loading, slicing, merging

- NumPy arrays: indexing, slicing, reshaping

- Descriptive statistics (mean, median, variance)

Practical Focus

- Analyze a CSV dataset (e.g., sales data) to extract summary statistics.

Session 3: Data Wrangling and Cleaning

Topics

- Handling missing data: dropna, fillna

- String manipulations and date conversions

- Combining and reshaping datasets (merge, concat, pivot)

Practical Focus

- Clean a messy dataset by handling missing values, converting data types, and merging files.

Session 4: Exploratory Data Analysis (EDA)

Topics

- Visualizing distributions (histograms, box plots)

- Correlation analysis and heatmaps

- Identifying patterns and outliers

Practical Focus

- Perform EDA on a dataset (e.g., customer data) to identify trends and relationships.

Session 5: Introduction to Machine Learning

Topics

- Machine Learning basics: supervised vs. unsupervised

- Overview of ML workflow: data preprocessing → model training → evaluation

- Common ML use cases in business

Practical Focus

- Discuss business-relevant ML use cases and map them to available datasets.

Session 6: Supervised Learning – Regression

Topics

- Linear Regression: simple and multiple

- Scikit-learn ML pipeline

- Model evaluation: MSE, RMSE, MAE

Practical Focus

- Build a linear regression model to predict sales/revenue from a dataset.

Session 7: Supervised Learning – Classification

Topics

- Logistic Regression, Decision Trees

- Evaluation metrics: accuracy, precision, recall, F1-score

- Confusion matrix interpretation

Practical Focus

- Train a logistic regression model to classify customers as likely churners or not.

Session 8: Model Evaluation and Validation

Topics
- Cross-validation (K-Fold)

- Hyperparameter tuning (GridSearchCV, RandomizedSearchCV)

- Bias-variance tradeoff

Practical Focus

- Perform cross-validation and hyperparameter tuning on a classification or regression

model.

Session 9: Feature Engineering

Topics

- Encoding categorical variables

- Feature scaling (standardization, normalization)

- Creating new features from existing data

Practical Focus

- Engineer features (e.g., date-based, interactions) to improve a machine learning model.

Session 10: Unsupervised Learning – Clustering

Topics

- K-means clustering

- Applications: customer segmentation, anomaly detection

- Cluster evaluation: silhouette score

Practical Focus

- Perform K-means clustering to segment customers and analyze cluster profiles.

Session 11: Ensemble Methods

Topics

- Random Forest and Gradient Boosting (XGBoost/LightGBM)

- Bagging vs. Boosting

- Practical tips for tuning ensembles

Practical Focus

- Train a Gradient Boosting model to improve classification accuracy.

Session 12: SQL for Business Analytics
Topics

- Writing advanced SQL queries (joins, subqueries, window functions)

- Query optimization and indexing

- Integrating SQL queries into Python (using sqlite3 or SQLAlchemy)

Practical Focus

- Query and analyze data from an SQL database integrated with a Python script.

Session 13: Introduction to Generative AI (GenAI)

Topics

- Overview of Generative AI (text generation, summarization)

- Working with pre-trained LLMs (e.g., Hugging Face transformers)

- Introduction to prompt engineering

Practical Focus

- Generate text summaries or insights from a dataset using an LLM.

Session 14: Retrieval-Augmented Generation (RAG) – Concepts

Topics

- How RAG combines retrieval systems with generative models

- Use cases for RAG in business (Q&A, report generation, decision support)

- Overview of vector databases (e.g., FAISS, Pinecone)

Practical Focus

- Sketch a workflow where queries fetch relevant data to feed into a generative model.

Session 15: Building the CSV Analytics Tool – Design

Topics

- Requirements for a CSV analytics tool (querying, summarizing, filtering)

- Efficient file handling for large datasets (chunking)

- Designing user-friendly outputs (charts, tables)

Practical Focus
- Draft the logic for a CSV analytics module that summarizes key metrics interactively.

Session 16: Implementing the CSV Analytics Tool

Topics

- Building core functionalities: query execution, metric calculations, visualizations

- Error handling and logging

- Exporting insights (e.g., saving summaries to Excel/CSV)

Practical Focus

- Build the CSV analytics tool and test it on real-world datasets.

Session 17: SQL Integration for RAG

Topics

- Querying SQL databases for context retrieval

- Converting SQL results into context for LLMs

- Handling large datasets and dynamic query results

Practical Focus

- Write Python code to retrieve data from SQL, format it, and prepare it for a generative
model.

Session 18: Building the RAG-Based Chatbot

Topics

- Connecting the chatbot to SQL and CSV modules

- Structuring prompts dynamically based on user queries

- Handling missing data or ambiguous queries

Practical Focus

- Build an initial RAG-based chatbot pipeline that retrieves context and generates responses.

Session 19: Testing and Refining the GenAI Project

Topics

- Testing edge cases for the CSV tool and RAG chatbot

- Handling incomplete user inputs or noisy data

- Improving performance and response accuracy

Practical Focus

- Test the combined system, focusing on query accuracy, response quality, and speed.

Session 20: Advanced Features and Final Review

Topics

- Adding advanced features: embedding-based similarity search, interactive filtering

- Business scalability considerations (security, multi-user support)

- Future enhancements: extending RAG or adding predictive analytics

Practical Focus

- Explore extensions, such as adding ML-driven recommendations or summarization

features to the chatbot.

Machine Learning and Artificial Intelligence
No ratings yet
Machine Learning and Artificial Intelligence
3 pages
AIML Curriculum
No ratings yet
AIML Curriculum
25 pages
AIML 2nd Year
No ratings yet
AIML 2nd Year
5 pages
Project Data Eng
No ratings yet
Project Data Eng
2 pages
Advance AI With Datascience v3 Nov24
No ratings yet
Advance AI With Datascience v3 Nov24
8 pages
Data Science for Business Certificate Program
No ratings yet
Data Science for Business Certificate Program
2 pages
MI 254 BAMD Course Outline 2024 25
No ratings yet
MI 254 BAMD Course Outline 2024 25
5 pages
DS Curriculum
No ratings yet
DS Curriculum
4 pages
AI-Internship Syllabus
No ratings yet
AI-Internship Syllabus
3 pages
Ai & ML FDP
No ratings yet
Ai & ML FDP
7 pages
Website
No ratings yet
Website
9 pages
Boot Camp OutLine
No ratings yet
Boot Camp OutLine
4 pages
Data Science Using Python
No ratings yet
Data Science Using Python
9 pages
Full Stack Data Science Brochure
No ratings yet
Full Stack Data Science Brochure
15 pages
DS&a + AI ML Nov 23 6868 - Calendar
No ratings yet
DS&a + AI ML Nov 23 6868 - Calendar
9 pages
10000coders Data Science Curriculum
No ratings yet
10000coders Data Science Curriculum
16 pages
Data Science
No ratings yet
Data Science
17 pages
Job Prep
No ratings yet
Job Prep
32 pages
Data Science Task List
No ratings yet
Data Science Task List
15 pages
Machine Learning With Python and Project
No ratings yet
Machine Learning With Python and Project
1 page
Machine Learning
No ratings yet
Machine Learning
4 pages
Outline For Data Analytics
No ratings yet
Outline For Data Analytics
2 pages
Python Data Science & ML Bootcamp
No ratings yet
Python Data Science & ML Bootcamp
15 pages
Data Science - Python, Machine Learning, AI
No ratings yet
Data Science - Python, Machine Learning, AI
4 pages
? Ultimate Data Science Topic List - (Beginner To ...
No ratings yet
? Ultimate Data Science Topic List - (Beginner To ...
4 pages
6months DS GenAI Contents
No ratings yet
6months DS GenAI Contents
5 pages
BL603 Transcript Notes May 10
No ratings yet
BL603 Transcript Notes May 10
9 pages
Machine Learning and Data Science Master
No ratings yet
Machine Learning and Data Science Master
19 pages
AI ML Course - 3
No ratings yet
AI ML Course - 3
7 pages
Ai ML Data Science Course Syllabus Brochure
No ratings yet
Ai ML Data Science Course Syllabus Brochure
10 pages
Course Overview Cloud Computing Data Engineering Machine Learning Data Analytics Soft Skills
No ratings yet
Course Overview Cloud Computing Data Engineering Machine Learning Data Analytics Soft Skills
4 pages
Full Stack Data Science Brochure
No ratings yet
Full Stack Data Science Brochure
15 pages
Data Analyst Workflow
No ratings yet
Data Analyst Workflow
2 pages
Ai and Data Science
No ratings yet
Ai and Data Science
9 pages
Project Based Experiential Learning Python For Datascience: Course Objective
No ratings yet
Project Based Experiential Learning Python For Datascience: Course Objective
2 pages
Course Outline - ML IIFT Delhi MBA (BA) Sep-Dec 24
No ratings yet
Course Outline - ML IIFT Delhi MBA (BA) Sep-Dec 24
5 pages
Machine Learning, AI & Its Applications: Live Online Instructor-Led Training On
No ratings yet
Machine Learning, AI & Its Applications: Live Online Instructor-Led Training On
6 pages
Predictive Analysis TSE
No ratings yet
Predictive Analysis TSE
5 pages
First Coding Session - Overview!
No ratings yet
First Coding Session - Overview!
5 pages
Data Science
No ratings yet
Data Science
17 pages
Full Stack Data Science Combined Brochure
No ratings yet
Full Stack Data Science Combined Brochure
15 pages
Complete Machine Learning and Data Science Program
No ratings yet
Complete Machine Learning and Data Science Program
3 pages
Artificial Intelligence & Machine Learning Curriculum Pregrad
No ratings yet
Artificial Intelligence & Machine Learning Curriculum Pregrad
12 pages
Data Analytics Task List
No ratings yet
Data Analytics Task List
15 pages
Hands On Data Science MAchine Learning SQL Power BI Tableau MongoDB With End To End Projects
No ratings yet
Hands On Data Science MAchine Learning SQL Power BI Tableau MongoDB With End To End Projects
13 pages
Python for Business Analytics
No ratings yet
Python for Business Analytics
11 pages
Complete Curriculum by Ashish
No ratings yet
Complete Curriculum by Ashish
6 pages
Data Analytics & Business Intelligence
No ratings yet
Data Analytics & Business Intelligence
15 pages
Full Stack Data Science Combined Without Prices Brochure
No ratings yet
Full Stack Data Science Combined Without Prices Brochure
15 pages
Python For Data Science
No ratings yet
Python For Data Science
2 pages
Data Science Professional Profile
No ratings yet
Data Science Professional Profile
4 pages
Ai and Data Science
No ratings yet
Ai and Data Science
9 pages
Data Analysis Roadmap
No ratings yet
Data Analysis Roadmap
6 pages
AI Applications for Industry Experts
No ratings yet
AI Applications for Industry Experts
3 pages
Tech Launch Program Data Science
No ratings yet
Tech Launch Program Data Science
22 pages
AI Content
No ratings yet
AI Content
8 pages
Data Sciecne Roadmap
No ratings yet
Data Sciecne Roadmap
5 pages
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
No ratings yet
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
16 pages
Anomaly Detection in Meteorological Data Using Machine Learning Techniques
No ratings yet
Anomaly Detection in Meteorological Data Using Machine Learning Techniques
6 pages
Course Recommendation via Data Mining
No ratings yet
Course Recommendation via Data Mining
29 pages
Forged Image Detection via Clustering
No ratings yet
Forged Image Detection via Clustering
10 pages
Machine Learning Engineering
No ratings yet
Machine Learning Engineering
80 pages
Computer Science Project Ideas
100% (1)
Computer Science Project Ideas
3 pages
0975 Data Science and Machine Learning
No ratings yet
0975 Data Science and Machine Learning
6 pages
Unit V: Distance and Rule Based Models
No ratings yet
Unit V: Distance and Rule Based Models
56 pages
Leaf Disease Detection Guide
No ratings yet
Leaf Disease Detection Guide
29 pages
Data Analytics Question Bank for CSE
No ratings yet
Data Analytics Question Bank for CSE
12 pages
A Prescriptive Model For Migration To Microservices Based On SDLC Artifacts
No ratings yet
A Prescriptive Model For Migration To Microservices Based On SDLC Artifacts
36 pages
PAC-Bayesian Structure Learning Insights
No ratings yet
PAC-Bayesian Structure Learning Insights
139 pages
AI & ML Lab Manual: Search Algorithms
No ratings yet
AI & ML Lab Manual: Search Algorithms
42 pages
Panduan Data Mining dan Excel
No ratings yet
Panduan Data Mining dan Excel
721 pages
Machine Learning With Python Report
100% (1)
Machine Learning With Python Report
41 pages
2013 COMP5318 Lecture1
No ratings yet
2013 COMP5318 Lecture1
21 pages
Engineering Literature Review Sample
100% (2)
Engineering Literature Review Sample
6 pages
An Enhanced Rough Set Based Technique For Elucidating Learning Styles in E-Learning System
No ratings yet
An Enhanced Rough Set Based Technique For Elucidating Learning Styles in E-Learning System
6 pages
Social Network Analysis PDF
No ratings yet
Social Network Analysis PDF
23 pages
December 2024: Top 10 Read Articles in Data Mining & Knowledge Management Process
No ratings yet
December 2024: Top 10 Read Articles in Data Mining & Knowledge Management Process
31 pages
AI & ML in Finance: Bibliometric Review
No ratings yet
AI & ML in Finance: Bibliometric Review
14 pages
AI in Software Reusability
No ratings yet
AI in Software Reusability
7 pages
K-Means Clustering
No ratings yet
K-Means Clustering
22 pages
Learning Predictive Analytics With Python Gain Practical Insights Into Predictive Modelling by Implementing Predictive Analytics Algorithms On Public Datasets With Python Gulipalli Instant Download
No ratings yet
Learning Predictive Analytics With Python Gain Practical Insights Into Predictive Modelling by Implementing Predictive Analytics Algorithms On Public Datasets With Python Gulipalli Instant Download
77 pages
08 - Data Analyses - Socio - Economic - Political Science
No ratings yet
08 - Data Analyses - Socio - Economic - Political Science
13 pages
Project Report Data Visualization
75% (4)
Project Report Data Visualization
23 pages
Machine Learning Applications Overview
No ratings yet
Machine Learning Applications Overview
15 pages
Fortran Routines for L-Moments
No ratings yet
Fortran Routines for L-Moments
39 pages
First Semester Complete
No ratings yet
First Semester Complete
95 pages
Nptel Ee181 MLDL Q&a
No ratings yet
Nptel Ee181 MLDL Q&a
42 pages
Complete ML Exam Answers 2024
No ratings yet
Complete ML Exam Answers 2024
3 pages