0% found this document useful (0 votes)

57 views3 pages

Python Scenario Based Interview QA

The document presents various scenario-based Python interview questions tailored for freshers applying for data analysis roles. Each scenario includes a specific data-related challenge, such as cleaning data, analyzing sales, preparing datasets for churn prediction, identifying outliers, merging datasets, visualizing trends, and preparing categorical data for machine learning. The document provides sample code snippets and methodologies to address these scenarios effectively.

Uploaded by

gauri pingat

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

57 views3 pages

Python Scenario Based Interview QA

Uploaded by

gauri pingat

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Scenario-Based Python Interview Questions for Data Analysis Roles (Freshers)

1. Scenario: You receive a CSV file with missing values, inconsistent casing, and duplicate

rows. How would you clean this data using Python?

Answer:

import pandas as pd

df = pd.read_csv('data.csv')

# Remove duplicates

df = df.drop_duplicates()

# Standardize casing (e.g., for a 'Name' column)

df['Name'] = df['Name'].str.title()

# Handle missing values

df = df.fillna(method='ffill')

2. Scenario: You have a sales dataset with columns: Date, Product, and Revenue. How would

you find the top 3 products with the highest average monthly revenue?

Answer:

df['Date'] = pd.to_datetime(df['Date'])

df['Month'] = df['Date'].dt.to_period('M')

monthly_avg = df.groupby(['Month', 'Product'])['Revenue'].mean().reset_index()

top_products =

monthly_avg.groupby('Product')['Revenue'].mean().sort_values(ascending=False).head(3)

3. Scenario: How would you prepare customer data with demographic info and activity logs
for a churn prediction model?

Answer:

- Handle missing values

- Convert categorical features to numeric using pd.get_dummies()

- Normalize/scale numerical features

- Merge datasets if activity logs are separate

- Label churn (e.g., Churn = 1 if customer left, else 0)

4. Scenario: You suspect some products have incorrect prices in a dataset. How would you

identify and handle outliers?

Answer:

Q1 = df['Price'].quantile(0.25)

Q3 = df['Price'].quantile(0.75)

IQR = Q3 - Q1

outliers = df[(df['Price'] < Q1 - 1.5IQR) | (df['Price'] > Q3 + 1.5IQR)]

df = df[~df.index.isin(outliers.index)]

5. Scenario: You have two datasets: users.csv and transactions.csv. How would you

combine them to analyze total spending per user?

Answer:

users = pd.read_csv('users.csv')

transactions = pd.read_csv('transactions.csv')

merged = pd.merge(users, transactions, on='user_id')

spending = merged.groupby('user_id')['amount'].sum()

6. Scenario: You have daily temperature data. How would you visualize trends and seasonal

patterns?
Answer:

import matplotlib.pyplot as plt

df['Date'] = pd.to_datetime(df['Date'])

df.set_index('Date', inplace=True)

plt.figure(figsize=(10,5))

plt.plot(df['Temperature'])

plt.title('Daily Temperature Trends')

plt.xlabel('Date')

plt.ylabel('Temperature')

plt.show()

7. Scenario: You have a column 'Country' with many categories. How would you prepare this

for machine learning?

Answer:

# Use OneHotEncoder or pd.get_dummies

df = pd.get_dummies(df, columns=['Country'], drop_first=True)

8. Scenario: Your dataset has a column 'Join_Date'. What features can you extract from it?

Answer:

df['Join_Date'] = pd.to_datetime(df['Join_Date'])

df['Year'] = df['Join_Date'].dt.year

df['Month'] = df['Join_Date'].dt.month

df['Weekday'] = df['Join_Date'].dt.day_name()

df['Join_Quarter'] = df['Join_Date'].dt.quarter

B Tech-AIML-question Bank-2 Answer Key
No ratings yet
B Tech-AIML-question Bank-2 Answer Key
9 pages
Python MCQs
No ratings yet
Python MCQs
21 pages
DS Question Bank Unit-1 Part-2
No ratings yet
DS Question Bank Unit-1 Part-2
3 pages
Document (4) - 1
No ratings yet
Document (4) - 1
15 pages
Data Handling Ques
No ratings yet
Data Handling Ques
2 pages
Text 3
No ratings yet
Text 3
3 pages
Assignment
No ratings yet
Assignment
12 pages
Create A Pandas Series From A Dictionary of Values and An Ndarray
No ratings yet
Create A Pandas Series From A Dictionary of Values and An Ndarray
15 pages
Practical File Infomatics Practices 2024-25
No ratings yet
Practical File Infomatics Practices 2024-25
39 pages
Data Analyst Interview Q&A Guide
No ratings yet
Data Analyst Interview Q&A Guide
20 pages
DW Lab File
No ratings yet
DW Lab File
18 pages
CSE445 NSU Week - 3
No ratings yet
CSE445 NSU Week - 3
48 pages
Even Students
No ratings yet
Even Students
36 pages
Data Prep & EDA for Python Users
No ratings yet
Data Prep & EDA for Python Users
12 pages
Cleaning Data in Python
No ratings yet
Cleaning Data in Python
8 pages
Practical File IP
No ratings yet
Practical File IP
27 pages
Exp 8 - LM
No ratings yet
Exp 8 - LM
10 pages
Informatics Practices Guide
No ratings yet
Informatics Practices Guide
34 pages
Essential Steps in Data Cleaning
No ratings yet
Essential Steps in Data Cleaning
17 pages
IP Practic MINE
No ratings yet
IP Practic MINE
30 pages
HCLTech
No ratings yet
HCLTech
5 pages
Python Questions BA
No ratings yet
Python Questions BA
5 pages
Work Sheet-1 Class 12 IPR
No ratings yet
Work Sheet-1 Class 12 IPR
5 pages
Data Cleaning in Python
No ratings yet
Data Cleaning in Python
14 pages
Data Cleaning
No ratings yet
Data Cleaning
13 pages
Final - EDA Assignment - Sourabh S Hubballi
No ratings yet
Final - EDA Assignment - Sourabh S Hubballi
34 pages
Data Cleaning & Transformation
No ratings yet
Data Cleaning & Transformation
3 pages
Oddstudents
No ratings yet
Oddstudents
35 pages
Class 12 Practical File Informatics Practices Python
No ratings yet
Class 12 Practical File Informatics Practices Python
19 pages
Data Cleaning
No ratings yet
Data Cleaning
40 pages
Python - Pandas - Numpy Interview Q&A
No ratings yet
Python - Pandas - Numpy Interview Q&A
12 pages
DAP Writeups - Merged
No ratings yet
DAP Writeups - Merged
33 pages
IP Lab Record
No ratings yet
IP Lab Record
23 pages
100 Real World Python Problem
No ratings yet
100 Real World Python Problem
7 pages
AIML
No ratings yet
AIML
13 pages
Pandas Ques
No ratings yet
Pandas Ques
3 pages
Statistical Transform Data Cleaning
No ratings yet
Statistical Transform Data Cleaning
30 pages
CSV Data Handling Guide
No ratings yet
CSV Data Handling Guide
14 pages
Assignment 2
No ratings yet
Assignment 2
6 pages
L6 and 7-Data Preprocessing-Coding
No ratings yet
L6 and 7-Data Preprocessing-Coding
34 pages
Data Wrangling & Pandas Guide
No ratings yet
Data Wrangling & Pandas Guide
48 pages
Universal Data Analytics Algorithm
No ratings yet
Universal Data Analytics Algorithm
51 pages
Data Analyst
No ratings yet
Data Analyst
7 pages
Python Interview Questions 1653100147
No ratings yet
Python Interview Questions 1653100147
24 pages
Python DataScience Theory and Codes
No ratings yet
Python DataScience Theory and Codes
4 pages
Class 12 Practical File Informatics Practices
No ratings yet
Class 12 Practical File Informatics Practices
28 pages
Pandas
No ratings yet
Pandas
5 pages
12 Ip Practical List With Solution Complete
No ratings yet
12 Ip Practical List With Solution Complete
5 pages
Python Data Science Cheat Sheet
0% (1)
Python Data Science Cheat Sheet
3 pages
IP - Pandas 1 & 2 (Worksheet) Class 12
No ratings yet
IP - Pandas 1 & 2 (Worksheet) Class 12
16 pages
Pandas
No ratings yet
Pandas
13 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
66 pages
Python NumPy and Pandas MCQs
No ratings yet
Python NumPy and Pandas MCQs
8 pages
Python Data Cleaning Cheat Sheet
100% (4)
Python Data Cleaning Cheat Sheet
8 pages
Python Interview Cheat Sheet Moodys
No ratings yet
Python Interview Cheat Sheet Moodys
2 pages
Cleaning
No ratings yet
Cleaning
4 pages
MY Question Bank
100% (1)
MY Question Bank
3 pages
Math Grade 3 CG
No ratings yet
Math Grade 3 CG
18 pages
Kkips Final CMSS Q1 2022-2023
No ratings yet
Kkips Final CMSS Q1 2022-2023
10 pages
HNC Mechanical Engineering Overview
No ratings yet
HNC Mechanical Engineering Overview
2 pages
Guidance PPT 1
No ratings yet
Guidance PPT 1
21 pages
Final Assignment-OB & HR
83% (6)
Final Assignment-OB & HR
11 pages
Gutalac Sped Center School Mean Percentage Scores (MPS), S.Y. 2016-2017
No ratings yet
Gutalac Sped Center School Mean Percentage Scores (MPS), S.Y. 2016-2017
1 page
Páginas de Poptropica English Islands My Language Kit 1
No ratings yet
Páginas de Poptropica English Islands My Language Kit 1
6 pages
Table of Content For The Preparation of Social Welfare Officer Job Through PPSC
No ratings yet
Table of Content For The Preparation of Social Welfare Officer Job Through PPSC
5 pages
DLL
67% (3)
DLL
4 pages
COACHING SKILLS AND STRATEGIES AND STUDENT ATHLETES PERFORMANCE - Proposal Manuscript Final
No ratings yet
COACHING SKILLS AND STRATEGIES AND STUDENT ATHLETES PERFORMANCE - Proposal Manuscript Final
18 pages
NCOs: Building Pride in the Military
No ratings yet
NCOs: Building Pride in the Military
4 pages
Resume of Md. Shajahan Ali
No ratings yet
Resume of Md. Shajahan Ali
3 pages
Listening-Speaker's Attitude-Point of View
100% (1)
Listening-Speaker's Attitude-Point of View
12 pages
PHD. Thesis Format
100% (1)
PHD. Thesis Format
16 pages
Story Listening Effect
No ratings yet
Story Listening Effect
3 pages
United Nations Lesson Plan Grades 6-8
No ratings yet
United Nations Lesson Plan Grades 6-8
7 pages
Indonesian Translation of Complex Sentences
No ratings yet
Indonesian Translation of Complex Sentences
72 pages
PRSSA Alumni & Student News
No ratings yet
PRSSA Alumni & Student News
7 pages
MC4 Templae
No ratings yet
MC4 Templae
13 pages
Recruit Top Talent from IIST
No ratings yet
Recruit Top Talent from IIST
16 pages
Simple Strategies To Boost Your IELTS Skills PDF
No ratings yet
Simple Strategies To Boost Your IELTS Skills PDF
8 pages
CV 18-06-25
No ratings yet
CV 18-06-25
4 pages
The Joyous Wedding Classic Selections For Organ and Trumpet
82% (11)
The Joyous Wedding Classic Selections For Organ and Trumpet
80 pages
Android Development Essentials
No ratings yet
Android Development Essentials
10 pages
Mzumbe University (Chuo Kikuu Mzumbe)
No ratings yet
Mzumbe University (Chuo Kikuu Mzumbe)
1 page
Communication Engineering Ec-Sem-4 - Google Search
No ratings yet
Communication Engineering Ec-Sem-4 - Google Search
2 pages
ECSA: Advanced Pen-Testing Skills
No ratings yet
ECSA: Advanced Pen-Testing Skills
1 page
The Neuropsychology of Women
No ratings yet
The Neuropsychology of Women
247 pages
Argumentative Essay - Day 1
No ratings yet
Argumentative Essay - Day 1
6 pages
Higher National Diploma in English ENGL 1108 Language and Society Answer Scheme
No ratings yet
Higher National Diploma in English ENGL 1108 Language and Society Answer Scheme
10 pages

Python Scenario Based Interview QA

Uploaded by

Python Scenario Based Interview QA

Uploaded by

Scenario-Based Python Interview Questions for Data Analysis Roles (Freshers)

rows. How would you clean this data using Python?

# Standardize casing (e.g., for a 'Name' column)

# Handle missing values

monthly_avg = df.groupby(['Month', 'Product'])['Revenue'].mean().reset_index()

- Handle missing values

- Convert categorical features to numeric using pd.get_dummies()

- Normalize/scale numerical features

- Merge datasets if activity logs are separate

- Label churn (e.g., Churn = 1 if customer left, else 0)

identify and handle outliers?

outliers = df[(df['Price'] < Q1 - 1.5*IQR) | (df['Price'] > Q3 + 1.5*IQR)]

combine them to analyze total spending per user?

merged = pd.merge(users, transactions, on='user_id')

import matplotlib.pyplot as plt

plt.title('Daily Temperature Trends')

for machine learning?

# Use OneHotEncoder or pd.get_dummies

df = pd.get_dummies(df, columns=['Country'], drop_first=True)

You might also like

outliers = df[(df['Price'] < Q1 - 1.5IQR) | (df['Price'] > Q3 + 1.5IQR)]