0% found this document useful (0 votes)

6 views2 pages

Python Ds ML Guide

The document provides an overview of key concepts in Python for Data Science and Machine Learning, focusing on data selection in pandas using loc and iloc, data wrangling techniques, and basic NumPy operations. It also covers machine learning processes with scikit-learn, including data splitting, preprocessing, and model fitting. Examples of code snippets illustrate the practical application of these concepts.

Uploaded by

freyalivanna

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views2 pages

Python Ds ML Guide

Uploaded by

freyalivanna

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Python for Data Science & Machine Learning

1. Data Selection in pandas: loc vs iloc

- `loc` is label-based: it selects rows/columns using labels (names).

- `iloc` is integer-position based: it selects rows/columns using index positions.

import pandas as pd

df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35]
}, index=['a', 'b', 'c'])

print(df.loc['a']) # Row with index label 'a'

print(df.iloc[0]) # First row (position 0)

2. Data Wrangling with pandas

- Handling missing values

- Renaming, filtering, grouping

- Applying functions to columns

df.dropna() # Remove rows with NaNs

df.fillna(0) # Replace NaNs with 0
df.rename(columns={'age': 'Age'})
df[df['age'] > 25] # Filter rows
df.groupby('name').mean() # Group by
df['age'].apply(lambda x: x+1) # Apply function

3. NumPy Basics

NumPy provides fast numerical operations on arrays.

Python for Data Science & Machine Learning

import numpy as np

arr = np.array([1, 2, 3])

print(arr.mean())
print(np.arange(0, 10, 2)) # Create range of numbers

4. Machine Learning with scikit-learn

- Splitting data

- Preprocessing

- Fitting models

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris

X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

model = LogisticRegression()
model.fit(X_train, y_train)
print(model.score(X_test, y_test))

? Python Topics For Data Science
No ratings yet
? Python Topics For Data Science
3 pages
Data Science Toc Srinivas
No ratings yet
Data Science Toc Srinivas
4 pages
Report
No ratings yet
Report
11 pages
Machine Learning Roadmap For Aspiring Data Scientists
No ratings yet
Machine Learning Roadmap For Aspiring Data Scientists
5 pages
Python Tutorial
No ratings yet
Python Tutorial
1 page
Python Data Mastery Report
No ratings yet
Python Data Mastery Report
9 pages
Datascienceusing Python Training
No ratings yet
Datascienceusing Python Training
11 pages
Python for Data Science Seminar Overview
No ratings yet
Python for Data Science Seminar Overview
11 pages
Python Data Science Intro To ML - Course 01
No ratings yet
Python Data Science Intro To ML - Course 01
3 pages
Learninng Plan
No ratings yet
Learninng Plan
6 pages
Python For Data Science
No ratings yet
Python For Data Science
5 pages
Data Science Full Stack Roadmap
No ratings yet
Data Science Full Stack Roadmap
25 pages
Python For Data Science
No ratings yet
Python For Data Science
89 pages
Innomatics Data Science Curriculum Overview
No ratings yet
Innomatics Data Science Curriculum Overview
10 pages
Data Science Interview Study Notes
No ratings yet
Data Science Interview Study Notes
7 pages
Complete Chapter
No ratings yet
Complete Chapter
6 pages
Python for Statistics & ML Guide
No ratings yet
Python for Statistics & ML Guide
300 pages
Python for Data Science and ML
No ratings yet
Python for Data Science and ML
5 pages
Statistics and Machine Learning in Python
No ratings yet
Statistics and Machine Learning in Python
218 pages
Analyzing Low Birth Weight Factors in R
100% (1)
Analyzing Low Birth Weight Factors in R
219 pages
Python - Follow Dr. AngShu (@drangshu) For More
100% (1)
Python - Follow Dr. AngShu (@drangshu) For More
300 pages
DS Final
No ratings yet
DS Final
46 pages
Statistics Machine Learning Python Draft
100% (1)
Statistics Machine Learning Python Draft
333 pages
Wa0005.
No ratings yet
Wa0005.
29 pages
Statistics and Machine Learning in Python
No ratings yet
Statistics and Machine Learning in Python
300 pages
Python Tutorial
No ratings yet
Python Tutorial
1 page
Data Science Book1
No ratings yet
Data Science Book1
9 pages
8-Month Data Science Roadmap Guide
No ratings yet
8-Month Data Science Roadmap Guide
25 pages
Ultimate Step by Step Guide To Machine Learning Using Python Predictive
100% (3)
Ultimate Step by Step Guide To Machine Learning Using Python Predictive
56 pages
Data Science Training in Naresh I Technologies
100% (3)
Data Science Training in Naresh I Technologies
18 pages
Statistics and Machine Learning in Python
100% (1)
Statistics and Machine Learning in Python
166 pages
Resolving TypeError in Seasonal Decompose
100% (1)
Resolving TypeError in Seasonal Decompose
319 pages
Data Analysis Python Read The Docs Io en Latest
No ratings yet
Data Analysis Python Read The Docs Io en Latest
79 pages
Report
No ratings yet
Report
18 pages
Python and PowerBI Syllabus
No ratings yet
Python and PowerBI Syllabus
3 pages
Statistics Machine Learning Python
No ratings yet
Statistics Machine Learning Python
419 pages
Statistics Machine Learning Python Draft
No ratings yet
Statistics Machine Learning Python Draft
329 pages
Python for Diverse Fields
No ratings yet
Python for Diverse Fields
8 pages
Calculating Vehicle Mileage Averages in R
100% (1)
Calculating Vehicle Mileage Averages in R
323 pages
StatisticsMachineLearningPythonDraft PDF
100% (1)
StatisticsMachineLearningPythonDraft PDF
313 pages
ML Notesv1
100% (2)
ML Notesv1
300 pages
Statistics Machine Learning Python
100% (2)
Statistics Machine Learning Python
389 pages
TBC 603 Fundamentals of Machine Learning
No ratings yet
TBC 603 Fundamentals of Machine Learning
2 pages
Module 1.foundations of Data Science
No ratings yet
Module 1.foundations of Data Science
17 pages
Python - Data Science Lecture 1
No ratings yet
Python - Data Science Lecture 1
55 pages
Mastering Python For Data Science With Numpy & Pandas
100% (3)
Mastering Python For Data Science With Numpy & Pandas
136 pages
Uttam
No ratings yet
Uttam
29 pages
Data Science
No ratings yet
Data Science
9 pages
.2 Dse
No ratings yet
.2 Dse
14 pages
Statistics Machine Learning Python
No ratings yet
Statistics Machine Learning Python
437 pages
Python Data Science & ML Course Guide
No ratings yet
Python Data Science & ML Course Guide
2 pages
Machine Learning and Data Science Master
No ratings yet
Machine Learning and Data Science Master
19 pages
Unit 4
No ratings yet
Unit 4
27 pages
Data Science, ML, and AI
No ratings yet
Data Science, ML, and AI
4 pages
Data Sciences
No ratings yet
Data Sciences
4 pages

Python Ds ML Guide

Uploaded by

Python Ds ML Guide

Uploaded by

Python for Data Science & Machine Learning

1. Data Selection in pandas: loc vs iloc

- `loc` is label-based: it selects rows/columns using labels (names).

- `iloc` is integer-position based: it selects rows/columns using index positions.

print(df.loc['a']) # Row with index label 'a'

2. Data Wrangling with pandas

- Handling missing values

- Renaming, filtering, grouping

- Applying functions to columns

df.dropna() # Remove rows with NaNs

NumPy provides fast numerical operations on arrays.

arr = np.array([1, 2, 3])

4. Machine Learning with scikit-learn

from sklearn.model_selection import train_test_split

You might also like