DVT Exp 3

The document outlines a Python script for analyzing financial data using clustering techniques. It includes loading data, handling missing values, standardizing the data, applying K-Means clustering, and visualizing results through scatter plots, histograms, and heatmaps. The script focuses on identifying patterns and distributions within financial metrics.

Uploaded by

abhilashdopati

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views1 page

DVT Exp 3

Uploaded by

abhilashdopati

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

import pandas as pd

import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler

# Load financial data

df = pd.read_csv("financial_analysis.csv")

# Display first few rows

print(df.head())

# Exclude non-numeric columns (e.g., 'Company')

numeric_cols = df.select_dtypes(include=['number']).columns

# Handle missing values only for numeric columns

df[numeric_cols] = df[numeric_cols].fillna(df[numeric_cols].mean())

# Standardize data for clustering

scaler = StandardScaler()
scaled_data = scaler.fit_transform(df[numeric_cols])

# K-Means Clustering
kmeans = KMeans(n_clusters=3, random_state=42, n_init=10)
df['Cluster'] = kmeans.fit_predict(scaled_data)

# Scatter plot for Clusters (using first two numeric columns)

plt.figure(figsize=(8,6))
sns.scatterplot(x=df[numeric_cols[0]], y=df[numeric_cols[1]], hue=df['Cluster'],
palette='viridis')
plt.xlabel(numeric_cols[0])
plt.ylabel(numeric_cols[1])
plt.title("Clustering Analysis")
plt.show()

# Histogram of a financial metric (e.g., Revenue)

plt.figure(figsize=(8,6))
sns.histplot(df['Revenue'], bins=30, kde=True, color='blue')
plt.title("Revenue Distribution")
plt.show()

# Heatmap of feature correlations

plt.figure(figsize=(10, 6))
sns.heatmap(df[numeric_cols].corr(), annot=True, cmap="coolwarm", linewidths=0.5)
plt.title("Correlation Heatmap")
plt.show()

Intro Qugates
No ratings yet
Intro Qugates
4 pages
Income (K-Means Clustering On A Sample Data Set)
No ratings yet
Income (K-Means Clustering On A Sample Data Set)
3 pages
Elbow Method
No ratings yet
Elbow Method
2 pages
Feature Engineering: Scaling Techniques
No ratings yet
Feature Engineering: Scaling Techniques
13 pages
K Means Clustering
No ratings yet
K Means Clustering
6 pages
PMA Experiment 2
No ratings yet
PMA Experiment 2
6 pages
Customer Clustering Analysis
No ratings yet
Customer Clustering Analysis
22 pages
Assignment 18
No ratings yet
Assignment 18
10 pages
Untitled Document
No ratings yet
Untitled Document
6 pages
7 A & B
No ratings yet
7 A & B
2 pages
Banknote Authentication
100% (1)
Banknote Authentication
3 pages
KMeans Clustering
No ratings yet
KMeans Clustering
1 page
Code
No ratings yet
Code
2 pages
Experiment-3 ML Lab
No ratings yet
Experiment-3 ML Lab
20 pages
Practical 5
No ratings yet
Practical 5
6 pages
Report ML 2
No ratings yet
Report ML 2
10 pages
Reading Data: #Importing Required Libraries
No ratings yet
Reading Data: #Importing Required Libraries
16 pages
DWDM Lab All
No ratings yet
DWDM Lab All
20 pages
Clustering Techniques in Python Analysis
No ratings yet
Clustering Techniques in Python Analysis
10 pages
K-Means Clustering Implementation Guide
No ratings yet
K-Means Clustering Implementation Guide
8 pages
Implement Clustering Algorithms For Unsupervised Classification
No ratings yet
Implement Clustering Algorithms For Unsupervised Classification
4 pages
Credit Card Segmentation Guide
No ratings yet
Credit Card Segmentation Guide
5 pages
Data Mining Practicals Complete
No ratings yet
Data Mining Practicals Complete
13 pages
Customer Segmentation with Jupyter
100% (19)
Customer Segmentation with Jupyter
50 pages
Untitled Document-2-1-13-7-11.4
No ratings yet
Untitled Document-2-1-13-7-11.4
5 pages
SOLUTION ONLY CODE DWDM - Lab - All
No ratings yet
SOLUTION ONLY CODE DWDM - Lab - All
8 pages
Unit 3 Unsupervised Learning
No ratings yet
Unit 3 Unsupervised Learning
9 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
3 pages
Mlda - Lab
No ratings yet
Mlda - Lab
35 pages
CSE4062S24 Group5 Project DescriptiveAnalysis
No ratings yet
CSE4062S24 Group5 Project DescriptiveAnalysis
10 pages
Mall Customer Segmentation Using KMeans Clustering Algorithm and Classification Algorithm
No ratings yet
Mall Customer Segmentation Using KMeans Clustering Algorithm and Classification Algorithm
40 pages
23CC554
No ratings yet
23CC554
10 pages
Project Explanation
No ratings yet
Project Explanation
17 pages
Da Exp 10
No ratings yet
Da Exp 10
6 pages
Market Analysis by Pchandru
No ratings yet
Market Analysis by Pchandru
10 pages
Code Shabab Error 7
No ratings yet
Code Shabab Error 7
5 pages
K Means Clustering
No ratings yet
K Means Clustering
5 pages
Aiml Assignment 10
No ratings yet
Aiml Assignment 10
6 pages
ML0101EN Clus K Means Customer Seg Py v1
100% (1)
ML0101EN Clus K Means Customer Seg Py v1
8 pages
DV Exp 6
No ratings yet
DV Exp 6
2 pages
Data Entry
No ratings yet
Data Entry
4 pages
ML Assignment 4
No ratings yet
ML Assignment 4
6 pages
Data Mining Assignment Guide
100% (1)
Data Mining Assignment Guide
21 pages
Da Exp 10
No ratings yet
Da Exp 10
6 pages
KMeans Clustering Bidimensional Daniel Ames Camayo
No ratings yet
KMeans Clustering Bidimensional Daniel Ames Camayo
15 pages
Clustering Algorithms for Data Analysis
No ratings yet
Clustering Algorithms for Data Analysis
7 pages
Baidurya Debnath 4
No ratings yet
Baidurya Debnath 4
37 pages
Ds Un4
No ratings yet
Ds Un4
11 pages
Program 7
No ratings yet
Program 7
3 pages
Experiment-7: Implementation of K-Means Clustering Algorithm
No ratings yet
Experiment-7: Implementation of K-Means Clustering Algorithm
3 pages
DWM Exp4
No ratings yet
DWM Exp4
9 pages
K Means Clustering - Experiment 12
No ratings yet
K Means Clustering - Experiment 12
3 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
4 pages
Exercise Plotting
No ratings yet
Exercise Plotting
10 pages
A Mini Rpoject
No ratings yet
A Mini Rpoject
7 pages
Exp 1
No ratings yet
Exp 1
6 pages
Jupyter Notebook Project DM Nikita Chaturvedi 25.07.2021
100% (5)
Jupyter Notebook Project DM Nikita Chaturvedi 25.07.2021
83 pages
Tugas Clustering - 132021012 - Kevin Gazkia Naufal
No ratings yet
Tugas Clustering - 132021012 - Kevin Gazkia Naufal
6 pages

DVT Exp 3

Uploaded by

DVT Exp 3

Uploaded by

import pandas as pd

# Load financial data

# Display first few rows

# Exclude non-numeric columns (e.g., 'Company')

# Handle missing values only for numeric columns

# Standardize data for clustering

# Scatter plot for Clusters (using first two numeric columns)

# Histogram of a financial metric (e.g., Revenue)

# Heatmap of feature correlations

You might also like