0% found this document useful (0 votes)

36 views2 pages

Market Analysis in Banking Domain - Code

Uploaded by

pradeep191988

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

36 views2 pages

Market Analysis in Banking Domain - Code

Uploaded by

pradeep191988

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

import scala.reflect.runtime.

universe
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.ml.Pipeline
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.ml.feature.Bucketizer
import org.apache.spark.ml.feature.Normalizer
import org.apache.spark.ml.feature.StringIndexer
import org.apache.spark.ml.feature.VectorAssembler
import org.apache.spark.mllib.evaluation.BinaryClassificationMetrics
import org.apache.spark.sql.DataFrame
import org.apache.spark.sql.SQLContext
import org.apache.spark.sql.functions.mean

val bank_people_data =
spark.read.option("multiline","true").json("/user/p_pradeep23_gmail/
bank_edited.json");
bank_people_data.show()

bank_people_data.registerTempTable("datanewtable")

bank_people_data.select(max($"age")).show()
bank_people_data.select(min($"age")).show()
bank_people_data.select(avg($"age")).show()
bank_people_data.select(avg($"balance")).show()
val median = spark.sql("SELECT percentile_approx(balance, 0.5) FROM
datanewtable").show()

val agedata = spark.sql("select age, count(*) as number from datanewtable where

y='yes' group by age order by number desc")
agedata.show()

val maritaldata = spark.sql("select marital, count(*) as number from datanewtable

where y='yes' group by marital order by number desc")
maritaldata.show()

val ageandmaritaldata = spark.sql("select age, marital, count(*) as number from

datanewtable where y='yes' group by age,marital order by number desc")
ageandmaritaldata.show()

val agedata = spark.udf.register("agedata",(age:Int) => {

if (age < 20)
"Teen"
else if (age > 20 && age <= 32)
"Young"
else if (age > 33 && age <= 55)
"Middle Aged"
else
"old"
})

//Replacing the old age column with the new age column

val banknewDF = bank_people_data.withColumn("age",agedata(bank_people_data("age")))

banknewDF.show()

banknewDF.registerTempTable("banknewtable")
//which age group subscribed the most

val targetage = spark.sql("select age, count(*) as number from banknewtable where

y='yes' group by age order by number desc")
targetage.show()

//pipelining with string Indexer

val agedata2 = new StringIndexer().setInputCol("age").setOutputCol("ageindex")

//Fitting the model

var strindModel = agedata2.fit(banknewDF)

//assigns generated value of index of the column, by feature engineering

strindModel.transform(banknewDF).select("age","ageIndex").show(5)

MLT Ann Lab 2
No ratings yet
MLT Ann Lab 2
7 pages
Copy of Final Project
No ratings yet
Copy of Final Project
16 pages
DSBDA Assignment 2
No ratings yet
DSBDA Assignment 2
10 pages
Analyzing Customer Data with NumPy
No ratings yet
Analyzing Customer Data with NumPy
9 pages
DACLUSTER
No ratings yet
DACLUSTER
9 pages
Machine Learning With PySpark and MLlib - Solving A Binary Classification Problem - by Susan Li - Towards Data Science
No ratings yet
Machine Learning With PySpark and MLlib - Solving A Binary Classification Problem - by Susan Li - Towards Data Science
10 pages
2795529-Python One Hot Encoding
No ratings yet
2795529-Python One Hot Encoding
2 pages
Loan Default Prediction System
No ratings yet
Loan Default Prediction System
13 pages
Naive Bayes Analysis for Personal Loans
No ratings yet
Naive Bayes Analysis for Personal Loans
4 pages
Alishba (S005)
No ratings yet
Alishba (S005)
5 pages
Python Code
No ratings yet
Python Code
2 pages
Senior Data Scientist Resume Example
No ratings yet
Senior Data Scientist Resume Example
2 pages
ML Lab Experiment Shivansh
No ratings yet
ML Lab Experiment Shivansh
29 pages
Regression On Adult Income Dataset Using PySpark
No ratings yet
Regression On Adult Income Dataset Using PySpark
1 page
22bit0079 VL2024250502751 Ast05
No ratings yet
22bit0079 VL2024250502751 Ast05
26 pages
Spark
No ratings yet
Spark
6 pages
DWM Journal
No ratings yet
DWM Journal
104 pages
Data Mining Assignment Overview
No ratings yet
Data Mining Assignment Overview
14 pages
Week 4 LAB
No ratings yet
Week 4 LAB
26 pages
Aiml
No ratings yet
Aiml
27 pages
LDA Code
No ratings yet
LDA Code
19 pages
21mic0107 1
No ratings yet
21mic0107 1
7 pages
Lab2
No ratings yet
Lab2
15 pages
Lê Hoàng Anh Duy - Spark Machine Learning
No ratings yet
Lê Hoàng Anh Duy - Spark Machine Learning
133 pages
SVM Practical4 ML4
No ratings yet
SVM Practical4 ML4
3 pages
Tony Stark Solution
No ratings yet
Tony Stark Solution
12 pages
Pyspark MLlib
No ratings yet
Pyspark MLlib
8 pages
Etl and Stats Code
No ratings yet
Etl and Stats Code
2 pages
Solution
No ratings yet
Solution
41 pages
Ai Labtask13
No ratings yet
Ai Labtask13
3 pages
Projet 2 Classification Des Crédits
No ratings yet
Projet 2 Classification Des Crédits
24 pages
Exp4 DM 1
No ratings yet
Exp4 DM 1
3 pages
DS - Assig-03-Part-I - Jupyter Notebook
No ratings yet
DS - Assig-03-Part-I - Jupyter Notebook
8 pages
Kakauikkla
No ratings yet
Kakauikkla
51 pages
Day 46
No ratings yet
Day 46
9 pages
Plot 3D: Import As
No ratings yet
Plot 3D: Import As
26 pages
Final-12-Lab Programs
No ratings yet
Final-12-Lab Programs
30 pages
Import Pandas As PD
No ratings yet
Import Pandas As PD
2 pages
Feature Engg Code
No ratings yet
Feature Engg Code
16 pages
Chapter 5 - Classification Problems
100% (1)
Chapter 5 - Classification Problems
25 pages
Code
No ratings yet
Code
2 pages
BD WPS2
No ratings yet
BD WPS2
23 pages
ML Lab-1
No ratings yet
ML Lab-1
5 pages
Assignment 2: Hive
No ratings yet
Assignment 2: Hive
11 pages
Kmeans
No ratings yet
Kmeans
4 pages
DSBDA Practicals
No ratings yet
DSBDA Practicals
16 pages
DSC Project 442
No ratings yet
DSC Project 442
12 pages
Json To Dataframe
No ratings yet
Json To Dataframe
13 pages
Ids Lab
No ratings yet
Ids Lab
14 pages
1) Download The Binary Classification Dataset For... - Colab
No ratings yet
1) Download The Binary Classification Dataset For... - Colab
6 pages
ML
No ratings yet
ML
10 pages
IS - Extended - Project - Guided - Template - Notebook
No ratings yet
IS - Extended - Project - Guided - Template - Notebook
26 pages
Bank Customer Churn Analysis - Jupyter Notebook
No ratings yet
Bank Customer Churn Analysis - Jupyter Notebook
11 pages
Practical 3
No ratings yet
Practical 3
8 pages
Pyspark RDD and DataFrame Examples
No ratings yet
Pyspark RDD and DataFrame Examples
3 pages
Page 02
No ratings yet
Page 02
2 pages
Customer Churn Prediction Model
No ratings yet
Customer Churn Prediction Model
6 pages
Lesson - 03 - Using Operators and Decision Constructs
No ratings yet
Lesson - 03 - Using Operators and Decision Constructs
26 pages
Fundamentals
No ratings yet
Fundamentals
2 pages
Lesson 8 AutoEncoders
No ratings yet
Lesson 8 AutoEncoders
29 pages
Ics Publish Subscribe
No ratings yet
Ics Publish Subscribe
8 pages
Lesson 2 Feature Engineering On Text Data
No ratings yet
Lesson 2 Feature Engineering On Text Data
131 pages
Lesson 04 Using Loop Constructs
No ratings yet
Lesson 04 Using Loop Constructs
26 pages
1Z0-1042-25-DEMO-2 Exam Dumps For Cert
100% (1)
1Z0-1042-25-DEMO-2 Exam Dumps For Cert
6 pages
Ics Overview
No ratings yet
Ics Overview
33 pages
Comprehensive Guide to Oracle Configurations
No ratings yet
Comprehensive Guide to Oracle Configurations
183 pages
1Z0-1042-24 Dumps For Cert
No ratings yet
1Z0-1042-24 Dumps For Cert
4 pages
Project Portfolio Management
No ratings yet
Project Portfolio Management
5 pages
Oracle Fusion Enterprise Structure
No ratings yet
Oracle Fusion Enterprise Structure
59 pages
1Z0-1042-25-2 Dumps For Cert
100% (2)
1Z0-1042-25-2 Dumps For Cert
5 pages
PPR Approval Process Configuration Guide
No ratings yet
PPR Approval Process Configuration Guide
2 pages
Oracle ERP Financial Consultant CV
No ratings yet
Oracle ERP Financial Consultant CV
6 pages
Create A Service PO With Accrue at Receipt Disabled
No ratings yet
Create A Service PO With Accrue at Receipt Disabled
3 pages
Oracle-Fusion-Financials Sample Resumes-2-1
No ratings yet
Oracle-Fusion-Financials Sample Resumes-2-1
5 pages
INterview Questions Fusion Financials
No ratings yet
INterview Questions Fusion Financials
6 pages

Market Analysis in Banking Domain - Code

Uploaded by

Market Analysis in Banking Domain - Code

Uploaded by

import scala.reflect.runtime.

val agedata = spark.sql("select age, count(*) as number from datanewtable where

val maritaldata = spark.sql("select marital, count(*) as number from datanewtable

val ageandmaritaldata = spark.sql("select age, marital, count(*) as number from

val agedata = spark.udf.register("agedata",(age:Int) => {

val banknewDF = bank_people_data.withColumn("age",agedata(bank_people_data("age")))

val targetage = spark.sql("select age, count(*) as number from banknewtable where

//pipelining with string Indexer

val agedata2 = new StringIndexer().setInputCol("age").setOutputCol("ageindex")

//Fitting the model

var strindModel = agedata2.fit(banknewDF)

//assigns generated value of index of the column, by feature engineering

You might also like