HBase Examples

The document contains Scala code for integrating Spark with HBase, focusing on inserting employee data into an HBase table. It checks for the existence of the 'employee' table and creates it if necessary, then adds a sample employee record. Additionally, it demonstrates how to write a DataFrame to HBase using Spark's DataFrame API.

Uploaded by

gkillerfish

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

25 views2 pages

HBase Examples

Uploaded by

gkillerfish

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

package com.zaloni.mgohain.sparkHbaseIntegration.

services

import org.apache.hadoop.hbase.client.{HBaseAdmin, HTable, Put}

import org.apache.hadoop.hbase.mapreduce.TableOutputFormat
import org.apache.hadoop.hbase.util.Bytes
import org.apache.hadoop.hbase.{HBaseConfiguration, HColumnDescriptor,
HTableDescriptor}

object Employee {
def main(args: Array[String]) {
if (args.length != 1) {
System.err.println("In correct number of arguments " + args.length)
System.out.println("Please provide correct arguments.")
System.exit(1)
}
val hbaseConf = HBaseConfiguration.create()
val tableName = "employee"
hbaseConf.set(TableOutputFormat.OUTPUT_TABLE, tableName)
hbaseConf.set("hbase.zookeeper.quorum","quickstart.cloudera")
hbaseConf.set("hbase.zookeeper.property.client.port","2181")
val admin = new HBaseAdmin(hbaseConf)
val cfProfessionalData = Bytes.toBytes("professional_data")
val cfPersonalData = Bytes.toBytes("personal_data")
if (!admin.isTableAvailable(tableName)) {
val tableDesc = new HTableDescriptor(tableName)
tableDesc.addFamily(new HColumnDescriptor(cfProfessionalData))
tableDesc.addFamily(new HColumnDescriptor(cfPersonalData))
}
val hTable = new HTable(hbaseConf,tableName)
//val records = sc.textFile(args(0))
val put = new Put(Bytes.toBytes("e_1"))
val eId = Bytes.toBytes("Emp_id")
val name = Bytes.toBytes("Name")
val dsgtn = Bytes.toBytes("Designation")
val doj = Bytes.toBytes("DOJ")
val addr = Bytes.toBytes("Address")
val phn = Bytes.toBytes("Phone")
val dob = Bytes.toBytes("DOB")
put.add(cfProfessionalData, eId, Bytes.toBytes(1))
put.add(cfProfessionalData, name, Bytes.toBytes("Mridul Gohain"))
put.add(cfProfessionalData, dsgtn, Bytes.toBytes("SE"))
put.add(cfProfessionalData, doj, Bytes.toBytes("15-07-2015"))
put.add(cfPersonalData, addr, Bytes.toBytes("Chabua"))
put.add(cfPersonalData, phn, Bytes.toBytes("9859559606"))
put.add(cfPersonalData, dob, Bytes.toBytes("04-10-1991"))
hTable.put(put)
hTable.close()
}
}

-- Dataframe to HBASE:

yourDataFrame.write.options(
Map(HBaseTableCatalog.tableCatalog -> catalog, HBaseTableCatalog.newTable ->
"5"))
.format("org.apache.hadoop.hbase.spark ")
.save()
-- Another:

def main(args: Array[String]): Unit = {

val spark =
SparkSession.builder().appName("sparkToHive").enableHiveSupport().getOrCreate()
import spark.implicits._

val config = HBaseConfiguration.create()

config.set("hbase.zookeeper.quorum", "ip's")
config.set("hbase.zookeeper.property.clientPort","2181")
config.set(TableInputFormat.INPUT_TABLE, "tableName")

val newAPIJobConfiguration1 = Job.getInstance(config)

newAPIJobConfiguration1.getConfiguration().set(TableOutputFormat.OUTPUT_TABLE,
"tableName")

newAPIJobConfiguration1.setOutputFormatClass(classOf[TableOutputFormat[ImmutableByt
esWritable]])

val df: DataFrame = Seq(("foo", "1", "foo1"), ("bar", "2",

"bar1")).toDF("key", "value1", "value2")

val hbasePuts= df.rdd.map((row: Row) => {

val put = new Put(Bytes.toBytes(row.getString(0)))
put.addColumn(Bytes.toBytes("cf1"), Bytes.toBytes("value1"),
Bytes.toBytes(row.getString(1)))
put.addColumn(Bytes.toBytes("cf2"), Bytes.toBytes("value2"),
Bytes.toBytes(row.getString(2)))
(new ImmutableBytesWritable(), put)
})

hbasePuts.saveAsNewAPIHadoopDataset(newAPIJobConfiguration1.getConfiguration())
}

Spark RDD and SQL Operations Guide
No ratings yet
Spark RDD and SQL Operations Guide
4 pages
Hbase PDF
No ratings yet
Hbase PDF
8 pages
Hbase Commands
No ratings yet
Hbase Commands
7 pages
Bigdata Ca2 12213552
No ratings yet
Bigdata Ca2 12213552
3 pages
Hbase
No ratings yet
Hbase
1 page
Hbase Commands
No ratings yet
Hbase Commands
9 pages
rc159-HBase 7 PDF
No ratings yet
rc159-HBase 7 PDF
7 pages
HBase Java API Operations Guide
No ratings yet
HBase Java API Operations Guide
14 pages
7th Jan FSDSnov (Hive Fsds Nov)
No ratings yet
7th Jan FSDSnov (Hive Fsds Nov)
6 pages
Employee Salary Calculation in Hadoop
No ratings yet
Employee Salary Calculation in Hadoop
5 pages
Scnfinal
No ratings yet
Scnfinal
5 pages
Company Interview Questions
No ratings yet
Company Interview Questions
6 pages
Hive Lab: Data Management Scenarios
No ratings yet
Hive Lab: Data Management Scenarios
33 pages
Sanya Sekhri Assignment
No ratings yet
Sanya Sekhri Assignment
2 pages
MySQL and Hive Database Commands Guide
No ratings yet
MySQL and Hive Database Commands Guide
5 pages
Dsbda Ass 3
No ratings yet
Dsbda Ass 3
3 pages
Hive Database Setup Guide
No ratings yet
Hive Database Setup Guide
2 pages
HBase Integration Hive
No ratings yet
HBase Integration Hive
7 pages
Loadeer Lab
No ratings yet
Loadeer Lab
3 pages
HOL Hive
No ratings yet
HOL Hive
85 pages
Spark Classnotfount
No ratings yet
Spark Classnotfount
3 pages
Dokumen - Tips - tp2 Big Data Hbase
No ratings yet
Dokumen - Tips - tp2 Big Data Hbase
8 pages
Spark RDD, DataFrame, and Dataset Guide
No ratings yet
Spark RDD, DataFrame, and Dataset Guide
9 pages
Essential PySpark Commands Guide
No ratings yet
Essential PySpark Commands Guide
12 pages
Hadoop MapReduce Java Examples
No ratings yet
Hadoop MapReduce Java Examples
15 pages
SparkSQL Extensions for Huawei
No ratings yet
SparkSQL Extensions for Huawei
39 pages
Lab Program
No ratings yet
Lab Program
8 pages
Journal
No ratings yet
Journal
47 pages
Spark SQL Hands - On
No ratings yet
Spark SQL Hands - On
3 pages
Ex3-Query Processing Using Hive and Beeswax
No ratings yet
Ex3-Query Processing Using Hive and Beeswax
4 pages
Bai 3
No ratings yet
Bai 3
5 pages
w12 - Runningnotes 201026 001818
No ratings yet
w12 - Runningnotes 201026 001818
25 pages
RDBMS to HDFS Data Import/Export Guide
No ratings yet
RDBMS to HDFS Data Import/Export Guide
5 pages
CCA175 Exam: Spark & Hadoop Tasks
No ratings yet
CCA175 Exam: Spark & Hadoop Tasks
17 pages
Sqoop MySQL to HDFS Data Transfer Guide
No ratings yet
Sqoop MySQL to HDFS Data Transfer Guide
7 pages
Apache Hive Notes
No ratings yet
Apache Hive Notes
15 pages
HBase: Features, Operations, and Architecture
No ratings yet
HBase: Features, Operations, and Architecture
93 pages
BDAV Practical
No ratings yet
BDAV Practical
17 pages
HIVE Installation-Lab
No ratings yet
HIVE Installation-Lab
7 pages
CCA175 Demo Examenes
No ratings yet
CCA175 Demo Examenes
19 pages
Step 2 - First MapReduce Program
No ratings yet
Step 2 - First MapReduce Program
25 pages
BDT MSE2Scheme 23-24
No ratings yet
BDT MSE2Scheme 23-24
4 pages
Bda From Module 3
No ratings yet
Bda From Module 3
81 pages
Class 4
No ratings yet
Class 4
3 pages
Comprehensive Big Data and Hadoop Course
No ratings yet
Comprehensive Big Data and Hadoop Course
17 pages
Merge Files and Calculate Averages
No ratings yet
Merge Files and Calculate Averages
3 pages
Complete Hive Practical
No ratings yet
Complete Hive Practical
8 pages
Problems On Relational Algebra
No ratings yet
Problems On Relational Algebra
12 pages
虚拟机安装 CentOS7
No ratings yet
虚拟机安装 CentOS7
49 pages
HBase Shell Commands Guide
No ratings yet
HBase Shell Commands Guide
10 pages
Create Database Organigrama CMD
No ratings yet
Create Database Organigrama CMD
4 pages
Data and AI - Spark Python
No ratings yet
Data and AI - Spark Python
11 pages
SpringBoot Assignment - Pravardhan Sajjan
No ratings yet
SpringBoot Assignment - Pravardhan Sajjan
9 pages
BDA 2ndperodical
No ratings yet
BDA 2ndperodical
2 pages
Understanding Sqoop in Hadoop
No ratings yet
Understanding Sqoop in Hadoop
27 pages
Big Data Notes
No ratings yet
Big Data Notes
7 pages
Spark DataFrame Analysis Project
No ratings yet
Spark DataFrame Analysis Project
9 pages
Spring Assign
No ratings yet
Spring Assign
8 pages
Introduction To JPEG and Mpeg: Ingemar J. Cox University College London
No ratings yet
Introduction To JPEG and Mpeg: Ingemar J. Cox University College London
68 pages
SQ L Normalization
100% (1)
SQ L Normalization
9 pages
Components of Operating System
100% (1)
Components of Operating System
5 pages
SQL Cheat Sheet
100% (2)
SQL Cheat Sheet
3 pages
DC Practical Examination Oral Question Bank - Prabable
No ratings yet
DC Practical Examination Oral Question Bank - Prabable
3 pages
Implicit Object in JSP
No ratings yet
Implicit Object in JSP
9 pages
Database Assignment 03
No ratings yet
Database Assignment 03
8 pages
Arrays 02 Class Notes DECODE DSA With C 2-0-650009a29d6901001963ec1c
No ratings yet
Arrays 02 Class Notes DECODE DSA With C 2-0-650009a29d6901001963ec1c
22 pages
Chapter IV Google Cloud IoT Core
No ratings yet
Chapter IV Google Cloud IoT Core
2 pages
C Programming Language Syllabus
No ratings yet
C Programming Language Syllabus
5 pages
CH-15 More On SQL - Grouping Records and Table Joins PDF
No ratings yet
CH-15 More On SQL - Grouping Records and Table Joins PDF
6 pages
Problem Set - Fiber, Digital and Data Communications
100% (1)
Problem Set - Fiber, Digital and Data Communications
4 pages
Bit Error Rate Comparison of Coded and Uncoded Non Orthogonal Multiple Access
No ratings yet
Bit Error Rate Comparison of Coded and Uncoded Non Orthogonal Multiple Access
3 pages
Class XI Java Fundamental
100% (1)
Class XI Java Fundamental
10 pages
Azure Data Architecture for ERP Integration
No ratings yet
Azure Data Architecture for ERP Integration
4 pages
70 CF&P Imp Qust
No ratings yet
70 CF&P Imp Qust
54 pages
Jini Presentation
No ratings yet
Jini Presentation
17 pages
Oracle SQL*Loader Data Import Guide
No ratings yet
Oracle SQL*Loader Data Import Guide
3 pages
10g Segment Space Management Guide
No ratings yet
10g Segment Space Management Guide
8 pages
User Manual: RTSP Server
100% (1)
User Manual: RTSP Server
27 pages
File Handling in C
No ratings yet
File Handling in C
45 pages
Gpfs Performance Tool
No ratings yet
Gpfs Performance Tool
29 pages
Petunjuk Penginstalan Dips: 1. Generate Serial Number
No ratings yet
Petunjuk Penginstalan Dips: 1. Generate Serial Number
2 pages
Data Analysis and Visualization Guide
No ratings yet
Data Analysis and Visualization Guide
18 pages
SAP Audit Program Guide
No ratings yet
SAP Audit Program Guide
15 pages
Evolution of Intel Microprocessors
No ratings yet
Evolution of Intel Microprocessors
81 pages
Objective Questions on Computers Set 5
No ratings yet
Objective Questions on Computers Set 5
27 pages
Export
No ratings yet
Export
3 pages
APC Switched PDU - User Manual
100% (1)
APC Switched PDU - User Manual
125 pages
News
No ratings yet
News
86 pages

HBase Examples

Uploaded by

HBase Examples

Uploaded by

package com.zaloni.mgohain.sparkHbaseIntegration.

import org.apache.hadoop.hbase.client.{HBaseAdmin, HTable, Put}

def main(args: Array[String]): Unit = {

val config = HBaseConfiguration.create()

val newAPIJobConfiguration1 = Job.getInstance(config)

val df: DataFrame = Seq(("foo", "1", "foo1"), ("bar", "2",

val hbasePuts= df.rdd.map((row: Row) => {

You might also like