Text Mining and Word Cloud in R

This document discusses loading packages and preparing text data for analysis in R. It loads packages for text mining, stemming, word clouds and colors. It then loads text data as a corpus, constructs a term document matrix, and cleans the text by converting to lowercase, removing numbers, stopwords and punctuation. Finally, it generates a word cloud of the most frequent terms and explores frequent term associations.

Uploaded by

yashsethea

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

42 views3 pages

Text Mining and Word Cloud in R

Uploaded by

yashsethea

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

#Install and load the required packages

# for text mining

[Link]("tm")
# for text stemming
[Link]("SnowballC")
# for word-cloud generator
[Link]("wordcloud")
# for colour palettes
[Link]("RColorBrewer")

# Load
library("tm")
library("SnowballC")
library("wordcloud")
library("RColorBrewer")

#Load the data as a corpus

docs <- Corpus(VectorSource(text))

#Build a term-document matrix

dtm <- TermDocumentMatrix(docs)

m <- [Link](dtm)
v <- sort(rowSums(m),decreasing=TRUE)
d <- [Link](word = names(v),freq=v)
head(d, 10)
#Cleaning the text

# Convert the text to lower case

docs <- tm_map(docs, content_transformer(tolower))
# Remove numbers
docs <- tm_map(docs, removeNumbers)
# Remove english common stopwords
docs <- tm_map(docs, removeWords, stopwords("english"))
# Remove your own stop word # specify your stopwords as a character vector
docs <- tm_map(docs, removeWords, c("blabla1", "blabla2"))
# Remove punctuations
docs <- tm_map(docs, removePunctuation)

# Build a term-document matrix

dtm <- TermDocumentMatrix(docs)

m <- [Link](dtm)
v <- sort(rowSums(m),decreasing=TRUE)
d <- [Link](word = names(v),freq=v)
head(d, 10)

#Generate the Word cloud

[Link](1234)

wordcloud(words = d$word, freq = d$freq, [Link] = 1,

[Link]=200, [Link]=FALSE, [Link]=0.35,

colors=[Link](8, "Dark2"))

#Explore frequent terms and their associations

findFreqTerms(dtm, lowfreq = 4)

Text Mining Code
No ratings yet
Text Mining Code
2 pages
Word Cloud
No ratings yet
Word Cloud
3 pages
5 Paso S Text Mining
No ratings yet
5 Paso S Text Mining
4 pages
Text Analysis
No ratings yet
Text Analysis
15 pages
Basic Textual Analysis in R
No ratings yet
Basic Textual Analysis in R
2 pages
Análisis de Texto de Señor de los Anillos
No ratings yet
Análisis de Texto de Señor de los Anillos
3 pages
Amazon Review Sentiment Analysis in R
No ratings yet
Amazon Review Sentiment Analysis in R
8 pages
Text Mining and Preprocessing Guide
No ratings yet
Text Mining and Preprocessing Guide
2 pages
KNN Classification of Cloth Reviews
No ratings yet
KNN Classification of Cloth Reviews
2 pages
Text Mining in R with TM Package
No ratings yet
Text Mining in R with TM Package
6 pages
Itaa Ongc
No ratings yet
Itaa Ongc
4 pages
Text Analysis
No ratings yet
Text Analysis
15 pages
R Text Mining & Sentiment Guide
No ratings yet
R Text Mining & Sentiment Guide
9 pages
EBUS622 - Week 5 - Lecture - Text Preparation
No ratings yet
EBUS622 - Week 5 - Lecture - Text Preparation
40 pages
Text Mining Twitter Data with R
No ratings yet
Text Mining Twitter Data with R
35 pages
Text Mining & Analysis Guide
No ratings yet
Text Mining & Analysis Guide
6 pages
Data Science With R Text Mining by Graham Williams
No ratings yet
Data Science With R Text Mining by Graham Williams
21 pages
Text Mining Assignment
No ratings yet
Text Mining Assignment
4 pages
Word Cloud
No ratings yet
Word Cloud
10 pages
R语言基础入门指令 (tips)
No ratings yet
R语言基础入门指令 (tips)
14 pages
Business Analytics CA3
No ratings yet
Business Analytics CA3
11 pages
Naive Bayes Text Classification Guide
No ratings yet
Naive Bayes Text Classification Guide
3 pages
Hands-On Data Science With R Text Mining
No ratings yet
Hands-On Data Science With R Text Mining
41 pages
NLP Text Preprocessing in R
No ratings yet
NLP Text Preprocessing in R
2 pages
DSBA+Master+Codebook+ +Text+Mining+&+TSF
No ratings yet
DSBA+Master+Codebook+ +Text+Mining+&+TSF
11 pages
Document Classification with tm Package
No ratings yet
Document Classification with tm Package
16 pages
Twitter Data Mining with R Techniques
No ratings yet
Twitter Data Mining with R Techniques
34 pages
Package Wordcloud': R Topics Documented
No ratings yet
Package Wordcloud': R Topics Documented
9 pages
Sentiment
No ratings yet
Sentiment
5 pages
Text Mining Notes
No ratings yet
Text Mining Notes
28 pages
Text Mining Tutorial in R
No ratings yet
Text Mining Tutorial in R
7 pages
Hands-On Data Science With R Text Mining: 10th January 2016
No ratings yet
Hands-On Data Science With R Text Mining: 10th January 2016
47 pages
Text Analysis
No ratings yet
Text Analysis
13 pages
SMTA - Lab Record - Aim, Procedures and Results
No ratings yet
SMTA - Lab Record - Aim, Procedures and Results
31 pages
Quanteda
No ratings yet
Quanteda
2 pages
Packages Which Are Used For Above Analysis
No ratings yet
Packages Which Are Used For Above Analysis
4 pages
Samaksh Gupta Programming Ass. IR
No ratings yet
Samaksh Gupta Programming Ass. IR
13 pages
Text Mining & Sentiment Analysis Guide
No ratings yet
Text Mining & Sentiment Analysis Guide
5 pages
Stewart LabHandout
No ratings yet
Stewart LabHandout
11 pages
NLP Soc
No ratings yet
NLP Soc
15 pages
Start Hadoop and Generate Word Cloud
No ratings yet
Start Hadoop and Generate Word Cloud
2 pages
British Airways Forage Report
No ratings yet
British Airways Forage Report
12 pages
Text Mining With Bag of Words in R - 1 PDF
No ratings yet
Text Mining With Bag of Words in R - 1 PDF
17 pages
RTextTools: Text Classification Guide
No ratings yet
RTextTools: Text Classification Guide
13 pages
R
No ratings yet
R
2 pages
Data Science Solved
No ratings yet
Data Science Solved
12 pages
Ir Lab 2 Ir Learning Outcomes: Pyterrier
No ratings yet
Ir Lab 2 Ir Learning Outcomes: Pyterrier
7 pages
Spam Classification Using OCR and R
No ratings yet
Spam Classification Using OCR and R
21 pages
Text Mining & NLP for Academics
No ratings yet
Text Mining & NLP for Academics
38 pages
Adithiyaa BR 23MBA0018 SMA DA Text Mining PDF
No ratings yet
Adithiyaa BR 23MBA0018 SMA DA Text Mining PDF
6 pages
R Programming Lab Manual-24-25
No ratings yet
R Programming Lab Manual-24-25
17 pages
Live Classroom 3
No ratings yet
Live Classroom 3
36 pages
Detailed Explanation of The Code
No ratings yet
Detailed Explanation of The Code
4 pages
Peer Graded Assignment: Task Milestones
No ratings yet
Peer Graded Assignment: Task Milestones
6 pages
Group Project - Text Mining
No ratings yet
Group Project - Text Mining
4 pages
Text Mining With R
No ratings yet
Text Mining With R
15 pages
Page Rank and HITS Algorithm in Hindi
No ratings yet
Page Rank and HITS Algorithm in Hindi
7 pages
Raj DV Exp5
No ratings yet
Raj DV Exp5
6 pages

Text Mining and Word Cloud in R

Uploaded by

Text Mining and Word Cloud in R

Uploaded by

#Install and load the required packages

# for text mining

#Load the data as a corpus

docs <- Corpus(VectorSource(text))

#Build a term-document matrix

dtm <- TermDocumentMatrix(docs)

# Convert the text to lower case

# Build a term-document matrix

dtm <- TermDocumentMatrix(docs)

#Generate the Word cloud

wordcloud(words = d$word, freq = d$freq, [Link] = 1,

[Link]=200, [Link]=FALSE, [Link]=0.35,

#Explore frequent terms and their associations

You might also like