0% found this document useful (0 votes)

11 views5 pages

Sentiment

Uploaded by

Ajay

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views5 pages

Sentiment

Uploaded by

Ajay

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

library(tm)

library(SnowballC)
library(wordcloud)
library(RColorBrewer)
library(syuzhet)
library(ggplot2)

data <- read.csv('spam.csv', stringsAsFactors = FALSE)

str(data)

spam_text <- data$v2

spam_corpus <- Corpus(VectorSource(spam_text))

clean_corpus <- tm_map(spam_corpus, content_transformer(tolower))

clean_corpus <- tm_map(clean_corpus, removePunctuation)
clean_corpus <- tm_map(clean_corpus, removeNumbers)
clean_corpus <- tm_map(clean_corpus, removeWords,
stopwords("english"))

custom_stopwords <- c("u", "so")

clean_corpus <- tm_map(clean_corpus, removeWords, custom_stopwords)

clean_corpus <- tm_map(clean_corpus, stripWhitespace)

dtm <- TermDocumentMatrix(clean_corpus)

dtm_matrix <- as.matrix(dtm)

word_freq <- sort(rowSums(dtm_matrix), decreasing = TRUE)

word_freq_df <- data.frame(word = names(word_freq), freq = word_freq)

top_5_words <- head(word_freq_df, 5)

print(top_5_words)

x11()
ggplot(top_5_words, aes(x = reorder(word, -freq), y = freq)) +
geom_bar(stat = "identity", fill = "steelblue") +
labs(title = "Top 5 Most Frequent Words in Spam Text", x = "Words",
y = "Frequency") +
theme_minimal()

set.seed(1234)
x11()
wordcloud(words = word_freq_df$word, freq = word_freq_df$freq,
min.freq = 1,
max.words = 100, random.order = FALSE, rot.per = 0.35,
colors = brewer.pal(8, "Dark2"))

sentiment_scores <- get_nrc_sentiment(spam_text)

sentiment_totals <- data.frame(colSums(sentiment_scores[, 1:8]))
names(sentiment_totals) <- c("sentiment", "score")
sentiment_totals <- sentiment_totals[order(sentiment_totals$score,
decreasing = TRUE), ]

print(sentiment_totals)

sentiment_freq <- data.frame(sentiment = colnames(sentiment_scores),

frequency = colSums(sentiment_scores))

sentiment_freq <- sentiment_freq[sentiment_freq$frequency > 0, ]

x11()
ggplot(sentiment_freq, aes(x = reorder(sentiment, -frequency), y =
frequency)) +
geom_bar(stat = "identity", fill = "coral") +
labs(title = "Frequency of Sentiments in Spam Text", x =
"Sentiment", y = "Frequency") +
theme_minimal()

Text Mining Code
No ratings yet
Text Mining Code
2 pages
Word Cloud
No ratings yet
Word Cloud
3 pages
Text Mining and Word Cloud in R
No ratings yet
Text Mining and Word Cloud in R
3 pages
Text Mining & Analysis Guide
No ratings yet
Text Mining & Analysis Guide
6 pages
R语言基础入门指令 (tips)
No ratings yet
R语言基础入门指令 (tips)
14 pages
5 Paso S Text Mining
No ratings yet
5 Paso S Text Mining
4 pages
Spam Classification Using OCR and R
No ratings yet
Spam Classification Using OCR and R
21 pages
Análisis de Texto de Señor de los Anillos
No ratings yet
Análisis de Texto de Señor de los Anillos
3 pages
Amazon Review Sentiment Analysis in R
No ratings yet
Amazon Review Sentiment Analysis in R
8 pages
Text Mining and Preprocessing Guide
No ratings yet
Text Mining and Preprocessing Guide
2 pages
Basic Textual Analysis in R
No ratings yet
Basic Textual Analysis in R
2 pages
Reddit Comment Scraper & Word Cloud
No ratings yet
Reddit Comment Scraper & Word Cloud
4 pages
Text Mining Assignment
No ratings yet
Text Mining Assignment
4 pages
Textual Analysis
No ratings yet
Textual Analysis
3 pages
AI Phash3
No ratings yet
AI Phash3
11 pages
Packages Which Are Used For Above Analysis
No ratings yet
Packages Which Are Used For Above Analysis
4 pages
Naive Bayes Text Classification Guide
No ratings yet
Naive Bayes Text Classification Guide
3 pages
Peer Graded Assignment: Task Milestones
No ratings yet
Peer Graded Assignment: Task Milestones
6 pages
AI Phase4
No ratings yet
AI Phase4
11 pages
Text Analysis
No ratings yet
Text Analysis
15 pages
Code
No ratings yet
Code
6 pages
Ba Ca 2
No ratings yet
Ba Ca 2
18 pages
R Text Mining & Sentiment Guide
No ratings yet
R Text Mining & Sentiment Guide
9 pages
ML6 Naive Bayes Spam Filter
No ratings yet
ML6 Naive Bayes Spam Filter
11 pages
Text Mining Twitter Data with R
No ratings yet
Text Mining Twitter Data with R
35 pages
KNN Classification of Cloth Reviews
No ratings yet
KNN Classification of Cloth Reviews
2 pages
Building A Powered Ai and Spam Caller
No ratings yet
Building A Powered Ai and Spam Caller
7 pages
Itaa Ongc
No ratings yet
Itaa Ongc
4 pages
Spam Detection 1
No ratings yet
Spam Detection 1
31 pages
Handling 50+ Warnings in R Code
No ratings yet
Handling 50+ Warnings in R Code
15 pages
8
No ratings yet
8
3 pages
Supervised Learningclassification Part3
No ratings yet
Supervised Learningclassification Part3
42 pages
Daima Jieshi
No ratings yet
Daima Jieshi
5 pages
Aayush Nihar Spam Mail Filtering
No ratings yet
Aayush Nihar Spam Mail Filtering
18 pages
Text Analysis
No ratings yet
Text Analysis
15 pages
Spamemailknn
No ratings yet
Spamemailknn
5 pages
Ai - Phase 3
No ratings yet
Ai - Phase 3
9 pages
44 Decision Tree Model For Email Classification
No ratings yet
44 Decision Tree Model For Email Classification
4 pages
Social Media Data Scraping with Python
No ratings yet
Social Media Data Scraping with Python
3 pages
Arnav MLlab04
No ratings yet
Arnav MLlab04
7 pages
Business Analytics CA3
No ratings yet
Business Analytics CA3
11 pages
Aiml Assignment-2
No ratings yet
Aiml Assignment-2
8 pages
Group Project - Text Mining
No ratings yet
Group Project - Text Mining
4 pages
Machine Learning for Spam Classification
No ratings yet
Machine Learning for Spam Classification
9 pages
Word Cloud
No ratings yet
Word Cloud
10 pages
Spam Email Classifier
No ratings yet
Spam Email Classifier
34 pages
Project Name Spam Email Detection 1
No ratings yet
Project Name Spam Email Detection 1
7 pages
Data Science Project
No ratings yet
Data Science Project
34 pages
SEO Keyword Clustering in R
No ratings yet
SEO Keyword Clustering in R
15 pages
Text Mining & Sentiment Analysis Guide
No ratings yet
Text Mining & Sentiment Analysis Guide
5 pages
NB
No ratings yet
NB
2 pages
Package Wordcloud': R Topics Documented
No ratings yet
Package Wordcloud': R Topics Documented
9 pages
Spam Detection Using ID3 Decision Trees
No ratings yet
Spam Detection Using ID3 Decision Trees
4 pages
Twitter Data Mining with R Techniques
No ratings yet
Twitter Data Mining with R Techniques
34 pages
Calling Required Packages
No ratings yet
Calling Required Packages
3 pages
Sma Exp 05 Code Print
No ratings yet
Sma Exp 05 Code Print
6 pages
Data Cleaning Using Dataset
No ratings yet
Data Cleaning Using Dataset
12 pages
Decision Tree
No ratings yet
Decision Tree
2 pages
Simple Linear Regression
No ratings yet
Simple Linear Regression
4 pages
1 s2.0 S1877050916311309 Main
No ratings yet
1 s2.0 S1877050916311309 Main
8 pages
Detecting RoQ DDoS Attacks with ML
No ratings yet
Detecting RoQ DDoS Attacks with ML
18 pages
Applsci 11 07868 v2
No ratings yet
Applsci 11 07868 v2
17 pages

Sentiment

Uploaded by

Sentiment

Uploaded by

library(tm)

data <- read.csv('spam.csv', stringsAsFactors = FALSE)

spam_text <- data$v2

spam_corpus <- Corpus(VectorSource(spam_text))

clean_corpus <- tm_map(spam_corpus, content_transformer(tolower))

custom_stopwords <- c("u", "so")

clean_corpus <- tm_map(clean_corpus, stripWhitespace)

dtm <- TermDocumentMatrix(clean_corpus)

word_freq <- sort(rowSums(dtm_matrix), decreasing = TRUE)

top_5_words <- head(word_freq_df, 5)

sentiment_scores <- get_nrc_sentiment(spam_text)

sentiment_freq <- data.frame(sentiment = colnames(sentiment_scores),

sentiment_freq <- sentiment_freq[sentiment_freq$frequency > 0, ]

You might also like