0% found this document useful (0 votes)

29 views7 pages

NLP Module 6 Notes

Module 6 covers various applications of Natural Language Processing (NLP) including machine translation, information retrieval, question answering systems, sentiment analysis, text categorization, named entity recognition, and ethical considerations. Each application is defined, with examples provided, and challenges are discussed, particularly in relation to bias and fairness. Additionally, transfer learning is highlighted as a method for improving NLP tasks using pre-trained models.

Uploaded by

nikyadav456

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

29 views7 pages

NLP Module 6 Notes

Uploaded by

nikyadav456

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

Module 6: Applications of NLP

- Machine translation:

- Rule-based

- Statistical

- Neural approaches

- Information retrieval:

- Search engines

- Semantic search

- Ranking algorithms

- Question Answering (QA) systems:

- Open-domain QA

- Closed-domain QA

- Conversational QA

- Text processing applications:

- Categorization

- Summarization (extractive & abstractive)

- Sentiment and opinion analysis (aspect-based sentiment analysis, emotion recognition)

- Named Entity Recognition (NER) and entity linking

- Ethical considerations in NLP: Bias in language models, fairness, interpretability

1. Machine Translation (MT)

Definition:

Machine Translation (MT) is an NLP task that automatically converts text from one language to another. It goes
beyond word-for-word translation to preserve the meaning, tone, and context of the source language.

Types of MT Systems:

Type Description Example

Rule-Based Uses linguistic grammar rules and bilingual dictionaries. SYSTRAN

(RBMT)

Statistical (SMT) Uses probabilities from large bilingual corpora (parallel texts). IBM Translation
Model

Neural (NMT) Uses Deep Learning models (e.g., LSTMs, Transformers) to learn Google Translate,
translation patterns contextually. DeepL

Process Flow (Flowchart):

Input Text → Tokenization → POS Tagging → Parsing → Semantic Analysis → Translation Generation → Target
Language Output
Example Input/Output:

Input (English): “How are you?”

Output (Hindi): “आप कैसे हैं ?”

Key Challenges:

• Ambiguity: Multiple meanings for the same word.

• Idioms: “Break a leg” → “Good luck” (not literal).

• Cultural Nuances: Context lost due to cultural references.

• Context Sensitivity: Same word changes meaning with context.

Applications:

• Website localization (e.g., multilingual websites).

• Document translation (technical, legal).

• Real-time translation (Google Translate).

• Language learning and accessibility tools.

2. Information Retrieval (IR)

Definition:

Information Retrieval is the process of fetching relevant documents from a large collection (corpus) based on a user
query. It powers search engines like Google or Bing.

Core Process:

Flowchart:

User Query → Preprocessing (Tokenization, TF-IDF) → Document Matching → Ranking → Top-k Results Displayed

Approaches to Matching:

1. Direct Match: Exact string match (inefficient).

2. Regex Matching: Uses patterns for flexible search.

3. Fuzzy Matching: Allows minor spelling variations.

4. Distance-based: Hamming/Levenshtein distances.

5. TF-IDF: Weighted word frequency.

6. Embedding Similarity: Uses word vectors and cosine similarity.

Ranking Techniques:

• Pointwise: Regression-based ranking using relevance score.

• Pairwise: Compares document pairs (RankNet, LambdaRank).

• Listwise: Optimizes ranking metrics like NDCG (Normalized Discounted Cumulative Gain).

Example Input/Output:

Input Query: “Best NLP research papers 2024”

Output: Ranked list of documents based on relevance (via cosine similarity or TF-IDF).

Applications:

• Search engines (Google, Bing)

• Job search tools (LinkedIn)

• E-commerce recommendations

• Research databases (Google Scholar)

3. Question Answering (QA) Systems

Definition:

QA systems allow computers to answer human questions directly by understanding the query and extracting or
generating precise answers.

Types:

Type Description

Open-domain General knowledge questions. Example: “Who is the Prime Minister of India?”

Closed-domain Domain-specific (medical, education).

Factoid Short factual answers.

Non-factoid Long explanatory answers.

Process Flow:

User Question → Natural Language Understanding → Information Retrieval → Answer Extraction → Response
Generation

Example Input/Output:

Input: “Who invented Python?”

Output: “Guido van Rossum in 1991.”

Applications:

• Search engine featured snippets.

• Chatbots and voice assistants (Alexa, Siri).

• Customer support automation.

• Educational tutoring systems.

4. Sentiment and Opinion Analysis

Definition:

Sentiment Analysis (or Opinion Mining) determines whether the emotional tone in text is positive, negative, or
neutral.

Levels of Analysis:

1. Document-level: Overall emotion of the document.

2. Sentence-level: Sentiment for each sentence.

3. Aspect-based: Opinion on specific attributes (e.g., “battery life poor, camera great”).

Approaches:

• Rule-based: Uses sentiment lexicons.

• Machine Learning-based: Trained models (Naive Bayes, SVM).

• Deep Learning-based: LSTM, BERT, Transformer models.

Example Input/Output:

Input: “The product quality is amazing but the delivery was slow.”
Output:

• Product quality → Positive

• Delivery → Negative

Applications:

• Customer feedback monitoring

• Brand reputation tracking

• Market trend analysis

• Healthcare emotion detection

5. Text Categorization

Definition:

Text categorization (or text classification) is assigning predefined labels to text based on its content.
Process Flow:

Input Text → Preprocessing (Tokenization, Stopword Removal) → Feature Extraction (TF-IDF/Embeddings) →

Classification (Naive Bayes, SVM, BERT) → Output Category

Example Input/Output:

Input: “Stock prices are falling rapidly.”

Output: Category = “Finance News”

Applications:

• News categorization

• Spam email detection

• Topic classification

• Sentiment tagging on social media posts

6. Named Entity Recognition (NER) and Entity Linking

Definition:

NER identifies named entities such as persons, organizations, locations, dates, etc.
Entity Linking connects these entities to structured databases (e.g., Wikipedia, DBpedia).

Example Input/Output:

Input: “Elon Musk is the CEO of Tesla.”

Output:

• Elon Musk → Person

• Tesla → Organization

Entity Linking: Tesla → “Tesla, Inc.” (Wikipedia link)

Challenges in NER:

• Ambiguity (e.g., “Apple” = fruit or company)

• Multilingual data

• Inconsistent capitalization

• Data bias or lack of representation

Applications:

• Information extraction

• News summarization

• Knowledge graph building

• Chatbots and Q&A systems

7. Ethical Considerations in NLP

Definition:

Ethics in NLP refers to ensuring fairness, transparency, and privacy in NLP systems and datasets.

Major Ethical Issues:

Issue Description

Bias and Fairness Models inherit biases from unbalanced training data.

Privacy Personal or sensitive data leakage during text processing.

Transparency Lack of explainability in model decisions.

Misinformation Automated text generation can spread false information.

Example:

If a dataset overrepresents one gender in job roles, a resume-screening NLP model may show gender bias.

Mitigation Strategies:

1. Use diverse and representative datasets.

2. Apply fairness-aware algorithms.

3. Maintain explainability (model transparency).

4. Implement user feedback loops.

5. Follow ethical guidelines and legal frameworks.

8. Transfer Learning in NLP

Definition:

Transfer Learning is the process of using a pre-trained NLP model (like BERT, GPT) for a new task with limited data. It
transfers knowledge learned from one domain to another.

Process:

Pre-trained Model (on large corpus) → Fine-tuning (on specific task) → Task-specific Output

Example Input/Output:

Input: Pre-trained BERT on Wikipedia → Fine-tune for Sentiment Analysis

Output: Classifies sentences as Positive/Negative with high accuracy.
Advantages:

• Reduces training time.

• Requires less labeled data.

• Provides high accuracy with fewer resources.

Applications:

• Text classification

• Sentiment analysis

• Named entity recognition

• Question answering

Summary Table: Applications Overview

Application Goal Techniques Used Example Tool/Model

Machine Translate text between Neural MT, Attention Google Translate

Translation languages Mechanism

Information Fetch relevant documents TF-IDF, Ranking, Cosine Google Search

Retrieval Similarity

Sentiment Analysis Detect emotion/opinion SVM, LSTM, BERT Tweepy Sentiment

Classifier

Text Categorization Classify text into topics TF-IDF, Naive Bayes, BERT Spam Filters

NER Identify named entities CRF, SpaCy, BERT Chatbots

Transfer Learning Use pre-trained models Fine-tuning BERT/GPT HuggingFace Models

Ethics in NLP Ensure fairness, privacy Bias detection, Explainability Responsible AI

Frameworks

NLP Module 6
No ratings yet
NLP Module 6
30 pages
Chapter 6 NLP
No ratings yet
Chapter 6 NLP
16 pages
NLP Handwritten Notes
No ratings yet
NLP Handwritten Notes
26 pages
Natural Language Processing
No ratings yet
Natural Language Processing
37 pages
Week3 NLP InFinance EN
No ratings yet
Week3 NLP InFinance EN
29 pages
NLP LectureNotes UNIT 1
No ratings yet
NLP LectureNotes UNIT 1
55 pages
Introduction To Data Science - Week 7 - LAQ's
No ratings yet
Introduction To Data Science - Week 7 - LAQ's
4 pages
Natural Language Processing - Bridging The Gap Between Humans and Machines
No ratings yet
Natural Language Processing - Bridging The Gap Between Humans and Machines
6 pages
Ai CH 4
No ratings yet
Ai CH 4
53 pages
SNLP - 1
No ratings yet
SNLP - 1
11 pages
Chapter 12
No ratings yet
Chapter 12
16 pages
Applications of NLP
No ratings yet
Applications of NLP
6 pages
NLP Unit 1
No ratings yet
NLP Unit 1
48 pages
Video Class NLP
No ratings yet
Video Class NLP
9 pages
NLP CH 1
No ratings yet
NLP CH 1
8 pages
Sha 10
No ratings yet
Sha 10
6 pages
NLP Sheets
No ratings yet
NLP Sheets
23 pages
NLP Application
No ratings yet
NLP Application
7 pages
Topic 2: Introduction To Natural Language Processing (NLP)
No ratings yet
Topic 2: Introduction To Natural Language Processing (NLP)
16 pages
Notes MSC NLP
No ratings yet
Notes MSC NLP
36 pages
What Is NLP
No ratings yet
What Is NLP
16 pages
1 NLP
No ratings yet
1 NLP
26 pages
Introduction To NLP - First - Week - Lecture - 1st
No ratings yet
Introduction To NLP - First - Week - Lecture - 1st
6 pages
Nlu 10th July
No ratings yet
Nlu 10th July
64 pages
Natural Language Processing (NLP) : Key Terms in NLP
No ratings yet
Natural Language Processing (NLP) : Key Terms in NLP
3 pages
AI Chapter 6
No ratings yet
AI Chapter 6
27 pages
Natural Language Processing
No ratings yet
Natural Language Processing
3 pages
NLP (Natural Language Processing) Student Book
No ratings yet
NLP (Natural Language Processing) Student Book
16 pages
What Is Natural Language Processing
No ratings yet
What Is Natural Language Processing
10 pages
NLP Unit 1
100% (1)
NLP Unit 1
34 pages
Eco 36
No ratings yet
Eco 36
6 pages
NLP Crash Course Comprehensive
No ratings yet
NLP Crash Course Comprehensive
2 pages
Natural Language Processing - Personal Notes
No ratings yet
Natural Language Processing - Personal Notes
8 pages
AI-Unit 5
No ratings yet
AI-Unit 5
31 pages
NLP Unit1 Presentation
No ratings yet
NLP Unit1 Presentation
65 pages
Understanding Natural Language Processing
No ratings yet
Understanding Natural Language Processing
15 pages
Disruptive Technologies AI Lecture 3
No ratings yet
Disruptive Technologies AI Lecture 3
19 pages
Module I NLP
No ratings yet
Module I NLP
65 pages
ورقة الذكاء
No ratings yet
ورقة الذكاء
7 pages
NLP Materia
No ratings yet
NLP Materia
29 pages
N LP Notes Detailed
No ratings yet
N LP Notes Detailed
12 pages
NLP Chapter - 1 Sheet
No ratings yet
NLP Chapter - 1 Sheet
6 pages
Tech Titans
No ratings yet
Tech Titans
12 pages
NLP Full - GPT 4o
No ratings yet
NLP Full - GPT 4o
108 pages
BTech Advanced AI Unit04
No ratings yet
BTech Advanced AI Unit04
45 pages
Natural Language Processing
No ratings yet
Natural Language Processing
29 pages
Java Assignment (NPL)
No ratings yet
Java Assignment (NPL)
9 pages
Asurvey On Novel Approach To Semantic Computing For Domain Specific Multi-Lingual Man-Machine Interaction
No ratings yet
Asurvey On Novel Approach To Semantic Computing For Domain Specific Multi-Lingual Man-Machine Interaction
10 pages
Ai 2
No ratings yet
Ai 2
7 pages
Unit-3NaturalLanguageProcessing (NLP) 1 T1743588944524
No ratings yet
Unit-3NaturalLanguageProcessing (NLP) 1 T1743588944524
83 pages
Chapter - 6 Communicating, Perceiving, and Acting
No ratings yet
Chapter - 6 Communicating, Perceiving, and Acting
30 pages
UNIT IV Lecture Notes Covering Natural Language Processing
No ratings yet
UNIT IV Lecture Notes Covering Natural Language Processing
6 pages
Natural Language Processing
No ratings yet
Natural Language Processing
6 pages
Unit 5 A.I
No ratings yet
Unit 5 A.I
17 pages
Natural Language Processing Notes
No ratings yet
Natural Language Processing Notes
61 pages
Campus X NLP Lecture 1
No ratings yet
Campus X NLP Lecture 1
2 pages
Unit 3 AI-ML Driven Data Science and Automation
No ratings yet
Unit 3 AI-ML Driven Data Science and Automation
49 pages
Module-1 Introduction To NLP
No ratings yet
Module-1 Introduction To NLP
28 pages
Module 2
0% (1)
Module 2
21 pages
Verbal 2
No ratings yet
Verbal 2
8 pages
Verbal 1
No ratings yet
Verbal 1
12 pages
Reasoning 3
No ratings yet
Reasoning 3
26 pages
Module 4 PDD
No ratings yet
Module 4 PDD
11 pages
A Hybrid IDS Approach For Effective Cyber Threat Detection
No ratings yet
A Hybrid IDS Approach For Effective Cyber Threat Detection
5 pages
Consistency of Linear System of Equations
No ratings yet
Consistency of Linear System of Equations
16 pages
Precalculus
No ratings yet
Precalculus
5 pages
Sagittal Diagram
No ratings yet
Sagittal Diagram
5 pages
Gretl Tutorial
No ratings yet
Gretl Tutorial
35 pages
Coplanar Waveguide-Fed Uniplanar Bow-Tie Antenna
No ratings yet
Coplanar Waveguide-Fed Uniplanar Bow-Tie Antenna
2 pages
AMT WEEK 4 Grade 9
No ratings yet
AMT WEEK 4 Grade 9
2 pages
Nutrient Uptake & Translocation Guide
No ratings yet
Nutrient Uptake & Translocation Guide
5 pages
SET D Machine
No ratings yet
SET D Machine
8 pages
Grade 6 - FA1 - AY 2025-26
No ratings yet
Grade 6 - FA1 - AY 2025-26
4 pages
PCB4023+Cell+Bio+Lab Cell+Culture+and+Cell+counting
No ratings yet
PCB4023+Cell+Bio+Lab Cell+Culture+and+Cell+counting
9 pages
Waves
No ratings yet
Waves
15 pages
List of Outside Recognized Laboratories: SL No. Name of The Recognized Laboratory Lab Code Testing Charges Remarks
No ratings yet
List of Outside Recognized Laboratories: SL No. Name of The Recognized Laboratory Lab Code Testing Charges Remarks
18 pages
Sequencing Problems
No ratings yet
Sequencing Problems
9 pages
Strike and Dips in Google Earth Pro Part 1 TLD08 May 2020
No ratings yet
Strike and Dips in Google Earth Pro Part 1 TLD08 May 2020
34 pages
Errors That Can Occur When You Run A Report From Tigerpaw
No ratings yet
Errors That Can Occur When You Run A Report From Tigerpaw
22 pages
Individual Footings (17.12.09) EDIT by J3
No ratings yet
Individual Footings (17.12.09) EDIT by J3
32 pages
Modern Sensor Technologies
No ratings yet
Modern Sensor Technologies
19 pages
Everything Created in Pairs
No ratings yet
Everything Created in Pairs
1 page
CHE F314 Process Design Principles-I Class Quiz-1
No ratings yet
CHE F314 Process Design Principles-I Class Quiz-1
2 pages
Grade VIII ICSE Coursework Tasks
No ratings yet
Grade VIII ICSE Coursework Tasks
5 pages
Employee Retention: Maruti Suzuki
No ratings yet
Employee Retention: Maruti Suzuki
9 pages
Helical Coil Steam Generator Study
No ratings yet
Helical Coil Steam Generator Study
17 pages
NJM2903/2403 Dual Comparator Overview
No ratings yet
NJM2903/2403 Dual Comparator Overview
5 pages
SM6-24 QM500 Discontinuation Notice
No ratings yet
SM6-24 QM500 Discontinuation Notice
3 pages
AT.04.15 Auditing in An IT Environment
No ratings yet
AT.04.15 Auditing in An IT Environment
4 pages
1 - Tech Pass For Drill Bits
No ratings yet
1 - Tech Pass For Drill Bits
4 pages
Engineering Graphics Lab Manual 2021-22
No ratings yet
Engineering Graphics Lab Manual 2021-22
56 pages
Cube Ultrasonic Sensor Manual
No ratings yet
Cube Ultrasonic Sensor Manual
3 pages
UniStrong DoraGIS User Manual PDF
100% (1)
UniStrong DoraGIS User Manual PDF
117 pages
Calculul Impingerii Pamantului
No ratings yet
Calculul Impingerii Pamantului
4 pages