0% encontró este documento útil (0 votos)

16 vistas4 páginas

Explicacion Chatbor

El documento describe la creación de un chatbot en Python utilizando la biblioteca NLTK y el modelo TF-IDF para evaluar la similitud entre las entradas del usuario y un conjunto de preguntas predefinidas. Incluye funciones para preprocesar texto, evaluar similitud y obtener respuestas basadas en un umbral de similitud. El código permite una interacción continua con el usuario, proporcionando respuestas o indicando falta de comprensión según la similitud encontrada.

Cargado por

Jorfel Adonay

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como TXT, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

16 vistas4 páginas

Explicacion Chatbor

Cargado por

Jorfel Adonay

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como TXT, PDF, TXT o lee en línea desde Scribd

.

Preparación y Descarga de Recursos

Python

import nltk
nltk.download('punkt_tab')

corpus = {
"Hola": "Hola, ¿cómo estás?",
"¿Cuál es tu nombre?": "Me llamo Responsibile Bias.",
"¿Qué puedes hacer?": "Puedo responder preguntas simples y mantener una
conversación básica.",
"Adiós": "¡Hasta luego!"
}

import nltk
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
import string
from nltk.chat.util import Chat, reflections

nltk.download('punkt')
nltk.download('stopwords')
import nltk: Importa la biblioteca nltk (Natural Language Toolkit), esencial para
el procesamiento de lenguaje natural.

nltk.download('punkt_tab'): Descarga un modelo específico de NLTK (punkt_tab), que

ayuda a la tokenización de texto (dividirlo en palabras u oraciones).

corpus = {...}: Define el conocimiento base del chatbot. Es un diccionario donde

las claves son las preguntas que el bot "conoce" (las que puede reconocer) y los
valores son las respuestas asociadas.

Las siguientes líneas (import nltk, from nltk.tokenize..., nltk.download('punkt'),

nltk.download('stopwords')) son importaciones y descargas duplicadas. Las librerías
y modelos se pueden importar/descargar solo una vez.

word_tokenize: Se usará para dividir texto en palabras.

stopwords: Contiene listas de palabras comunes (como "el", "la") que a menudo se
ignoran.

string: Proporciona acceso a constantes de cadenas, como la puntuación.

Chat, reflections: Son partes de NLTK para crear chatbots más tradicionales basados
en reglas, pero en este código no se usan realmente estas clases de nltk.chat.util.

2. Función de Preprocesamiento de Texto

Python

def preprocesar_texto(texto):
tokens = word_tokenize(texto.lower())
tokens = [t for t in tokens if t not in string.punctuation]
tokens = [t for t in tokens if t not in stopwords.words('spanish')]
return tokens
def preprocesar_texto(texto):: Define una función para limpiar el texto (tanto las
preguntas del corpus como las entradas del usuario).

tokens = word_tokenize(texto.lower()): Convierte el texto a minúsculas y lo divide

en palabras individuales (tokens).
tokens = [t for t in tokens if t not in string.punctuation]: Elimina los signos de
puntuación de la lista de tokens.

tokens = [t for t in tokens if t not in stopwords.words('spanish')]: Elimina las

"stop words" en español (palabras muy comunes que no suelen aportar mucho
significado) de la lista de tokens.

return tokens: Devuelve la lista de palabras limpias.

3. Función para Evaluar Similitud

Python

from sklearn.feature_extraction.text import TfidfVectorizer

from sklearn.metrics.pairwise import cosine_similarity

def evaluar_similitud(entrada, corpus):

corpus_keys = list(corpus.keys())
vectorizer = TfidfVectorizer(tokenizer=preprocesar_texto)
tfidf_matrix = vectorizer.fit_transform(corpus_keys + [entrada])
similitudes = cosine_similarity(tfidf_matrix[-1], tfidf_matrix[:-1])
indice_max_similitud = similitudes.argmax()
return corpus_keys[indice_max_similitud], similitudes[0, indice_max_similitud]
from sklearn.feature_extraction.text import TfidfVectorizer: Importa
TfidfVectorizer de scikit-learn. Esta herramienta convierte texto en vectores
numéricos basándose en la importancia de las palabras (TF-IDF).

from sklearn.metrics.pairwise import cosine_similarity: Importa cosine_similarity,

que calcula la similitud del coseno entre dos vectores. Una similitud de coseno
alta (cercana a 1) indica que los vectores son muy parecidos.

def evaluar_similitud(entrada, corpus):: Define una función que compara la entrada

del usuario con las preguntas del corpus.

corpus_keys = list(corpus.keys()): Obtiene una lista de todas las preguntas

conocidas del chatbot.

vectorizer = TfidfVectorizer(tokenizer=preprocesar_texto): Crea una instancia de

TfidfVectorizer. Le indica que use la función preprocesar_texto para procesar el
texto antes de crear los vectores TF-IDF.

tfidf_matrix = vectorizer.fit_transform(corpus_keys + [entrada]):

Crea una lista que contiene todas las preguntas del corpus más la entrada del
usuario.

fit_transform: Aprende el vocabulario de estos textos y luego los convierte a su

representación numérica TF-IDF. El resultado es una matriz donde cada fila es el
vector TF-IDF de una pregunta o la entrada del usuario.

similitudes = cosine_similarity(tfidf_matrix[-1], tfidf_matrix[:-1]):

tfidf_matrix[-1]: Es el vector TF-IDF de la entrada del usuario.

tfidf_matrix[:-1]: Son los vectores TF-IDF de todas las preguntas del corpus.

Esta línea calcula la similitud del coseno entre la entrada del usuario y cada una
de las preguntas del corpus.
indice_max_similitud = similitudes.argmax(): Encuentra el índice de la pregunta del
corpus que tiene la mayor similitud con la entrada del usuario.

return corpus_keys[indice_max_similitud], similitudes[0, indice_max_similitud]:

Devuelve la pregunta del corpus más similar y el valor de esa similitud.

4. Función para Obtener Respuesta

Python

def obtener_respuesta(entrada, corpus, umbral=0.5):

pregunta, similitud = evaluar_similitud(entrada, corpus)
if similitud >= umbral:
return corpus[pregunta]
else:
return "Lo siento, no entendí eso. ¿Puedes repetirlo?"
def obtener_respuesta(entrada, corpus, umbral=0.5):: Define la función principal
para obtener una respuesta del chatbot.

pregunta, similitud = evaluar_similitud(entrada, corpus): Llama a la función

anterior para obtener la pregunta más similar y su puntuación de similitud.

if similitud >= umbral:: Comprueba si la similitud encontrada es mayor o igual a un

umbral (por defecto 0.5). Este umbral determina qué tan parecida debe ser una
pregunta para que el bot la considere "conocida".

return corpus[pregunta]: Si la similitud supera el umbral, el bot devuelve la

respuesta asociada a esa pregunta conocida desde el corpus.

else: return "Lo siento, no entendí eso. ¿Puedes repetirlo?": Si la similitud es

menor que el umbral, el bot indica que no entendió la pregunta.

5. Bucle de Interacción y Ejemplo de Uso

Python

while True:
entrada_usuario = input()
respuesta = obtener_respuesta(entrada_usuario, corpus)
print(f"respuesta: {respuesta}")

def obtener_respuesta(entrada, corpus, umbral=0.5):

pregunta, similitud = evaluar_similitud(entrada, corpus)
if similitud >= umbral:
return corpus[pregunta]
else:
return "Lo siento, no entendí eso. ¿Puedes repetirlo?"

# Ejemplo de uso
entrada_usuario = "Hola"
respuesta = obtener_respuesta(entrada_usuario, corpus)
print(respuesta)
while True:: Inicia un bucle infinito, lo que permite que el chatbot interactúe
continuamente con el usuario.

entrada_usuario = input(): Le pide al usuario que escriba su pregunta.

respuesta = obtener_respuesta(entrada_usuario, corpus): Llama a la función para

obtener la respuesta del bot.

print(f"respuesta: {respuesta}"): Imprime la respuesta del chatbot.

La segunda definición de obtener_respuesta y el "Ejemplo de uso" al final del
código son duplicados e innecesarios. La función ya se definió y se usa en el bucle
while.

En resumen, el código crea un chatbot que usa el modelo TF-IDF para medir la
similitud semántica entre lo que el usuario escribe y un conjunto de preguntas
predefinidas. Si encuentra una pregunta suficientemente parecida, da la respuesta
asociada; de lo contrario, dice que no entendió.

También podría gustarte

Implementación de un Chatbot en Python
Aún no hay calificaciones
Implementación de un Chatbot en Python
4 páginas
Creación de Chatbots Inteligentes en NLP
Aún no hay calificaciones
Creación de Chatbots Inteligentes en NLP
16 páginas
Tarea02 19.02
Aún no hay calificaciones
Tarea02 19.02
17 páginas
Implementación de un Chatbot en Python
Aún no hay calificaciones
Implementación de un Chatbot en Python
4 páginas
IA interactiva que aprende preguntas
Aún no hay calificaciones
IA interactiva que aprende preguntas
2 páginas
ChatBot en Google Colab con PNL
Aún no hay calificaciones
ChatBot en Google Colab con PNL
2 páginas
PLN en Phyton
Aún no hay calificaciones
PLN en Phyton
23 páginas
ASK AI Chatbot para Bibliotecas
Aún no hay calificaciones
ASK AI Chatbot para Bibliotecas
18 páginas
Lematización en Procesamiento de Lenguaje
Aún no hay calificaciones
Lematización en Procesamiento de Lenguaje
21 páginas
Uso de Beautiful Soup y NLTK en PLN
Aún no hay calificaciones
Uso de Beautiful Soup y NLTK en PLN
52 páginas
Chat Bot Inteligente
Aún no hay calificaciones
Chat Bot Inteligente
46 páginas
Intro Chat 1
Aún no hay calificaciones
Intro Chat 1
6 páginas
Python para Procesamiento de Lenguaje Natural
Aún no hay calificaciones
Python para Procesamiento de Lenguaje Natural
9 páginas
Tarea #1 de PLN-2023
Aún no hay calificaciones
Tarea #1 de PLN-2023
7 páginas
Creación de Chatbots con Python y NLP
Aún no hay calificaciones
Creación de Chatbots con Python y NLP
10 páginas
Clasificación de Texto y Chatbots en Python
Aún no hay calificaciones
Clasificación de Texto y Chatbots en Python
27 páginas
NLTK Es
Aún no hay calificaciones
NLTK Es
16 páginas
Introducción a NLTK en PLN
Aún no hay calificaciones
Introducción a NLTK en PLN
47 páginas
Aprendizaje Profundo en NLP y Twitter
Aún no hay calificaciones
Aprendizaje Profundo en NLP y Twitter
105 páginas
Comparación de IA en Python
Aún no hay calificaciones
Comparación de IA en Python
10 páginas
NLP Integrador
Aún no hay calificaciones
NLP Integrador
11 páginas
Procesamiento Del Lenguaje y Python
Aún no hay calificaciones
Procesamiento Del Lenguaje y Python
70 páginas
Introducción a ChatGPT y su funcionamiento
Aún no hay calificaciones
Introducción a ChatGPT y su funcionamiento
32 páginas
Introducción a ChatGPT y su Uso Educativo
Aún no hay calificaciones
Introducción a ChatGPT y su Uso Educativo
17 páginas
Laboratorio 3
Aún no hay calificaciones
Laboratorio 3
2 páginas
Introducción a Sentence Embedding en Keras
Aún no hay calificaciones
Introducción a Sentence Embedding en Keras
12 páginas
Guía de Preprocesamiento de Texto en PNL
Aún no hay calificaciones
Guía de Preprocesamiento de Texto en PNL
25 páginas
Opencv Analisis de Sentimientos
Aún no hay calificaciones
Opencv Analisis de Sentimientos
10 páginas
NLTK
Aún no hay calificaciones
NLTK
56 páginas
Chatbot Educativo para Ingenieros Informáticos
Aún no hay calificaciones
Chatbot Educativo para Ingenieros Informáticos
3 páginas
Transformers
Aún no hay calificaciones
Transformers
109 páginas
Introducción a ChatGPT: IA Conversacional
Aún no hay calificaciones
Introducción a ChatGPT: IA Conversacional
11 páginas
Explicacion Clasificador de Texto
Aún no hay calificaciones
Explicacion Clasificador de Texto
8 páginas
Desarrollo de CAPTCHA con Python y Pybrain
Aún no hay calificaciones
Desarrollo de CAPTCHA con Python y Pybrain
8 páginas
Análisis de Sentimientos con LSTM en Python
Aún no hay calificaciones
Análisis de Sentimientos con LSTM en Python
11 páginas
TF Idf
Aún no hay calificaciones
TF Idf
25 páginas
Estrategias de ChatGPT en Redes Sociales
Aún no hay calificaciones
Estrategias de ChatGPT en Redes Sociales
12 páginas
Apuntes de Procesamiento del Lenguaje Natural
Aún no hay calificaciones
Apuntes de Procesamiento del Lenguaje Natural
10 páginas
Asistencia en programación con Crystal
Aún no hay calificaciones
Asistencia en programación con Crystal
7 páginas
Sesión 01. - Fundamentos Del PLN y Elementos Básicos Del Lenguaje
Aún no hay calificaciones
Sesión 01. - Fundamentos Del PLN y Elementos Básicos Del Lenguaje
95 páginas
Asistente de IA con Vosk y Gemini
Aún no hay calificaciones
Asistente de IA con Vosk y Gemini
9 páginas
Introducción a los Text Embeddings
Aún no hay calificaciones
Introducción a los Text Embeddings
56 páginas
Explicacion Codigo RNN
Aún no hay calificaciones
Explicacion Codigo RNN
10 páginas
Codigo Integrador1
Aún no hay calificaciones
Codigo Integrador1
4 páginas
Chatbot RAG con Llama3 y FAISS
Aún no hay calificaciones
Chatbot RAG con Llama3 y FAISS
9 páginas
Introducción a spaCy para PLN en Python
Aún no hay calificaciones
Introducción a spaCy para PLN en Python
28 páginas
Funciones Avanzadas de ChatGPT Plus
Aún no hay calificaciones
Funciones Avanzadas de ChatGPT Plus
2 páginas
ChatGPT Español Sin Registro
Aún no hay calificaciones
ChatGPT Español Sin Registro
1 página
Propuesta de Chatbot para Reservas de Viaje
Aún no hay calificaciones
Propuesta de Chatbot para Reservas de Viaje
13 páginas
Unidad 4 Procesamiento Del Lenguaje Natural PLN
Aún no hay calificaciones
Unidad 4 Procesamiento Del Lenguaje Natural PLN
14 páginas
ChatGPT y Creación de Prompts
100% (1)
ChatGPT y Creación de Prompts
8 páginas
Chatbot LinguAI: Divulgación Lingüística
Aún no hay calificaciones
Chatbot LinguAI: Divulgación Lingüística
67 páginas
Codigo Base Agente Productos
Aún no hay calificaciones
Codigo Base Agente Productos
28 páginas
Chatbot para IDbox: Diseño e Implementación
Aún no hay calificaciones
Chatbot para IDbox: Diseño e Implementación
60 páginas
ChatGPT: Fundamentos y Uso Eficaz
Aún no hay calificaciones
ChatGPT: Fundamentos y Uso Eficaz
9 páginas
Avances en Procesamiento de Lenguaje Natural
Aún no hay calificaciones
Avances en Procesamiento de Lenguaje Natural
6 páginas
Introducción a Transformers en Python
Aún no hay calificaciones
Introducción a Transformers en Python
1 página
Historia y Avances en Modelos Generativos
Aún no hay calificaciones
Historia y Avances en Modelos Generativos
33 páginas
Taller Telescopios
Aún no hay calificaciones
Taller Telescopios
22 páginas
Filtros Superiores
Aún no hay calificaciones
Filtros Superiores
141 páginas
Diseño de Osciladores Con Amp Op
Aún no hay calificaciones
Diseño de Osciladores Con Amp Op
46 páginas
Las Redes Generativas Adversarias (Teoría)
Aún no hay calificaciones
Las Redes Generativas Adversarias (Teoría)
2 páginas
Galaxy Bias Con Fine Tunning e Ingeniería de Prompts
Aún no hay calificaciones
Galaxy Bias Con Fine Tunning e Ingeniería de Prompts
9 páginas
Diseño de Contadores
Aún no hay calificaciones
Diseño de Contadores
143 páginas
Funcionamiento de Motores DC en Electrónica
Aún no hay calificaciones
Funcionamiento de Motores DC en Electrónica
20 páginas
PLN (Teoría)
Aún no hay calificaciones
PLN (Teoría)
4 páginas
Conceptos Teóricos de Las CNN
Aún no hay calificaciones
Conceptos Teóricos de Las CNN
3 páginas
Práctica 2 Con Dimmer SCR
100% (2)
Práctica 2 Con Dimmer SCR
16 páginas
Codigo VAE
Aún no hay calificaciones
Codigo VAE
7 páginas
Práctica 5 Laboratorio de Potencia, Detector Cruce Por Cero.
Aún no hay calificaciones
Práctica 5 Laboratorio de Potencia, Detector Cruce Por Cero.
12 páginas
Funcionamiento del TRIAC en AC
Aún no hay calificaciones
Funcionamiento del TRIAC en AC
10 páginas
Mitos y Leyendas de La Antigua Mesopotamia
Aún no hay calificaciones
Mitos y Leyendas de La Antigua Mesopotamia
100 páginas
Coherencia y cohesión en textos escritos
Aún no hay calificaciones
Coherencia y cohesión en textos escritos
10 páginas
Monografia Origen y Evolucion Del EspaÑol UAP
100% (1)
Monografia Origen y Evolucion Del EspaÑol UAP
23 páginas
Proceso y Elementos de la Comunicación
Aún no hay calificaciones
Proceso y Elementos de la Comunicación
9 páginas
Organizador Gráfico (La Gramática en La Comunicación Humana)
50% (6)
Organizador Gráfico (La Gramática en La Comunicación Humana)
2 páginas
Actividad de Aprendizaje 1. Ejercicios A Los Lenguajes Formales
Aún no hay calificaciones
Actividad de Aprendizaje 1. Ejercicios A Los Lenguajes Formales
3 páginas
ACTIVIDAD: Ciudades Romanas y Gentilicios.: NOMEN
Aún no hay calificaciones
ACTIVIDAD: Ciudades Romanas y Gentilicios.: NOMEN
2 páginas
Errores Comunes en Ventas Efectivas
Aún no hay calificaciones
Errores Comunes en Ventas Efectivas
4 páginas
Actividades de Álgebra para Secundaria
Aún no hay calificaciones
Actividades de Álgebra para Secundaria
3 páginas
El Sintagma Verbal - Definición, Estructura y Ejemplos 9no
Aún no hay calificaciones
El Sintagma Verbal - Definición, Estructura y Ejemplos 9no
2 páginas
Estrategias de Lectura y Escritura
Aún no hay calificaciones
Estrategias de Lectura y Escritura
9 páginas
Costumbres Culturales
100% (1)
Costumbres Culturales
5 páginas
El Zorro y El Condor / Cuentos Chuschinos 9
100% (1)
El Zorro y El Condor / Cuentos Chuschinos 9
6 páginas
TEMA 50 Mio
Aún no hay calificaciones
TEMA 50 Mio
13 páginas
Lección 4
Aún no hay calificaciones
Lección 4
6 páginas
Actividades de Inglés 4to Año 2021/2022
Aún no hay calificaciones
Actividades de Inglés 4to Año 2021/2022
1 página
Clase 6 Manuel Rodríguez
Aún no hay calificaciones
Clase 6 Manuel Rodríguez
1 página
Examen de Los Numeros Decimales
Aún no hay calificaciones
Examen de Los Numeros Decimales
1 página
Guía de Geografía de América del Sur
Aún no hay calificaciones
Guía de Geografía de América del Sur
5 páginas
Interpretacion de Planos
100% (1)
Interpretacion de Planos
190 páginas
Evaluación de Lectura: "El Fantasma de Palacio"
Aún no hay calificaciones
Evaluación de Lectura: "El Fantasma de Palacio"
3 páginas
Retos Ortograficos B o V
100% (1)
Retos Ortograficos B o V
9 páginas
Comunicacion Como Proceso Lineal
100% (1)
Comunicacion Como Proceso Lineal
6 páginas
Valores Del Cid
64% (11)
Valores Del Cid
2 páginas
Steve Vai Consejos
Aún no hay calificaciones
Steve Vai Consejos
14 páginas
Como Son Las Constumbres Indigenas Wayuu
Aún no hay calificaciones
Como Son Las Constumbres Indigenas Wayuu
9 páginas
Pcasm Book Spanish
Aún no hay calificaciones
Pcasm Book Spanish
194 páginas
El Trueno Entre Las Hojas
79% (19)
El Trueno Entre Las Hojas
6 páginas
Cuadro Conciencias Lingüísticas
Aún no hay calificaciones
Cuadro Conciencias Lingüísticas
5 páginas
Sintaxis El Velero Digital
Aún no hay calificaciones
Sintaxis El Velero Digital
16 páginas
4to Modulo 20 Fanzine
Aún no hay calificaciones
4to Modulo 20 Fanzine
4 páginas