0% encontró este documento útil (0 votos)

64 vistas5 páginas

Procesamiento Del Lenguaje Natural - PLN

Cargado por

Manuel Brambila Pelayo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

64 vistas5 páginas

Procesamiento Del Lenguaje Natural - PLN

Cargado por

Manuel Brambila Pelayo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Procesamiento del Lenguaje Natural – PLN

El Procesamiento del Lenguaje Natural es una rama de conocimiento de la Inteligencia

Artificial que pretende conseguir que una máquina comprenda lo que expresa una
persona mediante el uso de un lenguaje natural (inglés, español, chino...). Los
lenguajes naturales pueden expresarse de forma oral (mediante la voz), o por escrito
(un texto). El Procesamiento del Lenguaje Natural está mucho más avanzado en el
tratamiento de textos escritos. Las posibilidades de los modelos a aplicar se enfocan
no solo a la comprensión del lenguaje de por sí, sino a aspectos relacionados con la
organización de la información, así como a la importancia de los conceptos.

Para transformar un texto escrito en un lenguaje natural a algo interpretable por un

ordenador se pueden usar diferentes tipos de análisis, pero de forma básica
intentaremos una aproximación en la que al menos un programa sea capaz de
etiquetar las palabras y producir estadísticas de frecuencias en un primer paso. Esto
suele ser muy útil, por ejemplo, en disciplinas relacionadas con la medicina clínica
donde el profesional tradicionalmente toma notas manuscritas o en ordenador de la
situación clínica del paciente y luego esta información debería ser útil para el
diagnóstico (en la historia del paciente).

Nubes de etiquetas

Igualmente, en otras áreas se usa en esta primera fase, para producir diagramas/mapas
de resumen de conceptos con diferentes propósitos. En este caso, mapas/nubes de
palabras o etiquetas, como representación visual de las palabras que conforman un texto,
en donde el tamaño es mayor para las palabras que aparecen con más frecuencia.

Uno de sus usos principales es la visualización de las etiquetas de un sitio web, de modo
que los temas más frecuentes en el sitio se muestren con mayor prominencia. También
en medicina o cualquier otra disciplina.

Las etiquetas son palabras clave que suelen estar ordenadas alfabéticamente o, en
ocasiones, agrupadas semánticamente. La importancia de una etiqueta se muestra con
el tamaño de la fuente y/o color.

Enunciado: Diseñar un programa para dado un texto almacenado en un [Link],

construir un mapa de etiquetas de palabras.

Implementación

Texto1.m: script que realiza el PLN y genera la nube de etiquetas

FI_1_1.txt: fichero de texto que contiene la primera pregunta del tema 1 de

Fundamentos de Informática.
Referencias

Mariani, Joseph; Francopoulo, Gil; Paroubek, Patrick; Vernier, Frédéric (2019), «The NLP4NLP
Corpus (I): 50 Years of Research in Speech and Language Processing», Frontiers in Research Metrics
and Analytics

Hassan-Montero, Y., Herrero-Solana, V. Improving Tag-Clouds as Visual Information Retrieval

Interfaces. InSciT 2006: Mérida, Spain. October 25–28, 2006.

Hassan-Montero, Y., Herrero-Solana, V., Guerrero-Bote, V.; Usabilidad de los tag-clouds: estudio
mediante eye-tracking. SCIRE, Vol. 16, n. 1, 2010, pp. 15-33.
NUBE de PALABRAS según su frecuencia
close all;
clear all;

Lectura de un fichero de texto a analizazr

texto = fileread('FI_1_1.txt');
disp('El comienzo del texto del fichero es: ');
texto(1:300)

El comienzo del texto del fichero es:

ans =

'La Informática y la Ingeniería

Es necesario comenzar intentando dar una explicación al nacimiento de esta nueva
ciencia denominada Informática. La situación es fácil de imaginar: vivimos en un
mundo en el que estamos continuamente bombardeados por todo tipo de
informaciones, que en muchos de los'

Se convierte el texto a string

Se separa en líneas

texto = string(texto);
texto = splitlines(texto);
disp('El comienzo es : ');
texto(1:5)

El comienzo es :

ans =

5×1 string array

"La Informática y la Ingeniería"

"Es necesario comenzar intentando dar una explicación al nacimiento de esta nueva"
"ciencia denominada Informática. La situación es fácil de imaginar: vivimos en un"
"mundo en el que estamos continuamente bombardeados por todo tipo de"
"informaciones, que en muchos de los casos varían con el tiempo. Vivimos por tanto,"

Se sustituyen los signos de puntación por espacios

p = ["." "?" "!" "," ";" ":"];
texto = replace(texto,p," ");
texto(1:5)

ans =

5×1 string array

"La Informática y la Ingeniería"

"Es necesario comenzar intentando dar una explicación al nacimiento de esta nueva"
"ciencia denominada Informática La situación es fácil de imaginar vivimos en un"
"mundo en el que estamos continuamente bombardeados por todo tipo de"
"informaciones que en muchos de los casos varían con el tiempo Vivimos por tanto "

Se divide el texto en un string array con palabras individuales

Se unen todas y se divide según los espacios que se encuentren

texto = join(texto);
texto = split(texto);
texto(1:15)

ans =

15×1 string array

"La"
"Informática"
"y"
"la"
"Ingeniería"
"Es"
"necesario"
"comenzar"
"intentando"
"dar"
"una"
"explicación"
"al"
"nacimiento"
"de"

Borrar palabras de longitud menor que 5

texto(strlength(texto)<5) = [];
texto(1:15)

ans =

15×1 string array

"Informática"
"Ingeniería"
"necesario"
"comenzar"
"intentando"
"explicación"
"nacimiento"
"nueva"
"ciencia"
"denominada"
"Informática"
"situación"
"fácil"
"imaginar"
"vivimos"

Se convierte el texto un array de categorías

Se representa según su frecuencia

C = categorical(texto);
figure, wordcloud(C);
title("Mapa de frecuencia de palabras");

Published with MATLAB® R2018b

También podría gustarte

Procesamiento Lenguaje Natural (Español)
Aún no hay calificaciones
Procesamiento Lenguaje Natural (Español)
10 páginas
Tesis de Inteligencia Artificial
Aún no hay calificaciones
Tesis de Inteligencia Artificial
54 páginas
Análisis de GLN y Técnicas de Clasificación
Aún no hay calificaciones
Análisis de GLN y Técnicas de Clasificación
3 páginas
Procesamiento de Lenguaje Natural en PLN 17
Aún no hay calificaciones
Procesamiento de Lenguaje Natural en PLN 17
15 páginas
3 Analisis de Textos y Contenidos Semanticos
Aún no hay calificaciones
3 Analisis de Textos y Contenidos Semanticos
5 páginas
Procesamiento del Lenguaje Natural
Aún no hay calificaciones
Procesamiento del Lenguaje Natural
11 páginas
Procesamiento Del Lenguaje
Aún no hay calificaciones
Procesamiento Del Lenguaje
255 páginas
Mira La Introducción Es Un Resumen de Toda Una Investigación o Del Trabajo
Aún no hay calificaciones
Mira La Introducción Es Un Resumen de Toda Una Investigación o Del Trabajo
21 páginas
Compiladores e Interpretes - Teoria y Practica
Aún no hay calificaciones
Compiladores e Interpretes - Teoria y Practica
19 páginas
Algoritmos Computacionales: Lenguajes Naturales y de Programación
Aún no hay calificaciones
Algoritmos Computacionales: Lenguajes Naturales y de Programación
11 páginas
Ejemplos de Procesamiento de Lenguaje Natural
Aún no hay calificaciones
Ejemplos de Procesamiento de Lenguaje Natural
17 páginas
Grupo 3
Aún no hay calificaciones
Grupo 3
18 páginas
Procesamiento Del Lenguaje Natural de Li
Aún no hay calificaciones
Procesamiento Del Lenguaje Natural de Li
26 páginas
Lenguajes de Programacion
100% (1)
Lenguajes de Programacion
23 páginas
Expresiones Regulares en Facebook
Aún no hay calificaciones
Expresiones Regulares en Facebook
6 páginas
Que Es La Informática
Aún no hay calificaciones
Que Es La Informática
3 páginas
Text Mining
Aún no hay calificaciones
Text Mining
6 páginas
Introducción al Text Mining en Español
Aún no hay calificaciones
Introducción al Text Mining en Español
17 páginas
Lingüística Computacional
Aún no hay calificaciones
Lingüística Computacional
8 páginas
S4 Curso IA - Introducción Al Procesamiento Del Lenguaje Natural
Aún no hay calificaciones
S4 Curso IA - Introducción Al Procesamiento Del Lenguaje Natural
33 páginas
PLN
Aún no hay calificaciones
PLN
3 páginas
Haro Sofia - Investigaciones en Analisis Sintactico para El Español
100% (1)
Haro Sofia - Investigaciones en Analisis Sintactico para El Español
352 páginas
Base de Datos
Aún no hay calificaciones
Base de Datos
7 páginas
Introducción a NLTK en PLN
Aún no hay calificaciones
Introducción a NLTK en PLN
47 páginas
Texto como Dato en PLN
Aún no hay calificaciones
Texto como Dato en PLN
38 páginas
APUNTE - PLN Técnicas y Aplicaciones
Aún no hay calificaciones
APUNTE - PLN Técnicas y Aplicaciones
10 páginas
Lingüística Computacional
Aún no hay calificaciones
Lingüística Computacional
5 páginas
Minería de Texto y Aplicaciones NLP
Aún no hay calificaciones
Minería de Texto y Aplicaciones NLP
37 páginas
Inteligencia Natural y Artificial
Aún no hay calificaciones
Inteligencia Natural y Artificial
48 páginas
Nube de Palabras
Aún no hay calificaciones
Nube de Palabras
18 páginas
Zavala 2011 Que Son Las Ciencias de La Computacion Una Interpetacion
Aún no hay calificaciones
Zavala 2011 Que Son Las Ciencias de La Computacion Una Interpetacion
40 páginas
Capítulo de La Lingüística Computacional de Jeri Cerny
100% (1)
Capítulo de La Lingüística Computacional de Jeri Cerny
25 páginas
ANÀLISIS SINTACTICO PARA EL ESPAÑOL - Leido PDF
100% (1)
ANÀLISIS SINTACTICO PARA EL ESPAÑOL - Leido PDF
347 páginas
Lenguaje Natural
Aún no hay calificaciones
Lenguaje Natural
7 páginas
Inteligencia Artificial
0% (2)
Inteligencia Artificial
26 páginas
Aguirre Vazquez Daniel Actividad 6
Aún no hay calificaciones
Aguirre Vazquez Daniel Actividad 6
6 páginas
Técnicas de Procesamiento de Lenguaje
Aún no hay calificaciones
Técnicas de Procesamiento de Lenguaje
49 páginas
Organización de Documentos Mediante Grafos de Relaciones Semánticas
Aún no hay calificaciones
Organización de Documentos Mediante Grafos de Relaciones Semánticas
22 páginas
Introducción a las Ciencias de la Computación
Aún no hay calificaciones
Introducción a las Ciencias de la Computación
5 páginas
Tema 1
Aún no hay calificaciones
Tema 1
34 páginas
Iabdm1modelosdeinteligenciaartificial E2c09215 2030 3ecf 7ddb B69630ab6a4b
Aún no hay calificaciones
Iabdm1modelosdeinteligenciaartificial E2c09215 2030 3ecf 7ddb B69630ab6a4b
19 páginas
1.3.1lenguaje Natural y Artificial
100% (1)
1.3.1lenguaje Natural y Artificial
9 páginas
Introducción A Mineria de Texto DSRP ER 141121
Aún no hay calificaciones
Introducción A Mineria de Texto DSRP ER 141121
24 páginas
Procesamiento Del Lenguaje y Python
Aún no hay calificaciones
Procesamiento Del Lenguaje y Python
70 páginas
Grupo de Ingeniería Lingüística
Aún no hay calificaciones
Grupo de Ingeniería Lingüística
5 páginas
01 Clase
100% (1)
01 Clase
73 páginas
Clasificación Noticias con PLN
Aún no hay calificaciones
Clasificación Noticias con PLN
27 páginas
Minería de Datos
Aún no hay calificaciones
Minería de Datos
15 páginas
PLN Clase05
Aún no hay calificaciones
PLN Clase05
52 páginas
Clase 11 PLN
Aún no hay calificaciones
Clase 11 PLN
29 páginas
LyA2 Antologia Unidad1
Aún no hay calificaciones
LyA2 Antologia Unidad1
16 páginas
Clase 2 - Web Scraping
0% (1)
Clase 2 - Web Scraping
15 páginas
LibroPLN PDF
Aún no hay calificaciones
LibroPLN PDF
255 páginas
Guía 3. Historia y Evolucion de La Informatica
Aún no hay calificaciones
Guía 3. Historia y Evolucion de La Informatica
6 páginas
Examen 1 - ICC - 2024-1
Aún no hay calificaciones
Examen 1 - ICC - 2024-1
4 páginas
Aprendizaje en Robots Sociales Autor Koro Irusta Gonzalo
Aún no hay calificaciones
Aprendizaje en Robots Sociales Autor Koro Irusta Gonzalo
145 páginas
Icesi Economic Lecture Notes 9 2020
Aún no hay calificaciones
Icesi Economic Lecture Notes 9 2020
28 páginas
Cuadro Comparativo Funciones Empresa Comercial y Detransformacion
100% (2)
Cuadro Comparativo Funciones Empresa Comercial y Detransformacion
2 páginas
Logica Difusa Aplicaciones
Aún no hay calificaciones
Logica Difusa Aplicaciones
6 páginas
Diagramas Escalera en PLCs
Aún no hay calificaciones
Diagramas Escalera en PLCs
12 páginas
Informe EMC: Modelos BABY, JUNIOR, SENIOR
Aún no hay calificaciones
Informe EMC: Modelos BABY, JUNIOR, SENIOR
40 páginas
OgataKIngeniería de Control ModernaPP685a687
Aún no hay calificaciones
OgataKIngeniería de Control ModernaPP685a687
3 páginas
Sistemas de Ecuaciones Lineales
Aún no hay calificaciones
Sistemas de Ecuaciones Lineales
11 páginas
Modelos de Predicción en Big Data
Aún no hay calificaciones
Modelos de Predicción en Big Data
13 páginas
Activación de Cuenta Institucional
Aún no hay calificaciones
Activación de Cuenta Institucional
2 páginas
Investigacion RPC
Aún no hay calificaciones
Investigacion RPC
6 páginas
Proceso de Apagado y Encendido Del Chiller
Aún no hay calificaciones
Proceso de Apagado y Encendido Del Chiller
3 páginas
Operadores y Control en C#
Aún no hay calificaciones
Operadores y Control en C#
9 páginas
Historia de las Bases de Datos
Aún no hay calificaciones
Historia de las Bases de Datos
6 páginas
BDVenlínea Empresas: Guía de Uso
Aún no hay calificaciones
BDVenlínea Empresas: Guía de Uso
71 páginas
Componentes Internos y Externos Del Computador
Aún no hay calificaciones
Componentes Internos y Externos Del Computador
1 página
Trabajo No. 3 Fichas Ocupacionales
Aún no hay calificaciones
Trabajo No. 3 Fichas Ocupacionales
23 páginas
Sesion 02 Modelamiento Simulacion Ambiental
Aún no hay calificaciones
Sesion 02 Modelamiento Simulacion Ambiental
27 páginas
EAD Manual
Aún no hay calificaciones
EAD Manual
33 páginas
Algoritmo de Tomasulo
Aún no hay calificaciones
Algoritmo de Tomasulo
3 páginas
Experto en Seguridad Bancaria
Aún no hay calificaciones
Experto en Seguridad Bancaria
1 página
Guía para ponchar cable UTP RJ45
Aún no hay calificaciones
Guía para ponchar cable UTP RJ45
2 páginas
5z Pensar Patrimonio by Daniela Marsal
0% (1)
5z Pensar Patrimonio by Daniela Marsal
3 páginas
Proyecto Análisis Descriptivo 2025-2 - 85221282
Aún no hay calificaciones
Proyecto Análisis Descriptivo 2025-2 - 85221282
8 páginas
Legislación Laboral TP 2
Aún no hay calificaciones
Legislación Laboral TP 2
2 páginas
CE1.5 (Unidad de Aprendizaje 1, Epígrafe 5.2)
67% (3)
CE1.5 (Unidad de Aprendizaje 1, Epígrafe 5.2)
6 páginas
Comunicacion Empresarial y Atencion Al Cliente 21 22
Aún no hay calificaciones
Comunicacion Empresarial y Atencion Al Cliente 21 22
25 páginas
Siemens NX7
Aún no hay calificaciones
Siemens NX7
9 páginas
Plan de Pruebas para Magneto Empleos
Aún no hay calificaciones
Plan de Pruebas para Magneto Empleos
5 páginas
TFG Daniel Dominguez Yuste
Aún no hay calificaciones
TFG Daniel Dominguez Yuste
58 páginas
S03 - ÁLGEBRA - 1° SEC - Valor Numérico
100% (1)
S03 - ÁLGEBRA - 1° SEC - Valor Numérico
5 páginas
Matricula y Costos
Aún no hay calificaciones
Matricula y Costos
11 páginas
Khfe Efueg
Aún no hay calificaciones
Khfe Efueg
5 páginas
Reglas para el Sistema de Cine
Aún no hay calificaciones
Reglas para el Sistema de Cine
1 página
Inecuaciones en Ingeniería Industrial
Aún no hay calificaciones
Inecuaciones en Ingeniería Industrial
14 páginas
Tipos de AVA y Sus Principales Características
Aún no hay calificaciones
Tipos de AVA y Sus Principales Características
12 páginas
Guia Aprendizaje 5
Aún no hay calificaciones
Guia Aprendizaje 5
17 páginas
Practica #3 Resumen 1er Examen Parcial de Word - (Informatica 2)
Aún no hay calificaciones
Practica #3 Resumen 1er Examen Parcial de Word - (Informatica 2)
6 páginas