0% encontró este documento útil (0 votos)

122 vistas9 páginas

Análisis de Componentes Léxicos y Tokens

Este documento describe los conceptos de componentes léxicos, lexemas y patrones en el análisis léxico. Explica que los componentes léxicos son símbolos terminales de la gramática que representan unidades léxicas como identificadores, constantes y operadores. Los lexemas son cadenas de caracteres en el código fuente que concuerdan con los patrones asociados a los componentes léxicos. El análisis léxico agrupa los caracteres de entrada en tokens o estructuras lexicológicas que se almacenan en la tabla de

Cargado por

Jonathan Lopez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

122 vistas9 páginas

Análisis de Componentes Léxicos y Tokens

Cargado por

Jonathan Lopez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

IDENTIFICACION DE LEXAMAS COMPONENTES LEXICOS Y PATRONES A

PARTIR DE UN LENGUAJE.
Cuando se mencionan los términos “componentes léxicos” – token –, “patrón” y
“lexema” se emplean con significados específicos. En general, hay un conjunto de
cadenas
en la entrada para el cual se produce como salida el mismo componente léxico.
Este
conjunto de cadenas se describe mediante una regla llamada patrón asociado al
componente léxico. Se dice que el patrón concuerda con cada cadena del
conjunto. Un
lexema es una secuencia de caracteres en el programa fuente con la que
concuerda el
patrón para un componente léxico [Aho88]. Por ejemplo, en la preposición de
Pascal
const p:i=3.1416;
la subcadena pi es un lexema para el componente léxico “identificador”. En la
figura 1.3
aparecen ejemplos de los usos de componentes léxicos, patrones y lexemas.

Figura 1.3: Componentes léxicos, lexemas y patrones.

Los componentes léxicos se tratan como símbolos terminales de la gramática del
lenguaje fuente – en la figura 1.3 se representan con nombres en negritas –. Los
lexemas
para el componente léxico que concuerdan con el patrón representan cadenas de
caracteres
en el programa fuente que se pueden tratar como una unidad léxica.
En la mayoría de los lenguajes de programación, se consideran componentes
léxicos a las siguientes construcciones: palabras clave, operadores,
identificadores,
constantes, cadenas literales y signos de puntuación como por ejemplo paréntesis,
coma,
punto y coma. En el ejemplo anterior, cuando la secuencia de caracteres nom
aparece en el
programa fuente, se devuelve al analizador sintáctico un componente léxico que
representa
un identificador. La devolución de un componente léxico a menudo se realiza
mediante el
paso de un número entero correspondiente al componente léxico. Este entero es
al que hace
referencia el nom en negritas de la figura 1.3.
3
Un Generador de Analizadores Léxicos Traductores
Un patrón es una regla que describe el conjunto de lexemas que pueden
representar
a un determinado componente léxico en los programas fuentes. El patrón para el
componente léxico while de la figura 1.3 es simplemente la cadena sencilla while
que
deletrea la palabra clave. El patrón para el componente léxico relación es el
conjunto de
los seis operadores relacionales de Pascal. Para describir con precisión los
patrones para
componentes léxicos más complejos, como identificador y natural – para los
números
naturales –, se utilizará la notación de expresiones regulares desarrollada en la
siguiente
sección.
CONOCER LOS ELEMENTOS DE UNA TABLA DE TOKENS
a creación de la tabla de Tokens compete inicialmente al analizador de léxico,
quien registrará a las entidades (reconocidas bajo el patrón de Identificador) de
manera única, por medio del binomio de operaciones Búsqueda-Inserción.
Cuando construir la tabla de tokens
la tabla de símbolos es creada durante el paso de análisis léxico. Por medio de un
índice se entra a la tabla de símbolos para ubicar la variable, a partir del token
generado por el scanner.
Tipos de Tokens
Tokens
Símbolos terminales de una gramática, identificadores, palabras reservadas,
operadores.

Varios signos pueden formar un mismo token.

Atributos:
Información adicional que significa algo a la hora de compilar
Creación
La Tabla de Tokens es una serie de renglones, cada uno de los cuales contiene
una lista de valores de atributos que son asociados con una variable en particular

Una tabla de símbolos provee la siguiente información:

Analizador Léxico
Es tambien conocido como scanner y este aísla el analizador sintáctico de la
representación de lexemas de los componentes léxicos.

El analizador léxico opera bajo petición del analizador sintáctico devolviendo un

componente léxico conforme el analizador sintáctico lo va necesitando para
avanzar en la gramática.
Tabla de Tokens
Componentes léxicos
Es otra manera de llamar a los tokens y es la unidad mínima de información que
significa algo a la hora de compilar
-Da un Identificador

-Que información es asociada con un nombre

-como se asocia esa información con un nombre

-como acceder a esta información

Cadenas Especificas
Pero las dos funciones importantes que realizan las tablas Tokens en el proceso
de traducción son:

-Verificar que la semántica sea correcta

-Ayudar en la generación apropiada de código.

Este tipo de tokens son como las palabras reservadas (if o While), signos de
puntuación (., ,, = ...), operadores aritméticos (+,*,...) y lógicos (AND, OR, ...) Y no
tienen asociado ningún valor, solo su tipo
Cadenas no especificas
Este tipo de token son los identificadores o las contantes numéricas o de texto.
Estas siempre tienen un tipo y valor.

Por ejemplo, si dato es el nombre de una variable, el tipo del token será
identificador y su valor será dato
IDENTIFICAR PATRONES VALIDOS GENERAR AUTOMATAS Y TABLA DE
TOKENS DEL LENGUAJE PROPUESTO

Análisis lexicológico.
La entrada de un compilador es el código de un programa escrito en un lenguaje
de programación. Dicho código no es más que una secuencia de símbolos
pertenecientes al alfabeto del lenguaje de programación. El analizador lexicológico
o scanner se encarga de tomarlos y agruparlos en entidades sintácticas simples o
elementales denominadas tokens o lexemas. Las categorías de tokens pueden
variar de un lenguaje a otro, pero en general se distinguen las siguientes:

 palabras reservadas
 identificadores
 constantes numéricas y literales
 operadores

A cada token se le asigna una estructura lexicológica consistente en un par de la

forma <tipo del token, info>. La primera componente es una categoría sintáctica
como “constante”, “identificador”, “operador”, etc., y la segunda componente
proporciona información relacionada con el token en particular (valor de la
constante, índice del símbolo en la tabla de símbolos, etc.). Podemos afirmar, por
lo tanto, que el scanner es un traductor cuya entrada es una cadena de símbolos
(programa fuente) y cuya salida es una secuencia de estructuras lexicológicas o
tokens.

Operaciones sobre la tabla de símbolos.

Una tarea fundamental en un compilador es la de almacenar
los identificadores utilizados en un programa y sus atributos principales, de
manera que en cualquier momento pueda conocerse de un identificador, su tipo,
alcance, etc., para el caso de los procedimientos, la cantidad y tipo de los
parámetros, etc. Esta información se almacena generalmente en una estructura
conocida como tabla de símbolos, la cual tiene una entrada para cada identificador
y sus atributos. Los tokens que representan constantes o identificadores se
almacenan en la tabla de símbolos a medida que van apareciendo.
Ejemplo: 1 a Variable real 2 b Variable real 3 c Variable real 4 7 constante entera
Cuando el lenguaje fuente es de alto nivel (Pascal, C++, etc.) y el lenguaje objeto
es un lenguaje de bajo nivel o de máquina, al traductor se le denomina compilador.

El lenguaje de implementación puede ser en general cualquier lenguaje de

programación, aunque existen lenguajes explícitamente diseñados para escribir
compiladores (FSL, CDL, etc.). El criterio fundamental que se sigue para elegir un
lenguaje de implementación es: “Este debe minimizar el esfuerzo de
implementación y maximizar la calidad del compilador”. Generalmente los
traductores se representan a través de una T en la que se incluyen los lenguajes
que intervienen en el proceso.

 Intérprete por su parte es un programa que toma el código fuente, lo analiza y

a diferencia de los compiladores lo ejecuta directamente, sin generar un
lenguaje objeto.
REGLAS DE UN LENGUAJE DE PROGRAMACION PROPIO
DISTINGUIR LOS ERRORES LEXICOS

Errores léxicos
El análisis léxico constituye la primera fase, aquí se lee el programa fuente de
izquierda a derecha y se agrupa en componentes léxicos (tokens), que son
secuencias de caracteres que tienen un significado. Además, todos los espacios
en blanco, líneas en blanco, comentarios y demás información innecesaria se
elimina del programa fuente. También se comprueba que los símbolos del
lenguaje (palabras clave, operadores,...) se han escrito correctamente.

Como la tarea que realiza el analizador léxico es un caso especial de coincidencia

de patrones, se necesitan los métodos de especificación y reconocimiento de
patrones, y éstos métodos son principalmente las expresiones regulares y
los autómatas finitos. Sin embargo, un analizador léxico también es la parte del
traductor que maneja la entrada del código fuente, y puesto que esta entrada a
menudo involucra un importante gasto de tiempo, el analizador léxico debe
funcionar de manera tan eficiente como sea posible.

Son pocos los errores simplemente en el nivel léxico ya que tiene una visión muy
restringida de un programa fuente. El analizador léxico debe devolver el
componente léxico de un identificador y dejar a otra fase se ocupe de los errores.

Suponga que una situación en la cual el analizador léxico no puede continuar por
que ninguno de los patrones concuerda con un prefijo de la entrada. Tal vez la
estrategia de recuperación más sencilla sea recuperación “EN MODO PANICO”
(este método de recuperación es donde se borra caracteres sucesivos de la
entrada hasta que el analizador léxico pueda encontrar un componente léxico bien
formado). ¡¡Los programas no siempre son correctos!!

El compilador tiene que:

1. Reportar clara y exactamente la presencia de errores

2. Recuperarse de cada error lo suficientemete rápido para poder detectar
errores subsiguientes:

 Tratar de evitar mensajes falsos de error

 Un error que produce un token erroneo
 Errores léxicos posibles
Un token o componente léxico es una cadena de caracteres que tiene un
significado coherente en cierto lenguaje de programación. Ejemplos de tokens,
podrían ser palabras clave (if, while, int), identificadores, números, signos, o un
operador de varios caracteres. Son los elementos más básicos sobre los cuales se
desarrolla toda traducción de un programa, surgen en la primera fase, llamada
análisis léxico.

También podría gustarte

Componentes Léxicos y Tokens en Compilación
Aún no hay calificaciones
Componentes Léxicos y Tokens en Compilación
10 páginas
Análisis Léxico y Generadores Lex/FLEX
Aún no hay calificaciones
Análisis Léxico y Generadores Lex/FLEX
21 páginas
Componentes Clave de un Compilador
Aún no hay calificaciones
Componentes Clave de un Compilador
18 páginas
Anteproyecto de Autómatas
Aún no hay calificaciones
Anteproyecto de Autómatas
6 páginas
Análisis Léxico en Compiladores: Funciones y Tokens
Aún no hay calificaciones
Análisis Léxico en Compiladores: Funciones y Tokens
9 páginas
Funciones del Analizador Léxico en Compiladores
Aún no hay calificaciones
Funciones del Analizador Léxico en Compiladores
17 páginas
Guía del Analizador Léxico en Compiladores
Aún no hay calificaciones
Guía del Analizador Léxico en Compiladores
26 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
8 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
13 páginas
Funciones del Analizador Léxico
Aún no hay calificaciones
Funciones del Analizador Léxico
4 páginas
Análisis Léxico en Compiladores
100% (1)
Análisis Léxico en Compiladores
21 páginas
Fases del Compilador: Análisis Léxico y Sintáctico
Aún no hay calificaciones
Fases del Compilador: Análisis Léxico y Sintáctico
17 páginas
Investigacion U4 - Ambrosio Garcia Jesus Armando
Aún no hay calificaciones
Investigacion U4 - Ambrosio Garcia Jesus Armando
13 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
54 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
12 páginas
7 Análisis Lexico PDF
Aún no hay calificaciones
7 Análisis Lexico PDF
17 páginas
Análisis Léxico y Sintáctico en Compiladores
Aún no hay calificaciones
Análisis Léxico y Sintáctico en Compiladores
8 páginas
Unidad 5 Analizador Lexico
Aún no hay calificaciones
Unidad 5 Analizador Lexico
26 páginas
Análisis del Analizador Léxico en Compiladores
Aún no hay calificaciones
Análisis del Analizador Léxico en Compiladores
37 páginas
Análisis del Analizador Léxico en Compiladores
Aún no hay calificaciones
Análisis del Analizador Léxico en Compiladores
13 páginas
Compiladores y Procesadores de Lenguajes - (PG 42 - 78)
Aún no hay calificaciones
Compiladores y Procesadores de Lenguajes - (PG 42 - 78)
37 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
20 páginas
Función del Analizador Léxico en Compiladores
Aún no hay calificaciones
Función del Analizador Léxico en Compiladores
12 páginas
5.2 Componentes Lexicos, Patrones y Lexemas
50% (2)
5.2 Componentes Lexicos, Patrones y Lexemas
3 páginas
Componentes léxicos en análisis sintáctico
Aún no hay calificaciones
Componentes léxicos en análisis sintáctico
3 páginas
Funciones del Analizador Léxico en Compiladores
Aún no hay calificaciones
Funciones del Analizador Léxico en Compiladores
7 páginas
Componentes Léxicos y Lexemas
Aún no hay calificaciones
Componentes Léxicos y Lexemas
5 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
15 páginas
Apunte Analisis Lex 2009
Aún no hay calificaciones
Apunte Analisis Lex 2009
6 páginas
Cómo construir un analizador léxico
Aún no hay calificaciones
Cómo construir un analizador léxico
3 páginas
Guia 2
Aún no hay calificaciones
Guia 2
5 páginas
Introducción a Analizadores Léxicos
Aún no hay calificaciones
Introducción a Analizadores Léxicos
9 páginas
Analizador Léxico-Sintáctico en C
Aún no hay calificaciones
Analizador Léxico-Sintáctico en C
18 páginas
Final Anamim
Aún no hay calificaciones
Final Anamim
44 páginas
Análisis del Analizador Léxico en Compiladores
Aún no hay calificaciones
Análisis del Analizador Léxico en Compiladores
6 páginas
Analizador Lexico
Aún no hay calificaciones
Analizador Lexico
9 páginas
Funciones del Analizador Léxico en Compiladores
Aún no hay calificaciones
Funciones del Analizador Léxico en Compiladores
7 páginas
Grupo4 Semana7
Aún no hay calificaciones
Grupo4 Semana7
8 páginas
Significado de Macheado en Compiladores
Aún no hay calificaciones
Significado de Macheado en Compiladores
11 páginas
Fundamentos de Compiladores y Análisis Léxico
Aún no hay calificaciones
Fundamentos de Compiladores y Análisis Léxico
42 páginas
04 Analisis Lexico 1
Aún no hay calificaciones
04 Analisis Lexico 1
12 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
21 páginas
Funciones del Analizador Léxico en Compiladores
Aún no hay calificaciones
Funciones del Analizador Léxico en Compiladores
7 páginas
Análisis Léxico y Sintáctico en Compiladores
Aún no hay calificaciones
Análisis Léxico y Sintáctico en Compiladores
13 páginas
Fundamentos del Analizador Léxico
Aún no hay calificaciones
Fundamentos del Analizador Léxico
14 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
7 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
8 páginas
Teoría de La Computación Analizador Lexico
Aún no hay calificaciones
Teoría de La Computación Analizador Lexico
14 páginas
Análisis Léxico: Funciones y Aplicaciones
Aún no hay calificaciones
Análisis Léxico: Funciones y Aplicaciones
13 páginas
Análisis Léxico y Sintáctico
Aún no hay calificaciones
Análisis Léxico y Sintáctico
7 páginas
Funciones del Analizador Léxico
100% (1)
Funciones del Analizador Léxico
28 páginas
Unidad 4 Análisis Léxico
Aún no hay calificaciones
Unidad 4 Análisis Léxico
14 páginas
Análisis Léxico: Tokens, Patrones y Lexemas
0% (1)
Análisis Léxico: Tokens, Patrones y Lexemas
23 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
43 páginas
Análisis Léxico y Tokens en Compiladores
Aún no hay calificaciones
Análisis Léxico y Tokens en Compiladores
4 páginas
Análisis Léxico en Procesadores de Lenguaje
Aún no hay calificaciones
Análisis Léxico en Procesadores de Lenguaje
58 páginas
Análisis Léxico en Compiladores: Guía Práctica
Aún no hay calificaciones
Análisis Léxico en Compiladores: Guía Práctica
2 páginas
Adverbios
Aún no hay calificaciones
Adverbios
46 páginas
SENSORES
Aún no hay calificaciones
SENSORES
40 páginas
Contador de 0 a 99 con Arduino
Aún no hay calificaciones
Contador de 0 a 99 con Arduino
7 páginas
Proyecto Estacionamiento
Aún no hay calificaciones
Proyecto Estacionamiento
11 páginas
Circuito de Alarma con Sensor LM35
Aún no hay calificaciones
Circuito de Alarma con Sensor LM35
4 páginas
Introducción a la Lógica de Primer Orden
Aún no hay calificaciones
Introducción a la Lógica de Primer Orden
25 páginas
Clasificación de Lenguajes de Programación
Aún no hay calificaciones
Clasificación de Lenguajes de Programación
49 páginas
Práctica de Disparadores en Bases de Datos
Aún no hay calificaciones
Práctica de Disparadores en Bases de Datos
7 páginas
Introducción a la Programación Funcional
Aún no hay calificaciones
Introducción a la Programación Funcional
15 páginas
Fases de Gestion de Proyecto
100% (1)
Fases de Gestion de Proyecto
4 páginas
Análisis de Tráfico de Red con Wireshark
Aún no hay calificaciones
Análisis de Tráfico de Red con Wireshark
10 páginas
Ejemplos de Modelos de Red Funcional
Aún no hay calificaciones
Ejemplos de Modelos de Red Funcional
12 páginas
Análisis Léxico: Funciones y Métodos
Aún no hay calificaciones
Análisis Léxico: Funciones y Métodos
25 páginas
Elementos Lingüísticos y Paralingüísticos
Aún no hay calificaciones
Elementos Lingüísticos y Paralingüísticos
10 páginas
Analisis Contrastivo Fonetica Español Aleman
Aún no hay calificaciones
Analisis Contrastivo Fonetica Español Aleman
21 páginas
Ejemplos de Metáforas Comunes
Aún no hay calificaciones
Ejemplos de Metáforas Comunes
1 página
Separación de palabras en sílabas
Aún no hay calificaciones
Separación de palabras en sílabas
5 páginas
Evaluación de Lengua y Literatura 4to y 5to
100% (1)
Evaluación de Lengua y Literatura 4to y 5to
2 páginas
Guía Práctica. El Sustantivo y Sus Clases
100% (1)
Guía Práctica. El Sustantivo y Sus Clases
3 páginas
Idealismo y conocimiento en filosofía
Aún no hay calificaciones
Idealismo y conocimiento en filosofía
4 páginas
Zarzar Charur, Carlo, Lectura de Expresión Oral y Escrita - (2015) Editorial Patria (PG - 18 - 37) L
100% (1)
Zarzar Charur, Carlo, Lectura de Expresión Oral y Escrita - (2015) Editorial Patria (PG - 18 - 37) L
20 páginas
Bibliografía sobre lectura y bibliotecas infantiles
Aún no hay calificaciones
Bibliografía sobre lectura y bibliotecas infantiles
113 páginas
Practica de Lengua Esp, 011
100% (3)
Practica de Lengua Esp, 011
11 páginas
Organizador Gráfico
Aún no hay calificaciones
Organizador Gráfico
3 páginas
Elementos y Barreras de Comunicación
Aún no hay calificaciones
Elementos y Barreras de Comunicación
5 páginas
Módulo de Español-10°-Bach. Ciencias y Letras
Aún no hay calificaciones
Módulo de Español-10°-Bach. Ciencias y Letras
117 páginas
Banco de Preguntas de Lenguaje UNMSM
Aún no hay calificaciones
Banco de Preguntas de Lenguaje UNMSM
25 páginas
2 Bachillerato. Caracteristicas Del Español Actual
Aún no hay calificaciones
2 Bachillerato. Caracteristicas Del Español Actual
1 página
Estructura de Procesadores de Lenguaje
Aún no hay calificaciones
Estructura de Procesadores de Lenguaje
13 páginas
Evaluación de Verbos y Modos en Comunicación
Aún no hay calificaciones
Evaluación de Verbos y Modos en Comunicación
6 páginas
Pensar El Dibujo Artístico
Aún no hay calificaciones
Pensar El Dibujo Artístico
6 páginas
Diptico de Comunicación 3° Secundaria
Aún no hay calificaciones
Diptico de Comunicación 3° Secundaria
7 páginas
22 Comunidades Lingüística de Guatemala
Aún no hay calificaciones
22 Comunidades Lingüística de Guatemala
9 páginas
Alston - Introduccion A La Filosofia Del Lenguaje
Aún no hay calificaciones
Alston - Introduccion A La Filosofia Del Lenguaje
6 páginas
Estimulación del Lenguaje Infantil
Aún no hay calificaciones
Estimulación del Lenguaje Infantil
2 páginas
Produccion Radial 1
Aún no hay calificaciones
Produccion Radial 1
8 páginas
3161-Texto Del Artículo-6303-1-10-20201125
Aún no hay calificaciones
3161-Texto Del Artículo-6303-1-10-20201125
7 páginas
Comprensión del Mito Yurupary
71% (7)
Comprensión del Mito Yurupary
2 páginas
Voz Media y Pasiva en Griego
Aún no hay calificaciones
Voz Media y Pasiva en Griego
23 páginas
Aprendizaje sobre Vida Silvestre en Inglés
Aún no hay calificaciones
Aprendizaje sobre Vida Silvestre en Inglés
9 páginas
Ejercicios de Concordancia, Sujetos e Impersonales
Aún no hay calificaciones
Ejercicios de Concordancia, Sujetos e Impersonales
4 páginas
Centros de Apoyo a la Percepción Auditiva
Aún no hay calificaciones
Centros de Apoyo a la Percepción Auditiva
12 páginas
Expresiones No Verbales en Opinión Pública
Aún no hay calificaciones
Expresiones No Verbales en Opinión Pública
15 páginas