Procesadores Superescalares y Supersegmentados

Los procesadores superescalares utilizan múltiples cauces de instrucciones independientes para procesar varias instrucciones simultáneamente, mejorando así la velocidad y el paralelismo en la ejecución. Este enfoque permite la emisión y finalización de instrucciones en un orden diferente al del código original, utilizando técnicas como el renombramiento de registros para manejar dependencias. A pesar de sus ventajas, los procesadores enfrentan desafíos como excepciones imprecisas y la necesidad de gestionar adecuadamente las dependencias de datos.

Cargado por

nfaccipieri

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como TXT, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

38 vistas3 páginas

Procesadores Superescalares y Supersegmentados

Cargado por

nfaccipieri

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como TXT, PDF, TXT o lee en línea desde Scribd

Procesador escalar --> Trabajan con una ejecución secuencial: captan una

instrucción, la decodifican, la ejecutan y cuando termina la ejecución, captan la

segunda instrucción y así sucesivamente.
Luego aparece el segmentado de cause: nuevas operaciones pueden iniciarse mientras
otras están en proceso. Por ejemplo si una instrucción tiene 5 etapas y una
instrucción está en la etapa de decodificación, podemos captar otra instrucción y
así sucesivamente. Es una técnica que nos permite aprovechar mejor el hardware, la
corrida del programa es más rápida pero la velocidad de corrida de una instrucción
es la misma.
Con la necesidad de tener o querer mayores prestaciones, es decir tener máquinas
que corran programas más rápidamente, dieron lugar a la evolución de diseños de
cauces segmentados y surgieron dos técnicas de ejecución de mayores prestaciones:
los procesadores *Supersegmentados* y los *Superescalares*
*ENFOQUE SUPERSEGMENTADO:*
-> Muchas operaciones o etapas no necesitan un ciclo de reloj entero,
por ende puedo dividir ese ciclo en partes y asignárselo a la etapa que
corresponda, es decir puedo usar ese ciclo de reloj (dividido) y asignarlo a
distinto hardware. De esta manera estamos acelerando o adelantando la
corrida/ejecución de las instrucciones (al igual que en la segmentación de cause,
el tiempo para las instrucciones individuales no varía, es decir que tardan lo
mismo) dándonos una mayor frecuencia de ciclo de reloj, de esta forma las etapas de
las instrucciones se transforman en subetapas más pequeñas (por ende más rápidas) y
se transmiten los datos a la mayor velocidad del ciclo de reloj. Este enfoque nos
da un aumento del grado de paralelismo, voy a tener en forma simultanea diferentes
instrucciones que no necesariamente ocupan un ciclo de reloj dado que ahora está
subdividido e incrementa la aceleración percibida (el programa va a correr más
rápido)
*ENFOQUE SUPERESCALAR:* Está pensado para mejorar la velocidad de ejecución
de las instrucciones escalares. Un procesador superescalar usa múltiples cauces de
instrucciones independientes y nos permite procesar más de una instrucción a la
vez. Este enfoque nos da un mejor aprovechamiento del _paralelismo en las
instrucciones_ (grado en que las instrucciones de un programa pueden ejecutarse en
paralelo, es decir que son independiente). Esta mejora conlleva la duplicación de
algunas partes de la CPU/ALU para poder captar múltiples instrucciones, ejecutar
sumas y multiplicaciones y ejecutar carga/almacenamiento al mismo tiempo. La
aceleración de la máquina aumenta dado que se ejecutan más instrucciones en
paralelo.
-> *Limitaciones:* Dependencia de datos verdadera (RAW), dependencia
relativa al procedimiento (de saltos), conflictos en los recursos, dependencia de
salida (WAW), anti-dependencia (WAR).

Paralelismo de máquina: Es una medida de la capacidad del procesador para sacar

partido al paralelismo en las instrucciones. El paralelismo de la máquina depende
del número de instrucciones que pueden captarse y ejecutarse al mismo tiempo, del
numero de unidades funcionales y de los mecanismos que usa el procesador para
localizar instrucciones independientes (se utilizan compiladores "inteligentes" que
ven el programa y armar grupos de instrucciones que pueden correr o ejecutarse
simultáneamente sin perder cuidado con los problemas de dependencias de datos que
pueden aparecer al reordenar el código).
El procesador tiene que ser capaz de identificar el paralelismo en las
instrucciones y cuando localiza las instrucciones independientes debe tener en
cuenta: el orden en que se captan las instrucciones, el orden en que se ejecutan y
el orden en que las instrucciones actualizan los contenidos de los registros y de
las posiciones de memoria. Cuanto más sofisticado sea el procesador, menos limitado
estará por la relación entre este ordenamiento.
*Política de emisión de instrucciones:*
*Emisión en orden y finalización en orden:* Se emiten instrucciones en el
orden exacto en que lo haría una ejecución secuencial (emisión en orden) y escribir
los resultados en ese mismo orden (finaliza en orden). Es decir que si tengo una
instrucción 1 que tarda 2 ciclos de reloj y una instrucción 2 que tarda 1 ciclo de
reloj, no voy a poder escribir la instrucción 2 antes que la instrucción 1 dado que
deben finalizar en orden.
*Emisión en orden y finalización desordenada:* La finalización desordenada se
usa en los procesadores RISC escalares. Con esta finalización puede haber cualquier
número de instrucción en la etapa de ejecución en un momento dado, hasta alcanzar
el máximo grado de paralelismo de la máquina ocupando todas las unidades
funcionales. La emisión de instrucciones frena cuando hay una dependencia de datos
o una dependencia relativa al procedimiento. Además surge una dependencia de salida
o escritura-escritura (si ejecuto una instrucción posterior (I2) que escribirá un
valor en un registro que necesitará una instrucción posterior a ella (I3) y todavía
no finalizó una instrucción anterior (I1) que escribirá en ese mismo registro,
sobrescribirá el dato con un valor atrasado y la instrucción posterior a la
posterior (I3) tomará un dato erróneo. Para arreglar esto necesitamos algo más
complejo que la finalización en orden).
*Emisión y finalización desordenada:* Cuando al emisión era ordenada, se
ejecutaban instrucciones hasta que había una dependencia o conflicto. Para poder
emitir de forma desordenada necesitamos desacoplar las etapas del cauce de
decodificación y ejecución (con un buffer llamado ventana de instrucciones). Cuando
un procesador termina de decodificar una instrucción, la coloca en esta ventana.
Mientras el buffer no se llene, el procesador puede seguir captando y decodificando
nuevas instrucciones. Cuando una unidad funcional queda disponible, se puede emitir
una instrucción desde la ventana de instrucciones a la etapa de ejecución.

*RENOMBRE DE REGISTROS:*
Con la emisión desordenada de instrucción y/o finalización desordenada puede
darse el caso de dependencias de salida (WAW) (dos instrucciones intenten escribir
el mismo registro pero la instrucción anterior (I1) tarda más que la posterior
(I2), de esta manera la instrucción anterior y más lenta I1 sobrescribe con un
valor más antiguo el dato que escribió una instrucción posterior I2) y puede darse
también el caso de antidependencias (WAR) (se modifica un valor antes de que una
instrucción anterior lea el dato). Estas dependencias surgen porque los valores de
los registros no pueden reflejar la secuencia de valores dictada por el flujo del
programa, los valores entran en conflicto por el uso de los registros y el
procesador soluciona esto deteniendo alguna etapa del cause. Cuando la ejecución de
una instrucción guarda un resultado en registro, se almacena en un registro nuevo,
a esto se lo conoce como *renombramiento de registros*: el hardware del procesador
asigna *dinámicamente* los registros. Estos están asociados con los valores que
necesitan las instrucciones en diversos instantes de tiempo. Cuando se crea un
nuevo valor de registro, es decir, cuando se ejecuta una instrucción que tiene un
registro como operando destino, se asigna un nuevo registro para ese valor y las
referencias posteriores o sea las instrucciones que accedan a ese valor como
operando fuente, harán referencia a los registros nuevos y de esta manera
solucionaron los problemas de anti-dependencia y dependencia de salida. Sólo quedan
los riesgos de tipo RAW.

*Implementación superescalar*
El hardware que requiere la implementación superescalar tiene ciertos
elementos principales:
Tener bien estudiadas o analizadas las estrategias de captación
simultánea de múltiples instrucciones.
Debe haber una lógica para determinar dependencias verdaderas entre
valores de registros y mecanismos para comunicar esos valores a donde sean
necesarios.
Debe haber un mecanismo para iniciar o emitir múltiples instrucciones
en paralelo.
Recursos para la ejecución en paralelo de multiples instrucciones
(entre ellos: múltiples unidades funcionales segmentadas y jerarquías de memoria
capaces de atender multiples referencias a memoria)
Mecanismos para entregar el estado del procesador en el orden correcto
(es decir que cuando se presentan cosas como pedidos de interrupción debemos tener
un mecanismo que nos devuelva el procesador en el orden correspondiente, o sea sin
alterar los diferentes causes)
El compilador tiene una gran responsabilidad en el aprovechamiento del
procesamiento superescalar porque es el encargado de elegir las instrucciones que
van a correr en forma simultanea y va a tener que manejar las dependencias y
reordenar código.
*Consideraciones*
Cuando se produce una excepción y hay varias instrucciones en ejecución, por
ejemplo una instrucción presenta una excepción y en simultaneo se está ejecutando
otra instrucción, ésta no puede terminar hasta que no se resuelva la excepción de
la primer instrucción. Sin embargo la instrucción que no presentó la excepción pudo
haber modificado ya algún registro o valor y esto nos trae una inconsistencia ->
Estado inconsistente o *excepción imprecisa*. Se debe hacer lo siguiente: las
instrucciones anteriores a la que produjo el problema deben terminar correctamente,
la que origina la excepción y la siguiente se abortan (si la "siguiente" termina
antes que la que origina el problema, no es una finalización definitiva) y la
rutina de tratamiento se comienza por la que originó la excepción. Esto nos asegura
un estado consistente y evitamos que la instrucción siguiente termine antes que la
anterior, si termina antes se aborta o sea vuelve para atrás.
Cuando tenemos interrupciones externas (periféricos): se las llaman
*excepciones precisas*: la unidad de emisión deja de emitir (a la ALU no se le van
a pasar instrucciones para que ejecute) y se cancela la cola, se completan todas
las instrucciones pendientes y comienza el tratamiento de interrupciones.
Existe un compromiso en el funcionamiento de los Superescalares: nos conviene
tener una emisión o ejecución desordenada porque nos permite liberar rápidamente
las ALU (unidades funcionales). También necesitamos completas las instrucciones en
orden así evitamos las excepciones imprecisas (que una instrucción termine antes
que una posterior). La solución que existe para este compromiso es plantear una
*emisión desordenada y finalización ordenada* y así poder solucionar el problema
que nos presentan las excepciones imprecisas. Esta emisión, sumada al
renombramiento de registros nos da como resultado una arquitectura con una mejora
sustancial con respecto a la máquina de base segmentada y aun mejor a la maquina
supersegmentada.

Resumen: un procesador superescalar utiliza multiples causes de instrucciones

independientes, cada cause consta de varias etapas y así puede tratar varias
instrucciones a la vez. Introduce un nuevo nivel de paralelismo que permite que
varios flujos de instrucciones se procesen simultáneamente. Los procesadores sacan
provecho del paralelismo de instrucciones (Que tienen que ver con el grado en que
las instrucciones del programa pueden ejecutarse en paralelo). Una vez que se
identifican las instrucciones independientes, el procesador emite o completa
instrucciones en un orden diferente al del código original. El procesador puede
eliminar ciertas dependencias innecesarias mediante el uso de registros adicionales
y renombramiento. Para RISC el uso del salto retardado para evitar atascos no es
muy apropiado para el caso de Superescalares, se suele usar cualquier otra técnica
como btb (branch target buffer)

También podría gustarte

Segmentación y Procesadores Superescalares
Aún no hay calificaciones
Segmentación y Procesadores Superescalares
6 páginas
Resumen SuperEscalares
Aún no hay calificaciones
Resumen SuperEscalares
2 páginas
Procesadores Superescalares: Estructura y Paralelismo
Aún no hay calificaciones
Procesadores Superescalares: Estructura y Paralelismo
22 páginas
Procesadores Superescalares: Eficiencia y Diseño
100% (1)
Procesadores Superescalares: Eficiencia y Diseño
20 páginas
TEMA 2 Procesadores Superescalares
Aún no hay calificaciones
TEMA 2 Procesadores Superescalares
11 páginas
Procesadores Superescalares: Arquitectura y Funcionamiento
Aún no hay calificaciones
Procesadores Superescalares: Arquitectura y Funcionamiento
36 páginas
Procesadores Superescalares en Arquitectura
Aún no hay calificaciones
Procesadores Superescalares en Arquitectura
31 páginas
ARQII 04-Superescalar
Aún no hay calificaciones
ARQII 04-Superescalar
31 páginas
Paralelismo a Nivel de Instrucción en CPUs
Aún no hay calificaciones
Paralelismo a Nivel de Instrucción en CPUs
13 páginas
Procesadores Superescalares: Microarquitectura y Funcionamiento
100% (2)
Procesadores Superescalares: Microarquitectura y Funcionamiento
143 páginas
2 Proc Superescalares
Aún no hay calificaciones
2 Proc Superescalares
37 páginas
Procesadores Superescalares: Estructura y Funcionamiento
Aún no hay calificaciones
Procesadores Superescalares: Estructura y Funcionamiento
32 páginas
Procesadores Superescalares: Definición y Ejemplo
Aún no hay calificaciones
Procesadores Superescalares: Definición y Ejemplo
8 páginas
Tema 06b - Procesadores Superescalares (II) + Pres ActInd1
Aún no hay calificaciones
Tema 06b - Procesadores Superescalares (II) + Pres ActInd1
40 páginas
Procesadores Superescalares: Arquitectura y Funcionamiento
Aún no hay calificaciones
Procesadores Superescalares: Arquitectura y Funcionamiento
39 páginas
Técnicas de Paralelismo en Procesadores
Aún no hay calificaciones
Técnicas de Paralelismo en Procesadores
17 páginas
Procesadores Superescalares
100% (1)
Procesadores Superescalares
31 páginas
Procesamiento y Paralelismo en CPUs
Aún no hay calificaciones
Procesamiento y Paralelismo en CPUs
13 páginas
Arquitecturas Avanzadas - Parte 1
Aún no hay calificaciones
Arquitecturas Avanzadas - Parte 1
32 páginas
Ac - 4
Aún no hay calificaciones
Ac - 4
8 páginas
Procesadores Superescalares: Claves y Riesgos
Aún no hay calificaciones
Procesadores Superescalares: Claves y Riesgos
6 páginas
Principios de Arquitectura Computacional
Aún no hay calificaciones
Principios de Arquitectura Computacional
4 páginas
Arquitectura de Procesadores Superescalares
Aún no hay calificaciones
Arquitectura de Procesadores Superescalares
20 páginas
Capitulo3 PROCESADORES-SUPERESCALARES
Aún no hay calificaciones
Capitulo3 PROCESADORES-SUPERESCALARES
143 páginas
Workshop 8
Aún no hay calificaciones
Workshop 8
3 páginas
Procesadores Superescalares: Estructura y Funcionamiento
Aún no hay calificaciones
Procesadores Superescalares: Estructura y Funcionamiento
70 páginas
Paralelismo en Procesadores: Segmentación y Superescalares
Aún no hay calificaciones
Paralelismo en Procesadores: Segmentación y Superescalares
10 páginas
Procesadores Superescalares: Estructura y Funcionamiento
Aún no hay calificaciones
Procesadores Superescalares: Estructura y Funcionamiento
60 páginas
Procesadores Superescalares: Eficiencia IPC
Aún no hay calificaciones
Procesadores Superescalares: Eficiencia IPC
58 páginas
Tipos de Paralelismo en Computación
Aún no hay calificaciones
Tipos de Paralelismo en Computación
10 páginas
Monogrfia Procesamiento Superescalar PDF
Aún no hay calificaciones
Monogrfia Procesamiento Superescalar PDF
24 páginas
Notas de Clase 08 Arq08
Aún no hay calificaciones
Notas de Clase 08 Arq08
37 páginas
El Procesamiento en Paralelo
Aún no hay calificaciones
El Procesamiento en Paralelo
4 páginas
Segmentación de Instrucciones
Aún no hay calificaciones
Segmentación de Instrucciones
9 páginas
Arquitectura de Procesadores Superscalar
Aún no hay calificaciones
Arquitectura de Procesadores Superscalar
16 páginas
Procesadores Superescalares (I) - Microarquitecturas y Principios de Funcionamiento - Cap3 - Grupob
Aún no hay calificaciones
Procesadores Superescalares (I) - Microarquitecturas y Principios de Funcionamiento - Cap3 - Grupob
143 páginas
Arquitectura RISC y Pipelining
Aún no hay calificaciones
Arquitectura RISC y Pipelining
49 páginas
Arquitectura y Organización de Procesadores
Aún no hay calificaciones
Arquitectura y Organización de Procesadores
20 páginas
Arquitectura y Organización de Computadoras
Aún no hay calificaciones
Arquitectura y Organización de Computadoras
13 páginas
Paralelismo en Arquitecturas Avanzadas
Aún no hay calificaciones
Paralelismo en Arquitecturas Avanzadas
37 páginas
Paralelismo y Procesadores Superescalares
Aún no hay calificaciones
Paralelismo y Procesadores Superescalares
9 páginas
Procesadores Segmentados en DLX
Aún no hay calificaciones
Procesadores Segmentados en DLX
7 páginas
Ciclo de Ejecución de Instrucciones CPU
Aún no hay calificaciones
Ciclo de Ejecución de Instrucciones CPU
5 páginas
Técnicas Dinámicas de Paralelismo ILP
Aún no hay calificaciones
Técnicas Dinámicas de Paralelismo ILP
11 páginas
Procesadores Modernos y Paralelismo
Aún no hay calificaciones
Procesadores Modernos y Paralelismo
10 páginas
Arquitectura Exp4
Aún no hay calificaciones
Arquitectura Exp4
26 páginas
Mapas Unidad 4
Aún no hay calificaciones
Mapas Unidad 4
18 páginas
Procesadores Superescalares y ILP
Aún no hay calificaciones
Procesadores Superescalares y ILP
42 páginas
Ciclo de Instruccion
Aún no hay calificaciones
Ciclo de Instruccion
1 página
Procesadores ILP: Tipos y Limitaciones
Aún no hay calificaciones
Procesadores ILP: Tipos y Limitaciones
61 páginas
Procesadores Superescalares y VLIW: Práctica 4
Aún no hay calificaciones
Procesadores Superescalares y VLIW: Práctica 4
5 páginas
Arquitectura de Computadoras - Ciclo de Instrucción
Aún no hay calificaciones
Arquitectura de Computadoras - Ciclo de Instrucción
54 páginas
Segmentación de Instrucciones en CPUs
Aún no hay calificaciones
Segmentación de Instrucciones en CPUs
31 páginas
Computadores Supersegmentados
Aún no hay calificaciones
Computadores Supersegmentados
13 páginas
Arquitectura y Funciones del DSP
Aún no hay calificaciones
Arquitectura y Funciones del DSP
59 páginas
Procesadores Superescalares: Conceptos Clave
Aún no hay calificaciones
Procesadores Superescalares: Conceptos Clave
7 páginas
Quiz I Pipeline
Aún no hay calificaciones
Quiz I Pipeline
7 páginas
Arquitectura Superescalar
Aún no hay calificaciones
Arquitectura Superescalar
3 páginas
Plan de Mejoramiento en Lúdica y Danza
Aún no hay calificaciones
Plan de Mejoramiento en Lúdica y Danza
3 páginas
Plan de Reforzamiento en Matemáticas
Aún no hay calificaciones
Plan de Reforzamiento en Matemáticas
5 páginas
Reconquista y Repoblación Ibérica
100% (2)
Reconquista y Repoblación Ibérica
34 páginas
Inteligencia y Personalidad en Educación
0% (2)
Inteligencia y Personalidad en Educación
28 páginas
Currículum Enmanuel
Aún no hay calificaciones
Currículum Enmanuel
1 página
Filosofía de la esperanza en Gabriel Marcel
Aún no hay calificaciones
Filosofía de la esperanza en Gabriel Marcel
3 páginas
La Funcion Del Hijo Esteban Levin
Aún no hay calificaciones
La Funcion Del Hijo Esteban Levin
2 páginas
Análisis del fragmento de "El coronel"
Aún no hay calificaciones
Análisis del fragmento de "El coronel"
3 páginas
6º Grado - 6 Unid - Com - Leemos y Descubrimos La Importancia de Los Ecosistemas
Aún no hay calificaciones
6º Grado - 6 Unid - Com - Leemos y Descubrimos La Importancia de Los Ecosistemas
11 páginas
Programa-Laboratorio de Programacion I 1
Aún no hay calificaciones
Programa-Laboratorio de Programacion I 1
5 páginas
Carta Pizzbur
Aún no hay calificaciones
Carta Pizzbur
3 páginas
Formato de Guión Literario y Técnico
Aún no hay calificaciones
Formato de Guión Literario y Técnico
3 páginas
Actividades con Adverbios y Oraciones
Aún no hay calificaciones
Actividades con Adverbios y Oraciones
4 páginas
Poemas infantiles de Gabriela Mistral
Aún no hay calificaciones
Poemas infantiles de Gabriela Mistral
3 páginas
SM Diapositivas Texto Argumentativo 2022
Aún no hay calificaciones
SM Diapositivas Texto Argumentativo 2022
18 páginas
Importancia de la Toma de Decisiones
Aún no hay calificaciones
Importancia de la Toma de Decisiones
7 páginas
El Viento 2
100% (2)
El Viento 2
5 páginas
Origen y Evolución del Léxico Español
Aún no hay calificaciones
Origen y Evolución del Léxico Español
4 páginas
Teorías del Desarrollo del Lenguaje
Aún no hay calificaciones
Teorías del Desarrollo del Lenguaje
2 páginas
Mapa Conceptual de Vigotsky 4
Aún no hay calificaciones
Mapa Conceptual de Vigotsky 4
1 página
Jesús - Metáfora 7
100% (1)
Jesús - Metáfora 7
7 páginas
TIEMPO DE MIES... TIEMPO DE SIEGA. AlbertoMenéndez (México)
Aún no hay calificaciones
TIEMPO DE MIES... TIEMPO DE SIEGA. AlbertoMenéndez (México)
262 páginas
Cuadernillo de Lectoescritura para Aprender A Leer y Escribir-100-125
Aún no hay calificaciones
Cuadernillo de Lectoescritura para Aprender A Leer y Escribir-100-125
26 páginas
Estudio Proverbios 6 y 9
Aún no hay calificaciones
Estudio Proverbios 6 y 9
7 páginas
Urgencias subjetivas en psicoanálisis
Aún no hay calificaciones
Urgencias subjetivas en psicoanálisis
28 páginas
Análisis del Currículo Educativo en Perú
Aún no hay calificaciones
Análisis del Currículo Educativo en Perú
76 páginas
Google Chrome Trabajo
Aún no hay calificaciones
Google Chrome Trabajo
12 páginas
Propiedades de La Suma
Aún no hay calificaciones
Propiedades de La Suma
20 páginas
Prueba de Matemáticas: Números Reales y Áreas
Aún no hay calificaciones
Prueba de Matemáticas: Números Reales y Áreas
1 página
Fe y Sanidad en Tiempos Difíciles
Aún no hay calificaciones
Fe y Sanidad en Tiempos Difíciles
6 páginas