Especulación y Arquitectura de Computadores

El documento describe las técnicas de especulación de hardware utilizadas en procesadores superscalares para ejecutar instrucciones de forma especulativa antes de que se resuelvan las predicciones de saltos. Estas técnicas incluyen el uso de un búfer de reordenación para "deshacer" la ejecución de instrucciones especulativas incorrectas y asegurar que todas las instrucciones se completen en el orden correcto, incluso ante interrupciones. También describe el uso de remapeo de registros como una alternativa al búfer de reorden

Cargado por

e1s1v09092023

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

Modelo preciso de interrupcion…,
Fichero de registros,
Planificación dinámica,
Ejemplo de slti,
Instrucciones largas,
Instrucciones condicionales,
Predicción de saltos,
Cola circular,
Fase de emisión,
Ejemplo de predicción

0% encontró este documento útil (0 votos)

44 vistas9 páginas

Especulación y Arquitectura de Computadores

Cargado por

e1s1v09092023

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

Modelo preciso de interrupcion…,
Fichero de registros,
Planificación dinámica,
Ejemplo de slti,
Instrucciones largas,
Instrucciones condicionales,
Predicción de saltos,
Cola circular,
Fase de emisión,
Ejemplo de predicción

1.

3 Especulación hardware
IDEA: si la BTB predice, las instrucciones predichas podrían no ser válidas si
falla la predicción y habría que “deshacer” lo ejecutado por ellas.
• Son instrucciones especulativas, se está especulando con su ejecución.
• Pero la predicción es vital para el ILP: introducir hardware especial para
“deshacer” o mejor dicho, para que lo hecho por las instrucciones no sea
definitivo hasta que el salto no se haya resuelto. Tal hw se introduce
fácilmente en el algoritmo de Tomasulo (ver esquema de Power PC y Pentium
Pro).
Salto IF IS - - - EX ME WB
Instr predicha 1 IF IS EX ME WB
Instr predicha 2 IF IS EX ME WB ABORTAR: ¡Pero
Instr predicha 3 IF IS EX ME WB los WB y MEM ya
Store: Instr predicha 4 IF IS EX ME han escrito!
Store: Instr predicha 5 IF IS EX ME
Instr predicha 6
Instr predicha 7 IF IS EX ABORTAR: Sin
... IF IS EX peligro (no han escrito
IF IS en Reg ni en Mem)
IF IS

Arquitectura y Tecnología de Computadores. Univ. Sevilla. . ASP2: TEMA 1: Arquitecturas encadenadas avanzadas:
pág 1
• Se generaliza tal hardware para todas las instrucciones: todas las escrituras de
MEM o WB no se hacen en el fich de registros o en caché de datos, sino que
se “apuntan” en un búfer con cierto número de entradas (capacidad de
instrucciones especulativas). Antes se anotaron en la emisión de la instrucción
(fase IS).
o Nº entradas P6 ([Link], P II, P III): 40.
o Para Pentium 4 son 128, pues al ser superencadenado tiene muchas más
instr. en vuelo.
o Para Alpha 21264: 80 entradas.
o El procesador tiene en cada ciclo dos “estados”:
Especulativo: Reflejado en ROB y RS. Es empleado para emitir nuevas
instrucciones.
Confirmado: Reflejado en los registros. Corresponde a la última
instrucción que ha finalizado correctamente. Es el único que existe para
el programador.

Arquitectura y Tecnología de Computadores. Univ. Sevilla. . ASP2: TEMA 1: Arquitecturas encadenadas avanzadas:
pág 2
• Según la predicción sea correcta (o se produzca una interrupción):
o Cuando se descubre que la predicción fue correcta (o no hubo
interrupciones) se escribe definitivamente en fichero de registros o en caché
de datos: se confirma la instrucción (fase “commit”, “completion” CM o
“retired instruction” RET). Se establece un nuevo estado “confirmado” del
procesador.
o Si la predicción fue incorrecta (o surge una interrupción en una instrucción
anterior), se eliminan las instrucciones encoladas (por debajo del salto o de
la instrucción que produjo la interrupción). Se vuelve al último estado
confirmado.
• ROB es cola circular: una instr hace CM sólo cuando las anteriores ya lo han
hecho.
Entrada Instr. Fase por donde va Estado
1 instr 5 EX ejecutando
2 entr. libre
3 instr 1 CM entr. libre
4 instr 2 CM entr. libre
5 instr 3 IS espera dato
6 instr 4 WB ya escribió
• Luego para una instrucción, entre su fase WB (que escribe en ROB) y su fase
CM (escribe en fich Reg) pueden transcurrir muchos ciclos, y mientras otras
Arquitectura y Tecnología de Computadores. Univ. Sevilla. . ASP2: TEMA 1: Arquitecturas encadenadas avanzadas:
pág 3
instrucciones deben leer datos del ROB. Análogamente las Load pueden leer
del ROB (como si fuera un búfer de escritura del caché).
• Además debido a las interrupciones: interesa que toda instrucción termine o
complete en orden: de ahí el nombre de Búfer de Reordenación (“Reorder
Buffer”, ROB). Es decir, el algoritmo de planif. dinámica permite ejecución
fuera de orden (“out-of-order-execution”), y el ROB restablece tal orden:
finalización en orden (“in-order-completion”).
• Desde el punto de vista del cronograma no hay que modificar nada: se sabe
que existe una fase final CM o RET que reordena las instr para que terminen
en orden
• Solamente: si el ROB se llena, la máquina se bloquearía. Típicamente un
superescalar de grado m es capaz de completar o finalizar m instr.

Arquitectura y Tecnología de Computadores. Univ. Sevilla. . ASP2: TEMA 1: Arquitecturas encadenadas avanzadas:
pág 4
1.8 El problema de las interrupciones y la especulación hardware
¿Por qué las interrupciones necesitan finalización en orden? Sea instr. larga
que dará excepción ([Link]. overflow), y queremos modelo preciso de interrupciones
(es decir, como en un procesador secuencial, cuando hay una excepción o
interrupción, todas las instr. anteriores a la que la genera, han finalizado
completamente y las posteriores no han empezado, o al menos no han modificado
el estado de la máquina).
Hay que invalidar todas las instr. posteriores a la larga, antes de atender a la rutina
de interrupción:
Aquí se detecta
Instr anterior 1 IF IS EX ME WB CM la excepción
Instr anterior 2 IF IS EX ME WB CM

Instr larga, con excepción IF IS D1 D2 D3 D4 ME WB

Instr sig. 1 IF IS EX ME WB
Nunca harán
Instr sig. 2 IF IS EX ME WB
CM. WB y
Instr sig. 3 IF IS EX ME WB
MEM han
Store: Instr sig. 4 IF IS EX ME
Store: Instr sig. 5
escrito en
IF IS EX ME
Instr sig. 6 ROB y se
Instr sig. 7 IF IS EX invalidan
IF IS EX
...

Arquitectura y Tecnología de Computadores. Univ. Sevilla. . ASP2: TEMA 1: Arquitecturas encadenadas avanzadas:
pág 5
1.9 Especulación por Renombrado
• Alternativa al ROB: Nº Reg. Físicos> nº Reg. Lógicos.
• Los registros físicos se emplean para guardar los valores
contenidos tanto en las RS como en el ROB y los regs. Lógicos.
• En IS se averigua (“mapea”) a que registros físicos corresponden
los operandos fuentes y se asigna un registro libre para el destino
(evita conflictos WAW y WAR). Se saldrá de IS cuando los registros
contengan operandos válidos y haya UF disponible.
• En WR se escribe el registro destino asignado en IS.
• En CM se mapea el registro lógico destino a su registro físico
correspondiente.
• La forma más sencilla de liberar registros físicos es hacerlo cuando
otra instrucción que tenga el mismo registro lógico como destino
haga commit.

Arquitectura y Tecnología de Computadores. Univ. Sevilla. . ASP2: TEMA 1: Arquitecturas encadenadas avanzadas:
pág 6
• El “remapeo” de registro se usa en MIPS R10000 (Práctica), en
Alpha 21264, P4 …
• El número de registros físicos 40 a 128 dependiendo del
procesador.

Bibliografía básica: Páginas del H&P de la tercera edición: Temas 3 (pag 215-) y
4 (pag 315-). Revistas especializadas (IEEE Micro)

Arquitectura y Tecnología de Computadores. Univ. Sevilla. . ASP2: TEMA 1: Arquitecturas encadenadas avanzadas:
pág 7
1.10 Instrucciones Condicionales o Predicadas.
• Limite a la especulación Hardware: Dificultad en predecir más de un salto por
ciclo ⇒ Necesidad de aumentar nº instrucciones entre saltos.
• Solución: Transformación de dependencias de control en dependencias de
datos.
• Es sobre todo útil para saltos dependientes de datos (if) que son los más
difíciles de predecir.
• Idea: Instrucciones que solo se ejecutan si se cumple una condición. Ejemplo
más simple: CMOVZ Rd,Rf,Rc (equivale a if (¡Rc) Rd=Rf )
• Ejemplo: Rb=abs(Ra):
Addi Rb,Ra,0
Slti Rc,Rb,0
Beqz Rc,sigue
Sub Rb,R0,Rb
Sigue: …
El salto es muy corto y difícil de predecir. Si en sigue hubiera otro salto…
Addi Rb,Ra,0
Sgei Rc,Rb,0 //Rc=0 si Rb<0
Sub Rd,R0,Rb
Cmovz Rb,Rd,Rc
Arquitectura y Tecnología de Computadores. Univ. Sevilla. . ASP2: TEMA 1: Arquitecturas encadenadas avanzadas:
pág 8
Supongamos Predicción NT Errónea:
Adi Rb,Ra,0 I E M W C
Slti Rc,Rb,0 I R R E M W C
Beqz Rc,sigue I R R R R E M W C
Sub Rb,R0,Rb I E E M W (Anulada)
Sigue: … I ….. (Anulada)
I
Versión CMOVZ
Adi Rb,Ra,0 I E M W C
Sgei Rc,Rb,0 I I I E M W C
Sub Rd,R0,Rb I I I E M W C
Cmovz Rb,Rd,Rc I I I I I E M W C
Mayores ventajas en superescalares en que podamos emitir un salto/ciclo.

Arquitectura y Tecnología de Computadores. Univ. Sevilla. . ASP2: TEMA 1: Arquitecturas encadenadas avanzadas:
pág 9

También podría gustarte

Wuolah Free ASD L3
Aún no hay calificaciones
Wuolah Free ASD L3
11 páginas
Ac - 4
Aún no hay calificaciones
Ac - 4
8 páginas
Arquitectura Exp4
Aún no hay calificaciones
Arquitectura Exp4
26 páginas
Procesadores Superescalares
Aún no hay calificaciones
Procesadores Superescalares
39 páginas
Arquitectura Super Escalar PDF
Aún no hay calificaciones
Arquitectura Super Escalar PDF
13 páginas
Resumen T2
Aún no hay calificaciones
Resumen T2
6 páginas
Resumen Arqui1
Aún no hay calificaciones
Resumen Arqui1
20 páginas
Arquitectura de Las Computadoras UNIDAD II G
Aún no hay calificaciones
Arquitectura de Las Computadoras UNIDAD II G
48 páginas
Arquitectura y Funcionamiento de Microprocesadores
Aún no hay calificaciones
Arquitectura y Funcionamiento de Microprocesadores
7 páginas
Clase 1 MICROPROCESADORES 8086 y 8088 - Introducción
Aún no hay calificaciones
Clase 1 MICROPROCESADORES 8086 y 8088 - Introducción
16 páginas
Jenui 2000 006
Aún no hay calificaciones
Jenui 2000 006
7 páginas
Componentes y Arquitectura de Sistemas de Cómputo
Aún no hay calificaciones
Componentes y Arquitectura de Sistemas de Cómputo
10 páginas
Arquitecturas Avanzadas y Comerciales
0% (1)
Arquitecturas Avanzadas y Comerciales
25 páginas
Wuolah Premium EjerciciosTema3ARCOSolucion
Aún no hay calificaciones
Wuolah Premium EjerciciosTema3ARCOSolucion
7 páginas
Manual
Aún no hay calificaciones
Manual
103 páginas
Fundamentos de Arquitectura de Computadoras
Aún no hay calificaciones
Fundamentos de Arquitectura de Computadoras
103 páginas
Programación de Microcontroladores
Aún no hay calificaciones
Programación de Microcontroladores
13 páginas
Quiz I Pipeline
Aún no hay calificaciones
Quiz I Pipeline
7 páginas
Parcial 2 B Cas Sol
Aún no hay calificaciones
Parcial 2 B Cas Sol
7 páginas
Arquitectura y Procesadores Intel
Aún no hay calificaciones
Arquitectura y Procesadores Intel
4 páginas
Cap 3 Arqui - Removed
Aún no hay calificaciones
Cap 3 Arqui - Removed
39 páginas
TiposuPSistemasOperativos
Aún no hay calificaciones
TiposuPSistemasOperativos
51 páginas
AC Tema4
Aún no hay calificaciones
AC Tema4
41 páginas
Arquitectura Del Computador: Ingeniería en Computación
Aún no hay calificaciones
Arquitectura Del Computador: Ingeniería en Computación
15 páginas
Semana 14 - Fisica Electronica y Sistemas Digitales - FISI
Aún no hay calificaciones
Semana 14 - Fisica Electronica y Sistemas Digitales - FISI
61 páginas
Balotario Capitulo 3-4
Aún no hay calificaciones
Balotario Capitulo 3-4
13 páginas
Hardware para Mejorar el ILP
Aún no hay calificaciones
Hardware para Mejorar el ILP
41 páginas
Anexo Clase 06
Aún no hay calificaciones
Anexo Clase 06
16 páginas
DLX y Arquitectura de Pipeline
Aún no hay calificaciones
DLX y Arquitectura de Pipeline
18 páginas
Preguntas para El Segundo Examen de Arquitectura de Computadoras
Aún no hay calificaciones
Preguntas para El Segundo Examen de Arquitectura de Computadoras
40 páginas
Ordi 15 P1
Aún no hay calificaciones
Ordi 15 P1
5 páginas
Arquitectura de Computadoras: Microprocesador - 8086
Aún no hay calificaciones
Arquitectura de Computadoras: Microprocesador - 8086
26 páginas
Organización del CPU y Ciclos
Aún no hay calificaciones
Organización del CPU y Ciclos
37 páginas
Main
Aún no hay calificaciones
Main
20 páginas
Arquitectura de Computadoras: ISA y CU
Aún no hay calificaciones
Arquitectura de Computadoras: ISA y CU
29 páginas
19 Pipelining Hazards
Aún no hay calificaciones
19 Pipelining Hazards
29 páginas
Ventajas y Desventajas del Ensamblador
Aún no hay calificaciones
Ventajas y Desventajas del Ensamblador
32 páginas
Examen Arquitectura Computadores
Aún no hay calificaciones
Examen Arquitectura Computadores
5 páginas
Arquitectura de Computadoras - Algunas Definiciones
Aún no hay calificaciones
Arquitectura de Computadoras - Algunas Definiciones
7 páginas
Wuolah Free Resumen Tema 3
Aún no hay calificaciones
Wuolah Free Resumen Tema 3
16 páginas
LENGUAJE ENSAMBLADOR U1
Aún no hay calificaciones
LENGUAJE ENSAMBLADOR U1
117 páginas
Arquitectura de Los Microprocesadores Intel
Aún no hay calificaciones
Arquitectura de Los Microprocesadores Intel
5 páginas
Tubella, M. (2013) - Arquitectura de Los Sistemas Informáticos. (Págs.56 - 59)
Aún no hay calificaciones
Tubella, M. (2013) - Arquitectura de Los Sistemas Informáticos. (Págs.56 - 59)
4 páginas
Recopilación Test Tema 4
Aún no hay calificaciones
Recopilación Test Tema 4
20 páginas
Diseño de Procesadores
Aún no hay calificaciones
Diseño de Procesadores
482 páginas
Diseo de Procesadores PDF
Aún no hay calificaciones
Diseo de Procesadores PDF
482 páginas
Microprocesadores Savage
Aún no hay calificaciones
Microprocesadores Savage
354 páginas
Wuolah Free ASD L4
Aún no hay calificaciones
Wuolah Free ASD L4
9 páginas
Análisis de Cauce Segmentado DLX
Aún no hay calificaciones
Análisis de Cauce Segmentado DLX
5 páginas
Conversión y Registros en 8086
Aún no hay calificaciones
Conversión y Registros en 8086
9 páginas
Arquitectura CS2010 Simplificada
Aún no hay calificaciones
Arquitectura CS2010 Simplificada
72 páginas
Ordi 15 P2
Aún no hay calificaciones
Ordi 15 P2
6 páginas
Clase 2. El Procesador y Sus Registros Internos
Aún no hay calificaciones
Clase 2. El Procesador y Sus Registros Internos
26 páginas
Procesadores Superescalares: Implementaciones y Microarquitecturas
Aún no hay calificaciones
Procesadores Superescalares: Implementaciones y Microarquitecturas
50 páginas
Unidad III PEAD Equipo
Aún no hay calificaciones
Unidad III PEAD Equipo
25 páginas
Imagen World SASOct4-2021
Aún no hay calificaciones
Imagen World SASOct4-2021
11 páginas
2 Montajes Con Livewire Semáforo Discreto y Termómetro A.O. (Montajes) - SE208
Aún no hay calificaciones
2 Montajes Con Livewire Semáforo Discreto y Termómetro A.O. (Montajes) - SE208
1 página
Examen 2do Parcial-Control Lineal-Minoide de La Cruz Ochoa
Aún no hay calificaciones
Examen 2do Parcial-Control Lineal-Minoide de La Cruz Ochoa
11 páginas
Teoremas de Thevenin y Norton
Aún no hay calificaciones
Teoremas de Thevenin y Norton
29 páginas
Programacion Asignaturas
Aún no hay calificaciones
Programacion Asignaturas
5 páginas
Tipos de Dispositivos Electrónicos
Aún no hay calificaciones
Tipos de Dispositivos Electrónicos
12 páginas
Guía de Reparación de La Fuente de Alimentación Antminer APW8 (EN) - Minería Zeus
Aún no hay calificaciones
Guía de Reparación de La Fuente de Alimentación Antminer APW8 (EN) - Minería Zeus
19 páginas
Unidad I - Partes Del CPU
Aún no hay calificaciones
Unidad I - Partes Del CPU
12 páginas
Clase 1 - Inacap PDF
Aún no hay calificaciones
Clase 1 - Inacap PDF
7 páginas
E 164
Aún no hay calificaciones
E 164
11 páginas
Adf Instrumento
Aún no hay calificaciones
Adf Instrumento
9 páginas
Procedimiento para La Implementación y Configuracion de RET - v3 - Update
100% (1)
Procedimiento para La Implementación y Configuracion de RET - v3 - Update
32 páginas
Manual de Usuario S200 - v1 - 10
Aún no hay calificaciones
Manual de Usuario S200 - v1 - 10
59 páginas
Valores de referencia para ganancia TV
Aún no hay calificaciones
Valores de referencia para ganancia TV
7 páginas
Opi Informática
Aún no hay calificaciones
Opi Informática
17 páginas
ADAHRS IM (woEFIS) 64-000035 I
Aún no hay calificaciones
ADAHRS IM (woEFIS) 64-000035 I
140 páginas
1 3
Aún no hay calificaciones
1 3
3 páginas
Simbolos Valvulas Electronicas
Aún no hay calificaciones
Simbolos Valvulas Electronicas
4 páginas
Catalogo KNX Siemens PDF
Aún no hay calificaciones
Catalogo KNX Siemens PDF
193 páginas
Hoja de Vida Aldemar - Actual1
Aún no hay calificaciones
Hoja de Vida Aldemar - Actual1
7 páginas
Electrónica II: Guía de Curso Académico
Aún no hay calificaciones
Electrónica II: Guía de Curso Académico
9 páginas
Fundamentos del PC: Hardware y Software
Aún no hay calificaciones
Fundamentos del PC: Hardware y Software
3 páginas
Nexus Baliza
Aún no hay calificaciones
Nexus Baliza
1 página
Guía Completa sobre Redes Informáticas
Aún no hay calificaciones
Guía Completa sobre Redes Informáticas
1 página
Accu-214 Informedepráctica
Aún no hay calificaciones
Accu-214 Informedepráctica
18 páginas
CCNA: Conexiones de Sucursales y VPN
Aún no hay calificaciones
CCNA: Conexiones de Sucursales y VPN
67 páginas
U4 Ejercicios Herramientas Medicion
100% (1)
U4 Ejercicios Herramientas Medicion
4 páginas
Curso de Fibra Óptica: LAN y WAN
Aún no hay calificaciones
Curso de Fibra Óptica: LAN y WAN
78 páginas