0% encontró este documento útil (0 votos)

57 vistas4 páginas

Análisis de Rendimiento en Procesadores RISC-V

El documento presenta varios problemas relacionados con el rendimiento de implementaciones de juegos de instrucciones, la optimización de latencias en procesadores, la ejecución de código en RISC-V y el análisis de jerarquías de memoria. Se calculan tiempos de ejecución, CPI y speedup para diferentes implementaciones y se discuten las dependencias en el código, así como las mejoras posibles en la predicción de saltos. Finalmente, se analiza el tiempo medio de acceso a una jerarquía de memoria con caché y se detallan las acciones y tráfico asociado.

Cargado por

chatgptsebi

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

57 vistas4 páginas

Análisis de Rendimiento en Procesadores RISC-V

Cargado por

chatgptsebi

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Ejercicios II

Problema 1
Se tienen dos implementaciones del mismo juego de instrucciones. Hay cuatro clases de
instrucciones: A, B, C y D. La frecuencia de reloj y el CPI de cada implementación se muestran
en la siguiente tabla:

Fr CPI A CPI B CPI C CPI D

1 4 GHz 1 2 3 3

2 2 GHz 1 2 2 3

Dado un programa con 106 instrucciones dividas en las siguientes clases:

o 10% clase A
o 30% clase B
o 40% clase C
o 20% clase D
Calcular tiempo de ejecución en la implementación 1 y en la 2. ¿Qué implementación es la más
rápida? ¿Por cuánto más? Comenta brevemente el resultado en base a los parámetros de cada
una de las implementaciones.

Tcpu1 = 0,625 ms

CPI1 = 2,5

Tcpu2 = 1,05 ms

CPI2 = 2,1

Speedup = 0,6 < 1 La implementación 1 es mejor que la implementación 2. Aunque el CPI de

la implementación 2 es menor que el de la implementación 1, no compensa el hecho de que la
CPU 1 sea el doble de rápida que la CPU 2.

Problema 2

Dado el siguiente código en lenguaje C, y teniendo en cuenta que la variable h se asigna al

registro s2 (registro 18) y que el array A almacena datos de tamaño 4 bytes y que su dirección
base se encuentra en s1 (registro 9):

A[300] = A[300] - h;

¿Cuál es la secuencia de instrucciones RISC-V necesarias para ejecutar esta sentencia en C?

Incluye un comentario junto a cada línea de tu programa que comience con el carácter ‘#’ para
indicar qué hace cada instrucción.

Los elementos del array A son de tamaño palabra, de tipo Word, 4 bytes.

h è s2, dir. base A è s1

lw t0, 1200(s1) # t0 = A[300]

sub t0, t0, s2 # t0 = t0 – s2

sw t0, 1200(s1) # A[300] = t0

Problema 3
Se diseña un procesador con las siguientes latencias para los módulos de la ruta de datos:

Registros
MI ALU BR MD
intermedios

Lectura: 250ps
200ps 10ps 120ps 90ps
Escritura: 300ps

Si podemos mejorar un 15% la latencia de uno de los componentes de la ruta de datos, ¿qué
componente sería? Calcula el tiempo de ejecución en un procesador monociclo, sin y con la
mejora (debes indicar el valor de cada uno de los parámetros de la ecuación). ¿Hay ganancia?
Comenta el resultado.

Si pudiéramos mejorar la latencia de uno de los componentes, sería el de aquél con una
latencia mayor, esto es, la memoria de datos. Por lo tanto, la latencia de la lectura de la
memoria de datos sería 212,5 ps y la escritura 255.

Monociclo, CPI = 1, período de reloj = tiempo ejecución instrucción más lenta

Psin = tiempo que tarda en completarse la instrucción load

Pload = 750 ps

Pstore = 710 ps

Pcon = tiempo que tarda en completarse la instrucción load

Pload = 712,5 ps

Pstore = 665 ps

Speedup = 1,05 > 1 è Hay un poco de ganancia por mejorar la MD.

Problema 4

El siguiente código se ejecuta en el nanoRISC-V segmentado con adelantamiento para riesgos

de datos y de control.

1 loop: lw t1,A(t0)
2 beq t1,zero,end
3 lw t2,B(t0)
4 lw t2,B(t0)
5 add t3,t1,t2
6 sw t3,A(t0)
7 sw t1,B(t0)
8 end: addi t0,t0,4
9 bne t0,s0,loop

Indica las instrucciones que producen dependencias, el número de parones introducidos por la
dependencia y, en su caso, sobre qué registro y entre qué etapas se produce el
adelantamiento. Si suponemos que ya se han realizado los ciclos de llenado, calcula el CPI para
las dos posibles secuencias de instrucciones. ¿Se podría utilizar alguna otra mejora hardware
para reducir el número de parones? Explica en qué consiste dicha mejora y recalcula el CPI
para el mejor y el peor de los casos para las dos secuencias, también debes indicar la ganancia.
nanoRISC-V segmentado con adelantamiento para riesgos de datos y de control

Secuencia 1: tiene 9 instrucciones, por lo tanto, si no se tienen en cuenta los ciclos de

llenado, la secuencia 1 necesita 9 ciclos para completarse.

1 loop:lw t1,A(t0) è RAW 1-2, MèD, 2 pd

2 beq t1,zero,end
è 1 pc
3 lw t2,B(t0)
4 lw t2,B(t0) è RAW 4-5, MèX, 1 pd
5 add t3,t1,t2 è RAW 5-6, MèM, 0 pd
6 sw t3,A(t0)
7 sw t1,B(t0)
8 end: addi t0,t0,4 è RAW 8-9, XèD, 1 pd
9 bne t0,s0,loop
è 1 pc
CPI1 = 1,67

Secuencia 2: tiene 4 instrucciones, por lo tanto, si no se tienen en cuenta los ciclos de

llenado, la secuencia 2 necesita 4 ciclos para completarse.

1 loop:lw t1,A(t0) è RAW 1-2, MèD, 2 pd

2 beq t1,zero,end
è 1 pc
8 end: addi t0,t0,4 è RAW 8-9, XèD, 1 pd
9 bne t0,s0,loop
è 1 pc
CPI2 = 2,25

Con predicción de salto estática. La predicción de salto estática puede ser de salto no
tomado (se comienza a ejecutar la siguiente instrucción, para lo cual necesitamos conocer su
dirección) y de salto tomado (se comienza a ejecutar la instrucción destino de salto, para lo cual
necesitamos conocer su dirección). En el caso del nanoRISC-V pasada la etapa F ya sabemos la
dirección de la siguiente instrucción (PC+4), por lo que ya podríamos comenzar su ejecución.
Sin embargo, hasta que no finaliza la etapa D no conocemos la dirección de la instrucción
destino de salto, por lo tanto, en el caso del nanoRISC-V sólo nos interesa aplicar la técnica de
SALTO NO TOMADO, puesto que es la única forma de eliminar el parón de control que nos
queda. Mejor caso: se aciertan todas las predicciones. Aunque esta posibilidad no sea real, nos
proporciona el mejor CPI para la secuencia. El peor caso sería cuando se fallan todas las
predicciones, como si no se aplicase predicción de salto estática.

CPI1 = 1,44

CPI2 = 1,75

El valor real del CPI1 oscilará entre 1,44 y 1,67.

El valor real del CPI2 oscilará entre 1,75 y 2,25.

Problema 5

Se tiene una jerarquía de memoria con un único nivel de memoria caché que emplea post-
escritura y buffer de escritura. El tiempo de acceso a memoria caché es de 8ns, el tamaño de
bloque es de 24 palabras y la tasa de fallo del 9%. Se trata de post-escritura con ubicación,
siendo el porcentaje de bloques modificados del 8% y una probabilidad de acierto del buffer de
escritura del 92%. Por último, la latencia de acceso a la memoria principal es 98 ns. Haz un
esquema que refleje la relación entre los elementos de la jerarquía de memoria y la CPU y
completa la siguiente tabla indicando el tráfico con el siguiente nivel de la jerarquía. Se deben
indicar claramente las acciones y el orden en que se realizan.

Tipo de acceso Acciones Tráfico siguiente nivel

Calcula el tiempo medio de acceso a dicha jerarquía de memoria.

Tipo de acceso Acciones Tráfico con MP

Acierto de lectura o escritura 1. Leer o escribir 1 palabra en L1 0 palabras

Fallo de lectura o escritura + 1. Traer bloque fallo de MP a L1 24 palabras

reemplazo de bloque limpio 2. Leer o escribir 1 palabra en L1

Fallo de lectura o escritura + 1. Volcar bloque sucio en buffer 24 palabras

reemplazo de bloque sucio + 2. Traer bloque fallo de MP a L1

acierto buffer 3. Leer o escribir 1 palabra en L1

Fallo de lectura o escritura + 1. Volcar bloque sucio en MP 24 + 24 palabras

reemplazo de bloque sucio + 2. Traer bloque fallo de MP a L1

fallo buffer 3. Leer o escribir 1 palabra en L1

Tmem = 221,04 ns

También podría gustarte

Ejercicios II
Aún no hay calificaciones
Ejercicios II
2 páginas
Análisis de MIPS y rendimiento de compiladores
Aún no hay calificaciones
Análisis de MIPS y rendimiento de compiladores
2 páginas
Ejercicios de Procesadores y Compiladores
Aún no hay calificaciones
Ejercicios de Procesadores y Compiladores
2 páginas
Ejercicios de Arquitectura de Computadores
Aún no hay calificaciones
Ejercicios de Arquitectura de Computadores
28 páginas
Examen de Arquitectura de Computadores I
Aún no hay calificaciones
Examen de Arquitectura de Computadores I
5 páginas
Análisis de Ejecución de uOps en Procesadores
Aún no hay calificaciones
Análisis de Ejecución de uOps en Procesadores
9 páginas
Parcial 1 A Cas Sol
Aún no hay calificaciones
Parcial 1 A Cas Sol
7 páginas
Análisis de Pipeline en Procesadores
Aún no hay calificaciones
Análisis de Pipeline en Procesadores
5 páginas
Examen Arquitectura de Computadoras 2021
Aún no hay calificaciones
Examen Arquitectura de Computadoras 2021
1 página
Examen de Arquitectura de Computadoras 2021
Aún no hay calificaciones
Examen de Arquitectura de Computadoras 2021
1 página
Análisis de Compiladores y Procesadores RISC-V
Aún no hay calificaciones
Análisis de Compiladores y Procesadores RISC-V
7 páginas
Optimización de Rendimiento en Programas C
Aún no hay calificaciones
Optimización de Rendimiento en Programas C
9 páginas
Examen de Arquitectura de Computadores I
Aún no hay calificaciones
Examen de Arquitectura de Computadores I
6 páginas
Problemas de Arquitectura de Computadores
Aún no hay calificaciones
Problemas de Arquitectura de Computadores
63 páginas
Comparativa de Rendimiento entre M1 y M2
Aún no hay calificaciones
Comparativa de Rendimiento entre M1 y M2
3 páginas
Examen Sept 07
100% (1)
Examen Sept 07
6 páginas
Optimización de Benchmarks en C
Aún no hay calificaciones
Optimización de Benchmarks en C
9 páginas
Conceptos Clave de Arquitectura de CPU
Aún no hay calificaciones
Conceptos Clave de Arquitectura de CPU
30 páginas
Análisis de Ejecución y Penalización en Procesadores
Aún no hay calificaciones
Análisis de Ejecución y Penalización en Procesadores
39 páginas
Limitaciones de MIPS y Comparación de Procesadores
Aún no hay calificaciones
Limitaciones de MIPS y Comparación de Procesadores
16 páginas
Arquitectura Exp4
Aún no hay calificaciones
Arquitectura Exp4
26 páginas
Instrucciones de Acceso a Memoria RISC
Aún no hay calificaciones
Instrucciones de Acceso a Memoria RISC
9 páginas
Segmentación en Procesadores RISC MIPS
Aún no hay calificaciones
Segmentación en Procesadores RISC MIPS
2 páginas
Análisis de Desempeño en Arquitectura de Computadores
Aún no hay calificaciones
Análisis de Desempeño en Arquitectura de Computadores
2 páginas
Cuellos de botella en rendimiento de memoria
Aún no hay calificaciones
Cuellos de botella en rendimiento de memoria
7 páginas
PAC2
Aún no hay calificaciones
PAC2
19 páginas
Organización y Diseño de la CPU
Aún no hay calificaciones
Organización y Diseño de la CPU
9 páginas
Problemas de Tecnología Informática y Abstracción
Aún no hay calificaciones
Problemas de Tecnología Informática y Abstracción
6 páginas
Soluciones Examen Arquitectura de Computadores
Aún no hay calificaciones
Soluciones Examen Arquitectura de Computadores
8 páginas
Comparativa de Procesadores: Pipeline y Rendimiento
100% (1)
Comparativa de Procesadores: Pipeline y Rendimiento
12 páginas
Análisis de Código MIPS64 y Rendimiento de Chips
Aún no hay calificaciones
Análisis de Código MIPS64 y Rendimiento de Chips
4 páginas
Examen de Arquitectura de Computadores
Aún no hay calificaciones
Examen de Arquitectura de Computadores
5 páginas
Segmentación de Instrucciones
Aún no hay calificaciones
Segmentación de Instrucciones
9 páginas
Velocidad y Tipos de Microprocesadores
Aún no hay calificaciones
Velocidad y Tipos de Microprocesadores
4 páginas
Ejercicios Boletin1sincortocircuitos
Aún no hay calificaciones
Ejercicios Boletin1sincortocircuitos
9 páginas
Examen Parcial: Fundamentos de Computadores
Aún no hay calificaciones
Examen Parcial: Fundamentos de Computadores
2 páginas
Ejercicios
Aún no hay calificaciones
Ejercicios
4 páginas
Ej2 24 Nov 2023 - CLASE
Aún no hay calificaciones
Ej2 24 Nov 2023 - CLASE
2 páginas
Examen Parcial: Fundamentos de Computadores
Aún no hay calificaciones
Examen Parcial: Fundamentos de Computadores
2 páginas
Riesgos de Control en DLX y Optimización
Aún no hay calificaciones
Riesgos de Control en DLX y Optimización
16 páginas
Segmentación y Optimización en Procesadores
Aún no hay calificaciones
Segmentación y Optimización en Procesadores
7 páginas
Ejercicios sobre Procesadores VLIW
Aún no hay calificaciones
Ejercicios sobre Procesadores VLIW
5 páginas
Parcial 1 B Cas
Aún no hay calificaciones
Parcial 1 B Cas
3 páginas
Estructura de Computadores: Análisis y Rendimiento
Aún no hay calificaciones
Estructura de Computadores: Análisis y Rendimiento
3 páginas
3 - Soluciones
Aún no hay calificaciones
3 - Soluciones
38 páginas
Análisis de Máquinas Secuenciales y Encadenadas
Aún no hay calificaciones
Análisis de Máquinas Secuenciales y Encadenadas
5 páginas
Arquitectura y Organización de Procesadores
Aún no hay calificaciones
Arquitectura y Organización de Procesadores
20 páginas
Soluciones Examen Arquitectura de Computadores
Aún no hay calificaciones
Soluciones Examen Arquitectura de Computadores
5 páginas
Examen Extraordinario Estructura de Computadores
Aún no hay calificaciones
Examen Extraordinario Estructura de Computadores
7 páginas
Practica 6 - Cauce y Atascos
Aún no hay calificaciones
Practica 6 - Cauce y Atascos
12 páginas
Examen de Arquitectura de Computadores 2007
Aún no hay calificaciones
Examen de Arquitectura de Computadores 2007
8 páginas
Ejercicios de Paralelismo A Nivel de Instrucción
Aún no hay calificaciones
Ejercicios de Paralelismo A Nivel de Instrucción
10 páginas
6.wuolah Free PEC1
Aún no hay calificaciones
6.wuolah Free PEC1
17 páginas
Lab AC3 Guion
Aún no hay calificaciones
Lab AC3 Guion
10 páginas
ISA y Ejecución en Arquitectura de Computadores
Aún no hay calificaciones
ISA y Ejecución en Arquitectura de Computadores
7 páginas
TP1 2021
Aún no hay calificaciones
TP1 2021
5 páginas
Ejercicios de MIPS64 y técnicas de optimización
Aún no hay calificaciones
Ejercicios de MIPS64 y técnicas de optimización
3 páginas
Solución Examen Arquitectura Computadoras
Aún no hay calificaciones
Solución Examen Arquitectura Computadoras
4 páginas
Planificación Música 8° Básico 2020
50% (2)
Planificación Música 8° Básico 2020
19 páginas
Clase 1 - Introducción Optometria Geriatrica
Aún no hay calificaciones
Clase 1 - Introducción Optometria Geriatrica
30 páginas
El Rol de La IA en El Desarrollo Sostenible y La Seguridad Internacional
Aún no hay calificaciones
El Rol de La IA en El Desarrollo Sostenible y La Seguridad Internacional
2 páginas
Clase 04. SISTEMA TERMODINÁMICO
Aún no hay calificaciones
Clase 04. SISTEMA TERMODINÁMICO
37 páginas
Reglamento General de Investigación08-2024 - OK
Aún no hay calificaciones
Reglamento General de Investigación08-2024 - OK
19 páginas
Estrategia Nacional de Seguridad Vial
Aún no hay calificaciones
Estrategia Nacional de Seguridad Vial
19 páginas
Facultad de Ingenieria - UMSA
Aún no hay calificaciones
Facultad de Ingenieria - UMSA
1 página
Plantilla Estudiante Aula40
Aún no hay calificaciones
Plantilla Estudiante Aula40
4 páginas
Actividad 2 Teorías y Sistemas de La Psicología - Semana 2
Aún no hay calificaciones
Actividad 2 Teorías y Sistemas de La Psicología - Semana 2
9 páginas
Examen Parcial de Precálculo 2024
Aún no hay calificaciones
Examen Parcial de Precálculo 2024
12 páginas
Mapa Mental
100% (1)
Mapa Mental
4 páginas
Cogito Ergo Sum
Aún no hay calificaciones
Cogito Ergo Sum
5 páginas
Viscosidad de Líquidos: Método de Ostwald
Aún no hay calificaciones
Viscosidad de Líquidos: Método de Ostwald
10 páginas
Método Gráfico para Raíces de Ecuaciones
Aún no hay calificaciones
Método Gráfico para Raíces de Ecuaciones
6 páginas
Fundamentos del Pensamiento Político
Aún no hay calificaciones
Fundamentos del Pensamiento Político
12 páginas
TALLER 4 - EJERCICIOS DBO Rev C Sin Solucion
Aún no hay calificaciones
TALLER 4 - EJERCICIOS DBO Rev C Sin Solucion
8 páginas
Tema 51
Aún no hay calificaciones
Tema 51
14 páginas
Bases Biológicas de la Psicología
Aún no hay calificaciones
Bases Biológicas de la Psicología
11 páginas
Proceso y Tipos de Forja de Metales
Aún no hay calificaciones
Proceso y Tipos de Forja de Metales
18 páginas
Taller de Lectoescritura Trabada Fichas Actividades Recursosep BR
Aún no hay calificaciones
Taller de Lectoescritura Trabada Fichas Actividades Recursosep BR
9 páginas
Tarea Práctica 1
Aún no hay calificaciones
Tarea Práctica 1
12 páginas
Pre Básica Hasta 4° Básico Actividades Inteligencia Emocional
Aún no hay calificaciones
Pre Básica Hasta 4° Básico Actividades Inteligencia Emocional
10 páginas
06 CM041 Solución Indicador para Sulfitos
Aún no hay calificaciones
06 CM041 Solución Indicador para Sulfitos
6 páginas
Mapa Conceptual Busqueda de La Informacion
Aún no hay calificaciones
Mapa Conceptual Busqueda de La Informacion
3 páginas
Filosofía: Del Mito al Logos
Aún no hay calificaciones
Filosofía: Del Mito al Logos
5 páginas
I.2.1 Huella de Carbono
Aún no hay calificaciones
I.2.1 Huella de Carbono
22 páginas
Estructura y Diagnóstico Organizacional
Aún no hay calificaciones
Estructura y Diagnóstico Organizacional
168 páginas
El Libro de La Creación
Aún no hay calificaciones
El Libro de La Creación
2 páginas
Clasificación de Sistemas de Finca
Aún no hay calificaciones
Clasificación de Sistemas de Finca
5 páginas
Avanza Pais Partido de Integracion Social
Aún no hay calificaciones
Avanza Pais Partido de Integracion Social
50 páginas