100% encontró este documento útil (1 voto)
283 vistas17 páginas

Rubricas Wiggings

Este documento describe las rúbricas como herramientas para la evaluación educativa. Explica que las rúbricas definen los criterios y niveles de desempeño para una tarea, lo que ayuda a los estudiantes y evaluadores. También cubre temas como si las rúbricas deberían ser genéricas o específicas, y analiza versus holísticas. Además, discute cómo construir rúbricas basadas en criterios en lugar de indicadores, y cómo los estándares especifican qué tan bien se deben cumplir

Cargado por

Stefani Szymkow
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
283 vistas17 páginas

Rubricas Wiggings

Este documento describe las rúbricas como herramientas para la evaluación educativa. Explica que las rúbricas definen los criterios y niveles de desempeño para una tarea, lo que ayuda a los estudiantes y evaluadores. También cubre temas como si las rúbricas deberían ser genéricas o específicas, y analiza versus holísticas. Además, discute cómo construir rúbricas basadas en criterios en lugar de indicadores, y cómo los estándares especifican qué tan bien se deben cumplir

Cargado por

Stefani Szymkow
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Wiggins, G. (1998) Rbricas para la Evaluacin (captulo 7).

En: Educative Assessment. Designing Assessments to Inform and Improve Student

Performance. San Franciso. Jossey-Bass.


(En castellano: Evaluacin Educativa. Diseando evaluaciones para informar y

mejorar el desempeo de los estudiantes).


Seleccin y traduccin del captulo 7, realizada en el Instituto de Evaluacin Educativa por
Jennifer Vias y Pedro Ravela.
Captulo 7
Rbricas para la Evaluacin
Una de las herramientas ms bsicas para todo evaluador de desempeos es la rbrica. La
rbrica explicita para evaluados y evaluadores qu elementos del desempeo son ms
importantes y cmo el trabajo ser valorado en trminos de calidad relativa.
Las preguntas acerca del diseo y uso de las rbricas son abundantes entre los educadores. En
los captulos anteriores se dieron algunos ejemplos de rbricas apropiadas para varias tareas de
evaluacin y sugirieron que el papel central de las buenas rbricas en la evaluacin, es la
mejora del desempeo a travs del auto-ajuste del evaluado. Este captulo profundiza en
preguntas como:


Las rbricas deberan ser genricas o especficas para cada tarea? Holsticas
(enfocadas en una impresin general) o analticas (enfocadas en un nico
rasgo o criterio)?

A quin estn dirigidas las rbricas? Al principiante que es evaluado o al


evaluador que es veterano en la tarea?

Puede una rbrica dar un puntaje preciso sin brindar inferencias vlidas?

Puede ocurrir que una rbrica anule la creatividad, an cuando ayude al


estudiante a saber lo que se espera de l/ella?

Cmo hace un evaluador para construir una rbrica?

Qu es una rbrica?
La palabra rbrica viene de ruber, palabra del latn que significa rojo. En los tiempos
medievales, una rbrica era un conjunto de instrucciones o un comentario adjunto a una ley o a
un texto litrgico, que tpicamente era escrito en rojo. De este modo, el trmino rbrica lleg
a significar algo derivado de una autoridad que instruye a la gente.
En la evaluacin de estudiantes una rbrica es un conjunto de guas de valoracin y/o
calificacin para evaluar el trabajo de los estudiantes. Las rbricas responden a las siguientes
preguntas:


Con qu criterios debera juzgarse el desempeo?

2


Dnde y qu deberamos buscar para juzgar el logro de un desempeo?

Cmo es el rango de calidades del desempeo?

Cmo podemos determinar en forma vlida, confiable y justa la calificacin que


debera otorgarse y su significado?

Cmo deberan describirse los diferentes niveles de calidad y lo que distingue a un


nivel de otro?

Tpicamente, una rbrica contiene una escala de puntos que es posible asignar al valorar un
trabajo, en un continuo de calidad. Los nmeros altos usualmente se asignan a los mejores
desempeos. En general las escalas utilizan los nmeros 4, 5, o 6 como los puntajes ms altos,
y 1 o 0 como los ms bajos.
Una rbrica ofrece descriptores para cada nivel de desempeo, para permitir una valoracin
ms confiable e imparcial. A veces se usan indicadores dentro de un descriptor, para dar
ejemplos o seales concretas de evidencia para cada nivel. Dado que los descriptores contienen
criterios y a menudo estn referidos a estndares, una buena rbrica hace posible una
distincin vlida y confiable de los desempeos esto es, referida a criterios-. La figura 7.1
ilustra el uso de criterios, descriptores e indicadores en una rbrica para evaluar un ensayo del
ltimo grado del secundario.
Los criterios son las condiciones que cualquier desempeo debe cumplir para ser considerado
exitoso; definen qu significa cumplir con los requisitos de la tarea. Para una tarea intelectual
como escuchar efectivamente, por ejemplo, quizs decidamos establecer dos criterios:
comprender el mensaje (o dar los pasos adecuados para comprenderlo), y hacer que quien
habla se sienta escuchado. Ofrecer indicadores o comportamientos especficos que indican si los
criterios han sido cumplidos o no, resulta en una gua ms especfica. Los indicadores de que un
estudiante est dando pasos para comprender lo que ha odo incluyen, por ejemplo, el tomar
notas, hacer preguntas adecuadas, parafrasear el mensaje, estar atento, y otros por el estilo.
La razn por la que no construimos rbricas a partir de indicadores, que pueden parecer ms
concretos y tiles para estudiantes y evaluadores, es que los indicadores no son infalibles. Los
criterios deben ser logrados; los indicadores son una ayuda, pero un estudiante puede lograr
los criterios sin cumplir con todos los indicadores especficos descriptos. Un indicador dice a los
evaluadores por dnde pueden buscar y qu deberan mirar al valorar un desempeo. Pero
ningn indicador es 100% confiable. Por ejemplo, el estudiante aparentemente atento puede
no estar haciendo esfuerzos para comprender lo que se le dice, mientras que un estudiante que
parece distante del que habla y no toma notas puede, no obstante, estar escuchando
atentamente y comprendiendo lo que se le dice.
Muchas rbricas comenten el error de confiar demasiado en indicadores que son fcilmente
observables pero poco confiables. Debemos tener cuidado y asegurarnos que los criterios que
elegimos son necesarios y suficientes, como conjunto, para asegurar que se logr lo que se
buscaba. Los primeros intentos que los educadores realizan con las rbricas, a menudo pasan
por alto los modos ms difciles de ver pero ms vlidos de evaluar el logro.

Figura 7.1. Rbrica del Colegio Heritage High School de Littleton, Colorado, para
evaluar ensayos de bachilleres

9--8

El rango superior de respuestas satisface los siguientes criterios:


a. Sntesis. La sntesis debe identificar la idea principal [de la lectura].
b. Foco del acuerdo. El acuerdo y/o desacuerdo pueden ser completos o
parciales, pero el escritor debe dejar claro con que est de acuerdo o en
desacuerdo. Especficamente, los trabajos de 9-8 deben discutir la tesis del
autor, no el abuso de sustancias en general.
c. Sustento para el acuerdo / desacuerdo. La fundamentacin debe
proporcionar un anlisis de los argumentos y/o ejemplos relevantes y
concretos.
d. Estilo y coherencia. Estos trabajos tienen un estilo claro, organizacin
general y una progresin del pensamiento. Contienen unos pocos errores
repetidos de uso, gramtica o tipeo.
[Las cuatro frases en cursiva representan las dimensiones que estn siendo
valoradas. Dos de los criterios estn subrayados.]

7.

Esta calificacin es usada para trabajos que cumplen los requisitos bsicos de los
calificados con 9-8, pero tienen menos desarrollo, fundamentacin o anlisis.

6--5

Trabajos de rango intermedio, que omiten o son deficientes en uno de estos cuatro
criterios:
a. Sntesis. La sntesis est ausente o incompleta, solo se lista la tesis del
autor.
b. Foco del acuerdo / desacuerdo. Aquello con lo que quien escribe est en
acuerdo/desacuerdo no es claro o no se relaciona con las propuestas del
autor. Ejemplo: el escritor no usa suficientes frases como "por un lado por
otro lado" [Un indicador].
c. Sustento. El escritor solo contra-afirma; los ejemplos son muy generales o
no distinguibles de los ejemplos en el artculo. El anlisis puede ser pesado,
irrelevante o dbil.
d. Estilo y coherencia. Estos trabajos estn organizados sin demasiado rigor o
contienen errores notables de uso, gramtica o tipeo.

4.

Esta calificacin es usada para trabajos que son algo ms flojos que los trabajos de 65. Tambin un estudiante que escribe su propio ensayo paralelo en un estilo
competente debera recibir un 4.

3--2

Estos trabajos son deficientes en dos o ms criterios. Tpicamente, parafrasean


dbilmente el artculo o tienen serios problemas de organizacin / coherencia. Trabajos
con serios y repetidos errores de uso, gramtica o tipeo deben situarse en este rango.
[Todo este prrafo, como todos los previos, es un descriptor para este punto en la
escala.]

4
Rbricas y Estndares
Una rbrica tambin depende de los estndares. Un estndar especifica que tan bien deben
cumplirse los criterios. Por ejemplo, un estndar para salto alto especifica con precisin qu tan
alto debe ser el salto para ser considerado excelente. Qu tan exitoso fue el estudiante en
cumplir el criterio de sortear la barra? Esa es la pregunta que responden los estndares. El
mero hecho de pasar por encima de la barra el criterio- no es suficiente si la barra est muy
baja y el estudiante quiere saltar a nivel competitivo. Un estndar para salto alto se establece
tpicamente en trminos de las alturas especficas que deben saltarse para calificar para un
campeonato o de las marcas alcanzadas en el pasado por los mejores en la disciplina; por lo
tanto, el estndar se basa en patrones de desempeo real e instancias de desempeo ejemplar.
Estndares Absolutos y Estndares de Desarrollo
Como se indic en el Captulo Cinco acerca de la lgica del diseo de tareas de evaluacin, los
estndares de desempeo se establecen una vez que el logro a alcanzar est claramente
definido y que se han establecido criterios apropiados en relacin a dicha meta. Los criterios se

infieren de la meta, pero los estndares se seleccionan para representar la excelencia en el


desempeo, usando desempeos ejemplares y especificaciones apropiadas.
El ejemplo del salto alto ilustra solamente un sistema de evaluacin s/no. La cocina ofrece un
ejemplo que tambin es simple, pero ms cercano a los mltiples niveles de evaluacin que
caracterizan a la actividad acadmica. Los criterios para cocinar pasta primavera, por ejemplo,
probablemente se relacionan con cosas como el buen sabor y la presentacin, pero podemos
decidir que importa tambin que sea saludable en trminos del contenido de grasa y colesterol.
De estos tres criterios sabor, presentacin y salud- podemos desarrollar tres rbricas
separadas para juzgar el plato de pasta. Ahora supongamos que los espaguetis y los vegetales
estn ordenadamente dispuestos en el plato (buena presentacin) y parcialmente cubiertos por
un crculo de salsa de bajas caloras pero gustosa (saludable y de buen sabor). Hemos cumplido
con los tres criterios.
Supongamos ahora que nuestro plato cumple con los estndares locales de nuestra esposa e
hijos. Pero quizs estos estndares locales no son lo suficientemente altos. Cmo sera
evaluado nuestro plato en un restaurante? O por un crtico de restaurantes? El crtico,
justamente, usara estndares ms exigentes para valorar los tres criterios, que los que
aplicara la mayora de las familias. Si el espagueti est cocido, pero no realmente al dente; si
la presentacin es prolija pero no excepcionalmente interesante; y as en otros aspectos, el
plato puede cumplir e incluso exceder las expectativas familiares, pero resultar totalmente
insatisfactorio en un restaurante de cuatro estrellas. La importancia relativa de cada criterio
puede adems cambiar cuando pasamos del contexto de la cena familiar, a la comida en un
restaurante: la apariencia importa enormemente en un buen restaurante pero es menos
importante en una comida familiar.
Consideremos ahora una evaluacin de escritura. Los criterios a cumplir normalmente refieren a
la claridad de la prosa, a la efectividad de lo dicho, al anlisis en profundidad y cosas por el
estilo, y hay indicadores concretos para estos criterios, como no usar el lenguaje coloquial,

5
emplear imgenes y analogas vvidas o usar la voz pasiva lo menos posible. Sin embargo, como
en el ejemplo del espagueti, hay diferentes grados de cumplimiento de estos criterios. Los
estudiantes cumplen o no los criterios en el continuo de una escala que va de lo ptimo a lo
incompleto. Las diferencias en sus logros constituyen diferentes niveles de desempeo, que son
los puntos de la escala. Estos niveles de desempeo pueden ser valorados en relacin con
contra dos tipos distintos de estndares y en relacin con diferentes expectativas.
Los estndares absolutos (el tipo en que me he estado enfocando hasta ahora, como
desempeos modelo y ejemplares), se establecen de hecho a travs de la descripcin del
puntaje ms alto en la rbrica y, por tanto, a travs de las muestras especficas de trabajo,
elegidas para anclar la rbrica a un estndar de excelencia. En general necesitamos describir
los estndares absolutos, para llegar luego a otro conjunto de estndares que permitan
manejarse con las realidades del desarrollo. Por ejemplo en los deportes, adems de los
modelos del mejor desempeo a los que todos apuntan, estn los estndares para las
Olimpadas, para la universidad, para los equipos del secundario, para los equipos escolares y
dems. Cada uno de estos estndares apunta a qu es un desempeo excelente para el mejor
de esa cohorte.
Una expectativa es otro problema. En lugar de buscar el mejor de la cohorte, se busca el patrn
de desempeo anterior de un grupo o individuo esto es, las normas-. Puede esperarse que un
estudiante salte un metro y medio o ms, o que escriba una redaccin en el nivel 4 o superior,
porque histricamente la gente de su nivel de experiencia y habilidad lo ha hecho.
Los resultados referidos a normas y expectativas difieren en significado de los resultados
referidos a estndares y criterios. Los estudiantes pueden superar las normas y expectativas

pero, aun as, no lograr un desempeo que cumpla el estndar. Por ejemplo, podra decirse que
los estudiantes en el percentil 89 de un test normativo se han desempeado pobremente, si se
los compara con un estndar. Es por esto que muchos educadores desconfan de las pruebas
referenciadas por normas: no muestran cmo se estn desempeando los estudiantes y
profesores cuando se los evala con estndares exigentes y valiosos.
Es crucial ser conciente de las diferencias de significado entre estos trminos, no solo para
disear tareas y rbricas de evaluacin efectivas sino, adems, para que las devoluciones sean
lo ms claras posible. Necesitamos distinguir cundo estamos hablando de estndares o
modelos del mejor desempeo, cundo estamos hablando de estndares de desarrollo y
cundo estamos hablando de expectativas. Cuando decimos que un desempeo est conforme
con el estndar: queremos decir aceptable o ejemplar?; en un grado o cohorte en
particular?; estamos tratando con estndares de desarrollo en grados o cohortes para poder
evaluar el progreso de los estudiantes de principiantes a expertos? En la escritura, por ejemplo,
hay estndares profesionales de nivel internacional establecidos por autores publicados, hay
estndares de nivel de salida del secundario (incluyendo estndares mnimos de aceptabilidad),
y hay estndares de nivel de grado. En cada caso, sin importar qu tan pequeo o amplio sea
el marco de referencia, el estndar absoluto es establecido por los mejores desempeos los
ejemplares-. Por ejemplo, cero defecto por cada milln de partes es un estndar de ingeniera
que quizs nunca se alcance, pero sigue siendo la meta. El mejor desempeo real, el ejemplar,
en la industria automotriz, es de aproximadamente seis defectos por milln.

6
Los estndares absolutos y los criterios se mantienen estables; los estndares de desarrollo
varan de acuerdo al nivel de experiencia y al contexto.
En el trabajo cotidiano en las escuelas, el lenguaje de las rbricas es, usualmente, algo
ambiguo. Los mejores trabajos deben ser persuasivos, organizados y slidos. Pero estas
frases no insinan ni apuntan hacia un estndar especfico.
Es aqu donde entre en escena la importancia de las muestras de trabajos. La rbrica es
necesaria pero no es suficiente para una buena evaluacin y una buena devolucin. Para saber
qu significa realmente el lenguaje de las rbricas, tanto el estudiante como el evaluador
necesitan ver ejemplos de trabajos considerados persuasivos u organizados. Por qu?
Porque la percepcin del estudiantes sobre qu significa cumplir esos criterios y estndares,
puede ser incorrecta.
Por qu necesitamos distinguir entre estndares absolutos, estndares de desarrollo y
expectativas, en lugar de continuar haciendo lo que siempre hicimos poner notas o puntajes
basados en nuestros juicios sobre la excelencia-? Porque las normas y patrones locales no son
confiables como estndares. Puede que el mejor trabajo que una maestra normalmente ve de
sus nios, sea mediocre comparado con el trabajo de los estudiantes de otras escuelas o
regiones. Entonces, cmo nos aseguramos que los estndares locales sean vlidos? Cmo
podemos proteger al estudiante, asegurndole que los trabajos que localmente obtengan alto
puntaje el estndar local- son realmente excelentes? No podemos, a menos que logremos
establecer una relacin entre los estndares locales (a travs de muestras o correlaciones) y
estndares regionales o nacionales.
Un ejemplo concreto de las diferencias entre los criterios y los diferentes tipos de estndares,
aparece en la rbrica en la figura 7.2. Se puede decir, a partir de los criterios de esta rbrica,
si debera ser utilizada para evaluar la capacidad de resolver problemas de los estudiantes de
un curso de matemtica avanzada o para evaluar trabajos de aritmtica de los estudiantes de
quinto grado de primaria?
Como ilustra esta rbrica, los criterios de evaluacin en matemtica sern ms o menos los
mismos para los diferentes grados, pero los estndares de desarrollo y nuestras expectativas
debern ir cambiando en forma apropiada. Si usamos trabajos de clculo sofisticado como
nico estndar, ningn estudiante de aritmtica obtendr, probablemente, una calificacin
superior a 1 (no porque no sepan clculo, sino porque su capacidad para resolver problemas
ser relativamente reciente y limitada, en trminos comparativos), aunque el criterio sigue
siendo el mismo: resuelve el problema con lgica y elaboracin claras y apropiadas. A la
inversa, si decimos que un trabajo excelente en quinto grado es el nico estndar, entonces
todos los estudiantes de matemtica avanzada, salvo algunos muy incompetentes o
descuidados, obtendrn un 6 o un 5.

7
Figura 7.2. Rbrica para Problemas Matemticos Abiertos
Competencia Demostrada

Respuesta Ejemplar:
Puntaje = 6

Da una respuesta completa con una explicacin clara, coherente, no ambigua y


elegante; incluye un diagrama claro y sencillo; se comunica efectivamente con
la audiencia estipulada; muestra comprensin de las ideas y procesos
matemticos involucrados en el problema; identifica todos los elementos
importantes del problema; puede incluir ejemplos y contra-ejemplos; presenta
fuertes argumentos de apoyo.

Respuesta Competente:
Puntaje = 5

Da una respuesta bastante completa con explicaciones razonablemente claras;


puede incluir un diagrama apropiado; se comunica efectivamente con la
audiencia estipulada; muestra comprensin de las ideas y procesos
involucrados en el problema; identifica los elementos ms importantes del
problema; presenta slidos argumentos de apoyo.
Respuesta Satisfactoria

Completa el problema satisfactoriamente, pero la explicacin puede ser


Con Errores Menores Pero
confusa; la argumentacin puede ser incompleta; el diagrama puede ser
Satisfactoria:
inapropiado o poco claro; comprende las ideas matemticas subyacentes; usa
Puntaje = 4
las ideas en forma efectiva.

Con Errores Serios Pero


Casi Satisfactoria:
Puntaje = 3

Comienza el problema apropiadamente pero puede no lograr completarlo u


omitir partes significativas del problema; puede no lograr mostrar una
comprensin completa de las ideas y procesos matemticos implicados; puede
cometer errores de clculo serios; puede hacer mal uso o no lograr usar
trminos matemticos; la respuesta puede reflejar una estrategia inapropiada
para resolver el problema.
Respuesta Inadecuada

Comienza, Pero Falla en


Completar el Problema:
Puntaje = 2

La explicacin no es comprensible; el diagrama puede no ser claro; no muestra


comprensin de la situacin planteada en el problema; puede cometer errores
de clculo importantes.

Incapaz de Comenzar
Efectivamente:
Puntaje = 1

Las palabras usadas no reflejan el problema; los dibujos distorsionan la


situacin planteada en el problema; no logra indicar qu informacin es
apropiada.

No hay Intento:
Puntaje = 0

Por tanto, necesitamos tanto estndares de desarrollo como estndares absolutos, para educar
a los estudiantes sobre la excelencia real. El valor de anclar el trabajo en estndares absolutos
es fcil de ver cuando las rbricas son longitudinales, o de desarrollo, y los criterios de las
rbricas se articulan con los estndares de desarrollo, como en el ejemplo de la Figura 7.3.
Obviamente no hay ningn problema con estar en un nivel bajo en una rbrica de desarrollo, si
el estudiante es principiante; sin embargo, si el estudiante tiene aos de experiencia pero sigue
desempendose como principiante, debera esperarse un desempeo mejor. Por ejemplo, no
tiene sentido decir que principiantes en Alemn I deben obtener notas bajas porque no tienen
tanta fluidez como los estudiantes Alemn IV. (Esta idea es crucial para el argumento de no
traducir los puntajes de desempeo a calificaciones con letras, ver Captulo Nueve.)

Figura 7.3 Rubrica del desarrollo de niveles de habilidades de lectura de K-12


Nivel

El alumno debera ser capaz de:

Usar imgenes, smbolos o letras aisladas, palabras o frases, para comunicar significados.

Producir, en forma independiente, piezas de escritura utilizando frases completas, algunas con letras
maysculas, puntos o signos de pregunta.
Estructurar secuencias de eventos reales o imaginarios en forma coherente y cronolgica.
Escribir historias que muestren comprensin de los rudimentos de la estructura de una historia,
estableciendo un comienzo, personajes y uno o ms eventos.
Producir escritura simple, coherente y no cronolgica.

Producir, en forma independiente, piezas de escritura utilizando frases completas, principalmente


distinguidas con letras maysculas, puntos o signos de pregunta.
Desarrollar la escritura cronolgica, comenzando a utilizar un rango de conjunciones de frases ms
amplio que y y entonces.
Escribir historias ms complejas, con detalles ms all de los eventos simples, y con finales definidos.
Comenzar a revisar y reescribir, consultando al educador u otros nios, prestando atencin al
significado y la claridad, adems de revisar cosas como el uso correcto de los tiempos y pronombres.

Producir piezas de escritura en las que haya un intento rudimentario de presentar los temas de modo
estructurado (ttulo, prrafos, versos), en los que la puntuacin sea generalmente precisa, y en los que
exista evidencia de la habilidad de hacer que el significado resulte claro a los lectores.
Escribir historias que tengan un comienzo, espacio, personajes, una serie de eventos y una resolucin.
Organizar en forma ordenada la escritura no-cronolgica.
Comenzar a utilizar algunas estructuras de oraciones diferentes de aquellas ms caractersticas del
lenguaje hablado (por ejemplo, las oraciones subordinadas).
Intentar revisar independientemente la propia escritura y hablar sobre los cambios realizados.

Escribir en variedad de formatos (notas, cartas, instrucciones, historias, poemas) para un rango de
propsitos distintos (para planear, informar, explicar, entretener, expresar actitudes o emociones).
Producir piezas de escritura en las que haya un intento ms exitoso de presentar un tema simple de
modo estructurado, por ejemplo, a travs de la composicin, ttulos, prrafos, en que la puntuacin sea
usada casi con precisin, y en que los usos simples de la coma se dominen exitosamente.
Escribir en ingls estndar (excepto en contextos donde las formas no estndar sean apropiadas) y
mostrar una diferenciacin creciente entre el lenguaje escrito y el oral, por ejemplo, utilizando
construcciones que disminuyan la repeticin.
Reunir ideas en papel y mostrar algo de habilidad para realizar un borrador a partir de ellas y luego
reescribir o revisar lo que sea necesario.

Escribir en variedad de formas de un rango de propsitos, mostrando algo de habilidad para presentar
el tema en cuestin de modo diferente para diferentes audiencias especficas.
Hacer uso de las caractersticas de los estilos literarios, como la alteracin del orden de las palabras
para hacer nfasis o la repeticin ex profeso de palabras o patrones de oracin.
Mostrar algo de habilidad para reconocer cuando la planificacin, escritura del borrador, reescritura del
borrador y revisin son apropiadas y poder realizar estos procesos.

9
Continuacin
7

Producir piezas de escritura bien estructuradas, algunas de las que manejan temas ms demandantes,
como ser el ir ms all de la experiencia de primera mano.
Hacer un uso ms seguro y selectivo de un rango ms amplio de posibilidades gramaticales y lxicas,
de acuerdo al tema y la audiencia.
Mostrar una conciencia creciente de que el primer borrador es maleable, por ejemplo, cambiando la
forma en que se escribe (de la historia al juego), o alterando las oraciones, estructura y posicin.
Escribir, en extensin apropiada, en una amplia variedad de formas, con sentido asegurado de
propsito y audiencia.
Organizar temas complejos clara y efectivamente. Producir piezas bien estructuradas en las que las
relaciones entre prrafos sucesivos se sealen amablemente.
Hacer un uso seguro, selectivo y apropiado de un amplio rango de construcciones gramaticales de
vocabulario extenso. Mantener el estilo elegido consistentemente. Lograr efectos afortunados o
sorprendentes, mostrando evidencia de un estilo personal.
Escribir, con una longitud apropiada, en una amplia variedad de formatos, con un firme sentido del
propsito y la audiencia.

Organizar temas y materias complejas de manera clara y efectiva. Producir piezas de texto bien
estructuradas, en las que las relaciones entre los sucesivos prrafos estn sealadas de manera
amigable.
Hacer un uso seguro, selectivo y apropiado de una amplia gama de construcciones gramaticales y de
un vocabulario extenso. Sustentar de manera consistente el estilo elegido. Lograr efectos elogiosos o
sorprendentes, mostrando evidencia de un estilo personal en la escritura.

Diseo de Rbricas
Las mejores rbricas seguirn una lgica. Esto significa que, aunque no hay una receta
establecida para construir rbricas, necesitamos un mtodo til (aunque no rgido) y
lineamientos; ms importante todava, necesitamos criterios para revisar constantemente la
efectividad del trabajo de diseo que se est llevando a cabo. Los lineamientos del diseo son
como el itinerario de un viajero; los criterios son como las condiciones que el viajero debe
cumplir para tener un viaje que valga la pena. En trminos educacionales, los lineamientos son
como las instrucciones que se dan a los estudiantes para realizar una tarea y los criterios son
como la rbrica que el educador proporciona a los estudiantes para su auto-evaluacin y autoajuste a lo largo del camino.
Las rbricas facilitan la autoevaluacin de los estudiantes. Pero la autoevaluacin es un medio.
Para qu fin? Para el auto-ajuste y el logro de un mejor desempeo y pericia. Ningn
desempeo puede dominarse simplemente siguiendo reglas, itinerarios o recetas. Todo
desempeo complejo se alcanza a travs de la devolucin, referida a criterios y estndares. La
pregunta, llegamos a nuestro destino?, es muy diferente de preguntarse, intentamos tener un
viaje agradable? Aprender requiere devoluciones permanentes (a travs de la evaluacin y la
autoevaluacin), para asegurar que el estudiante obtenga del viaje el impacto que se propuso
el director del paseo (el docente). De la misma manera, una rbrica diseada para valorar el
desempeo de un estudiante debe ser diseada en referencia a criterios y estndares, y a la
autoevaluacin y autoajustes continuos.
Al disear rbricas necesitamos considerar los tipos de rbricas disponibles. Las rbricas
pueden ser holsticas o analticas. La rbrica holstica tiene un solo descriptor general del

10
desempeo como un todo. La rbrica analtica contiene mltiples rbricas que corresponden a
cada dimensin del desempeo que est siendo calificado. Por ejemplo, podemos tener
diferentes rbricas para sintaxis, foco y expresin al escribir, y para precisin de los
clculos y comprensin del mtodo cientfico en la ciencia.
Las rbricas tambin pueden ser genricas, o especficas para un gnero, un tema o una tarea.
Una rbrica genrica juzga un criterio muy amplio, como persuasivo o preciso. Una rbrica

especfica de gnero se aplica a un gnero de desempeo especfico, al interior de una


categora de desempeo amplia (por ejemplo, ensayo, discurso, narrativa o grficas y cuadros).
Una rbrica especfica para un tema tiene criterios referidos a las habilidades relacionadas con
los contenidos o al conocimiento (por ejemplo, informe oral de historia o razonamiento
matemtico). Las rbricas especficas para una tarea refieren a criterios nicos o altamente
especficos, derivados de una tarea en particular.
Finalmente, una rbrica puede enfocarse en un evento o ser longitudinal. En una rbrica
enfocada en un evento, el desempeo se describe en trminos particulares para esa tarea,
contenido y contexto. Una rbrica longitudinal (o de desarrollo) mide el progreso a lo largo del
tiempo hacia un dominio ms general de objetivos educacionales (por ejemplo, capacidad de
lectura o fluidez); el desempeo se evala en un continuo que va de principiante a experto y los
avances se miden en trminos de sofisticacin o nivel de desempeo a lo largo del tiempo.
Asegurando la validez de las rbricas
Recordemos que el aspecto principal de la validez es la cuestin de determinar qu es posible y
razonable inferir a partir de los puntajes o calificaciones. Supongamos que se asigna a los
estudiantes una tarea de escritura de cuentos y la rbrica para evaluar esta tarea pone el
nfasis exclusivamente en la ortografa y en la exactitud gramatical. Las calificaciones o
puntajes podran ser muy precisos porque es fcil contar estos errores-, pero conduciran a
inferencias no vlidas acerca de la habilidad de los estudiantes para escribir historias. No parece
razonable suponer que la precisin ortogrfica est relacionada con la habilidad para escribir un
cuento atractivo, vvido y coherente, que es lo que esta tarea pretende. Por lo tanto, la rbrica
estara valorando con precisin algo que no es lo que queremos evaluar.
El diseo de rbricas, por tanto, debera considerar no slo la validez y lo apropiado de la tarea
propuesta, sino la validez y lo apropiado de los criterios y los descriptores para establecer

distinciones en relacin a esa tarea.


Suponiendo que tenemos una tarea vlida y las capacidades que ella requiere, se enfoca la
rbrica en criterios que evalen dichas capacidades? Suponiendo que hemos logrado definir los
criterios ms apropiados para el objetivo propuesto, han sido identificadas las dimensiones
ms importantes y reveladoras del desempeo?
La rbrica ofrece un modo autntico y efectivo de distinguir entre niveles de desempeo? Los
descriptores para cada nivel de desempeo, estn suficientemente basados en muestras reales
de desempeo de diferente calidad? Estas y otras preguntas son el ncleo de la construccin de
rbricas vlidas.

11

Rbricas holsticas y analticas


La habilidad de disear una rbrica vlida depende mucho de cmo se definen los criterios.
Para comenzar, cuntos criterios pueden necesitarse para describir los rasgos centrales para el
desempeo exitoso de la tarea? Los criterios nos dicen qu buscar para distinguir logro de nologro; los rasgos nos dicen dnde buscarlo.
Por ejemplo, peso e ndice de colesterol son rasgos personales; peso saludable y
colesterol bajo son criterios para la salud. El criterio supone valoraciones: hay un rango de
masa corporal mnima y mxima para ser considerado saludable, y hay cifras por encima de las
cuales se considera que la persona tiene un ndice demasiado alto de colesterol. Pero si
cambiamos el criterio a ser feliz comiendo, el valor del rango de colesterol aceptable puede
cambiar. Para cumplir el criterio de tener un buen estado de salud, debo al menos cumplir con
los criterios establecidos para estos dos rasgos de mi perfil de salud.
Una rbrica analtica asla cada rasgo principal en una rbrica separada junto con sus propios
criterios. A la inversa, una rbrica holstica da una valoracin nica basada en una impresin
general. Pero generalmente es necesario que las rbricas analticas combinen diferentes rasgos
para hacerlas factibles y aplicables. Por ejemplo, expresin, organizacin, foco, estructura de
las oraciones, eleccin de palabras, coherencia, precisin del contenido, adecuacin de los
recursos y referencias y capacidad persuasiva, son criterios adecuados para juzgar los ensayos.
Pero usar 10 rbricas con los criterios que las acompaan, superara incluso a un devoto de las
rbricas. Por cuestiones prcticas, los 10 rasgos podran agruparse en tres rbricas: calidad de
las ideas y argumentos, calidad de la escritura y calidad de la investigacin, por ejemplo. O, en
ciertas instancias, pueden unirse en un nico criterio y rbrica: Se trata de un trabajo
persuasivo? En este caso, los criterios correspondientes a cada uno de los grandes
encabezados, podran servir como indicadores.
La aproximacin holstica puede parecer ms simple, pero puede tambin comprometer la
validez, confiabilidad y calidad de la devolucin al estudiante en nombre de la eficiencia.
Volvamos al ejemplo de la comida. La presentacin es independiente del gusto y de lo
saludable que sea el alimento, y cada una debe evaluarse por separado si queremos hacer
inferencias vlidas de los resultados. Es raro que los tres aspectos vayan en la misma lnea,
estando a la vez todas bien o todas mal. Consideremos la confusin que puede resultar de una
rbrica holstica para un desempeo complejo. Dos trabajos son evaluados como no
persuasivos, pero sus defectos son bastante diferentes. Uno es un texto desordenado, pero
lleno de buenos argumentos. El otro es claro, pero superficial y basado en hechos imprecisos.
Con una rbrica holstica se asignara la misma calificacin a ambos trabajos. La validez y la
calidad de las devoluciones requieren el uso de rbricas analticas.
A veces no resulta claro como calificar con un esquema holstico. La rbrica de evaluacin de
una presentacin oral en la figura 7.4 ilustra el problema. Qu deberamos hacer si un
estudiante establece un buen contacto visual pero no logra convencer acerca la importancia de
su tema? La rbrica nos hara creer que hacer contacto con la audiencia y argumentar sobre la

12
importancia del tema siempre van de la mano. Pero la lgica y la experiencia sugieren lo
contrario.
La confiabilidad tambin se ve amenazada cuando diferentes jueces aplican inconscientemente
diferentes criterios, formndose un juicio impresionista completo usando una rbrica holstica
vaga. Esto es lo que ocurre cuando tanto dos alumnos la misma calificacin en un curso, pero
por motivos muy diferentes. Ninguno lo sabe, salvo el educador y, ciertamente, no lo sabe
quien lee la escolaridad de los alumnos-. Un mismo profesor puede dar a los mismos
estudiantes calificaciones diferentes por cambios en su razonamiento o criterios. Las rbricas
especficas, basadas en criterios claros, distintos y adecuadamente sopesados, sin embargo,
mantienen el proceso de puntuacin consistente y estable, tanto para los estudiantes como
para los evaluadores.

Figura 7.4 Rbrica Holstica para una Presentacin Oral


El estudiante describe claramente la cuestin estudiada y provee razones fuertes para
justificar su importancia. Aporta informacin especfica para apoyar las conclusiones
obtenidas y descriptas. La presentacin es atractiva y la estructura de las frases es
consistentemente correcta. Se hace contacto visual con la audiencia y se mantiene a lo
5- Excelente
largo de la presentacin. Hay fuerte evidencia de preparacin, organizacin y
entusiasmo por el tema. Se utiliza apoyo visual para hacer la presentacin ms efectiva.
Las preguntas de la audiencia son respondidas correctamente con informacin
especfica y apropiada.

4 - Muy
buena

El estudiante describe la cuestin estudiada y provee razones para justificar su


importancia. Aporta una cantidad adecuada de informacin para apoyar las conclusiones
obtenidas y descriptas. La presentacin y la estructura de las frases es generalmente
correcta. Hay evidencia de preparacin, organizacin y entusiasmo por le tema. Se
utiliza apoyo visual. Las preguntas de la audiencia son respondidas con claridad.

3 - Buena

El estudiante describe la cuestin estudiada y las conclusiones son expuestas, pero la


informacin que las apoya no es tan fuerte como en los casos 4 y 5. La presentacin y la
estructura de las frases es generalmente correcta. Hay ciertos indicios de preparacin y
organizacin. Se menciona el apoyo visual. Las preguntas de la audiencia son
respondidas.

El estudiante expone la cuestin estudiada pero no la describe completamente. No


ofrece conclusiones para responder la pregunta. La presentacin y la estructura de las
2 - Limitada frases es comprensible, pero con algunos errores. Falta evidencia de preparacin y
organizacin. El apoyo visual puede no ser mencionado. Las preguntas de la audiencia
son respondidas, pero solo con la respuesta bsicas.

1- Pobre

El estudiante realiza la presentacin sin exponer cul fue la pregunta o su importancia.


El tema no es claro y no se exponen conclusiones adecuadas. La presentacin es difcil
de seguir. No hay seales de preparacin u organizacin. Las preguntas de la audiencia
reciben la respuesta ms bsica o quedan sin responder.
No se intenta realizar ninguna presentacin oral.

13
La figura 7.5 muestra una rbrica analtica que contiene un grupo de cuatro rbricas para
evaluar distintos aspectos de la investigacin cientfica y la resolucin de problemas. Abrir la
rbrica en rasgos no solo hace a la evaluacin ms precisa, sino que adems ensea a los
estudiantes acerca de los resultados deseados.

Figura 7.5 Rbrica analtica para experimentos de ciencias de quinto grado


Diseo del Experimento

Resultados cientficos

El diseo muestra que el estudiante ha analizado el


problema y ha diseado y conducido un
experimento en forma reflexiva e independiente.

El reporte explica con claridad convincente


la solucin al problema. Se utiliza
informacin de otras fuentes u otros
experimentos en la explicacin.

El diseo muestra que el estudiante comprende la


idea bsica del proceso cientfico, conduciendo
experimentos que controlan las variables obvias.

El reporte muestra que el estudiante


comprende los resultados y sabe cmo
explicarlos.

El diseo muestra que el estudiante comprende la


idea bsica del proceso cientfico, pero necesita
algo de ayuda para controlar las variables obvias.

El reporte muestra resultados del


experimento. Las conclusiones alcanzadas
son incompletas o fueron explicadas slo
luego de que se le hicieran preguntas.

El diseo muestra que el estudiante puede conducir


un experimento cuando recibe una cantidad de
ayuda considerable por parte del profesor.

El reporte muestra resultados del


experimento. Las conclusiones a que se
lleg fueron insuficientes, incompletas, o
confusas.

La exposicin presenta un punto de vista


claramente definido que puede ser apoyado
por la investigacin. El inters de la
audiencia fue considerado, ya que hubo
gestos, expresin y contacto visual.

Recoleccin de datos

Expresin Verbal

Los datos fueron recogidos y registrados de modo


ordenado, reflejando con precisin los resultados
del experimento.

Los datos fueron registrados de un modo que


probablemente representa los resultados del
experimento.

Los datos fueron registrados de modo


desorganizado, o slo con asistencia del profesor.

Los datos fueron registrados de modo incompleto,


catico o slo luego de considerable asistencia del
profesor.

La exposicin fue preparada con algo de


ayuda adulta, pero utiliza los resultados del
experimento. El discurso fue lgico y utiliz
gestos, expresin y contacto visual para
clarificar significados.
La exposicin fue dada luego de instruccin
activa por parte de un adulto. Se dio alguna
consideracin fue dada a los gestos, la
expresin y el contacto visual.
La exposicin fue dad despus de recibir
instruccin activa de un adulto.

Rbricas para el dominio de los contenidos


Hoy parecera que la mayora de los educadores prefieren enfocarse en la evaluacin de
habilidades genricas en lugar de enfocarse en la comprensin de los temas especficos de cada
materia. Ciertamente, es ms fcil evaluar las habilidades acadmicas generales y los
resultados pueden generalizarse con mayor facilidad: hablar es hablar, despus de todo, incluso
si el contenido del discurso vara. Mientras tanto, entender que F = m x a , no tiene vinculacin
con entender las leyes de Boyle o el concepto de la irona dramtica. La compresin debe ser
evaluada por separado para cada concepto enseado.

14

Ms importante an, pocos profesores o evaluadores han explorado suficientemente la


pregunta sobre, por ejemplo, qu sirve como evidencia de que ha comprendido F = m x a , y
no se est utilizando la frmula mecnicamente, insertndola sin entenderla, en los tpicos
problemas y ejercicios de los libros de texto? Cmo debemos distinguir la comprensin
superficial de la sofisticada o profunda?
En general, lo nico que se evala es el conocimiento y la aplicacin de una frmula. Pero es
posible distinguir niveles de comprensin, siguiendo la regla bsica que a continuacin se
enuncia: si tenemos muestras de trabajo que representan un rango de desempeos, podemos
desarrollar rbricas.
Por supuesto, para hacerlo bien necesitamos superar nuestra tendencia tradicional a pensar en
trminos dicotmicos (respuestas correctas o incorrectas) cuando lidiamos con contenidos
especficos de la materia. Es fcil pensar la evaluacin del conocimiento que tienen los
estudiantes en trminos de precisin de los hechos y aplicacin de los mismos. Sin embargo,
una vez que consideramos que la comprensin se desarrolla a lo largo del tiempo, y
comenzamos a utilizar trminos como profundidad de la comprensin, podemos hablar de
grados de comprensin de un tema. Podemos graficar el progreso en la comprensin del
estudiante en una escala que va de la comprensin simple y superficial en un extremo, a la
comprensin profunda y sofisticada en el otro.
Rbricas genricas vs. rbricas especficas para cada tarea
Enfrentamos muchas opciones cuando diseamos rbricas y descriptores. Una de ellas es si
utilizar rbricas genricas o rbricas especficas para una tarea. La confiabilidad aumenta
cuando utilizamos una rbrica que es especfica para cierta tarea, y muestras de desempeo
relacionadas con esta tarea. Sin embargo, seguimos teniendo un problema de viabilidad: el
diseo de una rbrica para cada tarea, resulta prohibitivo en trminos del tiempo y energa
requeridos. Y podemos perder de vista nuestro objetivo final.
Una evaluacin slida requiere el uso de un conjunto general de rbricas analticas. Los criterios
en relacin con los cuales evaluamos el desempeo son ms importantes que (y, lgicamente,
previos a) el diseo de cualquier tarea especfica. Y los criterios se relacionan con las metas
generales a lograr, lo que tiende a ser ms amplio que cualquier tarea especfica que utilicemos
en la evaluacin. Es preferible, entonces, utilizar rbricas generales que se enfoquen en
criterios clave relacionados con las metas clave. Por ejemplo, una rbrica para evaluar la
habilidad de un estudiante para argumentar persuasivamente y comprender el contenido
principal de un texto, puede ser aplicable tanto para trabajos escritos y como para exmenes
orales.
Si una rbrica general, aplicada a una tarea especfica, sacrifica notoriamente la especificidad
de la devolucin que se har al estudiante, podemos emplear la opcin intermedia antes
planteada: utilizar criterios generales que no varen de una tarea a otra y utilizar indicadores
especficos para definir mejor los criterios, en funcin de la variacin de las tareas concretas y
de lo que la resolucin de las stas requieran.

15

Desarrollando las primeras rbricas y ms all


Las rbricas no se disean con pura imaginacin y discusin. Se derivan de estndares y de
anlisis de muestras existentes de trabajos de diferente calidad. Una rbrica debera reflejar las
diferencias ms tangibles y apropiadas de calidad entre los desempeos. De qu otro modo
podramos validar nuestras evaluaciones? Despus de todo, las diferencias de calidad
observables aparecieron primero, y la descripcin analtica de esas diferencias, generalizada en
los descriptores de rbricas, vino en segundo lugar. Si procediramos de otro modo, estaramos
adivinando o inventando los criterios y fallaramos en la validacin de nuestro trabajo.
Como dijo Potter Stewart, de la Suprema Corte de Justicia, sobre la pornografa, sabemos que
est all cuando la vemos, incluso si no podemos definirla. De manera similar, podemos apilar
los trabajos de los estudiantes en montones ordenados por calidad decreciente, pero solo
cuando nos detenemos a mirar en qu difieren estos montones y a explicar cuidadosamente las
diferencias, es que empezamos a tener un sentido claro de cules deberan ser los descriptores
para cada pila.
Pero qu hacemos el primer ao? Debemos hacer lo mejor que podamos, basando nuestra
rbrica en nuestra experiencia general de las diferencias en el tipo de desempeo que nos
interesa, en cualquier tarea piloto que hayamos realizado y cualquier muestra que tengamos de
desempeos frente a desafos similares en el pasado. En el comienzo de nuestro trabajo puede
ser necesario depender del lenguaje comparativo y evaluativo. Para una primera rbrica, puede
ser suficiente con lograr expresar con claridad el nivel ms alto de desempeo y luego utilizar el
lenguaje comparativo para describir las debilidades progresivas de los dems niveles de
desempeo. Pero necesitaremos refinar la rbrica, tan pronto como tengamos ms desempeos
para analizar, porque una rbrica es tan buena como la amplitud y profundidad de nuestra
muestra de desempeos, y tan buena como nuestra capacidad para generalizar los resultados
de ordenar los trabajos de nuestros estudiantes. Cada ao trae consigo una muestra ms
diversa y reveladora de desempeos posibles y, con ello, una comprensin ms profunda de las
diferencias ms notorias entre los niveles de desempeo y la sorprendente diversidad de
trabajos posibles dentro de cada nivel.
Esto significa que debemos tener algo de fe en que nuestras muestras de desempeos
ejemplares realmente son ejemplares y en que nuestros criterios se derivan del anlisis de la
excelencia, y no solo de ideas abstractas sobre la excelencia. Esta distincin es el ncleo de la
diferencia entre normas y estndares. Si nos basamos solamente en muestras de productos que
son lo mejor que nuestros nios son capaces de hacer, pero no de lo mejor que es posible que
otros estudiantes y personas hagan, corremos el riesgo de estar construyendo rbricas a partir
de un anlisis de lo mediocre y describiendo indicadores de desempeos meramente
aceptables, mientras decimos que son para el nivel ms alto de desempeo. Imaginen si, por
ejemplo, construysemos los criterios para evaluar la expresin musical, a partir de los mejores
desempeos de personas principiantes. Vern entonces el problema que enfrentamos cuando
comenzamos a evaluar utilizando un rango de trabajos pobres de nuestros estudiantes.

16
Las mejores rbricas dependen de una definicin clara y no controversial de desempeos
ejemplares, lograda a partir de muestras de trabajos ejemplares. Luego se desciende en la
escala desde all.
Resumiendo las Rbricas
Las mejores rbricas son aquellas que:
1. Son lo suficientemente genricas como para relacionarse a las metas generales, ms
all del desempeo en una tarea, pero lo suficientemente especficas como para
permitir obtener inferencias tiles y slidas sobre la tarea.
2. Discriminan entre la validez de los desempeos en forma no arbitraria, evaluando las
caractersticas centrales del desempeo y no solamente aquellas ms fciles de ver,
contar o puntuar.

3. No combinan criterios independientes en una misma rbrica.


4. Se basan en el anlisis de muchas muestras de trabajo y en el rango ms amplio
posible de muestras de trabajo, incluyendo ejemplos vlidos.
5. Para establecer distinciones, se apoyan en el lenguaje descriptivo (cmo se identifica la
calidad o su ausencia) y no en el lenguaje meramente comparativo y evaluativo, como
no tan riguroso como o excelente producto.
6. Proveen una diferenciacin de niveles til y adecuada, que permite juicios
suficientemente buenos, pero no usan tantos puntos en la escala (normalmente no ms
de seis) como para que la confiabilidad resulte amenazada.
7. Usan descriptores que son lo suficientemente ricos como para permitir a los estudiantes
comprender sus calificaciones, auto-evaluarse y auto-corregirse. (El uso de indicadores
hace que las descripciones sean menos ambiguas y ms confiables, brindando ejemplos
de qu reconocer en cada nivel de desempeo. Pero, si bien los indicadores son signos
tiles y concretos de que se cumplen los criterios, los indicadores especficos pueden no
ser confiables o apropiados para todos los contextos).
8. Resaltan la importancia de evaluar el impacto del desempeo (el efecto en funcin del
propsito) en lugar de sobre-recompensar los procesos, los formatos, los contenidos o
la buena fe del esfuerzo realizado.
Las rbricas que cumplen los requisitos tcnicos son:
1. Continuas: El cambio en calidad de al pasar de un punto de la escala a otro es similar:
la diferencia entre el nivel 5 y el nivel 4 es similar que entre el 2 y el 1. Los descriptores
reflejan esta continuidad.
2. Paralelas: Cada descriptor es paralelo a todos los otros en trminos del lenguaje
utilizado en cada frase que define los criterios.
3. Coherentes: Las rbricas se enfocan en los mismos criterios desde el principio hasta el
fin. Aunque los descriptores para cada punto de la escala son diferentes de los que
estn antes y despus, los cambios refieren a la variedad de calidad para el criterio

17
(establecido), no hay cambios en el lenguaje que, explcita o implcitamente, introducen
nuevos criterios o modifican la importancia de los distintos criterios.
4. Adecuadamente ponderadas: Cuando se utilizan mltiples rbricas para evaluar un
evento, hay un adecuado y no arbitrario peso relativo de cada criterio, en relacin a los
dems.
5. Vlidas: Las rbricas permiten inferencias vlidas sobre el desempeo, al punto de que
lo que se califica es lo central al desempeo, y no lo simplemente es fcil de observar y
puntuar. Las diferencias propuestas en calidad deberan reflejar un anlisis de la tarea y
basarse en muestras de trabajo a lo largo de todo el rango de desempeos; describir
las diferencias cualitativas y no cuantitativas entre los desempeos.
6. Confiables: Las rbricas permiten calificar consistentemente, an cuando cambien los
evaluadores o pase el tiempo. Permiten una calificacin confiable, al punto de que el
lenguaje evaluativo (excelente, pobre) y el lenguaje comparativo (mejor que,
peor que), se transforman en lenguaje altamente descriptivo, que ayuda a los
evaluadores a reconocer las caractersticas salientes y distintivas de cada nivel de
desempeo.

También podría gustarte