0% encontró este documento útil (0 votos)
42 vistas24 páginas

Introducción a la Estadística Educativa

Este documento presenta conceptos preliminares sobre estadística y datos. Explica que la estadística se ocupa de recopilar, describir y sacar conclusiones de los datos. Los objetivos de aprendizaje son comprender mejor la estadística, conceptos clave como datos, inferencia, población y muestra, y las funciones de la estadística como descripción, explicación y predicción. Luego define estadística, datos, unidades de análisis, características, observaciones y valores.

Cargado por

Tricia Gómez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
42 vistas24 páginas

Introducción a la Estadística Educativa

Este documento presenta conceptos preliminares sobre estadística y datos. Explica que la estadística se ocupa de recopilar, describir y sacar conclusiones de los datos. Los objetivos de aprendizaje son comprender mejor la estadística, conceptos clave como datos, inferencia, población y muestra, y las funciones de la estadística como descripción, explicación y predicción. Luego define estadística, datos, unidades de análisis, características, observaciones y valores.

Cargado por

Tricia Gómez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Modulo 1

Conceptos preliminares. Estadística y datos


Bienvenido al Módulo 1. En este módulo se inicia nuestra revisión de la estadística, o al menos la
estadística que es pertinente a la evaluación de la educación. Este módulo le permitirá
comprender ciertos conceptos preliminares importantes, necesarios para iniciar el estudio de la
estadística.

Objetivos de aprendizaje:

Al término de este módulo, usted …

 •Comprenderá mejor lo que es la estadística;


 •Comprenderá mejor conceptos clave tales como: datos, inferencia, población y muestra;
 •Distinguirá las principales funciones de la estadística, esto es, descripción, explicación y
predicción.

Estructura del módulo

2.1 Estadística y datos


2.2 Descripción
2.3 Recopilación de datos
2.4 Poblaciones y muestras
2.5 Inferencia
2.6 Explicación y predicción

Estadísticas y datos

¿A qué nos referimos con los términos estadística y datos? En nuestra era inundada de
información, la palabra ‘estadística’ ha llegado a ser casi sinónimo del término ‘datos’; no sólo
datos sin elaborar y desorganizados, sino datos significativos que proporcionan información acerca
de aspectos pertinentes para nuestras sociedades. Para el ciudadano promedio, los medios de
comunicación le proporcionan la mayor parte de esta ‘información estadística’, entre la que se
incluyen ‘estadísticas económicas’, tales como tasas de inflación; ‘estadísticas políticas’,
habitualmente en la forma de encuestas de opinión; ‘estadísticas policiales’, tales como tasas
anuales de delincuencia, etc. Aunque con limitaciones, esta concepción racional de la estadística
es, hasta cierto punto, correcta.

En términos técnicos, “la disciplina de la estadística trata de los principios y procedimientos para
recopilar, describir y sacar conclusiones de los datos” (Freund y Wilson, 1997: 1). La Asociación
Estadística de los Estados Unidos afirma que la estadística es “la ciencia de aprender de los
datos”. En efecto, la estadística nos permite: (1) recopilar datos (proporcionando un conjunto de

1
métodos y reglas para obtener los datos en forma adecuada); (2) describir los datos en forma
directa sobre la base de una población o en forma indirecta a través del uso de una muestra; (3)
apoyar o rechazar explicaciones acerca de la forma en que diferentes elementos del mundo real
se relacionan entre sí; y (4) tratar de predecir sucesos futuros basándonos en los sucesos del
pasado. En este curso trataremos principalmente el tema de la descripción.

Los datos son la materia esencial de la estadística. Lo que llamamos datos son cualquier
información empírica acerca de algún aspecto del mundo real en el cual estamos interesados. En
un lenguaje más técnico, un conjunto de datos “es una colección de valores observados que
representan una o más características de algunos objetos o unidades” (Freund y Wilson, 1997: 1).

Cuadro 1. Características de tres maestros de escuela secundaria.

Maestro Experiencia Calificaciones Método de Salario mensual


(años) enseñanza (US$)
Ali 5 Educación terciaria B 300
Educación
María 36 A 550
secundaria

Lee 22 Educación terciaria C


450

En los datos proporcionados por el cuadro, ¿puede usted identificar cuáles son: (a) unidades, (b)
características, (c) observaciones y (d) valores? Piense independientemente y escriba sus
respuestas antes de continuar. Las respuestas correctas se ofrecen a continuación.

a. Las “unidades de análisis” son en este caso los “profesores” o, más exactamente, los
“profesores de escuelas secundarias de la India”. Las unidades de análisis son aquellas cosas
(objetos o sujetos) sobre los cuales estamos principalmente interesados en obtener información.

b. Cuando hablamos de “características” nos referimos a las características de las unidades de


análisis. Así, las características nos proveen de información acerca de las unidades de análisis o,
en el ejemplo, los profesores secundarios en India. En otras palabras, las características son
“características” de los “profesores secundarios en India”. El cuadro nos provee de información
respecto de cuatro características de los profesores: (i) ‘experiencia’ medida en años de ejercicio
de la profesión docente; (ii) ‘calificaciones’ medidas por el nivel de educación de cada profesor;
(iii) ‘método de enseñanza’ medido por el tipo de método (A, B o C) usado por cada profesor; y
(iv) ‘salario mensual’ medido en dólares.

c. Las observaciones son ‘Ali,’ ‘María’ y ‘Lee.’ Las observaciones son las unidades de análisis
(maestros de escuelas secundarias) ‘observadas’ en el mundo real. Estamos interesados en
comprender a los ‘profesores de educación secundaria de la India’ como categoría general, pero
ello sólo podemos realizarlo a través de la observación de profesores concretos, de carne y hueso
(Ali, María y Lee), quienes poseen características concretas y variadas. Desde la perspectiva de la
estadística no son las observaciones sobre las unidades individuales (‘Ali,’ ‘María’ o ‘Lee) las que
2
son de interés, sino el ‘comportamiento agregado’, es decir, lo que en estadísticas se llama la
‘distribución’ de las observaciones.

d. Finalmente, los ‘valores’ son los resultados concretos obtenidos de las ‘mediciones’ de cada
una de las observaciones respecto de cada una de las características relevantes. En otras
palabras, obtenemos un valor cada vez que medimos las características de un objeto o sujeto. Por
ejemplo, en términos de ‘experiencia’ (una de las características de los maestros que estamos
interesados en medir), Ali tiene un valor observado de ‘5’, María un valor de ‘36’ y Lee un valor de
‘22’; mientras que en términos de ‘calificaciones’, Ali tiene un valor observado de ‘educación
terciaria’, etc. Finalmente, para medir necesitamos lo que en estadísticas se llaman escalas de
medición (explicadas más adelante) y unidades de medición adecuadas, tales como dólares,
metros, tipos de métodos de enseñanza, etc).

Descripción de los datos

Una función principal de la estadística es la descripción de datos. El proceso consta de al menos


tres pasos: recopilación, organización y análisis (o interpretación) de los datos.

1. Se deben recopilar los datos según estrictos procedimientos que minimicen la probabilidad
de error, de modo que los datos recopilados realmente representen lo que se desea describir.

2. Los datos deben estar organizados de modo que permitan su análisis y comparación. Los
estadísticos organizan los datos en lo que denominan ‘distribuciones’ o ‘distribuciones de
frecuencias’ (un tema que trataremos más adelante).

3. Los datos, organizados en forma de distribuciones, deben ser analizados. Para describir una
distribución se requiere usar al menos dos tipos de indicadores: medidas de tendencia central (por
lo general, la ‘media’ o promedio) y medidas de dispersión (por lo general, la desviación
estándar); estos indicadores también se tratarán en la parte III de esta guía.

¿ Puede identificar un artículo, proyecto de investigación o documento relacionado con su trabajo


en que se hayan seguido estas pautas generales para describir los datos?

Recopilación de datos

Los datos necesitan ser primero recopilados antes de poder ser interpretados y transformados en
información útil, sobre cuya base tomar decisiones. La manera en que este procedimiento de
recopilación de datos se lleva a cabo es clave para determinar el posterior valor de cualquier
descripción, explicación y predicción que se realice con dichos datos. Como consumidor de
información, usted no debería olvidar jamás que el modo en que los datos son recolectados es
siempre crítico para su valor posterior como información. Es así de simple: si la base del análisis
es basura, el resultado del análisis, no importa cuán sofisticado, también será basura. Si utilizare,
sin advertirlo, datos recogidos con procedimientos inadecuados, entonces sus conclusiones y
decisiones basadas en el análisis de dichos datos serán igualmente inadecuadas.

3
Desafortunadamente, cuando consumimos información no siempre (y de hecho casi nunca)
tenemos acceso a los métodos utilizados para recoger los datos. Este es un problema serio,
incluso para profesionales de la estadística. Pero esta no es la única “mina” que usted encontrará
en el peligroso campo de la interpretación y uso de información estadística. Lamentablemente, la
manipulación de la información (o ‘estatistipulación’ como la llama Darrel Huff, 1954, p.100), a
pesar de ser tremendamente dañina, es práctica común y, a veces, extremadamente sofisticada.

Poblaciones y muestras

Una distinción crucial en la estadística descriptiva es aquella entre la descripción propiamente tal y
la inferencia. Esta distinción descansa en los conceptos de “población” y “muestra”.

Una población consta del universo de todos los objetos (o sujetos) que nos interesa describir. Una
muestra, como el nombre lo indica, consta sólo de una porción de la población de interés.

El siguiente ejemplo ilustra los conceptos de población y muestra. Supongamos que nos interesa
averiguar qué (distribución de) métodos de enseñanza utilizan los maestros primarios de India. Es
decir, deseamos obtener una descripción de la distribución de los métodos de enseñanza en las
escuelas primarias de India. En este caso, ¿cuál es nuestra población de interés? Nos interesa
conocer una de entre las muchas características de (todos) los maestros primarios de India: sus
métodos de enseñanza.

¿ Cómo podemos obtener la información que buscamos acerca de nuestra población de interés?
En realidad, tenemos dos opciones mutuamente excluyentes. Opción 1: ‘Observar’ a todos los
maestros de escuelas primarias de India y así obtener los datos acerca de los métodos de
enseñanza que utilizan. Opción 2: ‘Observar’ sólo una porción (relativamente pequeña) de los
maestros primarios de India y luego ‘inferir’ de los métodos de enseñanza de estos, los métodos
de enseñanza utilizados por todos los maestros primarios de India. En la jerga estadística, la
opción 1 se denomina realizar un ‘censo’, mientras que la opción 2 consiste en llevar a cabo un
‘muestreo’.

Así, se podría realizar un censo de toda la población de maestros primarios, o bien inferir
información acerca de la población mediante los datos obtenidos sobre la base de una pequeña
porción de los maestros, es decir, sobre la base de una muestra. Para efectuar un censo de toda
la población sería necesario consultar u observar directamente a cada maestro en la India, es
decir, ‘observar’ aproximadamente 2 millones de maestros. Esto significaría un esfuerzo en
extremo costoso. Un censo sería además muy poco eficaz, dado que la alternativa, es decir, llevar
a cabo un muestreo utilizando las técnicas estadísticas adecuadas, nos proveería normalmente de
información bastante confiable y precisa sobre dicha población a un costo muchísimo menor que
el de un censo. Es por esto que los profesionales de la estadística prefieren normalmente el

4
método de muestreo por sobre los censos. Volviendo a nuestro ejemplo sobre la India, no es
necesario consultar a cada maestro primario en India para describir los métodos de enseñanza
que ellos utilizan. Dichos métodos se pueden inferir sobre la base de la observación de sólo unos
cuantos cientos de maestros primarios y luego ‘aplicar’ las conclusiones a toda la población.

Trate de identificar ejemplos de datos recopilados mediante un censo y mediante muestreo que
sean pertinentes a (o que usted utilice frecuentemente) en su trabajo.

Inferencia

Utilizamos una muestra (o múltiples muestras) para recopilar datos cuando resulta relativamente
efectivo desde un punto de vista económico o cuando no es posible acceder a toda la población.
En este caso, las características de la población se infieren sobre la base de los datos obtenidos en
la muestra. En otras palabras, lo que aprendemos sobre la base de la muestra se usa como medio
para describir la población.

Para los reformadores de la educación, la inferencia es un área fundamental de la disciplina de la


estadística, ya que, como se decía antes, normalmente los profesionales favorecen el uso del
muestreo antes que del censo para describir y analizar realidades sociales complejas. De hecho,
buena parte de la información sobre educación que usted utiliza como autoridad responsable se
obtiene mediante la técnica del muestreo, incluyendo prácticamente la totalidad de la
investigación sobre educación llevada a cabo por una variedad de científicos sociales, incluidos
sociólogos, economistas, politólogos, educadores, psicólogos, etc.

El mayor desafío del muestreo consiste en lograr un grado razonable de “confianza” (o


probabilidad) en que las inferencias realizadas acerca de la población sobre la base de la muestra
sean adecuadas. Para tener “confianza” en que una inferencia realizada sobre la base de una
muestra representa adecuadamente a la población, la muestra se debe seleccionar y luego
interpretar siguiendo determinados procedimientos estadísticos estrictos que aseguren un grado
de mínimo de certeza. En otras palabras, se deben recopilar y analizar los datos de la muestra
utilizando métodos que permitan inferir con precisión (o con una probabilidad mínima de error) las
características de la población sobre la base de esa muestra.

La precisión de la inferencia depende, entre otros factores, del tamaño de la muestra. Esta
relación, sin embargo, no es obvia, es decir, la mejor muestra no es la que contiene un mayor
número de observaciones. A medida que la muestra aumenta de tamaño, el costo de recopilar y
analizar la información también aumenta. Hasta cierto punto, podríamos ganar en precisión, pero
pagar demasiado caro por ella. Además, después de determinado punto, el costo de cada
observación se eleva vertiginosamente con respecto a lo que se gana en precisión, que se vuelve
poco o nada. Lo que hacen los estadísticos es determinar el ‘grado de precisión’ que desean para
obtener para sus inferencias (esto es, determinar la probabilidad de error que están dispuestos a
tolerar) y luego emplear procedimientos técnicos para calcular el tamaño de la muestra que
necesitan para lograr dicho objetivo. Se puede lograr un grado de precisión razonablemente alto

5
mediante muestras relativamente pequeñas. Consideremos, por ejemplo, que el tamaño de las
encuestas de opinión de Estados Unidos utilizadas para predecir el resultado de las elecciones
presidenciales nacionales con una exactitud razonable es de poco más de 1.000 observaciones,
para una población en edad de votar cercana a los 200 millones de personas!

Es importante mantener una permanente actitud de escepticismo frente a la información


estadística recibida. Como consumidor de información estadística, usted al menos necesita estar al
tanto de la importancia que el método de selección de una muestra tiene sobre el valor de la
información. Es necesario preguntarse, a lo menos, si dicha información fue producida sobre la
base de una muestra adecuada (normalmente se tratará de una ‘muestra aleatoria,’ es decir, una
muestra en la cual todos los objetos de una población tienen una idéntica probabilidad de ser
seleccionados como parte de la muestra) que es de hecho representativa de la población de
interés.

Por ejemplo, en 1936, en los Estados Unidos, una publicación de amplia circulación predijo que el
demócrata Franklin Delano Roosevelt sería derrotado en la elección presidencial por su oponente
republicano. Roosevelt ganó la elección por un amplísimo margen. El error en la predicción de la
publicación fue resultado del simple hecho de que la encuesta de opinión se había llevado a cabo
por teléfono. En aquellos tiempos, sólo las personas de dinero poseían un teléfono en sus
hogares, por lo que la muestra no era representativa del conjunto de los electores y en cambio
estaba “sesgada” a favor del candidato republicano.

Por razones de tiempo y espacio, a pesar de la enorme influencia que los métodos de inferencia y
muestreo utilizados tienen sobre el valor de la información obtenida, estos temas no son tratados
con suficiente profundidad en esta guía. Para aquellos que tengan un interés en estudiar en
mayor detalle estos importantes temas, Phillips (1996, capítulos 7 y 8) provee una muy accesible
introducción a la inferencia estadística.

Explicación y predicción

Como reformador de la educación, usted no sólo está interesado en la descripción, sino también, y
principalmente, en la relación entre diferentes ‘objetos’ (o ‘variables,’ en la jerga estadística).
Usted quisiera saber qué explica o qué causa la realidad educativa de su país. También desearía
poder, en alguna medida, predecir las consecuencias concretas de las diferentes opciones de
reforma educativa. Por ejemplo, si desea aumentar la matrícula de las niñas en zonas rurales, le
gustaría saber qué elementos o acciones tendrán un efecto positivo en aumentar la matrícula de
las niñas. ¿Construir escuelas más cerca de sus casas? ¿Contratar más maestras del sexo
femenino? ¿Reducir las tasas de delincuencia? La estadística constituye una fuente crucial de
apoyo para identificar estos elementos.

Los profesionales de la estadística miden lo que denominan “correlación” para determinar la


fuerza de la relación entre dos elementos, como el número de maestras mujeres en la escuela y la
6
proporción de niñas matriculadas en zonas rurales, etc. Otra herramienta usada en forma
generalizada para medir las relaciones entre variables es el análisis de regresión. El objetivo del
análisis de regresión no sólo es medir la fuerza de una relación, sino también generar un modelo
de esa relación (llamado “función”), de modo de poder predecir el comportamiento de una cosa
basándose en el comportamiento de la otra. Por ejemplo, se usa la regresión para tratar de
predecir la oferta de maestros sobre la base del pago que ellos reciben. Esta regresión o relación
específica entre salario y oferta de trabajo se usa de manera generalizada en economía y se
denomina “curva de oferta de trabajo”. (En general, la relación entre el precio de un bien y la
cantidad ofrecida y demandad es central en economía y estudiada bajo el título de análisis de
oferta y demanda.)

Es necesario ser siempre muy cautelosos en nuestras conclusiones respecto de explicaciones y


predicciones estadísticas. En el mejor de los casos, la estadística puede establecer lo que los
especialistas llaman una “correlación” entre diferentes elementos (“variables”), es decir,
establecer que los elementos que se están midiendo se comportan como si estuvieran
correlacionados. Por cierto, también puede establecer que no hay ninguna relación entre los
objetos estudiados. Pero la estadística no puede establecer causalidad. En otras palabras, no se
puede inferir causalidad sobre la base de una correlación.

Por ejemplo, si en un país se mediera la relación entre las habilidades aritméticas de los
estudiantes primarios y sus estaturas, se concluiría que existe una correlación positiva entre
habilidades y estatura, o sea, que mientras mayor es la altura del estudiante, mayores son sus
habilidades aritméticas. Ahora, obviamente afirmar que las habilidades aritméticas de un individuo
son consecuencia de su estatura no tiene sentido. Lo que ocurre en este caso es que existe un
tercer factor que es la causa simultánea del aumento de las habilidades aritméticas de los
estudiantes y del aumento en su estatura, este factor es la ‘edad’ de los estudiantes. De modo
que no es que los estudiantes más altos sean mejores para la aritmética, sino que los estudiantes
de más edad son más altos y al mismo tiempo tienen mayores habilidades aritméticas.

Debemos ser muy cuidadosos. La presencia de causalidad sólo podrá sostenerse en forma
razonable luego de haber propuesto una teoría aceptable para explicar la relación meramente
fáctica entre los elementos o ‘variables’. En términos estrictos, aun cuando se haya propuesto una
teoría aceptable para explicar una relación que también parece estar respaldada por los hechos,
ésta será siempre una “hipótesis” en espera de ser, tarde o temprano, rebatida.

Una hipótesis es una afirmación acerca de la relación empírica existente entre dos variables. Una
hipótesis no podrá nunca ser definitivamente comprobada, ya que incluso cuando los hechos del
mundo real nunca han contradicho dicha hipótesis, siempre existe la posibilidad de que ello ocurra
en el futuro. La estadística sólo puede apoyar o rechazar una determinada hipótesis acerca de las
relaciones entre los objetos que nos interesan, pero nunca probarla.

7
Modulo 2

Bienvenido al Módulo 2. Los objetos o unidades de análisis que la estadística intenta medir,
describir, explicar y predecir son llamados “variables” en la jerga estadística. Este módulo intenta
explicar este concepto fundamental.

Objetivos de aprendizaje:

Al término de este módulo, usted …

 Comprenderá mejor el importante concepto estadístico de “variable”;


 Entenderá mejor otros conceptos estadísticos básicos, tales como medición, confiabilidad y
validez, además de tipos de variables (dependientes e independientes, etc);
 Comprenderá mejor los tipos de escalas de medición y su uso.

Lecciones

2.1 Variables y constantes


2.2 Escalas de medición
2.3 Conversión de escalas
2.4 Medición: confiabilidad y validez
2.5 Variables dependientes e independientes

Variables y constantes

En el lenguaje de las ciencias, lo que se trata de describir, explicar y/o predecir —es decir, las
unidades de análisis—se denomina ‘variables’. Naturalmente, también son los objetos (o sujetos)
que se intenta medir. Las unidades de análisis se llaman variables simplemente porque cuando se
observan en el mundo real, sus características ‘varían’ de una observación a otra. En el ejemplo
del Cuadro 1, los maestros son una variable. Cualquier otra cosa (objeto o sujeto) en que
estuviéramos interesados podría ser una variable, como las calificaciones de las pruebas, pago de
maestros, niveles de ingreso, tipos de escuelas y organización escolar, culturas, etc.

Los ‘maestros’ varían según su experiencia, capacitación, métodos de enseñanza y pago, según lo
ilustran Ali, Mary y Lee en el Cuadro 1 de la lección anterior. Pero esto es aplicable a cualquier
realidad educacional. Es decir, las distintas escuelas están organizadas y administradas de manera
diferente, los directores tienen diversos estilos de gestión, al igual que distintos grados de
autoridad, las calificaciones de las pruebas obtenidas por los diferentes estudiantes no son las
mismas, etc. Expresado de manera algo diferente, las características de los elementos que
deseamos medir varían de una observación a otra, porque no todos los maestros ganan lo mismo,
no todos los países invierten lo mismo en educación, no todos los niños obtienen las mismas
8
calificaciones en las pruebas, etc. En las ciencias sociales, prácticamente todos los objetos en los
que podamos estar interesados serán una “variable”. Las “constantes” son extremadamente raras
en las ciencias sociales.

Una ‘constante’, a diferencia de una variable, siempre tiene el mismo valor. En educación no
existen constantes, pero existen varias en física y matemáticas, por ejemplo, la fuerza de
gravedad o el número p (3.14159…). Tal vez el ejemplo clásico de una constante es la velocidad
de la luz (denominada ‘c’), cuyo valor es aproximadamente 300.000 km./seg. en cualquier lugar
del universo en que se mida. Todos los números, por ejemplo 2, 7, 35, etc., también se
denominan ‘constantes’, porque, por definición, siempre tienen el mismo valor; es decir, el
número 7 es una constante porque su valor siempre es 7 y nunca varía.

Una constante, como la velocidad de la luz, se comporta en forma muy diferente a una variable,
como las tasas de matrícula primaria. Estas tasas “varían” de modo significativo según el ingreso
medio de un país, la eficacia de las escuelas, el mercado laboral y la cultura, entre otras cosas. A
diferencia de la tasa de matrícula primaria, la velocidad de la luz es una constante y por lo tanto
siempre mantiene el mismo valor. El cuadro 2 proporciona una estimación de la tasa de matrícula
primaria (variable) y la velocidad de la luz (constante) en algunos países de Latinoamérica

Cuadro 2. Tasas de matrícula primaria y velocidad de la luz Latinoamérica.

País Tasa de Matrícula Velocidad


en Educación Primaria de la Luz
Brasil 89.3% 300,000 km/seg.
Jamaica 98.5% 300,000 km/seg.
Nicaragua 70.9% 300,000 km/seg.
Perú 96.3% 300,000 km/seg.

Existen diversos tipos de variables, discretas y continuas, dependientes e independientes, etc. A lo


largo de esta guía se discuten un buen número de tipos de variables, siempre intentando basar la
discusión en un contexto que les dé un significado concreto. Al final de este módulo se discuten
las llamadas variables dependientes e independientes.

Escalas de medición

Para medir variables necesitamos una “escala de medición”, o simplemente una “escala”. En
términos técnicos, una escala es “un conjunto de reglas para cuantificar o asignar calificaciones
numéricas a una variable determinada” (Tuckman, 1972: 142). En términos más simples, las
escalas son los instrumentos que usamos para ordenar elementos con el objeto de medirlos y
compararlos. En realidad no todas las escalas son numéricas. Diferentes escalas miden distintos
tipos de variables. El nivel de sofisticación de un análisis estadístico depende en buena parte de la
naturaleza de las variables que se desea analizar. Algunas variables no permiten el uso de escalas
9
de medición muy complejas. El tipo de escala que se use determinará también el nivel de
complejidad y sofisticación que podrá alcanzar el análisis estadístico.

Existen cuatro tipos de escalas:

1. Nominal
2. Ordinal
3. De intervalo
4. De razón

Las escalas nominales son las más simples y permiten sólo un limitado análisis estadístico. Las
escalas de razón son las más complejas y permiten el más completo uso del instrumental
estadísticos para su análisis.

Escalas de medición

Escalas Nominales

Las escalas nominales sólo trabajan con información cualitativa que no puede ser ordenada. Este
tipo de escala es la menos informativa de todas. Algunas características cualitativas de las
variables que deseamos medir no pueden ser ‘ordenadas’ de acuerdo a algún criterio de medición,
tales como por ejemplo, nombres de países, regiones o colores. Estas características se refieren
simplemente a “nombres” (de ahí el término variables “nominales”). Por ejemplo, Pakistán, Rusia,
Nicaragua y Fiji son nombres de países y por lo tanto no pueden ser ordenados. En consecuencia,
una escala nominal “no mide, sino que más bien nombra” (Tuckman, 1972, p. 142). Los diferentes
tipos de escuelas de acuerdo a sus fuentes de financiamiento, esto es, públicas, privadas o
mixtas, constituyen otro ejemplo de una variable, esta vez del área de la educación, que sólo
puede ser representada utilizando una escala nominal.

Escalas Ordinales

Una escala ordinal es simplemente un ranking u ordenamiento de objetos, de mayor a menor, por
así decirlo. Por ejemplo, si observamos un mapa del mundo podemos rápidamente ordenar los
cuatro países anteriormente mencionados de acuerdo a su aparente área geográfica. El ranking,
de mayor a menor, sería el siguiente: 1. Rusia; 2. Pakistán; 3. Nicaragua; 4. Fiji. Resulta evidente
que una escala ordinal, al entregarnos información sobre el orden de unos objetos, nos provee de
una mayor información acerca de los objetos observados que una escala nominal. Sin embargo,
una escala ordinal no nos dice nada respecto de las distancias cuantitativas entre los objetos
ordenados. Así, en nuestro ejemplo, la escala ordinal nos entrega información sobre el orden de
las áreas de los países, pero no nos dice exactamente cuánto más grandes son unos países que
otros.

Escalas de Intervalo

Este tipo de escalas nos proveen de información mucho más precisa, a la vez que nos permiten
llevar a cabo mediciones mucho más sofisticadas que las escalas nominales u ordinales. Las
escalas de intervalo no sólo nos informan acerca del orden de unos objetos, sino que también
acerca de las distancias o diferencias numéricas entre dichos objetos. De hecho, estas escalas nos

10
permiten medir y comparar esas distancias o diferencias con precisión. En otras palabras (y de
aquí el nombre de escalas de intervalo), las distancias o ‘intervalos’ de igual tamaño en la escala
son de hecho iguales no importando dónde en la escala se realice la medición. Por ejemplo, los
resultados numéricos de los exámenes académicos pueden ser medidos usando escalas de
intervalo.

Las escalas de intervalo, sin embargo, no poseen una definición única del valor cero. En otras
palabras, el cero es arbitrario en el sentido de que no representa ausencia absoluta de la
característica que se desea medir. En este sentido las escalas de intervalo son equivalentes a
termómetros, en los que el valor cero no representa la ausencia absoluta de calor. En nuestro
ejemplo anterior, si un estudiante obtiene un resultado de cero puntos en un examen, ello
obviamente no significa que el estudiante no sepa absolutamente nada acerca de la materia
evaluada. El comportamiento humano es casi siempre medido utilizando escalas de intervalo.

Escalas de Razón

Las escalas de razón proveen el mayor grado de información posible acerca de los objetos
medidos y permiten las descripciones e inferencias estadísticas más sofisticadas. Este tipo de
escalas se distingue de las de intervalo por que poseen un cero que no es arbitrario, es decir, que
representa la ausencia absoluta de la cualidad que se está midiendo. Ello nos permite comparar
‘razones’ (de ahí el nombre de la escala) o relaciones numéricas del tipo, por ejemplo, “A es tres
veces más pesado que B”, sobre la simple base de que en la escala el valor de A es tres veces
mayor que el de B.

En el ejemplo anterior sobre las áreas geográficas de cuatro países, el valor de dichas áreas en
kms2 podría ser medido utilizando una escala de razón. En este caso un valor de cero significaría
la completa ausencia de área geográfica (¿un país ‘virtual’?). Así, por ejemplo, simplemente
dividiendo el área de Rusia (17,075,200 kms2) por el área de Fiji (18,270 kms2), uno puede
afirmar con certeza que el territorio de Rusia es 935 veces más extenso que el de Fiji. En
educación, las escalas de razón se utilizan, por ejemplo, en el área del financiamiento de la
educación. Por ejemplo, algunos distritos podrían recibir “dos veces” o “tres veces” más dólares
por estudiante que otros.

Trate de explicar con sus palabras las diferencias entre cada una de estas cuatro escalas de
medición. Dé ejemplos de lo que podría medir con cada escala. El tema puede ser algo
complicado. Tómese su tiempo.

Conversión de escalas

Es muy fácil convertir las escalas de alto nivel en escalas de nivel inferior, pero las escalas de nivel
inferior, en general, no se pueden convertir en escalas de nivel superior. Esto nos lleva otra vez a
un importante punto ya planteado: que el nivel de sofisticación del análisis estadístico (es decir,

11
las descripciones e inferencias) que podemos llevar a cabo depende directamente del tipo de
escala que se use; y las escalas de razones permiten un máximo de complejidad.

El tipo de escala que se puede usar no es asunto de gusto, sino que, como ya indicamos, depende
de la naturaleza de la variable con la cual se esté trabajando. Entre los ejemplos que ilustran este
punto se incluyen las variables nominales (tales como tipo de escuela o nombre del país), las
variables ordinales (tamaño del país según su representación en un mapa), las variables de
intervalos (calificaciones de pruebas) y las variables de razón (el área geográfica medida en
kilómetros cuadrados o dólares empleados en la educación).

Medición: confiabilidad y validez

Todas las mediciones se caracterizan por la mayor o menor presencia de dos atributos: (a)
confianza (o qué tan confiable es la medición) y (b) validez (o qué tan válida es una medición).

Una medición es “confiable” si podemos esperar en forma razonable que los resultados de dicha
medición sean sistemáticamente precisos. Esto requiere que el instrumento usado para realizar la
medición (como por ejemplo una prueba o examen a estudiantes) sea confiable. Por ejemplo, una
pistola es por completo confiable si siempre da en el blanco al ser apuntada exactamente en la
misma dirección. En otras palabras, si la bala que dispara siempre da en el punto al cual se
apunta la pistola. O sea, que si la pistola no da en el blanco es porque la persona que la disparó
falló, o sea, no apuntó correctamente.

Una medición es “válida” si mide lo que en realidad trata de medir. Por ejemplo, una prueba de
matemática no es válida para medir el rendimiento de alfabetización de los estudiantes. Tampoco
sería válida una prueba culturalmente sesgada. En el caso de la pistola, si ésta no es apuntada en
la dirección del blanco, sino que fuera de él, simplemente jamás dará en el blanco, por muy
confiable que sea.

El problema de la validez, entonces, consiste asegurarnos de que estamos midiendo lo que


deseamos medir o, de acuerdo con nuestro ejemplo, que estamos apuntando en la dirección
correcta. El problema de la confiabilidad, en cambio, se resuelve utilizando un instrumento preciso
(una pistola en perfecto estado).

Observe que la confiabilidad es una condición necesaria, pero no suficiente para la validez. Así,
para tener confianza de que vamos a dar en el blanco necesitamos una pistola en perfecto estado,
pero esto no es suficiente: además necesitamos apuntar al blanco y no fuera de él. Podemos
medir con precisión, pero si medimos el objeto incorrecto, la información obtenida no será válida
12
para describir o explicar la población. Con sus propias palabras, explique los conceptos de
“confianza” y “validez” de una medición.

Variables dependientes e independientes

Una distinción de particular importancia es aquella entre variables dependientes e independientes.


Los términos “dependiente” e “independiente” se utilizan para representar una relación de
“causalidad” entre dos variables. La relación es la siguiente: el valor de la variable dependiente
‘depende’ del valor de la variable independiente. En otras palabras: la variable independiente
determina, en alguna medida (medida que puede ser mayor o menor), el valor de la variable
dependiente. Utilizando otros términos, la variable independiente “causa” la variable dependiente.
O sea que el comportamiento de la variable dependiente se podría predecir sobre la base del
comportamiento de la variable independiente.

Por ejemplo, consideremos la siguiente hipótesis: un buen maestro causa que los estudiantes
aprendan. En este caso, “buen maestro” es la variable independiente, mientras que “grado de
aprendizaje” (de los estudiantes) es la variable dependiente. Pero no siempre es fácil, o ni siquiera
posible, saber cuál es la variable dependiente y cuál la independiente en una relación. Siguiendo
con el ejemplo anterior, ¿es cierto que el aprendizaje de los niños resulta de la calidad del
maestro? Por ejemplo, ¿el hecho de que los estudiantes de la escuela A tengan un mejor
rendimiento que los de la escuela B significa que los maestros de la escuela A son mejores que los
de la escuela B? Para empezar, quizás los estudiantes de la escuela A son más aventajados en
cierto respecto, o hay otros elementos que causan ese mayor aprendizaje que no tienen nada que
ver con los maestros.

El problema de la determinación de causalidad (¿cuáles variables son dependientes y cuáles


independientes?) es uno de los problemas más serios que enfrenta la estadística. El análisis
empírico o estadístico sólo puede decirnos si dos variables parecen estar relacionadas, pero no
puede decirnos: (a) si de hecho existe una relación de dependencia y (b) cuál es la dirección de
dicha relación (cuál es la “causa” y cuál el efecto o la variable “causada”). Necesitamos una
“teoría” para dar plausibilidad a una relación empírica.

Considere la siguiente cuestión: ¿Es el aumento del ingreso per capita de un país que causa
mejoras en el nivel de educación o la mejora en el nivel de educación que causa mejoras en el
ingreso per capita? ¿O tal vez un tercer factor es la causa de ambos? ¿Cultura? Este complejo y
viejo debate no se puede resolver sólo sobre la base del análisis estadístico, aunque la estadística
es un importante instrumento en nuestros continuos esfuerzos por dilucidar estas cuestiones. El
debate mencionado ha persistido por décadas, además, porque muchas de las teorías que han
sido propuestas para explicar la relación entre educación y desarrollo económico no pueden ser
refutadas sólo sobre la base del análisis empírico.

Vayamos por un momento al tema de la interpretación de gráficos (tratado en mayor detalle en


los módulos 3 y 4 de esta guía). Un gráfico representa una relación entre por lo menos dos

13
variables. En matemáticas y geometría, la variable dependiente se denomina X y se representa en
el eje horizontal del gráfico, mientras que la variable independiente se llama Y (o ‘independiente’,
para facilitar la memorización) y se representa en el eje vertical. En la Figura 1, a continuación, se
muestra un ejemplo de una “curva de oferta” que presenta la relación entre dos variables: el
salario de los maestros y la cantidad o número de maestros disponibles o que ofrecen sus
servicios.

En el gráfico siguiente, ¿puede usted identificar cuál es la variable dependiente y cuál la


independiente?

(El siguiente módulo trata el tema de cómo leer gráficos. Si tuvo problemas en la
interpretación de la Figura 1, el módulo siguiente le debería ayudar a interpretarla con
mayor confianza.)

14
Modulo 3

Bienvenido al Módulo 3. En este módulo le presentamos una introducción a los gráficos. Aunque
este tema no forma naturalmente parte de una introducción a la estadística, en estadísticas
frecuentemente se usan gráficos para presentar los datos.

Este módulo simplemente pretende ayudarle a interpretar, o crear, gráficos y tablas. Es muy
básico.

Objetivos de aprendizaje:

Al término de este módulo, usted …

 Comprenderá mejor lo que es un gráfico;


 Tendrá una mayor practica y confianza en cómo interpretar gráficos.

Estructura del módulo

3.1 ¿Qué es un gráfico?


3.2 Los ejes de un gráfico (X e Y)
3.3 Aplicación: interpretación de gráficos
3.4 Aplicación: interpretación de gráficos de barras

¿Qué es un gráfico?

Los gráficos son simplificaciones visuales de realidades complejas. No se utilizan para complicar
las cosas, sino que para simplificarlas y así facilitar nuestro análisis de realidades, en nuestro caso
educacionales, complejas. Si sabemos cómo ‘leerlo’ o interpretarlo adecuadamente (y ayudar en
esta labor es el objetivo de esta sección), “un buen gráfico nos dirá más que mil palabras.” Como
profesional de la educación, cualquier esfuerzo que usted haga por aprender a interpretar gráficos
con confianza será ampliamente recompensado en su carrera profesional.

Un gráfico, en términos más técnicos y precisos, un gráfico nos ayuda a visualizar y simplificar el
análisis de relaciones entre variables. O sea, un gráfico es una simplificación de la realidad que
representa (o sea, es una ‘imagen’ de) una relación entre dos variables.

En un gráfico, cada variable se representa y se mide mediante una línea o eje. Y note que cada
eje, a su vez, representa un tipo de escala de medición. (Ver Figura 2).

15
Los gráficos de dos dimensiones tienen dos ‘ejes’, perpendiculares entre ellos. En un gráfico, los
ejes representan lo que se está midiendo y, por lo tanto, son verdaderas escalas de medición. En
la Figura 2 (anterior) se muestran ejemplos de los ejes de un gráfico. Cada uno de los tres ejes de
la Figura 2 representa un tipo de escala de medición: el eje 1 proporciona un ejemplo de escala
de razones, el eje 2, de una escala de intervalos, y el eje 3, de una escala nominal.

Aunque en esta introducción a la estadística sólo nos referimos a gráficos de dos dimensiones,
también hay gráficos de tres dimensiones. Estos representan la relación entre tres (y no dos)
variables. Un gráfico de dos dimensiones es equivalente a un plano que sólo tiene largo y ancho.
Un gráfico de tres dimensiones también tienen profundidad: la tercera dimensión. Una cuarta
dimensión es el tiempo. En física, por ejemplo, frecuentemente se usan gráficos que incluyen esta
cuarta dimensión.

¿Cree usted que puede existir un gráfico de una sola dimensión? ¿Por qué?

Los ejes de un gráfico (X e Y)

Un gráfico es el resultado de la unión de dos líneas individuales o ejes, como los de la Figura 2
anterior. Los ejes, cada uno de los cuales representa una variable de interés diferente, se unen
(a) en forma perpendicular entre sí, es decir, uno se coloca en forma horizontal y el otro en forma
vertical, y, (b) en el caso de variables numéricas, los ejes se intersectan entre sí en sus
respectivos ‘ceros’. El punto de intersección se llama el ‘punto de origen’.

16
Por convención matemática, el eje horizontal se denomina ‘eje X’, mientras que el eje vertical se
denomina ‘eje Y’. El resultado de la combinación perpendicular de estos dos ejes es un plano, es
decir, un gráfico de ‘dos dimensiones’, que proporciona una imagen de las relaciones entre las dos
variables representadas por los ejes. Los ejes podrían representar prácticamente cualquier cosa
interesante para la formulación de las políticas de educación que uno se pueda imaginar, como
métodos de enseñanza, gasto por estudiante en dólares, calificaciones de pruebas, países, al igual
que el rendimiento de lectura del octavo año, ingreso familiar, calificaciones o remuneraciones de
los maestros, regiones mundiales, etc.

Un uso común y muy importante de los gráficos en economía es en el análisis de la oferta y la


demanda. En éste, el eje Y representa el precio de un bien (como los salarios de los maestros,
derechos de matrícula, el precio de los libros de texto, etc.) y el eje X la cantidad de ese mismo
bien. (Ver la Figura 1 en el módulo anterior.)

Modulo 4

Bienvenido al Módulo 4. Este módulo se basa en lo que tratamos en el Módulo 3 y busca ampliar
sus conocimientos sobre gráficos. En este módulo examinaremos cómo interpretar versiones más
complejas de gráficos y analizaremos el problema de la interpretación de un gráfico paso a paso.

Objetivos de aprendizaje:

Al término de este módulo, usted …

Habrá mejorado su capacidad de leer e interpretar gráficos.

Trazo de un gráfico

En esta sección se proporciona un ejemplo, paso a paso, sobre cómo representar valores
numéricos en un gráfico (o plano). Si comprende el proceso y practica la lectura de gráficos,
pronto podrá leer gráficos muy complicados con gran facilidad. Como de costumbre, el secreto
está en la práctica.

17
La Figura 6 representa el piso de una habitación. El piso de la habitación tiene dos dimensiones,
ancho y largo. Por ende, el piso de la habitación constituye un ‘plano’ o un espacio de dos
dimensiones, exactamente como cualquier gráfico normal. Las dimensiones de la habitación son
6 metros de ancho por 8 metros de largo.

Note que el ejemplo trata de variables que se pueden medir usando escalas de razón. Así, el eje
de la Figura 5 representa escalas de intervalos medidos en metros. Tenga en cuenta que no
todas las variables se pueden graficar con este nivel de complejidad matemática. Lo positivo es
que si comprende la lógica de este ejemplo, debería comprender fácilmente la lógica de los
gráficos que representan variables medidas con escalas de intervalos, ordinales o nominales.

Supongamos que el Punto A (vea la Figura 6) representa el lugar donde usted está situado
dentro de la habitación. Usted se encuentra exactamente a tres metros de la pared sur y a 2
metros de la pared oeste. Ahora la pregunta es, ¿cómo puede representar inequívocamente su
posición dentro de la habitación por medio de un gráfico? La Figura 7 representa la solución. El
resto de este módulo se basa en el análisis del proceso a través del cual este gráfico (Figura 7)
fue trazado o construido.

18
Para trazar un gráfico (como por ejemplo el de la Figura 7) se deben seguir una serie de pasos
o etapas. En primer lugar, se deben identificar las variables representadas en los ejes X e Y. En
nuestro ejemplo, el eje X es el largo de la pared y el eje Y el ancho, los cuales miden la
distancia. En segundo lugar, se deben identificar las unidades en que se mide cada variable. En
nuestro ejemplo, utilizamos metros. En tercer lugar, se debe identificar un punto de referencia
desde el cual medir las variables, es decir, un punto de origen, fijo, desde el cual medir el largo
y el ancho en metros. En un gráfico, el punto de referencia se denomina precisamente “punto
de origen” o simplemente “origen”. En nuestro ejemplo el “punto de origen” es aquél en donde
tanto el largo como el ancho tienen un valor de cero y se ubica en el ángulo sudoeste del
gráfico.

Las relaciones se muestran en un gráfico usando ‘puntos’, como el punto A. Los puntos
describen las relaciones entre las variables representadas en los ejes del gráfico. Como
sabemos, en el ejemplo las variables son el “largo” y el “ancho” de la habitación y están
medidas en metros. Así, el punto A representa cierta magnitud de largo (2 metros) y de ancho
(3 metros), ambas magnitudes medidas sobre los respectivos ejes X e Y.

Los puntos de un gráfico se pueden describir usando coordenadas. Una coordenada es un par
de números que se usan para describir la posición en un plano. El punto A representa un par de
coordenadas, una para cada dimensión, o variables, esto es, el largo y el ancho. El punto A está
representado por el par de números (2, 3), puesto que por convención se establece que el
primer número del par representa el eje X, mientras que el segundo representa el eje Y. Un par
de coordenadas es una forma inequívoca de describir la posición en un plano, como el punto en
que usted está situado exactamente en una habitación. El “punto de origen” de un gráfico
también se llama coordenadas (0,0). Toda coordenada representa un punto en un plano. En
nuestro ejemplo, las coordenadas (0,0) representan un punto en el cual el largo y el ancho son
cero.

Ya indicamos que el punto A se podría representar usando las coordenadas (2, 3). ¿Pero cómo
se determinaron en forma exacta las coordenadas (2, 3)? Comencemos con la coordenada X. La
19
coordenada X se mide sobre el eje horizontal (o eje X) y nos indica a qué distancia se encuentra
usted del eje vertical o eje Y. En nuestro ejemplo, la coordenada X nos indica a qué distancia,
en una perpendicular, se encuentra usted de la pared oeste de la habitación (vea la Figura 8).

La coordenada Y se mide sobre el eje vertical (o eje Y) y nos indica a qué distancia se
encuentra usted del eje horizontal o eje X. En nuestro ejemplo, la coordenada Y nos indica a
qué distancia se encuentra de la pared sur de la habitación (Figura 9).

Ahora supongamos que usted está hablando con un amigo por teléfono y le quiere explicar
dónde está usted ubicado en la habitación en ese momento. Si su amigo sabe cómo leer
coordenadas, la única información que necesita entregarle es: (1) un punto de referencia (esto
es, indicarle que se trata de la esquina sudoeste de la habitación); (2) su unidad de medida
(esto es, metros); y (3) sus coordenadas (2, 3). De inmediato sabrá que usted se encuentra a 2
metros de la pared oeste y a 3 metros de la pared sur, medidos desde el punto de referencia,
esto es, la pared sudoeste. Si quiere que su amigo sepa a qué distancia se encuentra de las
paredes norte y este, entonces necesita además darle las dimensiones de la habitación.

Una observación final. A esta altura esto es ya obvio, pero vale la pena enfatizar que los puntos

20
en un gráfico representan dos valores, uno medido sobre el eje Y, y otro sobre el eje X. Es
decir, un gráfico (bidimensional) representa una relación entre dos variables medidas a lo largo
de los ejes del gráfico.

Modulo 5

Bienvenido al Módulo 5. Este módulo le proporciona una introducción al importantísimo concepto


de “distribución” o “distribución de frecuencia”. Para ser analizados, los datos deben estar
organizados. Las distribuciones de frecuencia (o simplemente “distribuciones”) son las principales
herramientas que usan los estadísticos para organizar los datos y así poder extraer información
útil de ellos. No es una exageración el decir que las “distribuciones” son los cimientos de nuestra
‘era de la información’.

Objetivos de aprendizaje:

Al término de este módulo, usted …

• Comprenderá mejor el concepto clave de “distribución de frecuencia”;

• Distinguirá entre variables discretas y continuas;

• Comprenderá mejor el concepto de “distribución de frecuencia relativa”.

Estructura del módulo

5.1 Variables discretas y continuas


5.2 ¿Qué es una distribución de frecuencia?
5.3 Distribuciones de frecuencia relativas

Variables discretas y continuas

La manera lógica de organizar datos es crear categorías y luego asignar las observaciones a una
categoría. Pero nuestra capacidad de categorizar está limitada por la naturaleza de las variables
que usamos. Además, no todas las variables se pueden categorizar con la misma facilidad. En
términos estadísticos, las variables que interesa medir pueden ser (a) discretas o (b) continuas.

Las variables discretas son aquellas cuyas observaciones se agrupan ‘inherentemente’ o


‘naturalmente’ en categorías, porque dichas variable por su naturaleza sólo pueden tomar ciertos
valores muy específicos. El “género” de un sujeto es un buen ejemplo de una variable discreta: los
seres humanos pueden ser mujeres u hombres, se ajustan a una u otra categoría y no hay

21
continuidad ni puntos intermedios entre ellas. Los países o regiones del mundo también son
buenos ejemplos de variables discretas. Otro ejemplo son las calificaciones o educación de los
maestros. Podemos crear las siguientes categorías para describir esta última variable: (a)
educación primaria completa, (b) educación secundaria completa, (c) educación superior
incompleta, (d) educación superior completa y (e) educación de postgrado.

Sin embargo, existe otra clase de variables, conocidas como variables “continuas”, que no son tan
fáciles de categorizar como las variables discretas. A diferencia de las variables discretas, las
variables continuas, como su nombre lo indica, sólo se pueden agrupar en forma arbitraria en
categorías, porque por su naturaleza pueden tomar cualquier valor a lo largo de un continuo (o de
una escala numérica continua). La estatura de los habitantes de un país es un ejemplo de variable
continua, así como el ingreso de las familias en dicho país. Un buen ejemplo en el área de la
educación son las “calificaciones de pruebas”, que sólo se pueden agrupar arbitrariamente
creando ‘intervalos’ artificiales, como por ejemplo 1-20, 21-40, etc. Note que los intervalos
también podrían ser 1-10, 11-20, 21-30, etc, o cualquier otro intervalo que se prefiera, ya que la
variable no se ajusta naturalmente a categorías predeterminadas como en el caso de las variables
discretas.

La distinción entre variables discretas y continuas es de gran aplicabilidad en la estadística. Pero


su importancia sólo queda clara después de comprender el concepto estadístico fundamental de
‘distribución’ o ‘distribución de frecuencias’. (Los estadísticos por lo general usan la primera
versión, la más corta, para referirse a la distribución de frecuencias.)

¿Qué es una distribución de frecuencias?

En estadística, los datos se organizan en distribuciones. En una distribución de frecuencias, las


observaciones se clasifican de acuerdo a categorías de valores. En otras palabras, una distribución
de frecuencias nos indica cuántas veces se observó cada categoría. En otras palabras, una
distribución proporciona datos sobre el número de observaciones que corresponde a cada
categoría. En el caso de las variables discretas, esto es más intuitivo, pero también se aplica a las
variables continuas. El siguiente ejemplo nos ayudará a ilustrar el concepto.

En el Cuadro 3 se muestra un ejemplo de la distribución de frecuencias de las matrículas primarias


en Balochistán, Pakistán, clasificadas según la variable “género”. Las categorías del ejemplo son
“niños” y “niñas”. El “género” de los estudiantes (femenino o masculino) es una variable discreta.
Los individuos observados simple y naturalmente pertenecen a uno u otro género. Así, el
procedimiento para clasificar según el género es simple y directo. El género, como todas las
variables discretas, dispone naturalmente de sus categorías.

Cuadro 3. Distribución de matrículas primarias por género en Balochistán, Pakistán.

22
Género Total matriculado (1998)
Niños 315.111
Niñas 80.260
En la Figura 11 se muestra la misma distribución de frecuencias en forma de gráfico o
“histograma”. Un “histograma” es simplemente el nombre que los estadísticos dan a un
gráfico que representa una distribución de frecuencia.

La información presentada en el Cuadro 2 nos indica que si bien hay 315.111 niños
matriculados en la educación primaria en Balochistán, Pakistán, las niñas matriculadas son
sólo 80.260.

El histograma (distribución) o gráfico de barras de la distribución representada en la Figura 11


se creó sobre la base de la información proporcionada por el Cuadro 2. Este histograma
(Figura 11) nos muestra que aunque hay un poco más de 300.000 niños matriculados en la
educación primaria, hay menos de 100.000 niñas matriculadas. Por sí misma, esta
información es en extremo valiosa y tiene importantes implicaciones en términos de políticas
públicas. Evidentemente es un llamado a aplicar medidas correctivas, aunque por otro lado es
lógico que se requeriría bastante más información que aquella proporcionada en este cuadro
para diseñar el contenido específico de una política efectiva.

Si alguien estuviera interesado en saber la proporción o porcentajes relativos de niños y niñas


matriculados en la educación primaria en Balochistán, los podría calcular basándose en el
cuadro o estimarlos en forma aproximada a partir del gráfico. Pero también podemos utilizar
lo que los estadísticos llaman una “distribución de frecuencias relativa” para describir
directamente las proporciones o porcentajes relativos de los niños y niñas matriculados en la
educación primaria en Balochistán. Una distribución (en el caso de las variables discretas) se
puede transformar fácilmente en distribuciones de frecuencia relativas.

Distribuciones de frecuencia relativas

Una distribución de frecuencia relativa describe los porcentajes del número total de observaciones
correspondiente a cada categoría. Una distribución de frecuencia relativa no nos indica cuál es el
23
número de observaciones en cada categoría, sino cuál es el porcentaje de observaciones en cada
categoría. Esta información es muy valiosa.

Cuadro 4. Distribución de frecuencia relativa de matrículas primarias por género en Balochistán.

Género Porcentaje del total matriculado (1998)


Niños 79,7 %
Niñas 20,3 %
En el Cuadro 4 se representa la distribución de frecuencias relativa correspondiente al
Cuadro 3 anterior. Las distribuciones de frecuencias pueden ser relativamente simples,
como en el Cuadro 4, pero también pueden ser más complejas y proporcionar mucha más
información, como veremos más adelante.

Hasta ahora, nuestros ejemplos se han limitado a variables discretas, que se representan
fácilmente mediante gráficos de barras. Pero los gráficos de barras no son la mejor forma
de representar variables continuas, sino que es mejor usar distribuciones de frecuencia
continuas.

Usted ya debería haber recibido una copia de la lista del curso. Usando esa lista, dibuje una
distribución de frecuencia y una distribución de frecuencia relativa de los participantes en el
curso de acuerdo a la variable “región del mundo” en la cual trabajan (puede usar las
regiones que normalmente utiliza el Banco Mundial (ver por ejemplo Figura 5) o puede
definir (claramente) las regiones que usted prefiera usar como categorías.

24

También podría gustarte