CAPÍTULO I
1.1 Introducción
La enseñanza de la Estadística, impartida durante muchos años a alumnos de
las carreras de Psicología, Sociología, Educación y Geografía, nos ha llevado a
comprender que esta disciplina no debe estudiarse aislada sino ligada
constantemente a los procesos científicos completos de la investigación. Es
más, hemos podido comprobar que los estudiantes y profesionales sólo
comprenden la necesidad de saber Estadística y de manejar adecuada-*
mente sus técnicas, cuando se dan cuenta de que es imprescindible para
cualquier tipo de investigación que quieran emprender. Esto nos ha
demostrado también, la importancia que tiene la Estadística para establecer los
vínculos interdisciplinarios que actualmente se consideran tan necesarios. Por
alejadas que nos parezcan materias tales como Agronomía, Psicología,
Biología, Geografía, Sociología, Ingeniería, Economía, Física o Antropología,
todas ellas para investigar usan Estadística.-Se establece así entre los distintos
investigadores una posibilidad de intercambio y de comunicación sobre sus
evaluaciones y no hay duda de que el razonamiento interdisciplinario conduce
a menudo a la creatividad. Los modelos estadísticos nacen de la matemática.
Es cierto; pero la matemática que se necesita para comprender las leyes es-
tadísticas no debe asustar a nadie, pues en sus aplicaciones la mayoría de los
problemas estadísticos se resuelve con simples cálculos aritméticos y
operaciones de álgebra elemental. Por otro lado, hoy en día, con los programas
de computación al alcance de todos, la pesada labor que suponía antes la
realización de muchos cálculos, se elimina completamente. En realidad, lo que
hay que saber muy bien en Estadística son los fundamentos lógicos, los
razonamientos y los modelos estadísticos que subyacen a estos cálculos.
Estos tres conceptos fundamentales son los que tendremos presentes a lo
largo de todo este manual?
1) Estadística para la investigación, 2) Estadística como vínculo
interdisciplinario y 3) facilitación de los cálculos mediante los programas de
computación.
Como veremos, la Estadística es una manera de pensar y de tratar cierta
problemática que la realidad plantea de una manera más elaborada,
(Consciente y exacta, que lo que hace el pensamiento 'ingenuo dando criterios
de decisión para evaluar los hechos cuando prevalecen condiciones de
indeterminación. La mayor aplicación de la estadística, en cualquier campo, se
basa en la posibilidad de observaciones repetidas, sin embargo, siempre que
se repiten las observaciones, y aun cuando se tomen las mayores
precauciones ¿para unificar las condiciones, los resultado» varían. En algunos
campos de investigación como las ciencias físicas varían menos en otros,
como en las ciencias sociales y del comportamiento, inevitablemente las
diferencias serán importantes. Cuando las observaciones, a pesar de ser
hechas en condiciones similares, dan diferente resultados existe una inseguri-
dad vinculada a la observación del fenómeno. Este hecho lleva al problema
central de la estadística que es, en cierto sentido, el intento de explicar la
tendencia de los resultados a variar aun cuando las observaciones, desde el
punto de vista del observador, parecen hacerse en condiciones idénticas.
Origen y evolución de la Estadística
La palabra "estadística" parece derivar de la voz latina status que en el latín
medieval tenía el sentido detestado político Así es usado por primera vez en el
Hamlet de Shakespeare.
Luego se empleó de modo más específico en tratados de política económica y
significaba la exposición sistemática y ordenada de las características más
notables de un estado. Consistía en la recolección 7 el análisis de datos
relativos a la población y a la riqueza para los fines de Ja guerra y finanzas. Se
trataba de los famosos censos romanos.* Sin embargo, ya en los monumentos
egipcios se encontraron interesantes documentos que atestiguan la sabia
organización administrativa de aquel pueblo, en los que los movimientos de
población eyan ya seguidos por observaciones sistemáticas y periódicas. En la
Biblioteca de Asurbanipal, en Asiría, fueron también hallados numerosos
cuadros estadísticos que se refería^ a la jerarquía de los oficiales
administrativos y a las producciones de las diversas provincias. En la Biblia se
habla de un ¿enso de los israelitas realizado por Moisés ep. el desierto, razón
por la que se dio a aquella parte especial del libro el nombre dé Los Números,
En el segundo libra de los Reyes también se habla de un censo hecho por
David. En China, Qonfucio (500 A.C.) habla de como el rey Yao (3000 A*C,)
mandó hacer una verdadera estadística agrícola y un relevamiento cornejal del
país. En Grecia y Roma la importancia de las observaciones estadísticas no fue
menor. En un Diálogo platónico, Sócrates le dice a Glauco lo necesario que es
para los hombres de gobierno el desarrollo de las indagaciones sobre la
población y sus: riquezas. El censo de los romanos (que tenía por objeto
calcular no sólo el número de ciudadanos sino los bienes que poseían) sirvió a
Servio Tulio como base constitucional y ahora se sabe que en Roma eran
cuidadosamente anotados y conservados los datos demográficos con un
registro de los nacimientos y las muertes. Cojí la caída del Imperio Romano se
perdieron las trazas de las observaciones estadísticas y no se hallan de nuevo
sino hasta después de un período más o menos largo que puede señalarse
como el año 1000, cuando el Rey Guillermo el Conquistador de Inglaterra
estable* ció un famoso censo o documento administrativo de notable im-
portancia, i.;".:::,'- . , ;-,:. ;. , ...•'••• VJ/
A fines de la Edad Media y comienzos del Renacimiento las repúblicas itálicas
comenzaron a mostrar documentaciones similares a la inglesa a fines del siglo
XHI, y finalmente la Iglesia, en il famoso Concilio de Trento, introduce en forma
obligada la inscripción de los matrimonios, los nacimientos y las muertes.
Hacia el siglo XVI empezaron a aumentar los datos oficiales y a estadística
adquirió una significación más autónoma, que se atendió como la descripción
de las cosas notables de un estado ornando sistematización orgánica. Esto fue
obra de Germán Jonning (1600 - 1681) fundador de esta orientación estadística
ue podemos llamar la escuela alemana y se llamó a sí misma Estadística
Universitaria*.
Corresponde a lo que entenderíamos actualmente por una es-idística
puramente descriptiva. El nombre concreto de Estadía-ca le fiíe dado por
Achenwald un notable profesor de Gotinga 1719-1772).
Al mismo tiempo surgía en Inglaterra una corriente que se amó de los
"aritméticos fülfficos* y que pretendía crear una stadística investigadori^ Su
representante más importante :e Graunt (1620 -1676)<$%* en su "Memoria"
ponía de relieve la ;fluencia de las estaciones del año sobreda mortalidad,
resalta: i la proporción constante de los sexos en la población adulta, ia luencia
dé la población del campo a las ciudades, etc.. De esta cuela inglesa derivaron
dos nuevas tendencias en estadística.
Una es la creación de la demografía por el alemán Süssmilch 707 - 1767), en
cuyos tratados se demostraron las regularidades o leyes que se verifican al
tenor de las poblaciones.
La otra derivación de los "aritméticos políticos* (Graunt, Da-nant y Petty) se
entroncó con la aparición del Cálculo de Pro-bilidades, que podríamos llamar
"enciclopédica matemática", este pertenecen una serie de figuras muy
representativas cu-s descubrimientos y estudios fueron importantísimos. Estos
a, entre otros, el holandés Christian Huyghens (1629 - 1695) e viviendo en
París se hizo famoso al demostrar la inexactitud
la cuadratura del círculo. Su obra De ratiociniis in ludo sae es el primer
tratado completo del cálculo de probabilidades ejemplificado con los juegos de
cartas y dados. Huyghens, e además de matemático era físico y astrónomo, fue
el primero en utilizar el movimiento del péndulo para la medición tiempo, pero
las investigaciones que le dieron mayor celebridad frieron su teoría ondulatoria
de la luz y sus aplicaciones sobre la reflexión y la refracción. ... . .
Tres años más tarde Blaise Pascal (1623 • 1662) y Fefmet, en su
correpondencia, discernían sobre "la geometría del azar". Se dice que esto fue
consecuencia de las preguntas que un cierto caballero de La Mere le había
hecho a Pascal sobre ciertas combinaciones de los dados. £1 Traite du triangle
arlthmó-tique de Pascal muestra la conveniencia del uso del triángulo para el
cálculo combinatorio y de las potencias del binomio.
Pascal, fue sobre todo, un filósofo que reaccionó contra el intelectualismo
cartesiano, lo que condujo a admitir dos principios de conocimiento Pesprit
géometrique (la razón) orientado a las verdades científicas y l'esprit de fínesse
(el corazón) en el que se dan, en forma de intuiciones, los principios básicos
para la comprensión de la vida.
Quien se dio cuenta tempranamente de la importancia de los datos de tipo
probable en lo social, fue el suizo Jaques Ber-nouilii (1664 -1705) ei primero de
una eminente familia de matemáticos que dieron fama a la Universidad de
Bamlea durante un siglo . Allí desarrolló Bernouüli problemas de cálculo infini-
tesimal a partir de los planteamientos dé Leibnitz, y en 1713 se publica su obra
postuma Ars Conjectandi, en donde aparecen por primera vez los teoremas
relativos a los conceptos de certeza y probabilidad.
Merecen también una mención especial: Abraham de Moivre (1665 -1754),
matemático inglés de origen francés, que introdujo los números complejos en
trigonometría y trabajó sobre el cálculo de probabilidades. Piére Simón Laplace
(1749 - 1827) matemático, físico y astrónomo francés, de origen noble, que es-
tudió probabilidades y sentó, las bases de Ja ley de los errores. Su obra más
importante esa este aspecto es Hiéorie Analyti-que de probabilités (1812).
Karl Priedrich Gauss (1777 - 1855) matemático, astrónomo y fisico alemán de
origen muy humilde, su padre quería que fuera carpintero, pero al trabar
conocimiento con el duque Karl Wil-helm, éste quedó tan impresionado con su
inteligencia, que le pagó todos los estudios en la Universidad de Gotinga. Allí
permaneció muchos años, realizando notables descubrimientos en física en el
campo de la electricidad, y en astronomía sobre la mecánica celeste. En su
obra "Disquisition Arithmétique" (1801) expresó la teoría de los números
complejos y estudió la congruencia, formas cuadráticas y la convergencia de
las series. En 1821 expresó su teoría de los errores y analizó la gráfica en
forma de campana usada tan frecuentemente en el campo de las probabili-
dades. Demostró que era una curva típica de la distribución de ios errores
cometidos en las observaciones científicas que, desde entonces, se ha llamado
curva de probabilidades normal o curva le Gauss. Finalmente, Poisson (1837)
discípulo de Laplace estableció el desarrollo matemático de la ley de los
grandes números.
Fue un astrónomo del Rey de Bélgica, Adolfo Quetelet (1796 -.874) quien
aplicó la curva normal de Gauss a datos de tipo so-;ial y biológico. Su obra
fundamental "Sur PHomme" contiene elevamientos y estadísticas sacadas de
los libros de los registros rvües para conocer frecuencia dé los delitos y
suicidios y sobre el ; esarrollo físico del hombre, por lo que se le considera
fundador e la Antropometría. En Economía, las aplicaciones estadísticas e
deben al francés Cournot (1801 -1877).
Francis Galton (1822 - 1911) antropólogo británico, primo de jarwin, se dedicó a
los problemas de la herencia y es el fundador e la Eugenesia. Por sus obras
Hereditary Talent y Hereditary ienius puede considerarse precursor de la
psicometría. En efec->, al extender la estadística a los datos de tipo genético
para él itudio de la herencia de los caracteres somáticos y psíquicos, la :ilizó
para demostrar sus conceptos sobre las diferencias indívi-lales y proporcionó,
con su ley de la regresión de los caracteres .amaños a la media, el origen del
método de las correlaciones, mdamental para el empleo en la elaboración de
tests mentales, e Galton procede toda la escuela inglesa de estadística como irl
Pearson, Fisher, Yule, Student, Spearman, Thurstone y tan-s otros, casi
contemporáneos y cuyos estudios conoceoremos a lo largo de este manual.
En la Argentina, en el Centro de Investigaciones interdisciplinarias para
Psicología Matemática y Experimental que depende del CONICET y que dirige
el Dr. Horacio Rimoldi, se ha formado un plantel de investigadores que utiliza
para sus trabajos elaborados diseños estadísticos como los de correlación
múltiple, análisis de variancia y covariancia y análisis factorial. El Dr, Rimoldi,
que estudió análisis factorial con Thurstone, está especialmente interesado en
el estudio de los procesos psicológicos de resolución de problemas y ha
empleado con creatividad la teoría de la información. -
1.3 Algunas definiciones de la estadística
Por Estadística entendemos los métodos científicos por medio de los cuales
podemos recolectar, organizar, resumir, presentar y analizar datos numéricos
relativos a un conjunto de individuos u observaciones y que nos permite
.extraer conclusiones válidas y efectuar decisiones lógicas, basadas en dichos
análisis. Utilizamos la estadística para estudiar aquellos fenómenos en los que
tenemos una gran cantidad de observaciones y cuya aparición se rige por leyes
del azar o aleatorias. La aplicación de la estadística tiene lugar porque los
fenómenos de algunas ciencias no se dan siempre iguales entre sí
exactamente, sino que presentan variaciones. Estas pequeñas diferencias son
debidas a una serie de causas tan numerosas y complejas que no podemos
determinarlas por separado y que las incluimos dentro del nombre común de
azar.
Observando una estadística de cualquier naturaleza, población, tráfico,
producción, ventas, salud, escolaridad, etcétera, salta & la vista
inmediatamente que los fenómenos a los qué ella se refiere cumplen la
condición de presentarse en grandes números, con mayor o menor rigurosidad
según ía naturaleza de los fenómenos y la cantidad de observaciones
anotadas. Además, puede verse enseguida que estos fenómenos dependen de
gran variedad de causas, pues si esto no se diera, el estudio podría ser objeto
de alguna ciencia especial que estudiara una causa específica y con la
observación de un solo fenómeno podríamos, idealmente, llegar a una
explicación válida para todos. Según Yule * por lo tanto, por estadística damos
a entender datos cuantitativos fuertemente influidos por una multitud de
causas. Según Gini m la estadística, en su aspecto metodológico, es una
técnica adecuada al estudio cuantitativo de los fenómenos de masa o
colectivos, entendiendo por tales aquellos cuya medición requiere una colec-
ción de observaciones de otros fenómenos más sencillos llamados fenómenos
aislados o índiviluales. En esta definición es importante señalar que se habla
de fenómenos cuya medición requiere una colección de observaciones, pues
hay fenómenos que se presentan en masa pero no se requiere observación
alguna, pues se conocen a priori. Por ejemplo, si queremos saber el porcentaje
de varones que hay en una ciudad en una época determinada, es necesario
una serie cíe observaciones. JEn cambio, para saber la cantidad de varones
que hay en un conjunto de 1000 matrimonios no se necesita ninguna
observación pues se sabe a priori que en 1000 matrimonios habrá por
definición 1000 mujeres y 1000 varones.
1.4 Población y muestra*
Cuando se quiere estudiar una característica de un grupo supongamos que
queremos saber la talla promedio de los estudiantes varones de la Universidad
de Buenos Aires) este grupo, m total, es nuestra población. Generalmente si la
población es muy grande, no se puede estudiar a todos los individuos y se tona
un subgrupo que se llama muestra,
Una población puede ser finita o infinita. El ejemplo anterior de los estudiantes
varones de la Universidad de Buenos Aires, es una población finita,
supongamos que son 15000. En cambio, en el caso de que la población sean
las tiradas sucesivas de una moneda al aire para averiguar los resultados
posibles (cara y seca) las sucesivas tiradas de moneda constituyen una
población infinita.
1.5. Estadística descriptiva e inferencial
*' Si estudiamos- una característica de un grupo, sea en una
población o en una muestra, por ejemplo talla, peso, edad, cociente intelectual,
ingreso mensual, etc. y lo describimos sin sacar de ello conclusiones estamos
en la etapa de la estadística descriptiva. -
Si estudiamos erTuna muestra una característica cualquiera e inferimos, a
partir de los resultados obtenidos en la muestra, conclusiones sobre la
población correspondiente, estamos haciendo estadística inductiva o inferencial
y como estas inferencias no pueden ser exactamente ciertas, aplicamos el
lenguaje probabilístico para sacar las conclusiones.
CAPÍTULO 2
1 Variables estadísticas
La realidad no es un continuo indiferenciado, sino que al observarla, llama
nuestra atención la enorme cantidad de distinciones sensibles que podemos
hacer en ella. Por ejemplo, si nuestro interés reside en estudiar un grupo de
niños de una escuela, seleccionaremos nuestras entidades que podrán ser los
niños de la escuela, y sobre estos elegiremos algunas características según lo
que nos interese, como por ejemplo su peso, su talla, su índice de capacidad
intelectual, sus actitudes hacia la escuela, el color de sus ojos, las
enfermedades que han padecido, la edad que tienen, su religión, el trabajo que
realizan sus padres, los ingresos que reciben mensualmente sus familias, su
rendimiento en aritmética, etc., etc. Estas características o propiedades de las
entidades, o sea de los niños, se llaman variables pues varían de un niño a
otro y son sobre estas variables que trabajará el estadístico. El nombre
"variable" en realidad proviene de que un símbolo representa diversos valores.
Estos símbolos suelen ser las últimas letras del alfabeto x, y y z. Al contrario de
una variable que puede tener valores distintos, una constante puede ser
reemplazada por un valor, y solo uno. Por ejemplo» en la expresión C = 2 n r,
los símbolos C y r pueden ser reemplazados por un conjunto infinito de
números positivos. Sin embargo el símbolo n es una constante y solo puede
ser reemplazado por 3.1416. Obsérvese también que en este caso C y r son
variables que están nacionalmente relacionadas, es decir, el valor de C
depende del valor de r.
Las variables son muy diversas y por lo tanto conviene que as clasifiquemos,
dado que no todos los cálculos estadísticos se pueden hacer con todas las
variables. Existen en la realidad una clase de variables que se llaman
variables cualitativas o atributos. Estas son, por ejemplo, el sexo, la religión,
el partido politico, la raza, la ocupación, la actitud hacia los maestros, el estado
civil, etc. El rasgo específico que caracteriza estas variables es que pueden ser
divididas en clases separadas y mutuamente exclusivas. Así, en el sexo
tenemos hombre y mujer, raza puede dividirse en negros, blancos, orientales,
etc, la religión podemos dividirla en católicos, protestantes, budistas, judíos,
ortodoxos, musulmanes, etc. Algunas veces las variables cualitativas tienen
una pauta de orden, por ejemplo las notas de los exámenes como os clásicos
Reprobado, Aprobado, Bueno, Distinguido y Sobresaliente, o si ordenamos las
actitudes de los niños hacia la escuela orno muy favorables, favorables,
desfavorables. Estas variables cualitativas son muy frecuentes en las ciencias
sociales y del comportamiento y son las más difíciles de analizar desde el pun-
o de vista estadístico.
Otro tipo de variables son las llamadas cuantitativas y es-is a su vez /«e
.clasifican cu variables cuantitativas discretas y variables cuantitativas
continuas.
Las variables discretas como por ejemplo: número de hijos i una familia, años
de educación completados, ingreso anual de . familia, goles que haya hecho un
equipo de foot-ball, etc., tie-¿n la propiedad de poderse contar. Así, una fámula
puede tener 2, 3 ó 4 hijos, pero no hay posibilidades de tener tres hijos y edio,
es decir hay separación total entre un valor y otro pero 5mpre están ordenados
y podemos contar sus elementos.
Por último, están las variables cuantitativas continuas, mo por ejemplo edad,
talla, peso, tiempo que una persona ha -ido en una ciudad, presión atmosférica,
presión arterial, tem-ratura, altura de una montaña, etc. Estas variables Jio se
antan sino que se miden y pueden tener cualquier valor en un ibito finito de
valores continuos. Por ejemplo, un estudiante, al erar en la universidad puede
tener 18 año&JL mpspfl fi rifas 2 ras y 5 minutos. La talla de un joven puede ser
1,84 mts. Ó 1,845 mts., ó 1.8452 mts. La fineza con que lo midamos < rá él
límite entre un valor y otro, pero en realidad, entre un valor y otro, es decir, por
ejemplo, 1,84 mts. y 1.85 mts., existe una continuidad cuyo corte solo depende
del instrumento con que efectuamos la medición. La mayoría de las variables
en las ciencias físicas y biológicas son cuantitativas continuas.
La aplicación* de la estadística para las variables continuas es más amplia que
para las variables discretas. Es por esto que en muchos casos se establece
con variables discretas lo que se suele llamar, una corrección por continuidad.
En resumen: las variables cualitativas son esencialmente variables para la
clasificación de las entidades; las variables cuantitativas discretas son
variables en donde las entidades so cuentan y las variables continuas son
aquellas variables que se pueden medir.
II.2. Las definiciones y las variables en investigación
Cualquier investigación suele .comenzar con una idea formulada como
hipótesis que tiene el investigador sobre algún proceso. Por ejemplo,
supongamos que alguien quiere examinar una hipótesis como la siguiente:
"Cuanto menor es el nivel social de una persona, menor será el grado de
conocimientos que posee". Se trata de conceptos que todos entendemos, pero
que no nos sirven para decir qué nivel social tiene un señor Juan Pérez cual-
quiera, ni cuál es el grado de sus conocimientos. La razón de esto es que se
trata de definiciones teóricas más bien que operacionales. En las definiciones
teóricas un concepto se define en términos de otros conceptos que se
suponen conocidos. En el modelo ideal de un sistema lógico deductivo
perfecto, algunos conceptos fundamentales pueden no estar definidos y todos
los demás se definen en sus términos. Por ejemplo, en geometría, una recta o
un punto pueden no estar definidos pero las nociones de ángulo, triángulo o
rectángulo se definen mediante aquellos términos no definidos. Las
definiciones operacionales, por otro lado, son definiciones en las que se
explicitan los procedimientos usados para la medición de las variables. Así, una
definición de altura debe indicar cómo se ha medido la longitud de un cuerpo.
Para la hipótesis anterior deberíamos definir nivel social, determinando con qué
escala se ha evaluado el nivel social y deberíamos también señalar el test, o
examen especial con el que medimos el grado de conocimientos de las
personas. Una definición operacio-nal debe ser suficientemente precisa para
que todas las personas que usen el procedimiento logren resultados similares.
En cuanto a las variables en una investigación, se debe tener en claro cuáles
son las variables dependientes y cuáles las variables independientes. En la
ecuación y =* b x, la variable x es la independiente, la variable y, la
dependiente. Siendo b un valor constante, cuando asignamos diversos valores
a x, y variará indefectiblemente; por esto se Ja llama variable dependiente,
dependiente del valor de x. En la definición anterior, el investigador ha consi-
derado que la variable nivel de conocimiento es dependiente mientras que el
nivel social es la variable independiente. JSsto * no siempre quiere decir que
la variable dependiente sea el efecto, y la independiente la causa, algunas
veces la causa está oculta y •ís otra variable no estudiada, sólo quiere decir
que entre la variable y, (nivel de conocimiento) y la variable x, (nivel social) el
¿nvestigador considera en su hipótesis que existe una relación, iue es lo que
deberá tratar de comprobar en su trabajo.
sr ' ÍL3. Medición e isomorfísmo
Vemos que en las definiciones operacionales que se necesitan jara la
investigación, la medición de las variables es un proble-na fundamental. La
medición es un concepto básico en todas las iencias y es más difícil de captar
en las ciencias sociales y del omportamiento que en las ciencias físicas y
naturales. La definí* ion de medición usada por Stevens (1951) dice que
''medición es a asignación de números a objetos o hechos de acuerdo a ciertas
reglas19. En realidad, Torgerson (1958) critica esta definición, pues señala que
al medir no se asignan números a objetos, por lo cual estará más de acuerdo
con la definición de Campbell (1938) que sostiene que "medición es la
asignación de números para representar las propiedades de los sistemas
materiales en virtud de leyes, que gobiernan estas propiedades". Es decir, por
ejemplo, un árbof no es medible sino que sí podemos medir su altura, su peso,
el diámetro de su tronco o su dureza. La medición de una propiedad implica por
lo tanto una relación de isomorfísmo que significa una equivalencia de formas,
es decir, tina relación uno a uno, entre la estructura lógica del sistema numérico
y la estructura de la naturaleza que se manifiesta en las propiedades que se
miden. Un ejemplo: en el sistema matemático de la aritmética el enunciado
formal de 1 + 2 = 3 es cierto. Podemos adaptar este resultado a la realidad y
decir "si tenemos 1 naranja y agregamos 2 naranjas, tendremos 3 naranjas" lo
cuál también es cierto. Pero si queremos sumar una naranja con 2 peras, ya no
sería cierto pues en la realidad aquí el signo (+) no tiene sentido. ..Esto 0s lo
que queremos decir cuando aplicamos a las propiedades de la naturaleza un
modelo matemático. Para poder aplicarlo hay que cumplir ciertos requisitos.
Y ¿cuáles son las características de la serie real de los números?
Fundamentalmente son tres: orden, distancia y origen *
1) Los números están ordenados de menor a mayor; ésta es
la característica de orden. •-•'.'•• •-. - f
2) Las diferencias entre los números también están ordenadas. Esto es,
cualquier diferencia entre un par de Mineros es igual, mayor o menor que la
diferencia entre otro par de números. Por ejemplo:
8-5>7-5
10-8 < 10-7
5-3=7-5
Esta característica se llama distancia.
3) La serie tiene un origen único que llamamos "cero" y lo importante es gue la
diferencia entre cualquier par de núme.
o™
8-0 = 8 Esta característica se llama origen.
ron °ü f!nÓ"eí08» sin embarg°. Pueden no satisfacer todas las a?^ !° S1nÚmerOS y no ob^te
permitirnos hacer cier! os melones de los mismos. Por lo tanto, es como si en la
medí-on hubiera grados de perfección de acuerdo con la exactitud con ue las
variables a medir cumplen con las propiedades
) Postulados básicos do idsatídad u equivalencia: 1) a = b o bien a * b. Los
números son iguales o diferentes.
r la relacíon de
' '
es
3) Si a == b y b = c, entonces a = c. Es decir, dos cosas iguales una tercera son
iguales entre si. Transitividad.
Postulados relativos al orden jerárquico:
4) Si a > b luego b < a. La relación «mayor que» es asimétrica,
5) Si a > b y b > c entonces a > c. Propiedad transitiva. Postulados relativos a
la aditividad:
DIS&ÑO ESTADÍSTICO PAM INVESTIGADORES EN CIENCIAS Sm
6) Si a = py b > o, entonces a + b > p. Indícala posibilidad de i
7) Si a + b = b + a. El orden de los sumandos no afecta el resultado.
8) Si a » p y b = q, entonces a + b = p + q. Es decir, los objetos idénticos
pueden ser sustituidos.
9) (a + b) + c = a + (b + cX Es decir, el orden de las asociaciones no produce
diferencias en él resultado.
II.4. Posibilidad de medición en las ciencias sociales y del
comportamiento.
La comparación es la base del conocimiento y los juicios cuantitativos son
inseparables de la comparación, por lo tanto absolutamente necesarios para la
ciencia. La medición es el arma esencial de la investigación científica, pues
como ha dicho alguien "todo lo que existe, existe en alguna cantidad", Los
problemas que se presentan en la ciencia son cada vez más complejos y no es
posible resolverlos por simple observación. Las relaciones entre fenómenos
son a menudo tan disimuladas por diversos factores que es necesario
iluminarlos con una medición delicada de los misinos, porque sólo midiendo los
fenómenos en condiciones distintas se puede llegar a obtener variaciones y
saber si éstas son concomitantes y, por lo tanto, si existe entre ellos alguna
relación. En psicología, sociología, educación y en las ciencias sociales en
general, la introducción de la medición ha sido lenta y difícil porque, por una
parte, no se comprendía cómo se podían medir fenómenos cualitativamente
diferentes y en segundo lugar, en estas ciencias la gran cantidad de factores
que interviene en la aparición de cualquier fenómeno, hace difícil establecer loa
controles adecuados, lo que no sucede con el estudio de las ciencias naturales
en un laboratorio. Por otro lado,el prestigio de Kant, que había dicho
enfáticamente que las matemáticas no podían aplicarse a la psicología y los
argumentos de Bergson en "Los datos inmediatos de la consciencia" en
contra del positivismo, retardaron la comprensión de la posibilidad de aplicación
de la estadística a la psicología. Para llegar a los desarrollos actuales de la
investigación en psicología matemática, ha sido necesario salvar muchos
escollos y comprender cuál es la relación de isomorfismo que se puede
establecer entre el mundo ideal de la lógica matemática y el mundo de la
observación psicológica y social. La matemática es una invención del hombre,
no un descubrimiento. Por esto, las funciones matemáticas como la curva de
probabilidad normal de Gauss son modelos matemáticos pura y
exclusivamente. Lo que sucede es que es muy conveniente utilizar estos
modelos matemáticos para las descripciones psicológicas cuando es posible
hacerlo. Esta es la gran función de la matemática: proveer modelos fructíferos
para la descripción de la naturaleza. La medición es posible porque la
estructura de la naturaleza, del pensamiento del hombre o sutactividad social,
poseen propiedades que desdé el punto de vista lógico, son suficientemente
similares, paralelas, a la estructura de los sistemas lógicos de las matemáticas.
Es posible establecer entre la naturaleza, en el sentido amplio, y la matemática,
un isomorfismo de estructuras. En algunos casos, este isomorfismo es casi
perfecto, en otros casos lo es menos.
En medición la base son los. números. El sistema numérico ha evolucionado
mucho.
En primer lugar, está el sistema natural de los números, tales como 1, 2, 3, 4,
etc. Con este sistema se pueden hacer las operaciones de suma y
multiplicación, pero no se puede restar, para esto fue necesario crear los
números enteros (que incluyen los números naturales, el O y los números
negativos). Para poder llevar a cabo la operación de dividir fue necesario
inventar los-nu-meros fraccionarios. El sistema que incluye números positivos,
negativos, el O y los fraccionarios se llama sistema racional de los números.
En este sistema se pueden llevar a cabo todas las operaciones fundamentales
excepto la división por 0. Existen algunas expresiones, sin embargo, que no
pueden llevarse a cabo con números racionales; como por ejemplo la raíz
cuadrada de 2. Para abarcar estos resultados fue inventado el concepto de nú-
meros irracionales. Pero para los propósitos prácticos de la raíz cuadrada de
cualquier número puede usarse la aproximación por redondeo, con un número
que pertenece al sistema racional.
\
II. 5. Niveles de medición
Si aceptamos como definición de medición el criterio amplio sostenido por
Stevens (1951) de que "medir es asignar números a objetos o datos de
acuerdo a ciertas reglas" podemos dividir los niveles de medición en cuatro
escalas fundamentales: nominal, ordinal, de intervalos iguales y de
cocientes.
IL5.1 Escala nominal o de clasificación
Es el nivel más primitivo. Según Coombs y Torgerson no debe considerarse
nivel de medición pues no se mide nada, sólo se clasifican objetos, personas o
características. La asignación de números es puramente arbitraria. Por
ejemplo, los distintos grupos de pacientes según una clasificación psiquiátrica,
los números de las chapas de licencia de los automóviles, los números de las
centrales telefónicas, la clasificación de profesionales (en médicos, abogados,
ingenieros, psicólogos, sociólogos, veterinarios, odontólogos, farmacéuticos,
etc.). Las propiedades formales de la escala nominal, es decir, las condiciones
que requiere, son que los miembros, elementos u observaciones de una clase
o categoría deben ser equivalentes, idénticos, respecto al atributo que tenemos
en cuenta. La relación de identidad a = b, a * b ya sabemos
que es simétrica y transitiva.
$•
Cuando tenemos que usar el nivel nominal podemos hacer pocas operaciones
estadísticas. Señalaremos oportunamente ,enea-da diseño estadístico, qué
nivel de medición se puede usar.
IL 5.2 Escala ordinal o por orden jerárquico
Puede suceder que los objetos o elementos de una categoría no solo sean
distintos de los de otras categorías, sino que estén en alguna relación con
ellos; por ejemplo» ser mayores, más altos, más difíciles, más enfermos, etc.
Tales relaciones se expresan por los símbolos ">" y "<" (mayor que, menor
que). Si estas relaciones se presentan entre los pares de categorías tenemos
una escala ordinal. Acá, no solo rigen los postulados matemáticos de identidad,
sino los de orden jerárquico que, como sabemos, son los de asimetría y
transitividad.
En las escalas ordinales están permitidas las transformaciones que mantengan
el mismo orden entre las clases, es decir, transformaciones monotónicas. Por
ejemplo, si tenemos las categorías de analfabetos, educación primaría,
educación secundaría y educación universitaria, podemos llamar a la primera
categoría 1, a la segunda 2, a la tercera 3 y a la cuarta 4 o podemos llamar a la
primera categoría 5, a la segunda 6, a la tercera 7 y a la cuarta 8, es decir,
tenemos que clasificarlas siempre guardando el orden de menor a mayor. O
sea. las transformaciones que no cambien el orden de las clases son
perfectamente admisibles; lo único que sucede es que no sabemos la distancia
entre una categoría y la otra. Así, en cuanto a educación, las categorías están
ordenadas: analfabetos < educación primaría < educación secundaría <
educación universitaria. Pero no sabemos si la distancia entre la categoría
"analfabetos" y "educación primaria" es igual, mayor o menor que la distancia
entre la categoría "educación primaria" y "educación secundaría".
IL5.3 Escala de intervalos iguales o de unidades iguales.
La propiedad más importante que presentan es, por encima de los tipos de
escala nominal y ordinal, que las distancias numéricamente iguales
representan distancias iguales empíricas en la variable que miden. Es decir,
que los objetos a los que se ha
asignado en la escala los números 5 y 10 están igualmente separados que los
otros a los que se les han asignado 10 y 15 en cuanto a la variable medida.
Una escala de intervalos se caracteriza por una unidad de medición común y
constante, que asigna un número real a todos los pares de objetos del conjunto
ordenado. En las escalas de intervalos iguales, el punto O de origen y la unidad
de medida son arbitrarios. :,
Por ejemplo, medimos la temperatura con una escala de tipo intervalo. Existen
dos tipos de escalas muy conocidas, la escala Centígrados y la Farenheit. La
unidad de medición y el punto O son en ambas arbitrarios y distintos; pero nos
dan la misma información. Están linealmente relacionadas, de manera que una
escala puede transformarse en otra por la ecuación y = a + bx ; en el caso de
transformar grados Centígrados a grados Farenheit la ecuación es F = 9/5 C +
32.
Puede así demostrarse que las relaciones de las diferencias de temperatura (o
sea los intervalos) son independientes de la unidad de medición y del punto 0.
Por ejemplo, el punto de congelación en la escala centígrada es 0° y el de
ebullición del agua 100°. En cambio, en la escala Farenheit el punid de
congelación es de 32° y el punto de ebullición 212°. Podemos ejemplificar así
algunos puntos en las 2 escalas:
c* 0 10 30 100
F. 32 50 86 212
Con esto podemos observar que la relación de las diferencias en una escala
son iguales a las relaciones de las diferencias equivalentes en la otra escala.
Por ejemplo, en la escala centígrada la relación entre (30 - 10) / (10 - 0) = 2. y
en la escala Farenheit . para los mismos puntos tenemos también (86 - 50) /
(50 - 32) = 2.
Es decir, que en uña escala de intervalos iguales la relación entre intervalos es
independiente de la unidad empleada y del punto de origen, que son siempre
arbitrarios. En cambio, la relación entre 2 puntos en una y otra escala no es la
misma. Por ejemplo, para la escala C^ 30 /10 = 3 mientras que' para la escala
F° 86 / 50 = 1,7; es decir, no existe una razón o cociente constante entre los
puntos para las dos escalas. También solemos medir por escalas de intervalos
iguales el tiempo del calendario, la altura de las montañas a partir del nivel del
mar, y los puntajes de los tests de inteligencia, de aptitudes o conocimiento. La
escala de intervalos iguales es la primera escala verdaderamente cuantitativa y
a ella pueden aplicarse casi todas las medidas estadísticas, con pocas
excepciones.
II 5.4 Escala de cocientes o razones.
Cuando una escala tiene todas las características de una escala de intervalos
iguales y, además, tiene un punto O verdadero en su origen, tenemos una
escala de cocientes. Esto quiere decir que el O de la escala ha de coincidir con
la "nada" en la variable a medir. En una escala dé cocientes la relación o
cociente entre dos puntos cualesquiera de la escala es independiente de la
unidad de medida (Obsérvese que decimos "dos puntos" y no "dos intervalos o
diferencias entre dos puntos"). Medimos peso, longitud, velocidad, presión
atmosférica, volumen , etc. con escalas de cocientes. Por ejemplo,
comparemos la escala en kilogramos del Sistema Métrico Decimal y la escala
en libras del Sistema Inglés. Por ejemplo:
Kg 1 2 3 4 5
L 2,2 .4,4 . 6,6 SJB U-
En este caso encontramos que no solo existe la misma relación entre los
intervalos o diferencias, es decir
(3-2) 7(6,6-4,4) = 0,454
(5 - 4) / (11-8,8) = 0,454
sino que también hay la misma relación entré dos puntos, es decir
3/2 = 1,5
6,6/4,4 = 1,5
En la escala de cocientes, todas las operaciones aritméticas son permitidas,
tanto a los valores numéricos asignados a los puntos mismos como a los
intervalos, pues existe un cero auténtico y solo es arbitraria la unidad de
medición. Las escalas de cociente se encuentran casi solamente en las
ciencias ñsicas y las únicas transformaciones que se pueden hacer son del tipo
"y = bx" , admitiendo todas las pruebas estadísticas.
Vemos que cuanto más refinadas son las escalas menos tras-formaciones
permiten. Así, en el nivel nominal, un número es tan bueno como cualquier otro
para describir una clase, cualquier operación sistemática mantiene la estructura
de la ciase» La igualdad de los casos dentro de las clases o categorías y la dis-
tinción entre clases no se fuerza.
En las mediciones ordinales se puede hacer también cualquier transformación,
mientras se mantenga el orden jerárquico intrínseco. Podemos multiplicar todos
los números por una constante o sumar una constante a cada número y los
resultados mantendrán el orden jerárquico.
En el caso de las escalas de medición por intervalos iguales las
transformaciones que se pueden permitir son no solo monotónicas, como en
las escalas ordinales, sino también lineales. Así las funciones que impliquen
potencias, raíces o logaritmos no son lineales. La transformación lineal está
expresada por la ecuación "y = a + bx" y da por resultado un cambio en unidad
y origen.
Para las escalas de cociente hay solo una transformación posible que es la
multiplicación por una constante, *y = bx* , en donde "b" puede ser mayor o
menor que O pero no igual.
Ejercicios
1. Clasifique las siguientes variables en cualitativas, discretas o continuas.
a) Edad al ingresar a la universidad* b ) Años de educación completados. c)
Color de ojos. OaMx*4A4 WA e ) Profesiones de una comunidad universitaria*
_ " f ) Respuesta a un cuestionario de actitudes cuyas posibilidades son: en
desacuerdo, de acuerdo, muy de acuerdo. O-»A iuA g) Tiempo que se tarda en
terminar una tarea. Qjo^J^iMuA h) Puntaje en un test de lectura. C*^ cl/^yA
i ) Peso de los chanchitos de la India al comenzar un experimento con vitamina
B. .C£>**^ ¿ ^^
j) Cantidad de arrestos que ha tenido un delincuente > k } Propprción de
proteínas en la alimentación de las personas. C^ll^A '
I) Religión de las personas. .QtJft^¿LMíuAf m ) Presión arterial de la persona
de 60 años. tf^ \ N u A n ) Cantidad de acciones vendidas un día determinado
en la
Bolsa de Comercio de Buenas *A*ires. J¡í¿¿^^ A
o) Temperaturas de Buenos Aires según el registro anual
del Servicio Meteorológico Nacional. OÍ^J^MV^V
p) Escala de sueldos nominales del personal de una Facul-
tad de la UBA. ' £±SLSñ¿5£* •
q) Serie de números de las .ruletas.
2. Con los siguientes datos determinar el nivel de medición que utilizaría en
cada caso.
a ) Religión practicante de cada individuo en un grupo de 200 personas.
v^ON^^M
b ) Un investigador pregunta a un grupo si los niños dejen tener perros para
jugar y los encuestados contestaron: 3n desacuerdo. Muy de acuerdo. De
acuerdo, Muy en desacuerdo, Indeciso. :.§£$±£^
c ) Se pide al investigador que organice los puntajes de un niños de 8 años en
el test de Raven:
43-40-33-32-37
4d-32-39-31-41-27
28-36-33-32-33-42
d) Edad cronológica de una grupo de niños. 4,7,10,8,10,10,8,9,9,6,5,7
Bibliografía
1) FERGUSON, G.A. Statistical Analynis in Paychology and Educatíon. Me
Graw. RY. 1966.
2) GÜILPORD, JP. Puychometric Metíiod». Me Graw H3U N.Y. 1954
3) Hays, W.L. Statistics for P^chdogtóa Holt, Rinehart y Winston.
4) Me Nemar, Al Psychological StoBsttok J. Wücy and Sons, Ñ.Y. 1962
5) Stevena, S.S, Handbook oí Experimental, Psychology. N.Y. J. Wüey and
Sons 1951. ^ •
6) Torgezson, W. S. Theory and Bfethods of Scaling. John Wüey and Sons, Inc.
N.Y. 195a
7)Zekliteh,MJLBasicCour»einSociologicalStati»tic«.H.Hoel N.Y. 1952.
CAPÍTULO III
Presentación de los datos
Cuando un investigador ha decidido el tema a tratar en su trabajo, ha
establecido una hipótesis, ha definido adecuadamente lai variables que
estudiará y ha recolectado los datos, lo primero que deberá hacer es
presentarlos de modo sistemático, mediante tablas y gráficos que le permitan
describir o explicar sus resultados con claridad
IIL1 Variables cualitativas
Cuando los datos obtenidos son sobre variables cualitativas que sólo poseen la
información correspondiente a escalas nominales u ordinales, es importante,
establecer comparaciones entre las distintas clases o categorías. Para esto
existen algunas operaciones sencillas que suelen resultar muy útiles. Estas
son: las proporciones, los porcentajes y las razones.
EDLl.l Proporciones
Supongamos que tenemos una escala nominal con cuatro categorías: Nj, N,, N 3
y N4. El número total de caso será N, o sea
.N N N N N
Supongamos que tenemos dos pequeñas poblaciones, A y B y
a continuación en la
Se
Tabla nú Delincuentes y no delincuentes en dos comu-nidadesAyB
Delincuentes No delincuentes
101 140
•
481 1146
582 . 1286
Estos datos resultan difíciles de comparar por tener cantidad
- Si ta
en proporciones tenemos
Tabla HI.2 Proporciones de delincuentes y no delin-cuentes en dos
comunidades A y B
Delincuentes No delincuentes
0,173 — -0,108
0,827 0.891
, 1,000 1,000
Estos datos sí pueden compararse y el investigador podrá tratar de explicar las
causas de por qué es mayor la proporción de delincuentes en la comunidad A,
etc.
IIL1.2 Porcentajes
Los porcentajes surgen de las proporciones multiplicando por 100. Sin
embargo, hay que tener en cuenta ciertas precauciones. Por ejemplo: si
tenemos los siguientes resultados como respuestas a una pregunta de un
cuestionario, tal como se presenta en la Tabla HI.3
Tabla ZIL3 Porcentajes relativos a las respuestas a una pregunta •
Respuestas N . .%
Muy agradable 10 40
Agradable 7 28
Indiferente 2 8
Desagradable 4• 16
Muy desagradable 2 8
25 100
Vemos que la diferencia entre el grupo que ha contestado a la pregunta como
agradable (7 casos, 28 %) y eljgrupo que ha contestado Desagradable (4
casos, 16%) hace pensar , por el porcentaje, que son muy diferentes, pero
veremos (cuando lleguemos a la estadística inferencial) que una diferencia de 3
casos en una muiestra de sólo 25 casos en total, puede muy bien ser debida
sencillamente al azar. Por lo tanto, en el uso de proporciones y porcentajes hay
dos reglas que se deben cumplir pues son muy importantes:
1) Siempre hay que informar sobre el número de casos usado para la
proporción o porcentaje.
2) No debe calcularse ningún porcentaje cuando'el N total de casos es menor
que 50.
La tabla que sigue, por ejemplo, sería correcta:
N
Tabla IIL4 Niveles de educación alcanzados según una encuesta realizada
a 880 jóvenes de 25 años.
Educación alcanzada
N
Nivel Primario 600 68,18
Nivel Secundario 200 22,73
Nivel Universitario 80 9,09
880 • 100,00
HL1J3 Razonéis. La razón de un número A respecto de otro B se define como
el cdciente A/B. Supongamos que tenemos la Tabla HL5 sobre afiliados a
partidos políticos.
Tabla HL5
Partidos políticos
N
Radicales Peronistas Otros partidos
La razón de radicales a peronistas será 365/420 ~ 0,86. La razón entre
radicales y peronistas a otros partidos será (365 + 420) /130 = 6,03. Obsérvese
que la razón puede tener un valor mayor que la unidad, lo que no puede
suceder con una proporción.
Las tasas de crecimiento son un tipo común de razones. Se suelen computar
viendo el aumento real durante un período de tiempo dividido por el tamaño al
iniciarse el período. Por ejemplo, si la población de una ciudad en 1980 era de
50.000 habitantes y en 1990 era de 65.000, la tasa de aumento en la década
será de:
65.000-50.000 15.000
= 0,30
50.000 ' 50.000
o sea que ha habido un aumento de la población de un 30% en diez años. En
el caso de las tasas, los porcentajes pueden ser mayores del 100 % y también
pueden ser negativos en el caso de que haya habido una disminución de la
población.
.4 Números índice
JSn .economía y finanzas son muy usados, los. números indi** que miden los
cambios de una variable o de un grupo de variables, respecto al tiempo. Por
ejemplo, mediante los números índice se puede comparar los precios de los
alimentos o de otras necesidades durante un año con los del año anterior Sin
embargo, los números índice pueden ser aplicados a muchos otros campos,
como por ejemplo la educación; mediante el uso de pruebas objetivas de
conocimiento se podría comparar, con los números índice, los conocimientos
de un grupo de estudiantes con otros de distintos lugares y para distintos años.
Por ejemplo, es muy conocido en el Cociente Intelectual que es, por tanto, un
número índice. Uno de los ejemplos más simples de número índice es el de
precio relativo, que es la relación del precio de un producto durante un
determinado período con su precio en otro período, llamado periodo base o
de referencia. Para simplificar, se supone que los precios son constantes
durante los períodos de tiempo utilizados.
Por ejemplo, supongamos que 1 litro de leche costaba 50 centavos en 1990 y
60 centavos en 1992. El precio relativo sería:
Precio en 1992 Precio en 1990
60
50
= 1,2 = 120%
Esto significa que en 1992 el precio de la leche fue 120% el de 1990, es decir,
que subió en un 20%.
Existen muchas maneras de calcular los números índice según se comparen
precios solamente o precios y cantidades, y también según se use un período
de tiempo o varios períodos promediándolos, todo lo cual está fuera del
alcance de este libro.
III, 1.5 Representaciones gráficas
-
Los gráficos más comunes para representar datos de escalas nominales u
ordinales son los siguientes:
1) Gráficos de barras o de columnas. Por ejemplo supongamos que tenemos
los datos de la Tabla III.6
•
Pabla III.6 Profesionales matriculados en un período en una una ciudad
hipotética A
Para granear esta tabla colocaríamos en el eje horizontal categorías de la
variable, todas de la misma amplitud, por ejemplo Icm., y separadas, y en el eje
vertical el número de casos, usando, según nos convenga convencionalmente,
por ejemplo, 2 cm. cada 100 sujetos. El resultado sería él que se presenta en le
Figura IIL1
Fig. HL1 Gráfico de barras o columnas según los datos de la tabla HL6
sobre distribución de profesionales.
Me.
Od.
So.
P*.
Otros
2) Gráfico sectorial
Por ejemplo, supongamos que tenemos una tabla cómo la Tabla HL7 en la que
se ve la distribución de grandes partes de la superficie terrestre.
Parte continental
Km»
África 30.200.000
Asia ;, 26.842.000
Europa 4.904.000
Norteamérica 24.261.000
Rusia 20.390.000
Oceanía 8.517.000
América del Sur 17.809.000
132.923.000
Podemos representar estas medidas como sectores de un círculo de una
circunferencia de un radio cualquiera, por ejemplo, de 5 cm. Como la
circunferencia vale 360° sólo tenemos que establecer la proporción del ángulo
correspondiente a cada categoría. Así, para África con 30.200.000 km 2 de
superficie, decimos: si a 132.923.000 km2 le corresponden 360°, a 30.?00.000
km2 le corresponden:
360° x 30.200.000 132.923.000
= 81,7"
Haciendo los cálculos para todas las regiones vemos que le corresponden a
Afinca 82°, a Asia 73°, a Europa 13°, a Norteamérica 66°, a Rusia 55°, a
Oceanía 23° y a América del Sur 48°. \sí. lo hemos representado en la Figura
HL2
Fig. IIL2 Gráfico sectorial o en forma de pastel según los datos de la Tabla
HL7, en millones de Km*
América del Norte 24,2 mili. Km*
América
del Sur
17 raill. Km*
3) Pietogramas
Supongamos que queremos hacer un pictograma de los datos de la tabla HI.8
Tfebla IIL8 Población de los Estados Unidos de Amétíea en millones de
personas.
1920 1930 1940 195Q 1960
105xnillQnes 122 millones 131 millones 151 millones 179 millones
Para hacer un pictograma se toma, por ejemplo, un dibujo que represente
esquemáticamente una persona, y esto podría significar 10 millones de
personas. El resultado es un pictograma como el de la Figura IIL3
Fig. IIL3 Con los datos de la tabla IIL8 se ha elaborado el pictograma en
donde A equivale a 10 millones de personas
ÍI.2 Variables Cuantitativas
La sistematización de los datos para las variables
cuantitati-
DISEÑO ESTADÍSTICO PAM INVESTIGADORA EN CIENCIAS SOCIALES
YDELC
*m
vas es igual si se trata de variables medidas en escala de intervalos iguales o
de cocientes. Los datos suelen clasificarse en estos casos usando tablas en la
que tenemos, por un lado, la variable con sus valores y al lado, las frecuencias,
o sea la cantidad de veces que se observa cada valor de la variable. Las
variables, que suelen simbolizarse por X se granearán en la horizontal o
abscisa en un sistema de coordenadas cartesianas y las frecuencias en la
vertical u ordenada.
IIL2.1 Variables discretas
"• . •''
Supongamos que tenemos la siguiente variable discreta: cantidad de hijos por
familia. Si tuviéramos los valores de la Tabla III.D los granearíamos como
aparecen en la Figura IIL4
Tabla III.9 Distribución de las familias de una comunidad A según número
de hijos
Número de hijos X
Cantidad de familias
L
0 30
1 80
2 240
3 320
4 78
5 12
6 5
765
Fig. IIL4 Gráfico de barras para representar los datos de la Tabla IIL9
Familias de una comunidad según el número de hijos.
6 x hijos
III.2.2 Variables continuas
Para las variables continuas, como los datos numéricos suelen ser más
numerosos explicaremos todo el proceso de la construcción de una tabla de
frecuencias.
Supongamos que aplicamos un test de inteligencia a 50 ni-ios. Lo primero que
obtenemos será un conjunto desordenado de puntajes como los de la Tabla
ITL10:
usa^antímnta^anamáaimv
Tabla ra.10. Puntajes obtenidos para 50 niños en un test de inteligencia
-,• =^^ 80 100 95
—————
80 90
88 95 79 104 98
82 98 86 102 93
80 87 '100 102 102
95 83 104 106 103
102 85- 103 103 110
92 83 90 80 104
100 103 102 95 83
90 97 93 92 104
94 91 85 102 103
Lo primero que podemos hacer es de menor a
ordenarlos yor por magnitud como en la ma-
Tabla ffi.ll
Tabla IBL11. Puntajes ordenados por rangos
79 85 93 100 103
80 86 93 100 103
80 87 94 100 103
80 88 96 102 104
80 90 95 102 104
82. 90 .95 102 104
83 90 95 102 104
83 91 97 102 105
83 92 98 103 106
85 93 98 103 110
Esta ordenación por rangos no tiene grandes ventajas, pero permite ver
rápidamente los valores que mas se-repiten. Esto permite pensar que los datos
se podrían poner en 2 columnas indicando por un lado los posibles puntajes y
por otro las veces o frecuencia con que un puntaje determinado se produce.
Veamos esto ejemplificado con los datos anteriores en la Tabla IIL12 Tabla
IH.12
79....................... ,..........................
80....................... ......! 4
81.......................
82....................... ...........................
83........................ .....0 ...................
84........................ .............1 ...........
....................3
85........................ ............. .............
.....0
86.:,..................... ...........................
....2
87........................ .....................;.....
. ....!
88........................ ...........................
. 1
89........................ ...........................
. ...1
90........................ ...........................
. ...0
92........................ ........:..................
.. ..!
93........................ ...........................
.. ..2
94........................ ...........................
.. ..2
95........................ ...........................
... .1
96........................ 4
...
97........................ ...........................
... 0
...........................
1
99........................ ...........................
.... .2
100 ...........................
0
101...................... ...........................
...... 3
102...................... ...........................
....... 0
103...................... ...........................
...... 5
104...................... ..........................
....... 5
105...................... ..........................
....... 4
106«—— .........>...^..........l
™................
107......................
........
108...................... .........................0
........
109...................... .... . ..................0
........
110...................... .........................0
.........
.........................0
m
DISEÑO ESTADÍSTICO PARA INVESTIGADORES ENOENCIAS SOCIALES Y
DEL (
. • i?
En esta Tabla HL12 los puntajes se han clasificado en tantas clases como
valores de la variable, o sea, puntajes. Pero como se ve por la cantidad de
ceros, es conveniente en estos casos ordenar las clases de la variable-
arbitrariamente, así los puntajes de 80 a 84 podrían ir juntos y los de 85 a 90
también. Este tipo de agrupamiento se llama Distribución de frecuencias
agrupa» das por intervalos de clase y en nuestro ejemplo se vería como en
la Tabla IH.13
Tabla ffl.13
Intervalos de clase Marcas Frecuencia
N° de Puntaje casos por
intervalos
75 - 79 . \ 1
80 . 84 WV \\\ 8
85 - 89 AA44- 5
90 - 94 JVm \\\\ 9
95 . 99 JUU \\ 7
100 -104 ^WVA-U^-VWU 17
105 - 109 \\ 2
110 - 114 \ 1
La agrupación en intervalos de clase supone, en cierto modo, pérdida de
información, ya que se da por supuesto que todas las observaciones de una
clase intervalo se concentran en el punto* medio del intervalo.
El tamaño del intervalo depende de: 1) la amplitud que abarcan los valores de
la variable y 2) la cantidad de observaciones. Con pocos intervalos
desperdiciamos información, con muchos intervalos ahorramos poco trabajo.
Conviene utilizar el mismo tamaño a lo largo de la distribución y no conviene
que sean menos dé 10 ni más de 20. Generalmente $e hacen de 2, 3, 5 a 10
unidades. Los intervalos tienen un límite inferior y superior que es el escrito; por
ejemplo, SO -.84 y un límite real que en este caso sería 79,5 y 84,5.
Para hallar el punto medio de un intervalo se suman los límites escritos y se
divide por dos. Por ejemplo, para el punto medio entre 80 y 84 sería:
80 + 84
-82
ÍII.2.3 Gráficos para las variables continuas
Existen dos gráficos que podemos usar para las variables continuas
expresadas en una tabla de distribución de frecuencias :on intervalos de clase.
Estos son el histograma de Pearson Figura ITI.5) y el polígono de frecuencias
(Figuras JHL6).
En el primer caso representamos la frecuencia del intervalo jor una superficie
(histograma viene de iorós = columna en griego), en el segundo caso la
frecuencia del intervalo se representa ,or una ordenada en el punto medio del
intervalo.
Siempre la variable X se -indica en la abscisa y la frecuencia n la ordenada.
Las Figuras HL5 y HL6 ejemplifican los datos Tela Tabla de puntajes HI.13:
Fig. IIL5 Histograma de Pearson para la distribución de frecuencias de la
Tabla HL13
f
18
16
14
12
10
3
6
4
2
74^ 79,5 84,5 89,5 94,5 99,5104,5109,5114,5 x puntajes
Fig* IIL6 Polígono de frecuencias para la distribución de la Tabla m.13
72 77
87 92 97 1Q2«< 107 112 117 PJkí x
Como puede verse en el histograma de Pearson, en la abscisa se colocan los
límites, inferiores de cada intervalo y las columnas están pegadas una a la otra,
no separadas como en las variables discretas.
En el polígono de frecuencias, los valores de la ordenada corresponden al
punto medio de cada intervalo y para los datos se coloca un punto medio
anterior y uno posterior a la distribución con frecuencia cero, para que quede
cerrada la figura del polígono, pues en realidad la superficie dentro del polígono
de frecuencias es igual a la del histograma para la misma distribución.
En los gráficos de distribuciones de frecuencia es usual representar los
puntajes en el eje horizontal y las frecuencias en el eje vertical. Se suele
establecer una relación arbitraria que establece un cociente de 3/5 de la altura
respecto al ancho to~ ;al de la figura. El cero debe colocarse en la intersección
de los ios ejes y señalar con un pequeño corte, si los puntajes o valo-•es no
comienzan desde 0. *
IIJ2.4 Distribución
de frecuencias acumuladas
Existen situaciones en las que es conveniente conocer la candad de valores
"mayores que0, "o menores que", un determína-) valor. Esto se obtiene
fácilmente con la distribución de fre-lencias acumuladas que además puede
hallarse también en )rcentajes o frecuencias acumuladas relativas. Para
nuestros ttos de la Tabla ICL13 tendríamos la siguiente Tabla DDL14 en mde
hemos colocado las frecuencias usuales, las acumuladas nples y las
acumuladas relativas.
DISEÑO ESTADÍSTICO PAM INVESTIGADORES EN aWCIAS SOCIALES Y
DEL (
Tabla m.14
Variable x Frecuenc Frecuencia
Frecuencias ias s
intervalos f Acumula Acumulada
de dase das s en%
75 - 79 1 1 2
80 - 84 8 9 18
85 - 89 5 14 28
90 - 94 9 23 46
95 - 99 1 30 60
100 -104 17 47 94
105 -109 2 49 98
110 -114 1 * 50 100
También sera útil a veces, granear las frecuencias acumuladas. En la abscisa
se colocan los límites inferiores reales de cada intervalo y en la ordenada van
los valores de las frecuencias hasta este límite inferior.
Podemos ver el gráfico correspondiente a la Tabla HL14 en la Figura HL7:
Fig. 111*7 Curva de frecuencias acumuladas paira los datos de la Tabla
ffl.13
50
46
40
35
30
25
20
15
10
5
O
74,5 79,5 84,5 89,5 94,5
104,5 109,5 114,5 z
Cuando graneamos la curva de frecuencias acumuladas relativas obtenemos
una curva en forma de S estilizada, que se llama Ojiva de Galton que facilita la
comparación entre distintas distribuciones por ser la altura común. Por ejemplo,
supongamos que tenemos dos distribuciones de frecuencias, como las que pre-
sentamos en la Tabla IIL15 como Distribuciones A y B. En ambas hemos
acumulado las frecuencias y obtenido sus frecuencias acumuladas relativas,
que podemos comparar observando el gráfico de la Figura III.8
Fig. IIL8. Comparación de dos distribuciones acumuladas A y B para los
datos de la Tabla IIL15
29,5. 34,5 39,5 44,5 49,5 54,5
- 79,5 x
I
a
Tabla m.15
DISEÑO ESTADÍSTICO PARA.INVESTIGADORESEH CIENCIAS SOCIALES
Y DEL
COHPOSTAiOSNTO
Distribución A Distribución B
X f fa fa% X f fa fa%
30-34 5 5 1.25 30-34 5 5 1.14
35-39 10 15 3.75 35-39 20 25 5.72
40-44 15 30 t.5 40-44 40 65 14.87
45-49 30 60 15.0 45-49 90 155 35.46
0
50-54 "60 120 30.0 50-54 100 255 58.37
0
55-59 120 240 60.0 55-59 80 335 76.65
0
60-64 80 310 80.0 60-64 60 395 90.38
0
65-69 45 365 91.0 65-69 30 425 97.25
0
70-74 25 390 97.0 70-74 10 435 99.50
0 •
76-79 10 .400 75*79 2 437 100.0
100.00 0
No todas las distribuciones, al ser acumuladas, producen la Ojiva de Galton.
Existe también la curva de concentración de Lo-renz. Para entenderlo
supongamos que tenemos 10 jóvenes estudiantes que tienen cada uno de ellos
1 peso. Si graneamos las frecuencias acumuladas de los pesos y de los
estudiantes tendremos una repta como se ve en la Figura IDL9
Fig. IIL9 Comparación de dos distribuciones acumuladas *v A y B para los
datos de la Tabla m.15
Pesos
9 10 Estudiantes
Sin embargo, como sucede a menudo, si la entrada de muchos es poca y la
entrada de pocos es mucha, la curva resulta como en la Figura IH.IO en donde
5 estudiantes no poseen nada, el sexto, séptimo y octavo tienen 1 peso, el
noveno 2 y el décimo 5. Acumulando estos valores resulta la curva de la Figura
IIL10
Fig. EUL10 Curva de Lorenz.
10
93765432OO
6.
8 9 10 Estudiantes
La cual demuestra muy gráficamente que cuanto más repartidas estén las
entradas, más se acercará la curva a la recta de a Figura ffl.9.
IIIJ.l Redondeo de las cifras
Como el investigador que emplea la estadística maneja a me-ludo muchos
números, es conveniente recordarle cómo se hace rl redondeo para los valores
de una serie continua. En primer lu-
DISEÑO ESTADÍSTICO PARA WESTIQADOJWWaSNC^
gar, debe decidir cuántas cifras significativas desea usar después de la coima
decimal; lo usual es usar dos, así, si aparece un número como 3,2875316 él
puede decidir aceptar dos o tres a partir de la coma. Para esto hay criterios
establecidos. Por ejemplo, si desea dejar 2 cifras significativas: 1) Si la cifra
real siguiente a la última significativa es menor qad 5 se desprecia la cantidad
residual. Así, 75,2831 quedaría 75,28. 2) Si la cifra siguiente a la última
significativa es mayor que 5 se aumenta la última significativa en una unidad.
Por ejemplo, 5,238 quedaría 5,24. 3) Cuando la cifra siguiente a la significativa
es 5 por convención se acepta que si la cifra significativa antes del 5 es par, se
desprecia el residuo, si es impar se aumenta en una unidad. Así, si tenemos
27,245 quedará 27,24; si tenemos 27,275 queda 27,28.
HI.3.2 Notación científica.
Cuando por algún motivo el estadístico debe usar números con muchos ceros
antes o después de la coma decimal es conveniente utilizar la notación
científica que utilízalas potencias de 10.
Por ejemplo:
101 = 10 10° = 1
10a = 100 10-* = 0,1
10* = 10000 10-6 = 0,00001
Í3s decir que, por ejemplo, si multiplicamos un número por 10 8 corremos la
coma decimal 8 lugares hacia la derecha* Así,
8,64 x!08 = 864000000
Si multiplicamos un número por 10"5 corremos la coma decimal 5 lugares hacia
la izquierda. Por ejemplos
3,416 x 10-6 » 0,00003416
Es conveniente saber esto porque, por ejemplo, cuando usamos una
computadora manual usual si queremos multiplicar, por ejemplo: 0,0003 x O,
0004 aparecerá en la pantalla 1,2 '7 es decir 0,00000012.