ESTADÍSTICA
Capítulo 1
Recolección, organización y
presentación de datos
Introducción
En el trabajo cotidiano nos encontramos continuamente frente a
situaciones en las cuales se deben tomar decisiones basadas en la observación
de fenómenos. Así, por ejemplo, el médico debe establecer medidas de acción
basadas en una serie de diagnósticos, el psicólogo debe recomendar distintas
terapias después de un estudio a fondo del caso en particular, el ingeniero debe
solucionar problemas técnicos del proceso productivo en base a observaciones
efectuadas sobre una serie de defectos de los productos fabricados, etc. Estas
decisiones generalmente están apoyadas por una teoría pertinente en el
campo específico y, a su vez, en la experiencia acumulada por el profesional en
base a la observación de hechos con características similares.
La persona común concibe la estadística como columnas de cifras o
gráficos, sin embargo, podemos decir que la estadística llega a tener un sentido
más amplio. La función principal de la estadística es elaborar principios y
métodos que nos ayuden a tomar decisiones frente a la incertidumbre.
La estadística se emplea hoy en toda clase de estudios científicos, en toda
situación en la cual deba tomarse una decisión basada en datos empíricos.
1
1. Recolección, organización y presentación de datos 2
1.1. Concepto de Estadística
Iniciaremos nuestro estudio de la estadística señalando, como lo hicimos
en la introducción, que la palabra tiene dos significados básicos. En el primer
sentido, el término se utiliza para referirse a números que derivan de datos
obtenidos, como se muestran en los siguientes ejemplos:
En la Copa Mundial FIFA Brasil 2014 hubo un promedio de 2,7 goles por
partido, superando al mundial anterior donde la media fue de 2,3 goles
por partido.
La publicación Newsletter Transplant 2014, que recogió datos a nivel
mundial durante el 2013, revelo´ que la Argentina lidera en América
Latina el número total de pacientes trasplantados, con 42,7 donantes por
millón de habitantes, seguido por Uruguay, con 42,6, y Brasil, con 37,8, y
que tiene además la tasa más alta de trasplantes cardíacos, con 2,4
donantes por millón de habitantes, seguido por Chile, con 1,8, y
Colombia, con 1,7.
El ministro de Agricultura, Carlos Casamiquela, expresó que la
producción argentina de soja del ciclo 2013/14, cuya cosecha avanza a
toda velocidad, alcanzara´ un récord de 55 millones de toneladas.
El segundo significado, en un sentido más amplio, se refiere a la estadística como
método de análisis.
Definición 1.1.1. La estadística es el estudio de los métodos y
procedimientos para recoger, clasificar, resumir y analizar datos y para hacer
inferencias científicas partiendo de tales datos que nos permitirá´ tomar
decisiones en determinados ´ámbitos.
Esta definición cubre gran parte de la actividad del científico. Es
importante observar que el objeto sobre el que se realiza el análisis estadístico
son los datos y las observaciones científicas son por sí mismos, más que el
material químico que interviene en el estudio.
Claramente, la estadística implica mucho más que simplemente trazar gráficas y
calcular promedios.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 3
1.2. Estadística descriptiva y Estadística
inductiva
La estadística se puede dividir en 2 categorías, la estadística descriptiva y
la estadística inductiva. La estadística descriptiva es una ciencia que sirve como
método para organizar, analizar series de datos (por ejemplo, edad de una
población, altura de los estudiantes de una escuela, temperatura en los meses
de verano, etc.) y poner de manifiesto sus características esenciales con el
propósito de llegar a conclusiones.
La estadística inductiva se basa en las conclusiones a la que se llega por la
ciencia experimental basándose en la utilización de datos muéstrales.
En la terminología estadística, el procedimiento inductivo implica el hacer
inferencias acerca de una población adecuada o universo a la luz de lo
averiguado en un subconjunto aparte o muestra. La inferencia estadística se
refiere a los procedimientos mediante los cuales se pueden hacer tales
generalizaciones o inducciones.
Es importante por todo lo dicho anteriormente, que el proceso de la
inferencia científica, implica el grado más elevado de cooperación entre la
estadística y el estudio experimental.
Las causas por las cuales se recurre al muestreo son:
Analizar a la población resulta muy costoso por la relación
costo/beneficio.
Analizar a la población completa lleva mucho tiempo.
Al analizar el objeto de estudio se lo destruye, por lo cual si analizamos a
toda la población nos quedamos sin unidades.
La población a analizar es infinita, por lo cual es imposible analizarla en su
totalidad.
La población a analizar es inaccesible.
1.3. Etapas del Método estadístico
El método estadístico consiste en una secuencia de procedimientos para el
manejo de los datos cualitativos y cuantitativos de la investigación.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 4
Dicho manejo de datos tiene por propósito la comprobación, en una parte de la
realidad, de una o varias consecuencias verificables deducidas de la hipótesis general
de la investigación.
Las características que adoptan los procedimientos propios del método
estadístico dependen del diseño de investigación seleccionado para la
comprobación de la consecuencia verificable en cuestión.
El método estadístico tiene las siguientes etapas:
1. Recolección
2. Organización
3. Presentación
4. Síntesis
5. Análisis
6. Interpretación
Tales etapas siempre se encuentran en el orden descrito y cada una de ellas
consiste, de manera resumida, en lo siguiente:
1. Recolección (medición). En esta etapa se recoge la información
cualitativa y cuantitativa señalada en el diseño de la investigación. En
vista de que los datos recogidos suelen tener diferentes magnitudes o
intensidades en cada elemento observado (por ejemplo, el peso o la talla
de un grupo de personas), a dicha información o datos también se les
conoce como variables. Por lo anterior, puede decirse que esta etapa del
método estadístico consiste en la medición de las variables.
La recolección o medición puede realizarse de diferentes maneras, a
veces ocurre por simple observación y en otras ocasiones se requiere de
complejos procedimientos de medición, en algunas ocasiones basta con
una sola medición y en otras se requiere una serie de ellas a lo largo de
amplios periodos de tiempo.
La calidad técnica de esta etapa es fundamental ya que de ella depende
que se disponga de datos exactos y confiables en los cuales se
fundamenten las conclusiones de toda la investigación.
Es tan grande la importancia de esta etapa que algunas clasificaciones de
las investigaciones se basan en la forma en que ocurre la medición; por
ejemplo, si la información es recogida en una sola ocasión suele decirse que
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 5
la investigación es transversal; en cambio, si la información es recogida a lo
largo del tiempo se denomina longitudinal a la investigación.
En ocasiones, la recolección de la información debe ocurrir en grupos tan
grandes de individuos que se hace impráctico tratar de abarcar a todos
ellos, entonces es cuando se ponen en práctica procedimientos de
muestreo. Tales procedimientos de muestreo están subordinados a la
consecuencia verificable que se desea comprobar y al diseño de
investigación seleccionado.
2. Organización. En esta etapa del método estadístico la información
recolectada es sometida a revisión realizando correcciones, clasificación
y computo numérico.
A veces la organización puede realizarse de manera muy simple, por
ejemplo, con rayas o palotes, en otras ocasiones se requiere el empleo de
tarjetas con los datos y, en investigaciones con mucha información y
muchos casos puede requerirse el empleo de computadoras y programas
especiales para el manejo de bases de datos.
En términos generales puede decirse que la organización consiste en la
cuantificación de la frecuencia con que aparecen las diversas
características medidas en los elementos en estudio; por ejemplo: el
número de personas de sexo femenino y el de personas de sexo
masculino, o el número de niños con peso menor a 3 kilos y el número de
niños con peso igual o mayor a dicha cifra.
3. Presentación. En esta etapa del método estadístico se elaboran los
cuadros y los gráficos que permiten una inspección precisa y rápida de
los datos.
La elaboración de cuadros, que también suelen llamarse tablas, tiene por
propósito acomodar los datos de manera que se pueda efectuar una
revisión numérica precisa de los mismos.
La elaboración de gráficos tiene por propósito facilitar la inspección
visual rápida de la información.
Casi siempre a cada cuadro con datos le puede corresponder una gráfica
pertinente que represente la misma información.
Presentar la misma información tanto en un cuadro como en su
correspondiente gráfico permite obtener una clara idea de la
distribución de las frecuencias de las características estudiadas.
4. Síntesis. En esta etapa la información es resumida en forma de medidas
que permiten expresar de manera sintética las principales propiedades
numéricas de grandes series o agrupamientos de datos.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 6
La condensación de la información, en forma de medidas llamadas de
resumen, tiene por propósito facilitar la comprensión global de las
características fundamentales de los agrupamientos de datos.
Tales medidas de resumen, al ser comunicadas, permiten a los
interlocutores evocar de una misma manera la esencia de los datos; por
ejemplo, cuando alguien informa que el promedio de calificaciones de un
grupo de alumnos es 9.6, en una escala que va del 0 al 10, la imagen que
se transmite es la de un grupo con buen aprovechamiento escolar;
igualmente, cuando se dice que el porcentaje de defunciones con una
cierta técnica quirúrgica es de 80%, las personas que escuchan se
imaginan que se trata de un procedimiento peligroso.
La información cualitativa, como el sexo, la ocupación o los tipos de
enfermedades, requiere ser condensada a través de medidas de resumen
diferentes a la que se usan para sintetizar la información cuantitativa o
numérica como el peso, la talla o la concentración de glucosa.
Entre las principales medidas de resumen para sintetizar a los datos
cualitativos se encuentran las razones, las proporciones y las tasas.
Entre las principales medidas para sintetizar los datos cuantitativos se
encuentran la moda y la amplitud, la mediana y los percentiles, y el
promedio y la desviación estándar.
5. Análisis. En esta etapa, mediante fórmulas estadísticas apropiadas y el
uso de tablas específicamente diseñadas, se efectúa la comparación de
las medidas de resumen previamente calculadas: por ejemplo, si antes se
han calculado los promedios de peso de dos grupos de personas
sometidas a diferentes dietas, el análisis estadístico de los datos consiste
en la comparación de ambos promedios con el propósito de decidir si
parece haber diferencias significativas entre tales promedios.
Existen procedimientos bien establecidos para la comparación de las
medidas de resumen que se hayan calculado en la etapa de descripción.
Tales procedimientos, conocidos como pruebas de análisis estadístico
cuentan con sus fórmulas y procedimientos propios.
Cada prueba de análisis estadístico debe utilizarse siempre en función
del tipo de diseño de investigación que se haya seleccionado para la
comprobación de cada consecuencia verificable deducida a partir de la
hipótesis general de investigación.
6. Interpretación. Es una etapa que esta´ presente en todo trabajo
estadístico y esta´ ligada a una apreciación subjetiva de los resultados del
trabajo.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 7
1.4. Conceptos básicos
En estadística es común utilizar los términos población, muestra y variable
entre otros. Estos términos son centrales en la estadística, así que los
definimos a continuación.
Individuo: es cualquier elemento que porte información sobre el fenómeno que se
estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un
individuo; si estudiamos la salud de mujeres embarazadas en un centro de salud,
cada mujer embarazada es un individuo.
Al individuo también se lo conoce como unidad de observación o unidad
experimental.
Población: es el conjunto de todos los individuos (personas, objetos, animales, etc.)
que porten información sobre el fenómeno que se estudia. Por ejemplo, si
estudiamos la alfabetización en una ciudad, la población será´ el total de los
individuos mayores de 10 años de dicha ciudad.
Una población es finita cuando todos los elementos que la constituyen pueden ser
físicamente listados e individualizados, en caso contrario se dirá´ que la población
es infinita. Una forma de simbolizar a la población será´ mediante la letra N.
Muestra: es un subconjunto representativo de la población que se selecciona para
ser estudiado ya que la población es demasiado grande como para analizarla en
su totalidad. Así, si se estudia la deserción escolar de una ciudad, lo normal será´
no recoger información sobre todas las escuelas de la ciudad (sería una labor muy
compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda
que es suficientemente representativo. Una forma de simbolizar a una muestra
será´ mediante la letra n.
Parámetro: es una medición numérica que describe alguna característica de una
población.
Estadística: es una medición numérica que describe alguna característica de una
muestra.
Censo: es el estudio realizado sobre la totalidad de la población.
Encuesta o muestreo: es el estudio realizado sobre una muestra.
Dato: es la información o característica que se registra en el proceso de
observación de un individuo. Ejemplos de datos son la edad, el peso y la
estatura de un niño.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 8
Variable: es cualquier característica que varía de individuo a individuo en
la muestra o población. Ejemplos de variables son los diferentes grados
de desnutrición en que se puede clasificar a un niño según su edad, peso
y estatura. Otro ejemplo de variable es la nacionalidad de los turistas que
ingresan al país durante temporada de vacaciones.
Las variables se clasifican en:
• Variable cualitativa o categórica: son aquellas que clasifican a las
unidades de observación o individuos en clases o categorías. Si las
categorías tienen un orden propio (por ejemplo: nunca, a veces,
siempre), se dice que la variable es ordenable. Si las categorías no
tienen un orden (por ejemplo: mujer, varón), se dice que la variable
es no ordenable. Las observaciones hechas sobre variable
cualitativas se denominan datos categóricos y muchas veces son
codificados.
• Variable cuantitativa o numérica: son aquellas cuyas observaciones
provienen de procesos de medición o conteo (finito, infinito
numerable). Las operaciones aritméticas definidas sobre tales
variables tienen significado. Son datos mensurables. Ejemplos son
edad, peso, altura, ingreso salarial, cantidad de autos, etc. Por su
parte, las variables cuantitativas se pueden clasificar en discretas y
continuas:
◦ Discreta: solo puede tomar valores enteros (1, 2, 8, –4, etc.). Un
ejemplo es el número de hermanos de un alumno de la escuela
primaria (puede ser 1,2, 3, etc., pero nunca podrá´ ser 3,45).
Estos valores se obtienen mediante el conteo.
◦ Continua: puede tomar cualquier valor real dentro de un
intervalo. Un ejemplo es la estatura de un adolescente del
colegio secundario (puede ser 1,83m,1,51m,1,79m, etc.). Estos
valores se obtienen mediante una medición.
Escala de medición: la recolección de datos requiere una escala de medición.
Esta puede ser nominal, ordinal, de intervalo o de razón.
• Escala nominal. Sus valores solo se pueden clasificar en clases (o
categorías), no se pueden ordenar de pequeño a grande o de menos
a más. Ejemplos: sexo, estado civil, profesión, ocupación. En
ocasiones estos valores se codifican asignándoles un símbolo
alfabético o numérico.
• Escala ordinal. Sus valores se pueden clasificar en categorías y se
pueden ordenar en jerarquías con respecto a la característica que
se evalúa. Ejemplos: nivel de estudio (primario, secundario,
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 9
terciario, universitario), calidad de un producto (malo, regular,
bueno, muy bueno), clase social (baja, media, alta), lugar en la clase
(primero, ..., último).
• Escala de intervalo. Sus valores no solo tienen un orden natural,
además es posible cuantificar la diferencia entre dos valores de
intervalo. Generalmente tienen unidad de medida. Una variable de
intervalo es discreta cuando solo puede tomar un valor entero (por
ejemplo: número de hijos, veces que se consultó al establecimiento
de salud); o bien es continua si puede tomar cualquier valor en un
intervalo (por ejemplo: peso, talla, índice de masa corporal, etc.).
• Escala de razón. Cuando una escala tiene todas las características de
una escala de intervalo y además un punto cero real en su origen, se
llama escala de razón. Además de distinción, orden y distancia, esta
es una escala que permite establecer en qué proporción es mayor
una categoría de una escala que otra. El cero absoluto o natural
representa la nulidad de lo que se estudia. Ejemplos: en el deporte,
por la escala de razones, se miden la distancia, la fuerza, la velocidad
y otras decenas de variables. Por la escala de razones también se
miden aquellas magnitudes que se forman como resultado de la
diferencia entre números calculados por la escala de intervalos. Así
el tiempo calendario se cuenta por la escala de intervalos, mientras
que los intervalos de tiempo se calculan por la escala de razones.
1.5. Organización y presentación de la
información
Un conjunto de datos puede ser resumido y clasificado de acuerdo con
criterios convenientes, de modo de facilitar su análisis y poder extraer
conclusiones.
Los datos se pueden organizar, reuniendo todos los valores observados, en
forma bruta, en un arreglo ordenado, en exhibición de tallo y hoja o en tablas
de distribución de frecuencias.
Forma bruta: es decir, en el orden aleatorio que se han recolectado. Se
utiliza cuando el número de observaciones es pequeño.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 10
Arreglo ordenado: se colocan los datos brutos en forma ordenada, de la
menor observación a la mayor observación. Esto facilita la evaluación
por parte del investigador.
Exhibición de tallo y hoja: esta es una técnica sencilla de gran utilidad para
explorar y describir gran número de datos.
Distribución de frecuencias: estas asocian cada valor de la variable con la
cantidad de veces que se observa dicho valor.
Ejemplo 1.5.1 En la siguiente lista se presentan en forma bruta las
precipitaciones durante un mes en 50 localidades del interior de la provincia en
mm.
112 72 69 97 107
73 92 76 86 73
126 128 118 127 124
82 104 132 134 83
92 108 96 100 92
115 76 91 102 81
95 149 81 80 106
84 119 113 98 75
68 98 115 106 95
100 85 94 106 119
Para desarrollar un diagrama de tallo y hoja, primero se colocan los dígitos
principales de cada valor a la izquierda de una línea vertical. A la derecha de
dicha línea se registra el último dígito de cada valor de datos.
Ejemplo 1.5.2 A continuación se presenta los datos del ejemplo anterior en tallo y
hoja.
Primero se colocan el último dígito de cada valor en la línea que corresponde
según el orden en que aparecen los datos.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 11
69 8
72 3 6 3 6 5
86 2 3 1 1 0 4 5
97 2 2 6 2 1 5 8 8 5 4
107 4 8 0 2 6 6 0 6
112 8 5 9 3 5 9
126 8 7 4
132 4
149
Con esta organización de los datos, la colocación de los dígitos en cada línea
en el orden de clasificación es simple. Hacerlo así proporciona el diagrama de
tallo y hoja.
68 9
72 3 3 5 6 6
80 1 1 2 3 4 5 6
91 2 2 2 4 5 5 6 7 8 8
100 0 2 4 6 6 6 7 8
112 3 5 5 8 9 9
124 6 7 8
132 4
149
Los números a la izquierda de la línea vertical forman el tallo, y cada dígito
a la derecha de la línea es una hoja.
Una vez organizados los datos, estos deben ser presentados. La
información puede ser presentada en forma textual, en cuadros o tablas, y
mediante gráficos.
Textual. Los datos se presentan en forma literal. Entre las ventajas de esta
presentación podemos encontrar que los datos de importancia se
pueden resaltar mediante subrayados, palabras o cifras en negrita,
palabras en cursiva o entre comillas. Entre las desventajas podemos
nombrar que solo se puede utilizar esta forma cuando los datos a
presentar son pocos o reducidos.
Tabular. Cuando los datos a presentar son abundantes, estos se presentan
mediante cuadros estadísticos. Como ventaja encontramos que los
cuadros son más breves, claros y fáciles de leer. Además, facilita las
comparaciones. Un cuadro consta de las siguientes partes:
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 12
• Título: debe dar una descripción del contenido del cuadro. Además, debe
responder a las preguntas: ¿Que datos son los incluidos en el cuerpo de
la tabla? ¿Dónde está el área representada por los datos? ¿Cómo están
clasificados los datos? ¿Cuándo ocurrieron los datos?
• Encabezado: es el título de la parte superior de las columnas. Una tabla
puede tener subencabezado.
• Cuerpo o columna matriz: son las descripciones en hileras colocadas en el
lado izquierdo de la tabla. Representan las clasificaciones de las cifras
incluidas en el cuerpo de la tabla. Pueden ser divididos en subconceptos.
• Cuerpo: es el contenido de los datos estadísticos.
• Nota de encabezado: es usado para expresar ciertos puntos relacionados
con el cuadro total y que no han sido incluidos en el título ni en el
encabezado ni en los conceptos.
• Nota de pie: se utiliza para clasificar algunas partes incluidas en el cuadro
que no son explicados en otras partes.
• Fuente: debe ser declarada al pie del cuadro. Es el dato en el cual se
informa de donde o a quien corresponde la información.
Gráficos. Los datos se presentan en gráficos circulares, de barras, de líneas,
etc., esto dependerá de lo que se quiera informar. Las partes principales
de una gráfica son:
• Título: es la descripción del contenido de la gráfica. Puede encontrarse en
la parte superior o en la parte inferior.
• Diagrama: representa, al igual que en un cuadro, los datos mostrados en
la gráfica.
• Escala: frecuentemente se coloca en el eje de las abscisas la clasificación
y en el eje de las ordenadas las magnitudes.
• Fuente: debe ser colocada al pie de la gráfica e indicar cuál fue el origen
de los datos a partir de los cuales la gráfica fue construida.
1.6. Gráficos y tablas. Principios generales. Tipos
Los gráficos se han de explicar enteramente por sí mismos. El contenido de
un gráfico deberá ser tan completo como sea posible.
Las escalas vertical y horizontal estarán rotuladas con claridad dando las
unidades pertinentes. La mayoría de los gráficos presentan información
numérica con escalas, que deben rotularse para describir completamente la
variable presentada en la escala y para variables de medida se dirán las
unidades de medición.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 13
No se debe tratar de abarcar demasiada información en un solo gráfico. Es
mejor hacer varios gráficos, que comprimir toda la información en uno solo.
Una regla práctica segura es evitar gráficos que contengan más de 3 curvas.
Los gráficos tienen que dar una visión general y no una imagen detallada de un
conjunto de datos. Las presentaciones detalladas se deben reservar para las
tablas.
Las tablas se explicarán por sí mismas enteramente. Como los gráficos, se
ha de dar suficiente información en el título y en los encabezamientos de
columnas y filas de la tabla para permitir que el lector identifique fácilmente
su contenido.
Como el título será por lo general lo primero que se lee en detalle, deberá
suministrar toda la información esencial sobre el contenido de la tabla y
deberá especificar el tiempo, lugar, material o estudio experimental y
relaciones que se presentan en la tabla.
A continuación, se muestran algunos ejemplos de cuadros generales y
específicos, y ejemplos de gráficos.
Cuadro general
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 14
Cuadro específico
Gráfico de líneas
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 15
Gráfico de barras múltiples
Gráfico de barras compuestas
Gráfico de sectores circulares
1.6.1. Tablas de distribución de frecuencias
Una tabla de distribución de frecuencias puede ser simple o con intervalos
de clase. La primera se utiliza cuando la variable es discreta de corto recorrido
y la segunda cuando la variable es continua o discreta de amplio recorrido.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 16
Tabla de distribución de frecuencias simple
(1) Campo de variabilidad: son todos los valores que puede tomar la variable.
También se lo conoce como dominio.
(2) Frecuencia absoluta: indica la cantidad de veces que se presenta un valor
observado de la variable. La suma de las frecuencias absolutas es igual al
número de observaciones.
(3) Frecuencia acumulada: es la suma de las frecuencias absolutas de los valores
de la variable inferior o igual a un determinado valor de la variable.
(4) Frecuencia relativa: es el cociente entre la frecuencia absoluta de un valor de
la variable y el número total de observaciones. La frecuencia relativa es un
número fraccionario positivo comprendido entre 0 y 1. La suma de las
frecuencias relativas es igual a 1.
; 0 ≤ hi < 1 ;
(5) Frecuencia relativa acumulada: es la suma de las frecuencias relativas de los
valores de la variable inferior o igual a un determinado valor de la variable.
(6) Frecuencia relativa porcentual: es la frecuencia relativa de un valor de la
variable expresada en porcentaje, es decir, multiplicada por 100.
(7) Frecuencia relativa acumulada porcentual: es la frecuencia relativa
acumulada de un valor de la variable expresada en porcentaje.
Tabla de distribución de frecuencias con intervalos de clase
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 17
(8) Intervalo de clase: es cada una de las subdivisiones o intervalos en que se
ha dividido al campo de variabilidad de una variable.
Límite de clase: son los valores que definen los extremos de una clase. Se
llaman Límite inferior (Li) y Límite superior (Ls).
(9) Marca de clase: es el punto medio o centro de una clase. Se obtiene
mediante la semisuma de los límites superior e inferior de un intervalo
o clase.
Amplitud del intervalo: es la diferencia entre el límite superior y el límite
inferior de una clase.
h = Ls–Li
En el caso de una distribución de frecuencias para datos agrupados es
necesario determinar los intervalos de clase para llegar a un resumen efectivo
de la información original que se presenta en la tabla. El problema
fundamental es pensar en una amplitud adecuada del intervalo y una cantidad
razonable de intervalos. Se aconseja no menos de 5 y no más de 20, de modo
que no sean tantas y la tabla resulte inmanejable, ni tampoco que la amplitud
de los mismos haga perder información. Para calcular la amplitud de un
intervalo o la cantidad de ellos que tendrá una tabla se busca primero el rango
o recorrido de la variable.
Rango: es la diferencia entre el mayor valor y el menor valor que toma la
variable en las observaciones.
R = xm´ax–xm´ın
Puede ser que se ha decidido agrupar la información en una cierta cantidad
de intervalos, entonces es necesario fijar la amplitud de cada uno de los
intervalos.
Rango
Amplitud del intervalo=
Cantidad de intervalos
O puede ocurrir que se necesite la información agrupada en clases con una
determinada amplitud, entonces es necesario fijar la cantidad de intervalos.
Rango
Cantidad de intervalos=
Amplitud del intervalo
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 18
Ejemplo 1.6.1 Con los datos del Ejemplo 1.5.2 construimos una tabla con intervalos.
intervalo fi Fi hi Hi hi % Hi %
[60 − 70) 2 2 0,04 0,04 4% 4%
[70 − 80) 6 8 0,12 0,16 12% 16%
[80 − 90) 8 16 0,16 0,32 16% 32%
[90 − 100) 11 27 0,22 0,54 22% 54%
[100 − 9 36 0,18 0,72 18% 72%
110)
[110 − 7 43 0,14 0,86 14% 86%
120)
[120 − 4 47 0,08 0,94 8% 94%
130)
[130 − 2 49 0,04 0,98 4% 98%
140)
[140 − 1 50 0,02 1,00 2% 100%
150]
Tabla 1.1
1.6.2. Representación gráfica
La representación gráfica de una tabla de distribución de frecuencias
permite percibir con mayor claridad algunas características del conjunto de
datos que se investiga.
Gráfico de Bastones: es la representación gráfica de las frecuencias
absolutas o relativas de una variable discreta mediante un gráfico de puntos
en el sistema de coordenadas cartesianas ortogonal (perpendicular) cuyas
abscisas son los valores de la variable y cuyas ordenadas son las frecuencias
absolutas o relativas del valor de la variable.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 19
Gráfico de Escalones: es la representación gráfica de las frecuencias
acumuladas o relativas acumuladas de una variable discreta mediante
segmentos paralelos al eje de las abscisas. Cada segmento se extiende entre
dos valores consecutivos de la variable, siendo las respectivas ordenadas las
frecuencias acumuladas correspondientes al valor de la variable que es la
abscisa del punto inicial del segmento.
Histograma: es la representación en un sistema de coordenadas
cartesianas de las frecuencias absolutas o relativas de una variable agrupada
en clases mediante un gráfico de superficie. Sobre el eje de las abscisas se
representan las clases y se levanta sobre cada una de ellas un rectángulo cuya
superficie es proporcional a la frecuencia del intervalo respectivo.
Polígono de frecuencias: es una línea poligonal obtenida en un
histograma de frecuencias absolutas uniendo los puntos medios de los lados
superiores de cada rectángulo.
Ojiva o Polígono de frecuencias acumuladas: es la representación
gráfica de las frecuencias acumuladas (absolutas o relativas) de una variable
agrupada en clases mediante una curva uniendo los puntos que tienen por
abscisa los límites superiores de cada clase y por ordenadas las respectivas
frecuencias acumuladas.
Prof. Irala Rocío Marilyn Apuntes de Estadística
1. Recolección, organización y presentación de datos 20
Clasificación de las distribuciones de frecuencias
Algunas de las curvas de frecuencias que aparecen en la práctica adoptan ciertas
formas características como se muestran a continuación.
Ejemplo 1.6.2 Construimos a continuación el polígono de frecuencias
correspondiente a la Tabla 1.1.
11
fi
9
8
7
6
2 2
1
60 70 80 90 100 110 120 130 140 150
Prof. Irala Rocío Marilyn Apuntes de Estadística