0% encontró este documento útil (0 votos)
348 vistas196 páginas

Estadistica Descriptiva

Este documento describe conceptos básicos de estadística descriptiva. Explica que la estadística descriptiva analiza una población sin sacar conclusiones generales, a diferencia de la estadística inferencial. También define términos clave como población, muestra, variables, escalas de medición y clasificación de variables.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
348 vistas196 páginas

Estadistica Descriptiva

Este documento describe conceptos básicos de estadística descriptiva. Explica que la estadística descriptiva analiza una población sin sacar conclusiones generales, a diferencia de la estadística inferencial. También define términos clave como población, muestra, variables, escalas de medición y clasificación de variables.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd

ESTADISTICA

DESCRIPTIVA
LUIS FERNANDO VILLANUEVA GARCIA
MPH, EE
Médico – Cirujano
CMP 25521
ESTADISTICA
DESCRIPTIVA

CONCEPTOS
BASICOS
DEFINICION DE
ESTADISTICA
La Estadística es parte del método científico y
se le define como un conjunto de técnicas
usadas para recopilar, organizar, presentar e
interpretar datos, con el fin de obtener
conclusiones y tomar decisiones sobre
determinados hechos o fenómenos en
estudios
CLASIFICACION DE LA
ESTADISTICA
La estadística se clasifica de acuerdo a las dos
funciones que realiza:
ESTADISTICA DESCRIPTIVA: Es aquella parte de la estadística
que describe y analiza una población, sin pretender sacar
conclusiones de tipo general. Es decir, las conclusiones
obtenidas son validas sólo para dicha población.
ESTADISTICA INFERENCIAL: Es aquella parte de la estadística,
cuyo propósito es inferir o inducir leyes de comportamiento de
una población, a partir del estudio de una muestra. Es decir las
conclusiones obtenidas a partir de una muestra, son validas para
toda la población.
POBLACION o UNIVERSO
Es un conjunto grande y completo de
individuos, elementos o unidades que
presentan características comunes y
observables

Ejemplo: Todos los pacientes atendidos con


cáncer en el año 2,006 en el Hospital
“Ollanta”
MUESTRA
Es un sub – conjunto de la población

Ejemplo: Si la población consiste en un total


de pacientes atendidos con cáncer en el año
2,006 en el Hospital “Ollanta”. Una muestra
sería el número de pacientes atendidos con
cáncer en febrero del 2,006
UNIDADES DE OBSERVACION
Constituyen los elementos o cosas
observados

OBSERVACIONES
Estadísticamente son los datos que se
recolectan para un estudio
Ejemplo: Si una enfermera lleva a cabo una
investigación sobre los menores desnutridos
atendidos en el Instituto Nacional de Salud
del Niño; para cada niño la enfermera
obtendrá la edad, peso y talla. En este caso,
los niños constituyen las unidades de
observación; y la edad, peso y talla de cada
niño vienen a ser las observaciones
VARIABLES
Se definen las variables, como magnitudes que
tienden a sufrir modificaciones o cambio dentro de un
dominio determinado.
Es decir, las características que varían de individuo a
individuo o de objeto a objeto se llaman variables;
mientras que las que permanecen inalterables, se
llaman constantes.
Generalmente, las variables se designan con las
últimas letras mayúsculas del abecedario: X, Y, Z; y
los valores de las variables se designan con letras
minúsculas: x, y z.
Ejemplo: La Universidad Daniel A. Carrión lleva a
cabo un estudio para determinar la situación
ocupacional de sus egresadas en la carrera de
Enfermería.
En relación a este estudio, identifique las propiedades
siguientes como constantes o variables:
 Sexo.

 Ingresos anuales.

 Profesión.

 Número de años de experiencia.

 Nivel jerárquico ocupacional.


PROPIEDADES ES ¿POR QUE?
Sexo Constante Sexo femenino
Ingresos anuales Variable Diferentes ingresos
Profesión Constante Todas son enfermeras
Años de experiencia Variable Diferentes años
Nivel Jerárquico Variable Diferente nivel
CLASIFICACION DE LAS
VARIABLES
POR SU GENERALIZACION O NIVEL DE
ABSTRACCION

TEORICAS: Son aquellas que necesitan definirse operacionalmente;


porque sus cualidades o características no son fácilmente observables
ni medibles
Ejemplo: Desarrollo económico, estrato socio – económico, rendimiento
académico, hábitos de consumo, etc.
INTERMEDIAS: Son variables que permiten especificar a las variables
teóricas, con el fin de hacerlas observables y medibles.

EMPIRICAS: Son aquellas variables que no necesitan definirse


operacionalmente; porque sus valores se identifican en forma inmediata
y son fácilmente medibles.
Ejemplo: Edad, sexo, peso, talla, etc.

NOTA: Operacionalizar una variable significa transformar las variables


teóricas (no observables ni medibles) en variables intermedias y luego
en variables empíricas (observables y medibles)
VARIABLE VARIABLE VARIABLE
TEORICA INTERMEDIA EMPIRICA
Rendimiento Calificaciones alta : 17 - 20
Académico de media : 11 - 16
Las alumnas de baja : 00 - 10
Enfermería Asistencia Regular : 81 – 100 %
a clases Media : 61 – 80 %
Baja : Menos de
61%
Practicas pre Eficiente : A
profesionales Regular : B
Deficiente: C
POR SU RELACION CAUSAL
INDEPENDIENTES: Generalmente se simbolizan con la letra mayúscula
X; y son aquellas que no dependen de ninguna variable dentro de un
contexto determinado. Indican: causa, antecedente, determinante.

DEPENDIENTES: Generalmente se simbolizan estas variables con la


letra mayúscula Y; y son aquellas que dependen de otra u otras
variables dentro de un contexto determinado. Indica: efecto, resultado,
consecuente.

Ejemplo: El escaso fomento de la educación en la población, genera


X
mayor desnutrición infantil en las familias con bajo nivel de
Y
instrucción.
Z
POR SU NATURALEZA
VARIABLES CUALITATIVAS: Son aquellas cuyo dominio de variación
son objetos de clasificación.
Ejemplo:
VARIABLE DOMINIO DE VARIACION
Sexo Masculino, Femenino

VARIABLES ORDINALES: Son aquellas cuyo dominio de variación son


objetos de clasificación y orden.
Ejemplo:
VARIABLE DOMINIO DE VARIACION
Nivel de Instrucción Analfabeto, primaria, secundaria,

superior
VARIABLES CUANTITATIVAS: Son aquellas cuyos valores del dominio
de variación son contados o medidos. Se clasifican en:
CUANTITATIVAS DISCRETAS: Cuando los valores del dominio de
variación son contados; y por lo tanto sólo pueden asumir valores
enteros.
Ejemplo:
VARIABLE DOMINIO DE VARIACION
Número de alumnos 50, 80, 100 alumnos

CUANTITATIVA CONTINUA: Cuando los valores del dominio de


variación son susceptibles de ser medidos. Pueden asumir valores
decimales
Ejemplo:
VARIABLE DOMINIO DE VARIACION
Peso 56.5 Kg. 58.7 Kg. 60.2 Kg.
MEDICION DE LAS VARIABLES
Las variables no sólo se clasifican, sino que también es necesario
medirlas. La medición se hace necesaria con el fin de diferenciar por
comparación , un elemento de otro, en las características de la variable.
Estas se hacen a través de niveles o escalas entre los cuales tenemos:

ESCALA NOMINAL: Es el nivel más simple de medición donde la


variable establece categorías sólo se nombran o se enumeran , pero no
se comparan. En este nivel las variables pueden ser:
DICOTOMICAS:
Ejemplo:
VARIABLE DOMINIO DE VARIACION
Sexo Masculino, Femenino
TRICOTOMICAS: Si tienen tres categorías o clases
Ejemplo:
VARIABLE DOMINIO DE VARIACION
Raza Blanca, Negra, Amarilla

POLITOMICAS: Si tienen más de tres categorías


Ejemplo:
VARIABLE DOMINIO DE VARIACION
Estado civil Soltero, casado, viudo, divorciado
ESCALA ORDINAL: Es el segundo nivel de medición donde la variable
establece categorías jerarquizadas. Este nivel de medición no mide las
magnitudes de las diferencias, pero si permite apreciar que los valores
asignados a los individuos caen más alto o bajo que otros
Ejemplo:
VARIABLE DOMINIO DE VARIACION
Nivel socio económico Alto, medio, bajo

ESCALA DE INTERVALO: Es el tercer nivel de medición, entre cuyos


diversos valores que toma la variable existen a la vez, clasificación,
orden y grados de distancia iguales entre las diferentes categorías, es
decir, los intervalos son considerados como equivalentes y con un
origen convencional (la unidad de medida no necesariamente tiene que
partir del valor cero; sólo sirve como punto o valor de comparación)
Ejemplo:
Temperatura: Un paciente puede llegar a tener 39 °c de fiebre, pero ello
no significa que su grado de temperatura haya tenido que partir de 0 °c.
Rendimiento escolar: Un niño puede obtener calificación 15 en
matemáticas, pero ello no nos lleva a pensar que necesariamente para
llegar a esa calificación haya tenido que obtener primero nota de cero.
Coeficiente de inteligencia.
Presión Arterial.

ESCALA DE RAZON O PROPORCION: Es el nivel más alto de medición,


y donde la variable supone o comprende a la vez a todos los casos
anteriores: clasificación, orden, distancia y origen único natural o punto
de origen natural (la unidad de medida necesariamente tiene que partir
del valor cero).
Ejemplo:
Edad: un paciente puede tener 30 años de edad, pero para llegar a esa
edad, necesariamente ha tenido que partir de cero años.
Estatura
Peso
NOMINAL
CUALITATIVAS
ORDINALES
ORDINAL
VARIABLE

CUANTITATIVAS INTERVALO
DISCRETAS
CONTINUAS RAZON o PROPROCION

ESCALA DE MEDICION

Las variables que según su naturaleza son cualitativas, por su medición


pertenecen a la escala nominal; y las ordinales a la escala ordinal. Las
variables que según su naturaleza son cuantitativas, pertenecen a la
escala de intervalo o razón
ESTADISTICA
DESCRIPTIVA

ETAPA DE RECOLECCION
DE DATOS
RECOLECCION DE DATOS
A través de la recolección, se obtienen los datos que requieren
para alcanzar los objetivos y demostrar las hipótesis de la
investigación. La obtención de los datos se hace teniendo en
cuenta lo siguiente:

FUENTES DE INFORMACION: Cuando se recoge información se


posible que los datos ya hayan sido obtenidos de las unidades
de observación y publicados o registrados por otros , o que los
datos se tengan que obtener directamente de las unidades de
observación en forma personal.
Según los casos, estamos hablando de las fuentes de
información, que son de dos tipos:
FUENTE PRIMARIA
Si la información se obtiene directamente de la misma persona o
entidad utilizando ciertas técnicas (entrevista, cuestionario, etc.)
Ejemplo:
Aplicar un test a un grupo de estudiantes para determinar el nivel
intelectual.
Llevar a cabo una encuesta para conocer la situación socio
económica de los pobladores del asentamiento humano “Fuji”.
Observar la reacción de un grupo de pacientes con determinada
enfermedad.
FUENTE SECUNDARIA
Si la información a obtener, ya ha sido recopilada y elaborada por
otras personas o instituciones.
Este tipo de información la encontramos en los informes
estadísticos de las Instituciones Públicas y privadas. En el Perú,
el Instituto Nacional de Estadística, publica boletines estadísticos
con respecto a la producción, inversiones, población,
migraciones, salud, etc.
SISTEMAS DE RECOLECCION
Los datos pueden ser recogidos a través de:

REGISTROS: Mediante los registros se anotan los datos en forma


regular, permanente y obligatoria, obteniendo la información total
y sistemática de los hechos ocurridos.
Ejemplo:
Registro de contribuyentes.
Registro Nacional de Identificaciones
Registro Civil
Etc.
ENCUESTAS: Es la recolección de datos en forma temporal y puede ser:
Censal: Cuando abarca a toda la población en estudio
Ejemplo:
Censo de población y vivienda de una localidad o de un país.
Muestral: Cuando abarca una parte de la población en estudio.
Ejemplo:
Encuesta de fecundidad.
Encuesta de nutrición.
Etc.

TECNICAS DE RECOLECCION: Existen muchos procedimientos para


recoger la información, entre los cuales el investigador debe elegir los
que se adapten a las circunstancias o al tipo de investigación. Entre las
técnicas más usadas tenemos:
Cuestionario, Observación, Entrevista, Test, Análisis de contenidos, etc.
ESTADISTICA
DESCRIPTIVA

ETAPA DE ELABORACION
DE DATOS
ELABORACION DE DATOS
En la etapa de recolección se obtiene gran cantidad de datos, los
mismos que se encuentran en formularios, cuestionarios, etc.; y
totalmente desordenados. En esta etapa se trata de organizar
dichos datos y para ello es necesario cumplir dos actividades:
Revisión o crítica y clasificación de datos.
REVISION O CRITICA DE DATOS: La revisión tiene por objeto:
a) Determinar si se han recibido todos los formularios o,
cuando menos, en una proporción que sea suficiente para no
invalidar las conclusiones que se podrían hacer.
b) Verificar que estén registradas todas las respuestas
requeridas.
c) Localizar posibles incongruencias en la información
proporcionada
La Revisión de datos constituye lo que se ha dado en
llamar Control de Calidad de la Información

Entre las posibles causas del envío incompleto de formularios


tenemos: formularios o cuestionarios muy extensos, ausencia
de instrucciones claras, bajo nivel educativo del informante,
dotación insuficiente o inoportuna de los formularios
cuestionarios, etc.
Si no se han registrado todas las respuestas requeridas, puede
deberse a: Formularios o cuestionarios mal diseñados,
negligencia del entrevistador ya que no recibió adiestramiento,
informante se niega a contestar la pregunta, etc.
Las incongruencias provenientes de respuestas, cuyos valores
quedan fuera de lo considerado como posible o probable. Por
ejemplo, si se indica que una persona tiene 5 años de edad y
luego aparece su grado de instrucción como educación
Superior, entonces es evidente que existe incongruencia.
Las causas de tales incongruencias pueden ser: personal poco
calificado e irresponsable, preguntas confusas en el formulario
que por su extensión provoca fatiga, informante poco motivado
que da como respuesta lo primero que se le ocurre para salir
del paso o demasiado complaciente, pues piensa que negar o
afirmar determinada cosa va ser recibido con beneplácito por el
encuestador.
CLASIFICACION DE DATOS
La clasificación tiene por objeto organizar los datos en
categorías, pero teniendo en cuenta la escala de medición de las
variables.

CLASIFICACION DE LOS DATOS MEDIDOS A NIVEL NOMINAL u


ORDINAL: Para elaborar datos que pertenecen a variables
nominales y ordinales, es necesario conocer como se clasifica
la variable, y luego se procede a la tabulación.
Grado de Instrucción Frecuencia o cantidad

Analfabeto

Primaria

Secundaria

Superior

TOTAL
CLASIFICACION DE LOS DATOS MEDIDOS A NIVEL DE
INTERVALO O DE RAZON: La elaboración de datos cuyas
variables pertenecen a la escala de intervalo o de razón, tienen
otro tipo de tratamiento, ya que su organización y posterior
análisis, es necesario agruparlos en clases o intervalos. Esta
forma de organización se conoce con el nombre de
DISTRIBUCION DE FRECUENCIAS.

Supongamos que hemos recogido información sobre el


consumo de proteínas (medidos en gramos) en una muestra
de 20 niños entre 1 a 6 años de edad, y que corresponden al
estudio de los niños desnutridos de la comunidad
“Adelante”. Los datos son los siguientes:
21, 25, 35, 22, 18, 24, 21, 23, 16, 23, 27, 17, 26, 19, 29, 20, 19, 20,
23, 22.
Al observar los datos podemos apreciar su variabilidad y también
el desorden en que se encuentran, haciéndose difícil el análisis lo
cual no permite destacar los hechos más importantes para
obtener conclusiones acertadas que ayuden en la toma de
decisiones. De allí que se hace necesario ordenar los datos en
una TABLA DE DISTRIBUCION DE FRECUENCIAS.
Para elaborar una tabla de distribución de frecuencias se debe
seguir los siguientes pasos:

PASO 1: CALCULO DEL RANGO O RECORRIDO (R):El rango se


define como la distancia entre el dato máximo y el dato mínimo.
Se halla restando el dato mayor (X max) con el dato menor
(X min):
R = X max - X min
Para el ejemplo tenemos: X max: 35; X min: 16; Luego el
R = 35 - 16 = 19
PASO 2: DETERMINACION DEL NUMERO DE CLASES (K):
Número de clases, es el número de categorías o intervalos en el
que se va a dividir la información.
El número de clases se puede fijar arbitrariamente, dependiendo
del número de datos que se tenga. Por lo general el número de
clases a elegir, varía entre 5 a 20.
Sin embargo, existe también otra forma de determinar el número
de clases con bastante aproximación, la cual se le conoce con el
nombre de REGLA DE STURGE, y cuyo cálculo responde a la
siguiente fórmula:

K = 1 + 3.3 Log N

K = Número de clases N = NUMERO DE DATOS


Para el ejemplo tenemos:
K = 1 + 3.3 Log 20 = 5.29
NOTA: El valor de K debe redondearse siempre al entero más
próximo.
Esto significa que la información se dividirá en cinco clases, de la
siguiente manera:

CLASES (i)
1
2
3
4
5
PASO 3: DETERMINACION DE LA AMPLITUD DEL INTERVALO
(W): Llamado también ancho de clase, la amplitud es la
cantidad de datos que están comprendidos en un intervalo de
clases.
Un intervalo se forma por dos límites que van a definir una
clase.
Límites son los valores extremos de un intervalo y son de dos
tipos: límite superior y límite inferior. Cuando un intervalo no
tiene límite superior o inferior, se llama intervalo de clase
abierto.
Luego podemos definir también la amplitud del intervalo (w)
como la distancia entre el límite inferior y superior de un
intervalo, y se halla a través de la fórmula:
RANGO
AMPLITUD DE
W=R / K
INTERVALO NUMERO DE CLASES
Para el ejemplo tenemos:
W = 19 / 5 = 3.8 = 4
NOTA: El valor de W se redondea al entero sólo si los datos
son enteros o discretos. Si los datos proporcionados están en
decimales, W se redondea de acuerdo al número de decimales
de la información.

PASO 4: FORMACION DE LOS INTERVALOS DE CLASE (Ii):


Formar los intervalos de clase, significa hallar los límites inferior
y superior de cada intervalo; y para ello se parte del dato menor
(X min = 16) y se le suma la amplitud del intervalo (W = 4), de la
siguiente manera:
W: 1 2 3 4

LIMITE INFERIOR 16 17 18 19 LIMITE SUPERIOR

INTERVALO
Luego 16 constituye el límite inferior y 19 el límite superior de la
primera clase. Igual procedimiento se sigue con la segunda y hasta la
quinta; de tal forma que se obtiene lo siguiente:

CLASES (i) INTERVALOS DE


CLASES (Ii)
1 16 - 19
2 20 - 23
3 24 - 27
4 28 - 31
5 32 - 35
Una forma práctica de determinar los intervalos de clase,
consiste en hallar primero todos los límites inferiores de cada
clase, sumando el primer limite inferior la amplitud del
intervalo.
Así:
X min = 16 Límite inferior de la primera clase.
16 + 4 = 20 Límite inferior de la segunda clase.
20 + 4 = 24 Límite inferior de la tercera clase.
24 + 4 = 28 límite inferior de la cuarta clase.
28 + 4 = 32 límite inferior de la quinta clase.
Al límite inferior de la segunda clase, se le resta una unidad
para obtener el límite superior de la primera clase; obtenido
éste, se le suma la amplitud del intervalo para obtener los
límites superiores de cada clase.
Así:
20 – 1 = 19 Límite superior de la primera clase.
19 + 4 = 23 Límite superior de la segunda clase.
23 + 4 = 27 Límite superior de la tercera clase.
27 + 4 = 31 límite superior de la cuarta clase.
31 + 4 = 35 límite superior de la quinta clase.

NOTA: Cuando se trata de números decimales se le resta un


décimo (0.1), un centésimo (0.01), un milésimo (0.001), según
corresponda al número de decimales que contenga la
información.
Los intervalos no siempre van a tener la misma amplitud. De acuerdo
a la investigación y a la necesidad de presentar la información para su
análisis correspondiente, es posible tener tres tipos de intervalos:

Intervalos de igual Intervalos de Intervalos abiertos


amplitud diferente amplitud
Proteínas en gramos Grandes grupos de Peso de pacientes en
edad Kg.
16 - 19 0 - 14 Menos de 55
20 - 23 15 - 64 55 - 59
24 - 27 65 - 85 60 - 64
28 - 31 65 - 69
32 - 35 70 y más
PASO 5: FRECUENCIA ABSOLUTA SIMPLE (fi): Es el número de
veces que se repite los valores dentro de los diferentes
intervalos en que se ha dividido la información.
Para obtener la frecuencia absoluta de cada clase, se efectúa la
tabulación o conteo mediante el sistema de palotes. Para
nuestro ejemplo hay cinco valores (16,17,18,19,19) que se
encuentran en el intervalo 16 a 19; luego la frecuencia absoluta
simple para la primera clase es igual a cinco. Así mismo, para
la segunda clase hay 9 valores (20,20,21,21,22,22,23,23,23) que
se encuentran en el intervalo 20 a 23; siendo la frecuencia
absoluta simple para dicha clase 9; y así sucesivamente hasta
obtener las frecuencias absolutas simples para todas las
clases, de la siguiente manera:
FRECUENCIAS ABSOLUTAS
INTERVALOS DE CLASES
SIMPLES
NUMERO DE CLASES

i Ii fi
1 16 - 19 5

2 20 - 23 9

3 24 - 27 4

4 28 - 31 1

5 32 - 35 1

20 SUMATORIA
PASO 6: FRECUENCIA ABSOLUTA ACUMULADAS (Fi): Se
obtiene sumando y acumulando los valores absolutos clase
por clase en orden ascendente.
Para nuestro ejemplo tenemos:
F1 = 5
F2 = 5 + 9 = 14
F3 = 5 + 9 + 4 = 18
F4 = 5 + 9 + 4 + 1 = 19
F5 = 5 + 9 + 4 + 1+ 1 = 20
PASO 7: FRECUENCIAS RELATIVAS SIMPLES (hi): Es el valor
que resulta al dividir cada una de las frecuencias absolutas
simples entre el total de frecuencias o datos. Así tenemos:
hi = fi / N h1 = 5 / 20 = 0.25
h2 = 4 / 20 = 0.20
PASO 8: FRECUENCIA REALTIVAS ACUMULADAS (Hi): Se
obtiene sumando y acumulando los valores relativos clase por
clase en orden ascendente.
Así tenemos:
H1 = 0.25
H2 = 0.25 + 0.45 = 0.70
H3 = 0.25 + 0.45 + 0.20 = 0.90
H4 = 0.25 + 0.45 + 0.20 + 0.05 = 0.95
H5 = 0.25 + 0.45 + 0.20 + 0.05 + 0.05 = 1.00
NOTA: Por lo general, a las frecuencias relativas las
multiplicamos por 100, con el fin de obtener los valores
expresados en porcentajes
PASO 9: PUNTO MEDIO O MARCA DE CLASE (Xi): Se define
como la semi suma de los límites inferior y superior de cada
intervalo de clase:

Xi = (Límite inferior + Límite superior) / 2

Para nuestro ejemplo tenemos:


X1 = 16 + 19 / 2 = 17.5
X2 = 20 + 23 / 2 = 21.5
Así sucesivamente …

Luego la tabla completa de distribución de frecuencias sería la


siguiente:
Clase Intervalo Frec. Frec. Frec. Frec. Marca de Frec. Frec.
s de clase Absolutas Absolutas Relativas Relativas clase Relativas Relativas
simples acumulad simples acumulad simples acumulad
as as (%) as (%)
i Ii fi Fi hi Hi Xi hi% Hi%

1 16 - 19 5 5 0.25 0.25 17.5 25 25

2 20 - 23 9 14 0.45 0.70 21.5 45 70

3 24 - 27 4 18 0.20 0.90 25.5 20 90

4 28 - 31 1 19 0.05 0.95 29.5 5 95

5 32 - 35 1 20 0.05 1.00 33.5 5 100

TOTAL 20 1.00 100


PROPIEDADES Y REALCIONES DE LAS FRECUENCIAS:
1. Las frecuencias absolutas son cantidades enteras positivas
(o cero en algunos casos)
2. Las frecuencias relativas se pueden expresar en tanto por
uno ( números decimales mayor o igual que cero, pero
menor que 1); también pueden expresarse en porcentaje. Es
decir: 0 < = hi < 1 o 0% < = hi < = 100%
3. La suma de las frecuencias absolutas de todas las clases es
igual al número total de datos.
4. La suma de las frecuencias relativas es igual a 1.00 ó 100%
5. La frecuencia absoluta acumulada de la última clase es igual
al número total de datos.
6. La frecuencia relativa acumulada de la última clase es igual
a 1 ó 100%.
ETAPA DE ELABORACION
DE DATOS

EJERCICIOS RESUELTOS
1. Un investigador social desea determinar en la comunidad
“Pan y agua” el número de horas semanales que dedican los
niños menores de 6 años de edad, a ver televisión, Una
muestra de 25 niños, arrojó los siguientes resultados (en
número de horas semanales)
10 19 25 19 26
16 19 27 27 25
23 22 17 12 20
15 21 23 26 14
18 25 23 24 21
Se solicita
a. Ordenar la información en una tabla de distribución de
frecuencias.
b. Interpretar algunos valores de las frecuencias halladas
a. Para ordenar la información, utilizaremos la regla de Sturges.
Calculo del rango: R = 27 - 10 = 17

Número de clases: K = 1 + 3.3 Log 25 = 5.62

Que redondeando al entero será 6

Amplitud de intervalo: W = 17 / 6 = 2.83

Que redondeando al entero será 3

Formación de intervalos y frecuencias:


i Ii fi Fi hi Hi Hi (%) Hi (%)
1 10 - 12 2 2 0.08 0.08 8 8

2 13 - 15 2 4 0.08 0.16 8 16

3 16 – 18 3 7 0.12 0.28 12 28

4 19 – 21 6 13 0.24 0.52 24 52

5 22 – 24 5 18 0.20 0.72 20 72

6 25 - 27 7 25 0.28 1.00 28 100

25 1.00 100
Interpretación:
 f6 = 7 de los 25 niños, ven televisión entre 25 y 27 horas / semanales, o
sea, el 28% de los niños está la mayor cantidad de tiempo viendo
televisión.
 f1 = 2 niños, que equivalen al 8%, ven televisión entre 10 y 12 horas /
semanales
 H4 = 52% = El 52% de los niños de esa comunidad Pan y Agua
ven televisión entre 10 y 21 horas / semanales.
2. Los siguientes datos son los pesos medidos en Kg. De 30
pacientes, atendidos en los meses de enero a marzo del 2,005,
en el consultorio de nutrición del Hospital Nacional “Fuji - Fuji”
75.8 69.3 96.2 86.3 99.8
84.6 72.2 74.1 76.0 86.5
70.2 61.8 58.4 69.2 68.4
68.3 75.0 67.3 82.2 72.1
59.4 65.5 76.4 76.5 81.0
65.0 86.2 68.3 65.9 69.0
Se solicita:
a. Organizar los datos en una tabla completa de distribución de
frecuencias.
b. Interpretar el valor de algunas frecuencias.
a. Como la variable peso, por su medición pertenece a la escala de razón,
utilizaremos la regla de sturges para elaborar una tabla de distribución de
frecuencias, detallando los pasos siguientes:
Cálculo del Rango: R = 99.8 - 58.4 = 41.4
Número de clases: K = 1 + 3.3 Log 30 = 5.88 = 6
Amplitud de intervalo: W = 41.4 / 6 = 6.9 (Redondeando a un decimal, porque
los datos aparecen con un decimal)
Formación de intervalos:
i Ii

1 58.4 – 65.2

2 65.3 – 72.1

3 72.2 – 79.0

4 79.1 – 85.9

5 86.0 – 92.8
El dato mayor 99.8 no se
6 92.9 – 99.7 contabiliza dentro de este
intervalo y se perdería un dato
Soluciones posibles:
a. Dejar el limite superior de la ultima clase, abierto, de la siguiente manera:

i Ii

1 58.4 – 65.2

2 65.3 – 72.1

3 72.2 – 79.0

4 79.1 – 85.9

5 86.0 – 92.8

6 92.9 – y más
b. Aumentar una clase y formar un nuevo intervalo, de la siguiente forma:

i Ii
1 58.4 – 65.2
2 65.3 – 72.1
3 72.2 – 79.0
4 79.1 – 85.9
5 86.0 – 92.8
6 92.9 – 99.7
7 99.8 – 106.6
b. Aumentar un décimo (0.1) la amplitud del intervalo, con lo cual W = 6.9 + 0.1 = 7.0. Luego los
nuevos intervalos serían:

i Ii

1 58.4 – 65.3

2 65.4 – 72.3

3 72.4 – 79.3

4 79.4 – 86.3

5 86.4 – 93.3

6 93.4 – 100.3
En este caso adoptaremos la última alternativa, por ser la más conveniente,
la tabla completa de distribución de frecuencias, sería la siguiente:

i Ii fi Fi hi Hi hi (%) Hi (%)

1 58.4 – 65.3 4 4 0.133 0.133 13.3 13.3

2 65.4 – 72.3 12 16 0.400 0.533 40.0 53.3

3 72.4 – 79.3 5 21 0.167 0.700 16.7 70.0

4 79.4 – 86.3 6 27 0.200 0.900 20.0 90.0

5 86.4 – 93.3 1 28 0.033 0.933 3.3 93.3

6 93.4 – 100.3 2 30 0.067 1.000 6.7 100.0

30 1.000 100.0
b. F3: 21 = 21 pacientes tienen entre 58.4 y 79.3 Kg.
h2: 40% = El 40 % de los pacientes, pesan entre 65.4 y 72.3 Kg.
H4: 90% = El 90% de los pacientes, tienen como peso máximo 86.3
Kg.
3. Se presentan los siguientes datos correspondientes a la
cantidad de creatinina en mg / 100 cc., en muestra de orina de
un grupo de 40 personas normales atendidos en el Hospital
Nacional “La Justicia de Salinas”
1.51 1.63 1.51 1.56 1.69 1.65 2.18 1.68
1.09 1.46 2.29 1.48 2.29 1.60 1.38 1.56
1.22 1.50 1.58 1.37 1.65 1.67 1.23 1.73
1.65 1.47 1.89 1.61 1.81 1.61 2.01 1.33
1.53 1.60 1.47 1.67 1.66 1.69 1.54 1.83
Se solicita:
a. Agrupar la información proporcionada, en una cuadro de
frecuencias.
b. Interpretar algunos valores de las frecuencias obtenidas.
Solución:
La variable en estudio pertenece a la escala de razón y por lo
tanto utilizaremos la regla de Sturges, para agrupar los datos en
un cuadro de distribución de frecuencias:
Calculo del Rango: R = 2.29 - 1.09 = 1.2
Número de clases: K = 1 + 3.3 Log 40 = 6.28 = 6
(redondeando al entero)
Amplitud de intervalo: W = 1.2 / 6 = 0.20 (redondeando a dos
decimales, ya que los datos proporcionados tienen dos
decimales)
Formación de intervalos y frecuencias:
La tabla de frecuencias sería la siguiente:
i Ii fi Fi hi Hi hi (%) Hi (%)

1 1.09 – 1.28 3 3 0.075 0.075 7.5 7.5

2 1.29 – 1.48 7 10 0.175 0.250 17.5 25.0

3 1.49 – 1.68 20 30 0.500 0.750 50.0 75.0

4 1.69 – 1.88 5 35 0.125 0.875 12.5 87.5

5 1.89 – 2.08 2 37 0.050 0.925 5.0 92.5

6 2.09 – 2.29 3 40 0.075 1.000 7.5 100.0

40 1.000 100.0
b. f3: 20 = 20 personas tienen entre 1.49 y 1.68 mg / 100 cc de
creatinina.
F4: 35 = 35 personas tienen de 1.09 a 1.88 mg / 100 cc inclusive de
creatinina.
H1: 75% = El 75% de las personas tienen como máximo 1.68 mg /
100 cc de creatinina.
4. Los siguientes datos que se presentan en una tabla incompleta
de distribución de frecuencias, corresponden a las calificaciones
de un grupo de estudiantes del Diplomado en Epidemiología, en
el módulo de Estadística:

i Ii Hi (%) fi hi (%)

1 - 20 12

2 5- 60

3 9- 70

4 - 85

5 -
Solución:
a. Sabemos que la última frecuencia relativa acumulada es
igual al 100% (H5 = 100)
b. Para completar las frecuencias relativas simples, decimos:
h1: H1: 20
h2: H2 – H1: 60 - 20 = 40
h3: H3 – H2: 70 - 60 = 10
h4: H4 – H3: 85 - 70 = 15
h5: H5 – H4: 100 – 85 = 15
c. Las frecuencias absolutas simples, se obtienen utilizando la
fórmula:
hi = fi / N fi = hi . N

Frecuencias Frecuencias Frecuencia


Absolutas Relativas Total
i Ii fi hi (%) Hi (%)

1 1–4 12 20 20

2 5–8 24 40 60

3 9 – 12 6 10 70

4 13 – 16 9 15 85

5 17 - 20 9 15 100

60 100
ESTADISTICA
DESCRIPTIVA

ETAPA DE PRESENTACION
DE DATOS
FORMAS DE
PRESENTACION DE DATOS
La presentación de datos se hace
principalmente a través de dos formas:
a través de tablas o cuadros
estadísticos y a través de gráficos.
TABLAS o CUADROS
ESTADÍSTICOS

1. Concepto: Consiste en la presentación


ordenada de los datos en filas y
columnas con el objeto de facilitar su
lectura y posterior análisis e
interpretación.
PARTES DE UNA TABLA
ESTADISTICA
1. Título: Expresa en forma resumida la
información que contiene y se coloca en la
parte superior de la tabla. Debe ser breve,
concreto y completo. Un título completo
debe obtener lo siguiente:
a. La circunstancia espacial, es decir, debe
indicar la institución o área geográfica al que
pertenecen los datos.
Responde a la pregunta: ¿A DÓNDE
pertenece la información?
PARTES DE UNA TABLA
ESTADISTICA
b. El fenómeno que se está tratando, o la
naturaleza de los datos
Responde a la pregunta: ¿QUÉ contiene la
tabla?
c. El criterio de la clasificación de los datos.
Responde a la pregunta: ¿CÓMO se
presentan el contenido de la tabla?
d. El espacio temporal o periodo que abarca la
información que se presenta.
Responde a la pregunta: ¿CUÁNDO?
EJEMPLO DE UN BUEN
TITULO
1. ¿Qué contiene la tabla?: Pacientes con
cáncer
2. ¿Cómo se presenta el contenido?:
Lugar de residencia.
3. ¿A dónde pertenece la información?:
Hospital Junín. Provincia Junín. Junín
4. ¿Cuándo? 2,005
Tabla Nº 1.1
Pacientes con cáncer según lugar de residencia.
Hospital Junín. Prov. Junín. Junín. 2,005

CIUDAD NUMERO DE PORCENTAJE


PACIENTES

J 11 36.7

O 6 20.0

C 7 23.3

U 6 20.0

TOTAL 30 100.0
PARTES DE UNA TABLA
ESTADISTICA
2. Encabezado: Está formado por la primera fila
superior y nos indica las características (variables)
del fenómeno en estudio.
3. Matriz: Está formado por la primera columna de la
izquierda y nos indica las características (variables)
del fenómeno en estudio.
4. Cuerpo: Es el contenido de la tabla, es decir, es la
información que se presenta en filas y columnas.
5. Fuente: Se coloca en la parte inferior del cuadro y
nos indica el lugar de donde se obtuvieron los
datos contenidos en la tabla.
PARTES DE UNA TABLA ESTADISTICA
TITULO ENCABEZADO

CIUDAD NUMERO DE PORCENTAJE


PACIENTES
J 11 36.7
O 6 20.0
MATRIZ
C CUERPO
7 23.3
U 6 20.0
TOTAL 30 100.0

FUENTE: Archivo de la Oficina de Estadística del Hospital Junín.


Prov. Junín. Junín. 2,005.

FUENTE
TIPOS DE TABLAS
ESTADISTICAS

1. De acuerdo al uso:
a. Tabla General o de Referencia: Son
tablas referenciales que se utilizan
generalmente como fuente de
información, ya que contiene datos en
detalle sobre diversas variables de un
fenómeno.
CUADRO Nº 2.1
Universidad Nacional Daniel Alcides Carrión
Alumnos matriculados por departamento de procedencia, según datos personales. Provincia
Yanacancha, Cerro de Pasco. 2,005

EDAD ESTADO CIVIL COLEGIO DE PROCEDENCIA


PROGRAMA
DEPARTAMENTO ACADEMICO
DE PROCEDENCIA
16 - 19 20 - 23 24 - 27 27 a más Soltera Casada Estatal Particula Religioso
r
TIPOS DE TABLAS
ESTADISTICAS

b. Tabla de Texto o Resumen: Son tablas que


se elaboran en base a la tabla general o de
referencia, de donde se seleccionan una o
más variables de interés o que presentan
cierta relación entre si, con el fin de explicar
una determinada situación. En relación al
ejemplo anterior, de todas las variables que
contiene la tabla general, se puede elaborar
una tabla resumen, seleccionando dos
variables
Cuadro Nº 2.2
Universidad nacional Daniel Alcides Carrión
Alumnos matriculados por departamento de procedencia, según edad.
Prov. Yanacancha. Cerro de Pasco. 2,005

DEPARTAMENTO DE EDAD TOTAL


PROCEDENCIA

16 – 19 20 - 23 24 - 27 28 a más

Arequipa

Junín

Cuzco
TIPOS DE TABLAS
ESTADISTICAS

2. Desde el punto de vista de su


disposición:
a. Tablas de una entrada o entrada simple:
Son tablas en cuyo orden presentan una
sola variable, análisis o característica y
su clasificación va definida en columna
matriz.
Cuadro Nº 2.1
Pacientes atendidos por Tuberculosis Pulmonar por nivel de instrucción.
Hospital Daniel Alcides Carrión. Lima. Marzo 2004

NIVEL DE NUMERO PORCENTAJE


INSTRUCCION
Analfabeto 38 31.7

Primaria 63 52.5

Secundaria 16 13.3

Superior 3 2.5

TOTAL 120 100.0

FUENTE: Archivo de la Oficina de Estadística del Hospital Daniel Alcides Carrión. Lima. Marzo 2,004.
TIPOS DE TABLAS
ESTADISTICAS

b. Tablas de dos entradas o entrada doble:


Son tablas que presentan
simultáneamente dos variables, análisis
o características relacionadas, donde
una va definida en columna matriz
(vertical) y la otra en encabezado
(horizontal)
Cuadro Nº 2.2
Pacientes atendidos de Tuberculosis Pulmonar por nivel de instrucción,
según sexo. Hospital Daniel Alcides Carrión. Lima. Marzo 2004

NIVEL DE SEXO TOTAL


INSTRUCCION
MASCULINO FEMENINO

Analfabeto 28 10 38

Primaria 32 31 63

Secundaria 9 7 16

Superior 1 2 3

TOTAL 70 50 120

FUENTE: Archivo de la Oficina de Estadística del Hospital Daniel Alcides Carrión. Lima. Marzo 2,004.
TIPOS DE TABLAS
ESTADISTICAS

c. Tablas Complejas: Son tablas que


presentan en forma simultánea tres o
más variables, análisis o características
relacionadas que van definidas unas en
columna matriz (vertical) y otras en
encabezado (horizontal).
GRAFICOS o DIAGRAMAS
Es la representación en dibujo que permite destacar la
magnitud o modificación de las características de una
variable, o comparar las diversas relaciones entre
variables, ofreciendo una visión panorámica y rápida
del fenómeno en estudio.
Los gráficos constituyen un complemento del análisis
descriptivo y en su presentación pueden ir
acompañados de la tabla o cuadro que le dio origen, ya
que ésta presenta detalles que no aparecen en el
gráfico.
IMPORTANCIA
Los gráficos son importantes por lo
siguiente:
 Son esenciales en el estudio y presentación de
trabajos estadísticos. Los datos transformados en
dibujo permite un examen visual que constituye,
muchas veces, la primera etapa de una análisis e
interpretación de datos.
 Permiten observar en forma instantánea el
comportamiento de la variable o variables materia de
estudio.
 Permite formar una idea bastante aproximada sobre
la tendencia de las variables en el futuro.
PARTES DE UN GRAFICO O
DIAGRAMA
1. Título: Expresa el contenido del gráfico y
por lo general, es igual o parecido al título
del cuadro estadístico que sirvió de
referencia.
2. Escalas: Para graficar se utiliza el sistema
cartesiano, compuesto por dos ejes: uno
horizontal llamado abcisa; y otro vertical
llamado ordenada. Ambos ejes se cortan en
un punto llamado origen.
Las escalas vienen a ser la graduación de
ambos ejes, según la naturaleza de las
variables y frecuencias correspondientes.
PARTES DE UN GRAFICO O
DIAGRAMA

3. Cuerpo: Es el gráfico en sí, y constituye la


representación en dibujos de los datos.
4. Fuente: Indican el origen de los datos
estadísticos que se está representando en el
gráfico.
PARTES DE UN GRAFICO
TITULO
(EJE DE LAS ORDENADAS)
ESCALAS

CUERPO

ESCALAS
(EJE DE LAS ABCISAS)
FUENTE
TIPOS DE GRAFICOS
ESTADISTICOS
1. Cuando los datos son medidos a nivel nominal u
ordinal:
a. Gráfico de barras: Es usado generalmente para
representar hechos o fenómenos son
continuidad, sin movimiento, de tal forma que
permite visualizar la magnitud y comparar los
elementos en que se clasifican las variables. Los
gráficos de barras, pueden ser de los siguientes
tipos:
TIPOS DE GRAFICOS ESTADISTICOS
a.1. Gráfico de barras simple: Para su elaboración se debe
contar con una tabla o cuadro de entrada simple. En su
construcción se debe observar lo siguiente:
 Todas las barras tienen el mismo ancho.
 El espacio entre barra y barra debe ser la misma y
constituye la mitad del ancho de la barra.
 El ancho de la barra debe ser el doble del espacio que se deja
entre barra y barra.
 En el eje de las ordenadas, la longitud entre escala y escala
debe ser la misma que la longitud entre escala y escala del
eje de las abcisas.
 El número de escalas en cada eje deben ser proporcionales
Preferentemente construir las barras en orden decreciente
de magnitud, en orden alfabético, cronológico, etc.
75

60

45
2E

30 E
15

C1
Tabla N° 1.2
Pacientes atendidos de Tuberculosis Pulmonar por grado de
instrucción. Hospital Loayza. Lima. Marzo 2,004

GRADO DE NUMERO DE
PORCENTAJE
INSTRUCCIÓN PACIENTES

ANALFABETO 38 31.67
PRIMARIA 63 52.50
SECUNDARIA 16 13.33
SUPERIOR 3 2.50
TOTAL 120 100.00
FUENTE: Hospital Loayza. Oficina de estadística.
1. En el eje de las abcisas, se representa la variable y a cada
categoría le corresponde una barra. Si asumimos que el
espacio entre barra es de 0.5 cm. Entonces el ancho de
cada barra es de 1 cm.
2. En el eje de las ordenadas, debemos tener entre 4 a 6
escalas, a fin de que guarden proporción con las escalas
del eje de las abcisas. La longitud entre escala y escala en
el eje de las ordenadas, debe ser la misma que aparece
entre escala y escala del eje de las abcisas (1 cm.). El
valor de cada escala se calcula aproximadamente
dividiendo la frecuencia más alta entre el número de
categorías de la variables (63 / 4 = 15.75), donde el
resultado se redondea al número entero más próximo y
de fácil manejo. En nuestro ejemplo, redondeamos a un
valor de 15.
3. Cada barra alcanzará la altura que indique la frecuencia
que aparece en la tabla correspondiente.
4. Para graficar el porcentaje de pacientes por
grado de instrucción, se sigue el mismo
procedimiento; sólo se debe tener en cuenta que
en el eje de las ordenadas ya no se mide
cantidad, si no porcentaje y para hallar el valor
en porcentaje de cada escala, dividimos el
porcentaje más alto entre el número de
categorías de la variable (52.5 / 4 = 13.13) y el
resultado se redondea al número entero más
próximo y de fácil manejo. En nuestro ejemplo
redondeamos a 10.
5. Las barras alcanzarán la altura que indique el
porcentaje que aparece en la tabla
correspondiente.
a.2. Gráfico de barras compuestas: Para su
elaboración se debe contar con una tabla o
cuadro de entrada doble.

Tabla N° 1.3
Pacientes atendidos de Tuberculosis Pulmonar por grado de
instrucción según sexo. Hospital Loayza. Lima. Marzo 2,004

GRADO DE SEXO
TOTAL
INSTRUCCIÓN MASCULINO FEMENINO
ANALFABETO 13 15 28
PRIMARIA 35 28 63
SECUNDARIA 9 7 16
SUPERIOR 2 1 3
TOTAL 59 51 110
1. Hallamos las escalas del eje de las abcisas siguiendo el
mismo procedimiento que en el caso de las barras simples.
Si asumimos que el espacio entre barra y barra es de 0.5
cm. Entonces el ancho de la barra será de 1 cm.
2. El ancho de cada barra se divide en dos partes iguales,
donde una representa al sexo masculino y la otra al
femenino.
3. El valor de las escalas del eje de las ordenadas, se calcula
aproximadamente ubicando la máxima frecuencia entre
los dos sexos (masculino y femenino) y dividiendo dicha
frecuencia entre el número de categorías de la variable
(35 / 4 = 8.75) el valor hallado redondeamos al entero más
próximo y de fácil manejo (en este ejemplo 10).
4. Las barras alcanzarán la altura que indique las
frecuencias de la tabla respectiva.
40

30

20

10

0
ANALFABETO PRIMARIA SECUNDARIA SUPERIOR

SEXO MASCULINO SEXO FEMENINO


a.3. Gráfico de barras superpuestas: La información
representada a través de barras compuestas,
también puede representarse en barras
superpuestas.

SEXO
GRADO DE TOTAL
MASCULINO
INSTRUCCIÓN FEMENINO (%) (%)
(%)
ANALFABETO 46.43 53.57 100.00
PRIMARIA 55.56 44.44 100.00
SECUNDARIA 56.25 43.75 100.00
SUPERIOR 66.67 33.33 100.00
1. Para hallar las escalas del eje de las abcisas se sigue el
mismo procedimiento que el caso de las barras simples.
Asumimos un valor de 0.5 cm. Para el espacio entre barra
y barra y por lo tanto el ancho de la barra será de 1 cm.
2. Para hallar las escalas del eje de las ordenadas, se ubica la
más alta frecuencia en el total. En nuestro ejemplo: 63 / 4
= 15.75 que se redondea al entero más próximo y de fácil
manejo; y se tendría lo mismo que en el caso del gráfico
de barras simple.
3. En el segundo caso se necesita traducir los valores
absolutos del cuadro en porcentajes. El valor de cada
escala será de 100 / 4 = 25
4. Las barras correspondientes a la variable grado de
instrucción, alcanzarán la altura según lo indique la
frecuencia total. Asimismo, cada barra se cortará su
altura en dos, según lo indique la frecuencia de la variable
sexo.
100.00

75.00

50.00

25.00

0.00
ANALFABETO PRIMARIA SECUNDARIA SUPERIOR

masculino femenino
75

60

45

30

15

0
ANALFABETO PRIMARIA SECUNDARIA SUPERIOR

masculino femenino
b. GRAFICO CIRCULAR: Se usa para
representar y comparar la dimensión de las
partes de un fenómeno con el fenómeno total.
Para su elaboración se utiliza la
circunferencia, siendo necesario que los
valores absolutos y/o porcentuales, sean
traducidos en GRADOS. A cada elemento de
la variable le corresponde un sector de la
circunferencia.
Tabla N° 1.2
Pacientes atendidos de Tuberculosis Pulmonar por grado de
instrucción. Hospital Loayza. Lima. Marzo 2,004

GRADO DE NUMERO DE
PORCENTAJE
INSTRUCCIÓN PACIENTES
ANALFABETO 38 31.67
PRIMARIA 63 52.50
SECUNDARIA 16 13.33
SUPERIOR 3 2.50
TOTAL 120 100.00
FUENTE: Hospital Loayza. Oficina de estadística.
Teniendo en cuenta el cuadro anterior,
graficar los datos utilizando un gráfico
circular.
Solución: Sabemos que la circunferencia tiene
un total de 360°, utilizando la regla de tres
simple, se hallan los grados para cada clase:
100 % - 360°
31.7% - X

X = 360° x 31.7 / 100 = 114°


 Analfabeto: 360° x 31.7 / 100 = 114°
 Primaria: 360° x 52.5 / 100 = 189°
 Secundaria: 360° x 13.3 / 100 = 48°
 Superior: 360° x 2.5 / 100 = 9°
 Total de grados: 360°
Utilizando un transportador se diseñan los
sectores, partiendo de cualquier punto de la
circunferencia, pero se recomienda partir del
punto donde el reloj marca las 12, luego
siguiendo la dirección de las manecillas del reloj
determinar los grados para cada sector.
INICIO


CONTINUACION
48°
114°

189°

ANALFABETO PRIMARIA SECUNDARIA SUPERIOR


1. Cuando los datos son medidos a nivel de
intervalo o razón:
a. Histograma: Es un gráfico que se utiliza
para representar la distribución de
frecuencias absolutas o relativas simples.
Consiste en un grupo de rectángulos
adyacentes que tienen sus bases en el eje de
las abcisas (donde se representan los
intervalos de clase de la variable) y altura
igual a las frecuencias de cada clase.
b. Polígono de frecuencias: También es un
gráfico que se utiliza para representar la
distribución de frecuencias absolutas o
relativas simples. Consiste en un gráfico
lineal que se obtiene uniendo los puntos
hallados, mediante el par de valores de
marca de clase y frecuencia
correspondiente. Para fines de gráfico, se
hace necesario incrementar un intervalo de
clase en cada extremo, con frecuencia cero.
Cuadro N° 2.1
Edad de personas detenidas por delito de robo
Comisaria "Madre Mía". Lima. Mayo 2,003

Edad (en años) Edad (en años) Número


5 9 4.5 - 9.5 0
10 14 9.5 - 14.5 20
15 19 14.5 - 19.5 35
20 24 19.5 - 24.5 30
25 29 24.5 - 29.5 18
30 34 29.5 - 34.5 12
35 39 34.5 - 39.5 0
Total 115
35

30

25

20

15

10

0
4.5 - 9.5 9.5 - 14.5 14.5 - 19.5 19.5 - 24.5 24.5 - 29.5 29.5 - 34.5 34.5 - 39.5
Solución:
Para su elaboración hallamos las marcas de
clase o punto medio de cada intervalo,
incrementando una anterior a la primera clase
y otra posterior a la última clase, ambas con
frecuencias cero.
Luego se procede a la unión de los puntos, los
mismos que se unen a través de una línea
recta.
c. Ojivas: Son gráficos que se utilizan para
representar las frecuencias acumuladas
absolutas o relativas, y consiste en un
gráfico lineal que nos permite observar la
cantidad de elementos que quedan por
encima o por debajo de determinados
valores.
120

100

80

60

40

20

10 15 20 25 30 35
ETAPA DE ANALISIS E INTERPRETACION DE
DATOS: MEDIDAS DE RESUMEN
Introducción
Se ha estudiado los cuadros y gráficos como formas para
ordenar y describir un conjunto de datos para tomar
decisiones. Sin embargo, el análisis resulta todavía un
tanto incompleto, pues se hace necesario que todos los
datos contenidos en la tabla de distribución de frecuencias,
se puede resumir aún más para facilitar al análisis e
interpretación de la información, utilizando ciertos
indicadores.
Estos indicadores, llamados también medidas de resumen
o ESTADIGRAFOS, permita hablar un solo valor
numérico, el mismo que representa a toda la población o
muestra en estudio.
Las medidas de resumen o estadígrafos más
importantes son:
 De tendencia central: Medida aritmética,
mediana, moda, media geométrica, etc.
 De posición: Deciles, cuartiles, percentiles.

 De dispersión: Rango, desviación media,


desviación estándar, varianza, coeficiente de
variación.
6.2.- Medidas o Estadígrafos de Tendencia Central
6.2.1.- Concepto
Son estadígrafos que permiten hallar un solo valor
numérico e indica al “centro” de un conjunto de datos.
Este único valor describe al conjunto de datos, señalando
la característica que destaca de la información.
6.2.2 Descripción de las Medidas o Estadígrafos de
Tendencia Central.
Los estadígrafos de Tendencia Central son los más
importante y son:
(A) Media Aritmética o Promedio Aritmético ( X )
Es la media de tendencia central más estable y se
obtiene de acuerdo a lo siguiente:
a) Media aritmética para datos no agrupados
i) Promedio aritmético simple.-
Se halla sumando todos los datos de la
distribución y dividiendo dicha suma entre el
total de los datos.
Se expresa mediante la siguiente fórmula:
Ejemplo: El coeficiente de inteligencia ( CI ) de 5
personas si el siguiente: 100, 95, 102, 115 y 98.
El CI promedio será:
Interpretación: El coeficiente de inteligencia promedio es de
102.
ii) Promedio aritmético ponderado.-
Es aquel promedio que se utiliza cuando prevalece cierto
peso, importancia o repetición de los datos en el estudio.
Se halla mediante la siguiente fórmula:
Ejemplo: Es una Universidad, 28 profesores tiene 5
años de servicios, 16 profesores tiene 10 y 11
profesores tiene 15. Hallar el tiempo promedio de
servicios de los docentes.
Solución:
Ordenamos la información en el siguiente cuadro y
hallamos los datos parciales que pide la fórmula:
Luego:

Interpretación: El tiempo de servicios promedio de


los docentes en esta Universidad es de 8 años
d) Media aritmética para datos agrupados.-
Cuando los datos están agrupados en una tabla de
distribución de frecuencias, el promedio puede ser
calculado principalmente a través de dos métodos.
i) Método largo.-
Por este método el promedio se obtiene sumando el
producto de las marcas de clase por la frecuencia
correspondiente y dividiendo la suma entre la
frecuencia absoluta total.
La fórmula es:
Ejemplo: El consumo semanal de carne
vacuno en la muestra de 80 familias en la
comunidad “X”, es como sigue:
Hallar el consumo promedio
Solución: Se hallan las marcas de clase (X¡), se
multiplica con su frecuencia respectiva (X¡ . F¡); y
se suma los productos. El siguiente cuadro ayuda a
efectuar estas operaciones:
Según fórmula:

Reemplazando:

Interpretación: La muestra de familias de la comunidad “X”,


consume en promedio 4.2 kg. Semanal de carne vacuno.
Ventajas de la Media Aritmética:
- Es útil cuando los datos siguen
aproximadamente una progresión
aritmética o están distribuidos en forma
normal o simétrica.
- Es un estadígrafo de gran
estabilidad, porque toma en cuenta todos
los datos.
- Nos permite estimar o probar
parámetros en estadística inferencial.
Desventajas de la Media Aritmética:
Como incluye todos los datos, puede ser afectado por
valores extremos.
Cuando los datos agrupados tienen clase abierta en
los extremos no es recomendable calcular la media
aritmética.

Mediana (Me):
Es el estadígrafo que representa el punto medio de
los datos, en el cual cae el 50% de las puntuaciones.
Se obtiene de la siguiente manera:
Mediana para datos no agrupados.-
La Mediana es el valor medio (cuando la serie
es impar) o la media aritmética de los dos
valores medios (cuando la serie es par), del
conjunto de datos previamente ordenados en
forma creciente o decreciente.

Ejemplo: Hallar la media de las edades de 5


personas: 12, 15, 13,48, 10 años.
Solución:
Ordenamos los datos en forma creciente y la media es el
dato que ocupa el valor central, ya que la serie
es impar .

Interpretación: El 50% de las personas tiene


máximo 13 años de edad.
Ejemplo: Hallar la media de las edades de 6
personas: 48, 52, 05, 50, 53, 55 años.
Solución:
Ordenemos los datos en forma creciente:

Observemos que 50 y 52 ocupan el centro del


conjunto de datos ordenados, entonces la mediana es
el promedio aritmético simple de esos dos valores.
Así:

Interpretación: El 50% de las personas tiene como


máximo 51 años de edad.

La Mediana se utiliza también en variables ordinales.


Así por ejemplo, supongamos la siguientes
información sobre el número de alumnos remitentes
por años de estudios secundarios en 1992 para el
colegio “X”.
Solución:
Se halla la frecuencia acumulada F¡ (ver tabla)
Se divide la frecuencia total entre 2 : 56 /2 = 28
Se busca dentro de la frecuencia acumulada, el
primer valor que contiene a 28; en este caso 39, por
tanto la clase media se ubica en la segunda clase y la
media corresponde a la categoría “segundo”.
Luego:

Interpretación: La mitad de los estudiantes


repitentes (50%) lo hacen como máximo hasta
segundo de secundaria.
Aproximadamente la otra mitad repite categorías
superiores al segundo de secundaria.
Media para datos agrupados.-
Cuando los datos se encuentran agrupados en la
tabla de distribución de frecuencias, la mediana se
halla utilizando la siguiente formula:
donde:
Me = mediana
L¡ = Límite inferior del intervalo de la clase media
f¡/2 = Semisuma de las frecuencia absoluta simple.
(f ¡)1 = Suma de todas las frecuencias absoluta
anterior a la clase media
f Me = Frecuencia de la clase media
W = Amplitud del intervalo
Ejemplo: Continuando con el problema anterior, sobre el
consumo semanal de carne de vacuno en una muestra de 80
familias en la comunidad “X”, la media se calcula siguiendo los
pasos siguientes:
1°) Se halla frecuencia acumulada (Fi). (ver Tabla)
2°) Se ubica la clase madia: La clase en el cual estará incluida la
mediana, se determina mediante:
La clase mediana será aquella en donde la
primera frecuencia acumulada contenga el
valor. Para este caso la primera frecuencia
acumulada que contiene a 40, es como 41 se
encuentra en la segunda clase, entonces
dicha clase será la clase media.
i Ii fi Fi
1 0 - 1.9 15 15
2 2 - 3.9 26 41
3 4 - 5.9 20 61
4 6 - 7.9 13 74
5 8 - 9.9 6 80
80

Otros datos: Li = 2; = 15; fme = 26; W = 2

Reemplazando en la formula:
Me = 2 + (80/2 – 15 / 26) x 2
Me = 2 + 1.9 = 3.9 Kg.
Interpretación: En la muestra en estudio, el
50% de las familias consumen como máximo
3.9 Kg. / semana de carne de vacuno. El
restante 50% de las familias consume más de
3.9 Kg. / semana.
VENTAJAS DE LA MEDIANA
 La mediana es un estadígrafo que no está
afectada por valores extremos, y por lo
tanto es más representativa que la media
aritmética cuando alguno de los valores de
la variable se aleja mucho de los demás o
cuando las series son simétricas.
 Es útil cuando los datos agrupados tienen
clases abiertas en los extremos.
 Se aplica también a variables que
pertenecen a la escala ordinal.
MODA
Es un estadígrafo que nos indica el valor o
cualidad que se presenta con más frecuencia
dentro de una variable. Se halla de acuerdo
a lo siguiente:
a. Moda para datos no agrupados: La moda
es el valor más frecuente o el valor que más
se repite dentro de una serie de datos.
Ejemplo: Calcular la moda del coeficiente
intelectual de un grupo de alumnos: 100, 95,
105, 100, 110, 100
Solución: Observamos que el dato que más
se repite es 100. Luego la moda será 100.
Interpretación: Se interpreta como que la
mayoría de los alumnos tienen un CI
aproximado de 100. En este caso la serie es
Uni modal, porque tiene una sola moda.
Ejemplo: Calcular la moda del coeficiente
intelectual del siguiente grupo de alumnos:
95, 100, 105, 110, 95, 100, 115, 95.
Solución: Se observa que existen dos valores
que se repiten. Luego la moda será 95 y 100.
Y se interpreta como que el CI más
frecuente en el grupo de alumnos es de 95 y
100.
 En este caso la serie es Bimodal, porque
tiene dos modas:
 Cuando la serie tiene tres o más modas se el
conoce con el nombre de Multimodal.
 La moda también es útil cuando la variable
en estudio pertenece a la escala nominal.
Ejemplo: Hallar la moda para la siguiente
información que consiste en una muestra de
consumidores según preferencias por marca
de mantequilla:
MARCA DE MANTEQUILLA CONSUMIDORES
ASTRA 20
DORINA 32
CREMA DE ORO 18
LAIVE 12
NINGUNO 5
TOTAL 87

Solución: Observamos que la marca de mantequilla


de mayor preferencia es Dorina, por lo tanto: La
moda es Dorina.
MODA PARA DATOS AGRUPADOS
 En este caso la moda se halla mediante la
formula:
d’ . W
Mo = Li + ----------------
d’ + d’’
Li = Límite inferior de la clase modal.
d’ = Diferencia de la frecuencia de la clase
modal y la frecuencia de la clase anterior a ella.
d’’ = Diferencia de la frecuencia de la clase
modal y la frecuencia de la clase siguiente a ella.
Ejemplo: Con respecto al problema
anterior sobre el consumo semanal de carne
vacuno en una muestra de 80 familias, la
moda se calcula de acuerdo al siguiente
procedimiento:
1° Ubicación de la clase modal.- La clase modal se ubica en
aquella clase que tiene la mayor Frecuencia, En nuestro
ejemplo la mayor frecuencia es 26 y corresponde a la
segunda clase; por consiguiente la segunda clase constituya

la clase modal.

i I, F,
1 0 - 1.9 15

2 2 - 3.9 26 Clase Modal


3 4 - 5.9 20

4 6 - 7.9 13

5 8 - 9.9 6
2°) Cálculo d’:
d’ = 26 – 15 = 11

3°) Cálculo d”:


d” = 26 – 20 = 6

4°) Otros datos:


L¡ = 2; w = 2.

5°) Aplicando la formula:

Mo = L¡ + d’ . w
d’ + d”

Mo = 2 + (11) (2).= 22 = 2 + 1.29 = 3.29


11 + 6 17
Mo = 3.3 kg
Interpretación: Las familias en
estudio consumen con mayor frecuencia 3.3
kg./semana de carne de vacuno.

Ventajas de la Moda.-
- Al igual que la mediana, no está afectada por
valores externos.
- Puede usarse cuando los datos agrupados tiene
clases abiertas en los extremos.
- Se usa también para variables que pertenecen a la
escala nominal.
Desventajas de la moda:
 No es representativa a menos que la
distribución contenga un gran número de
datos y exista significativa repetición de
alguno de ellos.
 Muchas veces la serie no tiene moda porque
ningún valor se repite.
 Cuando la serie tiene dos, tres o más modas,
se hace difícil su interpretación y
comparación
Medidas de Posición o Cuantiles.
Concepto.-
Son estadígrafos que dividen a una
distribución de frecuencias en cuatro,
diez o cien partes iguales.
Descripción de los Cuantíles.-
A) Cuartiles.-
Son estadígrafos que dividen a la información
en cuatro (04) partes iguales donde cada uno
de ellos incluye el 25% de las observaciones.
Si se estudia el 25% de las observaciones se dice que está
analizando el cuartil 1 (Q ).
1

Si se estudia el 50% de las observaciones, se dice que se está


analizando el cuartil 2 (Q2).
Si se estudia al 75% de las observaciones, se dice que se está
analizando el cuartil 3 (Q3).
Q1 se interpreta como el limite máximo del 25% de la
observaciones inferiores; o como el limite mínimo del 75%
de la observación superiores,
Q2 se interpreta como el limite que divide a la distribución en
dos partes iguales (50%) en este caso: Q2 = Me.
Q3 se interpreta como limite máximo del 75% de la
observación inferiores; o como limite mínimo de 25% de la
observación superiores.
Esquemáticamente se tiene:
Información

25%

Primer Cuartil (Q1) 25%

Cuartil (Q3)
Tercer
Segundo
25% Cuartil (Q2)

25%

TOTAL 100%
Los Cuartiles se calcula de la siguiente manera:

Donde:
i = 1,2,3; Según se trate de hallar el primero,
segundo, tercero cuartil.
L¡ = Límite inferior de la clase cuartílica.
f¡ = Suma de todos las frecuencias absoluta
simples.
( f ¡)1 = Suma de las frecuencia absoluta simple de
toda las clases anteriores de la clase
cuartílica.
fp= Frecuencia que corresponde a la clase cuartílica.
Ejemplo: Teniendo en cuenta la información
del cuadro sobre el consumo de carne vacuno,
hallar el cuartil 1.
Solución:
Para hallar el Q1, se siguen los siguientes
pasos:
1°) Se halla la frecuencia acumulada F¡). (ver
Tabla)
2) Se ubica la clase cuartílica: Para el cuartil i
= 1, luego se utiliza parte de la fórmula: 1 x 80
/ 4 = 20
La clase cuartílica será aquella en donde la primera
frecuencia acumulada contenga el valor de 20. En
esta caso la primera frecuencia acumulada que
contiene a 20 es 41;observamos que 41 se encuentra
en la 2da. Clase, entonces dicha clase será la clase
cuartílica.
 Reemplazando en la fórmula:
Q1 = 2 + (1x80/4 – 15 / 26) 2
Q1 = 2,4 Kg.
Interpretación: El 25% de las familias en
estudio consumen como máximo 2.4 Kg. /
semana de carne vacuno.
El 75% de las familias restantes, consume
más de 2.4 Kg. / semana.
DECILES
 Son estadígrafos que dividen la información en
diez (10) partes iguales, donde cada uno de
ellos incluye el 10% de las observaciones.
 Si se estudia el 10% de las observaciones, se
dice que se está analizando el decil 1 (D1)
 Si se estudia el 20% de las observaciones, se
dice que se está analizando el decil 2 (D2).
 D1 se interpreta como el límite máximo del 10%
de las observaciones inferiores; o como el límite
mínimo del 90% de las observaciones superiores.
 D2 se interpreta como el límite máximo del 20%
de las observaciones inferiores; o como el límite
mínimo del 80% de las observaciones superiores;
y así sucesivamente hasta el D9 que se interpreta
como el límite máximo del 90% de las
observaciones inferiores, o como el límite mínimo
del 10% de las observaciones superiores.
 Los deciles se calculan utilizando la fórmula:

i fi / 10 - F i - 1
Di = Li + -------------------------- x W
fi
Donde:
i = 1, 2, 3, ……. 9 según se trate de hallar el primer,
segundo……. Noveno decil.
Li = limite inferior.
F i – 1 = Suma de todas las frecuencias absolutas
simples de todas las clase decílica.
3° Otros datos:

( f¡ = Suma de las frecuencias absolutas de todas


las clase anteriores a la clase decílica. F¡ =
Frecuencia que corresponde a la clase decílica.

Ejemplo: Teniendo en cuenta la información


sobre el consuma de la carne de vacuno por
parte de 80 familias; hallar el 8° decil.
Solución: Para hallar el decil 8, se emplea el
siguiente procedimiento:
1°) Se halla la frecuencia acumulada (F¡).
2°) Se ubica la clase decílica:

Parte el 8° decil: i =, luego:

(8) ( i )= 8 x 80 = 64
10
La clase decílica será aquella en donde la primera
frecuencia la acumulada contenga al valor 64. En
este caso la frecuencia acumulada que contiene a
64 es 74; se observa que 74 se ubica en la 4ta clase,
entonces dicha clase constituye la clase decílica
3° Otros Datos:

4° Reemplazando valores en la formula:

i fi / 10 - F i - 1
Di = Li + --------------------- x W
fi

D8 = 6.5
Interpretación: El 80% de las familias en estudio
consuma como máximo 6.5 kg/semana de carne de
vacuno.
El 20% restante de las familias consumen más de 6.5
kg/semana.
C) Percentiles:
Son estadígrafos que dividen a la información en cien
(100) partes iguales, donde cada uno de ellos incluye al
1% de las observaciones.
Cuando se estudia el 1% de las observaciones, se dice
que se está utilizando el percentil 1 (P ).
1
Si se estudia al 2% de las observaciones , se dice
que se está analizando el percentil 2 (P2); y así
sucesivamente se puede estudiar hasta el 99% de
las observaciones, donde se dice que se está
analizando al 99 (P99)
P1 se interpreta como el límite máximo del 1% de
las observaciones inferiores, o como el límite
mínimo del 99% de las observaciones superiores.
.
.
.
P15 se interpreta como el límite máximo del 15% de
las observaciones inferiores; o como el límite
mínimo del 85% de las observaciones superiores; y
así sucesivamente hasta al P99 que se interpreta
como el límite máximo del 99% de las observaciones
inferiores; o como el límite mínimo del 1% de las
observaciones superiores
Esquemáticamente se tiene:
1% Segundo Percentil
Primer Percentil
(P2)
(P1)
1%

1%

1%
Tercero
Percentil (P3)

1%

TOTAL 100%
Es necesario tener en cuneta que se puede utilizar los
percentiles para calcular cualquier cualrtil o decil,
pues, según lo que hemos analizado llegamos a la
siguientes igualdades.

Q1 = P25 D1 = P10
Q2 = D5 = Me = P50 D2 = P20
Q3 = P75

D9 = P90
 Los percentiles se obtienen utilizando la
fórmula:

i fi / 100 - F i - 1
Pi = Li + --------------------------- W
fi

Donde:
i=1,2,3,…….99, según se trate de hallar el primer, segundo,
….noventinueveavo percentil.
L¡=Límite inferior del a clase percentilica.
f¡= Suma de frecuencias absoluta simple
F i – 1 = Suma de las frecuencias absolutas simples, de todas las
clases anteriores a la clase percentilica.
Fi =Frecuencia que corresponde a la clase percentilica.

Ejemplo: En base a la información del cuadro sobre consumo


semanl de carne vacuno, calcular el 60°Percentil.
Solución:
Par calcular el percentil 60, se sigue el siguiente procedimiento.
1°)Se halla la frecuencia acumulada (F¡)
2°) Se ubica en la clase percentilica:
60 x 80 / 100 = 48

La clase percentilica será aquella donde la primera


frecuencia acumulada contenga el valor 48. Para
nuestro caso la primera frecuencia acumulada que
contiene a 48 es 61; se observa en el cuadro que 61 se
encuentra ubicado en la 3era clase, luego dicha clase
constituye a la clase percentilica.
Otros datos: Li = 4; F i – 1 = 41; Fi = 20; W = 2
Reemplazando en la fórmula tenemos:
P60 = 4.7

Interpretación: El 60% de las familias en estudio


consumen carne hasta 4.7 kG. / semana de carne
vacuno. El 40% de familias restantes, consume más de
4.7 Kg. / semana.
Medidas de Dispersión
Introducción
En los temas anteriores hemos estudiados las medidas de
tendencia central, que tiene como objeto ubicar un solo valor
que represente o describa la totalidad de los elementos. Estas
medidas, al igual que los cuantiles, son solo parte de las técnicas
necesarias para describir las características de un conjunto de
observaciones o datos. Si para el análisis e interpretación de la
información sólo consideramos a las medidas de tendencia
central, podríamos llegar a conclusiones erróneas o equivocadas.
Por ejemplo, supongamos que estamos evaluando o
comprobando el tiempo en minutos que tardan 6 niñas y 6 niños
de igual edad para desarrollar la misma tarea. El tiempo
promedio obtenido por los dos grupos fue la siguiente:
Niñas: 15.2 minutos
Niños: 14.7 minutos
Al analizar e interpretar los datos, podríamos
concluir que las niñas utilizan mayor tiempo para
desarrollar la tarea.
Sin embargo si analizamos el tiempo utilizando, por
cada niño tenemos:
Niñas: 14,16,13,15,17,16 X = 15.17
Niños: 16,12,15,18,13,14 X = 14.67
Observamos que la conclusión a la que habíamos
arribado es equivocada porque el tiempo utilizado por
un niño( 18 minutos), es mas alto que el tiempo
utilizado para cualquiera de las niñas.
Si seguimos analizando las puntuaciones individuales
podemos observar que el tiempo utilizado por los
niños están mas dispersos, distantes o separados entre
si (al menor tiempo es 12 minutos. Y el mayor es 18
minutos.); mientras que el tiempo utilizado para las
niñas están mas concentrados ( el menor tiempo es de
13 minutos y el mayor de 17 minutos.). De allí que
para el análisis e interpretación de datos, se hace
necesario de otros estadígrafos que nos permitan
apreciar el grado de variabilidad o de dispersión de las
observaciones.
Definición de Medidas de Dispersión
Son estadígrafos que miden la dispersión o desviación de los datos con
respecto al valor central.

Descripción de las medidas de Dispersión.-


a. Rango (R)
Para datos no agrupados.
R = Vmax - Vmin
El Rango es la diferencia entre el dato mayor y el dato menor, es decir.

Ejemplo: El tiempo que utilizan 6 niños de igual edad para desarrollar


una misma tarea fue el siguiente, 16, 12, 15, 18, 13, 14 minutos.
El Rango será:
R= 18 – 12
R= 6 minutos.
Para datos agrupados.-
El rango es la diferencia entre el limite superior de la ultima clase y el límite
inferior de la primera clase. Así:

R = L sup clase k - Linf. clase 1


Los datos agrupados son intervalos abiertos en los extremos, no tienen rango.
EDAD (años) NUMERO PORCENTAJE
0-2 5 9.43
3-5 12 22.64
6-8 20 37.74
9 - 11 10 18.87
12 - 14 6 11.32
Total 53 100.00

R = 14 – 0 = 14
El Rango es un estadígrafo de cálculo fácil, pero de uso
limitado, ya que no considera a todas las observaciones, sino
solo a los datos ,mínimos y máximos. Por lo tanto, esta
fuertemente influenciado por los datos extremos. Solo debe
usarse cuando se desea saber la información inmediata la
dispersión de datos , sin ninguna precisión estadística.

DESVIACION ESTÁNDAR O DESVIACION TIPICA:


a. Para datos no agrupados: La desviación estándar es la
raíz cuadrada del promedio de la suma de las desviaciones
de cada observación o dato con respecto a su media
aritmética. Así
2
(X1 - X)
DS = ---------------------
N
En la desviación estándar las desviaciones negativas con respecto a la
media, se hacen positivas, elevando al cuadrado y extrayéndole la raíz
cuadrada.
Ejemplo:
Si el tiempo que utilizan 6 niños de igual edad para desarrollar la misma
tarea es: 16,12,15,18,13,14 minutos
Para calcular la desviación estándar, seguimos los siguientes
pasos:
1. Se halla la media aritmética: 14.7
2. Cada dato se resta de la media aritmética, elevando al
cuadrado dicha diferencia. Luego sumamos los
resultados, tal como se aprecia en el siguiente cuadro:
DATO (Xi) (Xi - X)2
16 (16 - 14.7)2 = 1.69
12 (12 - 14.7)2 = 7.29
15 (15 - 14.7)2 = 0.09
18 (18 - 14.7)2 = 10.89
13 (13 - 14.7)2 = 2.89
14 (14 - 14.7)2 = 0.49
23.34
3. Aplicando la fórmula: La DS = 2 minutos.
Interpretación: El tiempo utilizado por los
niños para desarrollar la tarea, se dispersa
en promedio 2 minutos con respecto al
valor central.
PARA DATOS AGRUPADOS:
La desviación estándar, es la raíz cuadrada
del promedio de la suma de las
desviaciones de cada marca de clase con
respecto a su media aritmética,
multiplicado por la frecuencia respectiva
EDAD (años) fi Xi (Xi - X)2 (Xi - X)2 . fi
0-2 5 1 (1 -7 )2 = 36 36 x 5 = 180
3-5 12 4 (4 - 7)2 = 9 9 x 12 = 108
6-8 20 7 (7 - 7)2 = 0 0 x 20 = 0
9 - 11 10 10 (10 - 7)2 = 9 9 x 10 = 90
12 - 14 6 13 (13 - 7)2 = 36 36 x 6 = 216
Total 53 594

Con base a siguiente información calcular la desviación


estándar:
Solución:
1. Calculamos su media aritmética.
2. Restamos cada marca de clase menos el promedio y los
resultados, elevados al cuadrado, se multiplican por la
frecuencia de clase.
2
(Xi - X) - fi
DS = ------------------------
fi

3. Aplicando la fórmula: la DS será 3.3

Interpretación: La edad de los pacientes con leucemia aguda


atendidos en el Hospital Fuji, se dispersa en promedio 3.3
años con respecto al valor central.
VARIANZA
La varianza es el promedio de la suma de los
cuadrados de las desviaciones de la variable
respecto a su media. Así:
2
(Xi - X)
V = ------------------
N
 En la practica, la varianza ser obtiene elevando al
cuadrado la desviación estándar tanto para datos
agrupados como no agrupados.
 En la interpretación debemos tener en cuenta que
las unidades también han sido elevadas al
cuadrado. Por lo tanto, los resultados serán “años
al cuadrado”, etc.
 Ejemplo: Si se sabe que la DS == 2 minutos, del
tiempo que utilizan 6 niños para desarrollar la
misma tarea, entonces la varianza será: 4
minutos al cuadrado.
Interpretación: El tiempo utilizado por los niños
para desarrollar la tarea se dispersa en promedio
en 4 minutos al cuadrado con respecto al valor
central.
COEFICIENTE DE VARIACION:
 El coeficiente de variación (CV) es el
cociente de la desviación estándar y la
media aritmética, expresado en porcentaje.
Así:
DS
CV = ------------ x 100
X
 El coeficiente de variación es un indicador de la
dispersión relativa de los datos, y la unidad de
medida está expresado en porcentaje. Es muy útil
cuando se desea comparar dos o más
distribuciones, donde las unidades de medidas
son diferentes (por ejemplo peso en Kg. Y edad
en años)
 Ejemplo: En el caso del tiempo utilizado por los
niños para desarrollar la tarea, sabemos que, la
desviación estándar es 2 minutos y su promedio
era de 14.7 minutos. Su CV será de 13.6%
Interpretación: El tiempo utilizado por los niños
para desarrollar la tarea, se dispersa en promedio
en 13.6% con respecto al valor central.
CARACTERISTICAS DE LAS
MEDIDAS DE DISPERSION
1. Si se desea exactitud estadística en un estudio, se debe aplicar
los estadígrafos de acuerdo al siguiente orden: Desviación
estándar, rango.
2. Si se desea llevar a cabo un trabajo rápido sin que la exactitud
estadística importe demasiado, se debe aplicar los estadígrafos
anteriores, pero en sentido contrario.
3. La desviación estándar es el estadígrafo de dispersión más
importante y de mayor uso. Un valor grande de DS, significa
que la generalidad de los datos están alejados de la media; un
valor pequeño de la DS significa que la mayoría de los datos
están concentrados en las proximidades de la media aritmética.
4. La varianza tiene gran aplicación en el campo del muestreo y la
inferencia estadística.

También podría gustarte