0% encontró este documento útil (0 votos)
22 vistas20 páginas

Eje #1 y 2 - Estadistica

Cargado por

Magali Quinteros
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
22 vistas20 páginas

Eje #1 y 2 - Estadistica

Cargado por

Magali Quinteros
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.

INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

¿Qué es la estadística?
La Estadística es la ciencia que provee de métodos que permiten colectar, organizar, resumir,
presentar y analizar datos relativos a un conjunto de individuos u observaciones, que permiten
extraer conclusiones válidas y tomar decisiones lógicas basadas en dichos análisis.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en
áreas de negocios o instituciones gubernamentales

CONCEPTOS BÁSICOS
La parte de la Estadística que solo trata de descubrir y analizar un grupo de datos (sobre una
muestra) sin sacar conclusiones o inferencias sobre un grupo mayor (población) se denomina
Estadística Descriptiva.
Al recolectar datos respecto a las características de un grupo de objetos o individuos, tales
como las estaturas y el peso de todos los estudiantes de una secundaria básica son la finalidad
de hacer un estudio de su comportamiento, es casi imposible observar el comportamiento de
las características del grupo completo de individuos que la forman el que es llamado población
o universo, entonces se examina una parte del mismo llamada muestra.
Población: conjunto de individuos (objetos, sucesos o procesos) que poseen entre sus
características una común.
Muestra: cualquier subconjunto de una población.
Este subconjunto tiene que ser representativo de la población.
Una muestra es representativa no por su tamaño, sino, porque realmente representa a todas
las características de la población.
Las características de la población reciben el nombre de variable estadística.
Variable estadística: cualquier característica o propiedad de los miembros de una población
susceptible de tomar determinados valores mediante un procedimiento de medición, de modo
que dichos valores pueden ser clasificados de forma exhaustiva en un cierto número de
categorías posibles. De ello se deduce que no todas las variables estadísticas son del mismo
tipo.
Por lo general, se dividen en:

Variables cualitativas: se refieren a características o atributos que expresan una cualidad,


que no puede tomar valores numéricos, o sea, no se pueden medir.
Ejemplos:
-La profesión de las personas (profesor, médico, mecánico, etc) .
- El estado civil (soltero, casado).
-El color de los ojos (verdes, azules, pardos, etc).
- La carrera que se desea estudiar (periodismo, magisterio, medicina, etc).
- El rendimiento académico de un estudiante (bajo, medio, alto)
Variables cuantitativas: se refieren a atributos que expresan una cantidad o cantidad de
magnitud y por tanto toma valores numéricos, o sea, se pueden medir numéricamente.
Ejemplos:
- La edad de una persona (2 años, 15 años, …).
- La cantidad de estudiantes de un grupo o de una escuela (15, 30, 700,…).
- La talla de una persona (1,64 m, 2,00 m,…).
- Los registros de temperatura de una ciudad (30ºC, –5ºC, 0ºC, …).

1
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Las variables cuantitativas se clasifican en: discretas y continuas.


Variable estadística discreta: cuando solo pueden tomar un número finito o a lo sumo
numerable de valores (suelen coincidir con números enteros).
En los ejemplos anteriores las variables cuantitativas discretas serían las dos primeras: la
edad de una persona y la cantidad de estudiantes de un grupo o escuela pues sólo pueden
tomar un número finito de valores.
Variable estadística continua: cuando puede teóricamente, tomar cualquier valor de un
intervalo real.
En los ejemplos anteriores las variables cuantitativas continuas serían las dos últimas: la talla
de una persona y los registros de temperatura de una ciudad, pues en este caso pueden tomar
valores dentro de un intervalo determinado.
El siguiente esquema te ilustrará mejor sobre las clases de variables:

Tabla de Distribución de Frecuencias:


Contiene todos los datos de una serie Estadística (conjunto de observaciones o medidas
realizadas a una población atendiendo a una determinada característica), de forma ordenada,
organizada y fácil de consultar.

Frecuencia Absoluta (fa): Indica la cantidad de veces que se repite la variable sobre el total
analizada su suma siempre debe ser igual a n, es decir, a la población o total de elementos
estudiados.
∑ fa = n con n = población o muestra estudiada

Frecuencia Relativa (fr): Indica qué parte del total corresponde a cada variable, y se la
obtiene dividiendo la frecuencia absoluta (fa) por el total de elementos estudiados.

∑ fr = 1
Frecuencia Porcentual (f%): Indica el porcentaje en que se encuentra cada una de las
variables.
Para calcularla sólo hay que multiplicar por 100 a la frecuencia relativa.

f% = fr . 100 ∑ fr = 100%

Frecuencia Acumulada (F): Indican cuántos datos se acumulan hasta una cierta variable; por
ello para calcularla se suman las frecuencias de los valores anteriores.
Fa = Frecuencia absoluta acumulada.
Fr = Frecuencia relativa acumulada.

2
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

F% = Frecuencia porcentual acumulada.

Tipos de gráficos
a. Gráfico de líneas
¿Cómo se construyen?
Sigue el siguiente proceso:
1º Construye un sistema de coordenadas.
2º Haz corresponder un punto del eje de la abscisa o eje X positivo con los datos de la variable
en estudio, cuidando el orden y la proporción de distancias entre dato y dato.
3º Sobre el eje de la ordenada o eje Y (vertical), ubica los valores de la frecuencia absoluta o
de la frecuencia relativa.
4º Ubica el punto en el primer cuadrante, que represente al par variable y su frecuencia.
Considerando la tabla ubicaremos el punto que representa al par (obrero y su respectiva
frecuencia) y demás pares:

Observando el gráfico tenemos:


– Que la mayor parte de los padres son trabajadores
– Un menor número de padres son desempleados y ejecutivos.
– Un gran número de padres son empleados.
Luego, el gráfico de líneas es la representación de los datos mediante líneas.

b. Gráficos de barras
Es aquella representación gráfica bidimensional donde los datos son representados por un
conjunto de rectángulos dispuestos paralelamente, de manera que la extensión de los mismos
es proporcional a la magnitud que se quiere representar.

3
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Los rectángulos o barras pueden estar colocados horizontal o verticalmente. En este último
caso reciben también el nombre de gráficos de columnas.
Considerando la lámina del periódico, veremos que los caracteres estadísticos como edad de
los padres, ocupación y deportes que más practican, están representados en gráficos de barras
horizontales.
Considerando la Tabla , su gráfico de barras es el siguiente:

c. Gráfico circular
El gráfico circular es la representación de datos mediante un círculo, donde se hace
corresponder un sector circular con cada una de las variables, de tal manera que el arco del
sector sea proporcional a la frecuencia, para lo cual se hace corresponder el número total de
datos con los 360º que mide la longitud de la circunferencia.
¿Cómo se construye?
Sigue el procedimiento mediante el siguiente ejemplo:
Consideraremos los datos de la tabla que corresponden a una encuesta hecha a 200
alumnos/alumnas, teniendo como carácter estadístico el medio de transporte que usan para ir
de su casa al colegio. La tabla está construida en forma horizontal.

4
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Observa el gráfico adjunto


En el recuadro interior nos indican los colores que
representan cada variable; a este recuadro se le llama
leyenda.
Este tipo de representación permite visualizar mejor y es
más apropiada para reflejar datos cuya variable es
cualitativa. También es frecuente su uso para frecuencias
relativas.
Análisis del gráfico:
El sector verde, el más amplio, nos indica que el mayor porcentaje de alumnos/alumnas viaja
en bus escolar, seguido de los que viajan en bus urbano.
Con solo observar, podemos decir que la menor cantidad de estudiantes viajan en automóvil.

d. Pictogramas

Observando la lámina del recorte periodístico “Conociendo mejor a papá”, veremos que la
representación gráfica de la frecuencia porcentual de las variables se da mediante imágenes.
También podemos encontrar gráficos con representación de objetos y/o personas, a los cuales
se les denomina Pictogramas.

Ejemplos:
1. Principales pasatiempos
El signo musical representa que el 33,0%
de padres escucha música.
La cuchara nos muestra que a 2,8% de
los padres les gusta cocinar.
La raqueta nos muestra que el 11,2% de
los padres hace deporte.
Así puedes deducir en los demás casos.

2. Número de hijos por familia


Nos muestra que la mayoría de las familias de la
muestra tienen dos hijos, seguidas de las que
tienen un solo hijo. Además, que la menor
cantidad de familias de la muestra tiene 5 hijos.

5
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Distribución De Frecuencias Para DATOS AGRUPADOS


Hasta aquí, en nuestros ejemplos, no hemos utilizado variables continuas ni variables discretas
en mayor número, es más, dijimos que tenían un proceso especial. ¿Qué hacer en esos casos?
Veamos.
Recuerda que las variables continuas están representadas por los pesos, las tallas, las
temperaturas.
Intervalo de clase
Es el conjunto de todos los números comprendidos entre dos valores dados, llamados límites
inferior y superior del intervalo. Se denota por:
[Li - Ls]
Li: es límite inferior
Ls: es límite superior
¿Qué hacer para agrupar datos?
A continuación, vamos a sistematizar cómo debemos proceder ordenadamente con los datos
de una muestra con variable continua:
1. Recoger los datos: tomar datos mediante instrumentos de recolección de datos (encuesta,
fechas de entrevista o de observación).
2. Ordenación de los datos: una vez recogidos los datos, los colocaremos en orden creciente
o decreciente.
3. Rango: determinar las diferencia entre el mayor y menor de los datos. Se representa por R.
4. Agrupación de datos: agrupar los datos en intervalos de clases, dividiendo el rango entre
el número de intervalos. Así, todas las clases deben tener la misma amplitud o longitud.
Respecto a cuántos intervalos tomar, no hay respuesta única, depende de los propósitos del
estudio. Si el número de intervalos (k) es muy pequeño, se pierde información; mientras que, si
es muy grande, se introducen distorsiones y no es muy manejable. Se piensa en el número de
intervalos a obtener en correspondencia con el rango de los datos de manera que propicien
una distribución adecuada de estos donde no se propicie la concentración ni la dispersión.
5. Determinación de la amplitud o longitud de los intervalos. Se determina dividiendo el
rango entre el número de intervalos:

Con el fin de que la clasificación sea uniforme, los intervalos se deben construir de tal manera
que el extremo superior de una clase coincida con el extremo inferior de la siguiente. Así, en el
intervalo [40 – 45) se contabilizan todos los pesos desde los 40 kg (incluido este valor) hasta
45 kg (excluido este valor que se contabiliza en la siguiente clase).
Si [a – b) es el intervalo de clase, se tiene que:
a: Límite inferior o valor mínimo que puede tomar un dato.
b: Límite superior que no puede ser igualado ni superado por un dato.

Marca de clase ( ) La marca de clase de un intervalo de clase


[ Li – Ls) se define como la semisuma de los límites inferior y superior de cada intervalo de
clase. Esto es:
Donde:

: es marca de clase
Ls: es límite superior
Li: es límite inferior
Ejemplo:

6
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

1° (Recolección de datos)
Durante la preparación para futuras competencias, su entrenador anota cada uno de los
resultados (longitud del lanzamiento en metros) obtenidos en 30 de sus lanzamientos, los que
se muestran a continuación.
58,95 59,26 62,50 68,30 61,50 66,85 58,00 59,04 60,00 67,25
58,60 58, 5 66,00 62,20 70,00 67,25 69,70 69,40 59,30 59,35
63,20 65,65 67,00 69,05 65,40 59,35 64,55 69,00 67,20 68,75

2° Organización de los datos

58,00 58,60 58,95 58,95 59,04 59,26 59,30 59,35 59,35 60,00
61,50 62,20 62,50 63,20 64,55 65,40 65,65 66,00 66,85 67,00
67,20 67,25 67,25 68,30 68,75 69,00 69,05 69,40 69,70 70,00

3° Rango
Dato menor: 58.00 Dato mayor: 70.00 Diferencia: 70 – 58 = 12
Por tanto 12 es el rango.
4° Agrupación de datos:
En este caso, como el recorrido es igual a 12, se pueden elegir 6 clases.

5. Determinación de la amplitud o longitud de los intervalos.

12 : 6 = 2 Luego, cada clase tendrá una amplitud igual a 2.


Longitud del fa
lanzamiento en
metros
58-60 9
60-62 2
62-64 3
64-66 3
66-68 6
68-70 7
Total 30

Gráfico de datos agrupados


¿Cómo representar los datos agrupados en intervalos de clase?
Se construirán en forma similar al gráfico de barras y se les llamará histogramas.
Histogramas y polígonos de frecuencia
Histogramas: son un conjunto de rectángulos que tienen:
a. Sus bases sobre el eje x, con centros en las marcas de clase y longitud igual a la amplitud
de los intervalos. Por tanto, sus lados laterales son comunes.
b. Superficies proporcionales a las frecuencias de clase. Si los intervalos de clase tienen todos
iguales tamaños, las alturas de los rectángulos son proporcionales a las frecuencias de clase.

7
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Otro ejemplo: Considerando las frecuencias absolutas de los pesos de 72 estudiantes de dos
secciones del primer año de secundaria del colegio.

Polígonos de frecuencia
Cuando construimos el histograma, consideramos las marcas de clase. Si ubicamos los puntos
de las marcas de clase en la base de los rectángulos y unimos dichos puntos con el de la
frecuencia respectiva, estaremos construyendo un polígono, incluida la porción del eje X. A
dicho polígono lo llamaremos Polígono de frecuencia.

8
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

MEDIDAS de TENDENCIA CENTRAL


Cuando quieres saber cómo vas en una determinada área, por ejemplo, Matemática, ¿qué
haces? Recuerdas tus calificaciones y luego calculas tu promedio, ¿no es cierto?, es decir,
sumas tus calificaciones y las divides entre el número de calificaciones, obteniendo un número
que representa al conjunto de tus notas.
Y si tus padres te preguntan: “¿Cómo vas en el área de Ciencia, tecnología e inglés?”, tú
respondes: “De mis siete calificaciones tengo cuatro diez, un seis y dos ocho”. Al dar esta
respuesta a tus padres estás haciendo Estadística. En el primer caso estás calculando la
media aritmética y en el segundo caso la moda. A estas medidas se las llama Medidas de
Tendencia Central, porque son pocos números que resumen o centralizan información en
lugar de toda la distribución de frecuencias. Sirven para poder relacionar y comparar
información de manera más sencilla. Son medidas de tendencia central la Media, la Mediana,
la Moda, entre otras.

Media aritmética
Si tus calificaciones en el área de Matemática referentes a: “Interpreta representaciones
gráficas de distribución de frecuencias”; “Aplica y utiliza algoritmos y procesos para la
elaboración de tablas de frecuencia y gráficos de datos agrupados” y otros indicadores de
participaciones, exposiciones,
son: 10; 10;10; 10; 8;8 ; 6; entonces la media aritmética sería:
̅
Tu promedio sería 8,85
Luego:
Llamamos media aritmética de una serie de N valores, al cociente obtenido al dividir la suma
de dichos valores entre el número total de datos (n).
La denotamos como x , que representa la media aritmética y x1, x2, …, xn son valores dados.
Así tenemos:

Significado de la media aritmética.- La media aritmética significa el valor promedio de la


distribución de datos, es el valor promedio en la distribución.
Cuando tenemos una serie de datos x1+ x2+ …+ xn , para indicar uno, cualquiera de ellos,
escribimos xi. Igualmente, para indicar la suma de todos ellos empleamos la expresión
simbólica:

El símbolo ∑ se llama sumatoria. Es la letra mayúscula griega sigma, que equivale a nuestra S,
por eso la empleamos para indicar la suma de valores.
La expresión se lee: suma de xi desde i igual a 1 hasta n. Si la desarrollamos, obtenemos:

Empleando este símbolo, la fórmula de la media aritmética queda de la siguiente manera:

Características de la media aritmética:

9
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

- Son las medidas de centralización más utilizadas.


- Su cálculo aritmético es sencillo.
- Tienen en cuenta todos los datos de la observación.
- No son aplicables a variables cualitativas.

Ejemplo:
1. Considerando una muestra mayor, tenemos la temperatura de 20 estudiantes,
organizados en la siguiente tabla:

Resolución:
Con el fin de facilitar el cálculo podemos multiplicar cada valor de la variable estadística por su
frecuencia absoluta correspondiente, sumar los resultados y dividir por el tamaño de la
muestra:

La expresión general de la media aritmética es:

Media aritmética para datos agrupados

Para hallar la media aritmética en datos agrupados utilizaremos la misma fórmula. Por ejemplo:
considerando el peso de 72 estudiantes, de la siguiente tabla, queremos saber: ¿cuál es el
promedio de los pesos, es decir, su media aritmética?
Resolución:
Consideremos las marcas de clase y las frecuencias absolutas. Construiremos una nueva
columna, donde colocaremos los productos de las marcas y frecuencias de cada clase.

10
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Luego:

̅ ̅ ̅
Luego, la media aritmética será 44,29; que significa que el peso promedio de los 72 estudiantes
es de 44,29 kg.

MODA

Todos hemos oído la expresión “está de moda” o “es la moda”. Si buscamos el significado de la
palabra moda, encontramos: “Costumbre o uso que prima en un determinado grupo social”.
En Estadística se mantiene este significado.
Moda es entendida como el valor de la variable estadística que tiene máxima frecuencia. Se
simboliza: Mo
La moda puede no ser única. Así, si hay dos modas, la distribución se llama bimodal, si tiene
tres modas, trimodal, y así sucesivamente. Cuando la variable está agrupada en intervalos de
clase, hablaremos de intervalo modal.
Significado de la Moda: Significa el valor que más número de veces se repite en una
distribución.
Ejemplo:
1. Dadas las edades de un conjunto de niños que viajan en un autobús escolar:
7, 9, 10, 8, 11, 13, 15, 10, 13, 7, 13. ¿Cuál será su moda? MO = 13
2. Consideremos las calificaciones de 30 estudiantes:

Calcular la moda:
Las modas son: MO = 13 y MO = 17, son los valores de la variable que tienen mayor
frecuencia. Es bimodal, significando que la mayor cantidad de veces que se repiten son las
calificaciones de 13 y 17.

11
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Moda para datos agrupados


Si consideramos las edades de 22 personas agrupadas en la siguiente tabla, podemos hallar
su moda en datos agrupados. Debemos seguir el siguiente procedimiento:
a. Determinemos la clase modal, es decir, la clase que
contiene la moda. Observando la tabla, esta será: [10 – 14),
pues es la que tiene la mayor frecuencia (8).
b. Luego Li = 10 (Límite inferior de la clase modal)
I = 4 (Amplitud del intervalo)
c. ∆1 = fa – f(a – 1)
∆1 = 8-5 = 3
Diferencia entre la frecuencia de la clase modal y la clase
contigua inferior.
d. ∆2= fa – f(a + 1)
∆2 = 8 - 4 = 4
Diferencia entre la frecuencia de la clase modal y la clase contigua superior.
e. Para datos agrupados existe la fórmula siguiente, que aplicaremos para calcular la moda:

Dónde:
M0 es moda
Li : es límite interior del intervalo modal
I: es amplitud de clase
fa: es frecuencia del intervalo modal

Reemplazando nuestros datos en la fórmula tenemos:

Lo que significa que: la edad que más veces se repite entre las 22 personas es
aproximadamente 12.

MEDIANA

Dada una variable estadística, podemos disponer de valores en orden creciente o decreciente.
El valor que ocupa el lugar central se llama mediana. Según esto, podemos definirla como:
Mediana.- Es el valor de la variable estadística que deja igual número de observaciones
inferiores y superiores a ella. La simbolizaremos por Me.
En el caso de que el número de datos sea impar, la mediana coincide con uno de los datos. Si
el número de datos es par, tenemos dos valores centrales; en este caso se toma como
mediana el promedio de los dos.
Significado de la mediana: es el dato que divide en dos partes iguales a toda la distribución.

12
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Ejemplo:
1. Dada la serie estadística correspondiente a los pesos en kilos de nueve niños:
10; 12; 18; 14; 20; 19; 17; 22; 15, calcular la mediana de dichos pesos.

Resolución: primero ordenamos los datos (puede ser en forma ascendente o descendente):
10 – 12 – 14 – 15 – 17 – 18 – 19 – 20 – 22, luego ubicamos el dado central. La media es 17,
entonces: Me = 17
Lo mismo que significa que 4 niños tienen pesos de 10 a 15 kilos y los otros 4 niños tienen
pesos de 18 a 22 kilos.

2. Si consideramos las edades de 10 personas en un consultorio médico:


50; 25; 12; 20; 45; 08; 15; 24; 60; 17. ¿Cuál será su mediana?
Resolución: Como en el caso anterior, ordenamos los datos:
60 – 50 – 45 – 25 – 24 – 20 – 17 – 15 – 12 – 08
En este caso, hay dos valores centrales: 24 y 20; luego, la mediana es:

Lo mismo que significa que el 50% de las personas tienen edades entre 8 y 22 años y el otro
50% de las personas tienen edades comprendidas entre 22 y 60 años.

Mediana para datos agrupados


Si consideramos los datos agrupados de la
siguiente tabla, para determinar la mediana en
datos agrupados, debemos seguir el siguiente
procedimiento:
a. Determinemos cuál es la clase que contiene a
la mediana, esto es:

(undécima posición), donde n es el


número total de datos.
Once respecto a la frecuencia acumulada corresponde en la
tabla al intervalo de clase [ 10 - 14).
b. Teniendo en cuenta la tabla dada determinaremos algunos
datos:
Li = 10 (Li es el límite inferior de la clase que contiene la
mediana)
f3 = 8 (frecuencia absoluta de la tercera clase)
f3 = 16 (frecuencia acumulada de la tercera clase)
Fa-1 = F 3-1 = F2 entonces F2 = 8 (frecuencia acumulada de la
clase inferior al de la clase donde se encuentra la mediana)
I = 4 (amplitud del intervalo que contiene a la mediana)
Para datos agrupados existe la fórmula siguiente, la que
aplicaremos:

Sustituyendo los datos que tenemos en la fórmula tenemos:

13
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Significa que el 50% de estudiantes tienen edades comprendidas entre 12 y 22 años.

14
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

OTRAS MEDIDAS DE POSICIÓN

CUANTILES

Constituyen una generalización del concepto de mediana. Así como la mediana divide a la
serie en dos partes con el mismo número de elementos cada una, si la división se hace en
cuatro partes, o en diez, o en cien partes, llegamos al concepto de cuantil.
Hay, principalmente, tres cuantiles importantes: cuartiles, deciles y percentiles.

CUARTILES:

Son tres valores con las siguientes características:


 = primer cuartil: es el valor de la variable por debajo del cual queda ¼ de los
elementos de la serie estudiada.
 = tercer cuartil: es el valor de la variable por debajo del cual queda ¾ de los
elementos que constituyen la serie.
 Evidentemente el segundo cuartil coincide con la mediana. Como puede comprobarse,
no tendría ninguna utilidad definir el cuarto cuartil. El cálculo de los cuartiles se realiza
por el mismo procedimiento que el cálculo de la mediana, pues hay únicamente una
diferencia cuantittiva entre ambas medidas, pero tienen significados paralelos.

Así, el primer cuartil se hallará aplicando la siguiente fórmula:

( )

Y el tercer cuartil
( )

Dónde: L = Límite inferior del intervalo de la clase a la que pertenece el cuartil, que es la
clase que deja por debajo de ella el 25% de las observaciones (o el 75%en el caso de ).
I = Amplitud del intervalo.
fm = Frecuencia absoluta de la clase cuartílica.
fi = Frecuencia acumulada del valor anterior a la clase que contiene el cuartil.

DECILES:

Es la segunda clase de cuantiles. Si se divide toda la serie en diez partes iguales tendremos
los deciles.
- El decil 1= , deja el 10%de los valores de la serie por debajo de él.
- Análogamente ocurre con los deciles . El decil 8, por
ejemplo, deja el 80% de la masa de datos investigada por debajo de él.
Las fórmulas para calcularlo son también análogas a las de la mediana.

( ) ( )

( ) ( )
…………………………
( ) ( )

15
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

PERCENTILES

Hay 99 percentiles que se denotan: . Así por ejemplo, deja


por debajo de él 90% de los elementos. El coincide con la mediana.
La fórmula para realizar el cálculo del percentil 45, por ejemplo, sería.

( )
EJEMPLO:
De la siguiente serie hallar el primero y el tercer cuartil, el segundo y el séptimo decil y los
percentiles 8 y 73.
Clase SOLUCIÓN:
20-25 5 5 Cuartiles:
25-30 9 14 Primero se calcula cuál es el intervalo por debajo del cual
queda el 25% de los valores (la cuarta parte). Para ello se
30-35 14 28
aplica la fórmula:
35-40 20 48
40-45 26 74 ( )
45-50 18 92 Como 110/4 = 27,5 la primera frecuencia acumulada que
50-55 7 99 contiene 27,5 elementos es 28, que corresponde a la clase
55-60 11 110 30-35; luego, L=30. Entonces:
Total (n) 110 ( )

( )
Como 3 x 110/4 = 82,5 la primera frecuencia acumulada que contiene 82,5 elementos es 92,
que corresponde a la clase 45-50; luego, L=45. Entonces:
( )

Análogamente se calculan los demás valores pedidos:


Deciles:

( ) ( )

( ) ( )

Percentiles:

( ) ( )

( ) ( )

Obsérvese que entre los 6 cuantiles calculados en el ejemplo aparecen valores muy parecidos.
En particular se dan siempre las siguientes coincidencias:
 El segundo cuartil equivale a la mediana.
 El quinto decil y el quincuagésimo percentil se corresponde también con la mediana.
 Los percentiles y se corresponde con el primer y tercer cuartil, respectivamente.

16
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión son útiles porque:

Nos proporcionan información adicional que nos permite juzgar la confiabilidad de nuestra
medida de tendencia central. Si los datos están muy dispersos la posición central es menos
representativa de los datos, como un todo, que cuando estos se agrupan más estrechamente
alrededor de la media.

Ya que existen problemas característicos de distribuciones muy dispersas, debemos ser


capaces de distinguir que presentan esa dispersión antes de abordar los problemas.

Nos permiten comparar varias muestras con promedios parecidos.

Los analistas financieros están preocupados por la dispersión de las ganancias de una
empresa que van desde valores muy grandes a valores negativos. Esto indica un riesgo mayor
para los accionistas y para los acreedores. De manera similar los expertos en control de
calidad, analizan los niveles de calidad de un producto.

RANGO:
Es la diferencia entre el mayor y el menor de los valores observados

 El rango es fácil de entender y de encontrar, pero su utilidad como medida de dispersión


es limitada. Como sólo toma en cuenta el valor más alto y el valor más bajo ignora la
naturaleza de la variación entre todas las demás observaciones, y se ve muy influido
por los valores extremos.
 Debido a que considera sólo dos valores tiene muchas posibilidades de cambiar
drásticamente de una muestra a otra en una población dada.

Ejemplo:
Distribución de datos simples

Distribución de encuestados según edad: 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
Rango = 63 – 18 = 45 años
Entre el encuestado de mayor edad y el más joven, hay una diferencia de 45 años.

Distribución de datos agrupados

17
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Recorrido o rango intercuartílico

 Es la diferencia entre el Q1 y el Q3
 Nos indica la dispersión en el 50% central de la distribución
 Es más sensible a la concentración de los datos que el recorrido ordinario
 Su cálculo es indistinto para datos simples como para datos agrupados.

Ejemplo:

Para datos simples: 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48

18
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Varianza

 Se basa en las diferencias entre la media aritmética y cada una de las puntuaciones
 Es el promedio de los cuadrados de las distancias de las observaciones a partir de la
media (su valor nunca será observaciones a partir de la media (su valor nunca será
negativo).
 La fórmula del cálculo dependerá si la distribución es de datos simples o agrupados así
como de si se trabaja con datos simples o agrupados.

Para datos simples

Ejemplo:
̅ ̅ ̅
0 2 -2 4 8 ̅
1 5 -1 1 5
2 7 0 0 0
3 4 1 1 4
4 1 2 4 4
5 1 3 9 9
Total 20 30
(n)

Para datos agrupados


∑ ̅

Ejemplo:
Intervalo ̅ ̅ ̅
123,5- 3 125,5 -8,8 77,4 232,2
127,5
127,5- 5 129,5 -4,8 23,4 115,2
131,5
131,5- 7 133,5 -0,8 0,64 4,48
135,5
135,5- 4 137,5 3,2 10,24 40,96
139,5
139,5- 3 141,5 7,2 51,84 155,52
143,5
143,5- 2 145,5 11,2 125,84 250,88
147,5
Total (n) 24 799,24
̅

Desvío estándar o típico


 Es la medida más frecuentemente usada de variabilidad, y se calcula como la raíz
cuadrada de la varianza.
 Expresa la cantidad de variabilidad promedio en una distribución.
 Nos permite determinar cómo se distribuyen los valores en relación con la media.
 Su fórmula es indistinta para distribuciones de datos simples o agrupados.

19
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA

Ejemplo:
Para datos simples: √ √ √

Para datos agrupados: √ √ √


Coeficiente de Variación

 Hace referencia a la variabilidad relativa, relaciona la media con el desvío


 Nos indica el porcentaje de variación que existe con respecto al valor promedio de la
distribución.
 Su fórmula es igual para datos simples que para datos agrupados.

Ejemplo:

Para datos simples: ̅


%

Para datos agrupados: ̅

20

También podría gustarte