Eje #1 y 2 - Estadistica
Eje #1 y 2 - Estadistica
¿Qué es la estadística?
La Estadística es la ciencia que provee de métodos que permiten colectar, organizar, resumir,
presentar y analizar datos relativos a un conjunto de individuos u observaciones, que permiten
extraer conclusiones válidas y tomar decisiones lógicas basadas en dichos análisis.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en
áreas de negocios o instituciones gubernamentales
CONCEPTOS BÁSICOS
La parte de la Estadística que solo trata de descubrir y analizar un grupo de datos (sobre una
muestra) sin sacar conclusiones o inferencias sobre un grupo mayor (población) se denomina
Estadística Descriptiva.
Al recolectar datos respecto a las características de un grupo de objetos o individuos, tales
como las estaturas y el peso de todos los estudiantes de una secundaria básica son la finalidad
de hacer un estudio de su comportamiento, es casi imposible observar el comportamiento de
las características del grupo completo de individuos que la forman el que es llamado población
o universo, entonces se examina una parte del mismo llamada muestra.
Población: conjunto de individuos (objetos, sucesos o procesos) que poseen entre sus
características una común.
Muestra: cualquier subconjunto de una población.
Este subconjunto tiene que ser representativo de la población.
Una muestra es representativa no por su tamaño, sino, porque realmente representa a todas
las características de la población.
Las características de la población reciben el nombre de variable estadística.
Variable estadística: cualquier característica o propiedad de los miembros de una población
susceptible de tomar determinados valores mediante un procedimiento de medición, de modo
que dichos valores pueden ser clasificados de forma exhaustiva en un cierto número de
categorías posibles. De ello se deduce que no todas las variables estadísticas son del mismo
tipo.
Por lo general, se dividen en:
1
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Frecuencia Absoluta (fa): Indica la cantidad de veces que se repite la variable sobre el total
analizada su suma siempre debe ser igual a n, es decir, a la población o total de elementos
estudiados.
∑ fa = n con n = población o muestra estudiada
Frecuencia Relativa (fr): Indica qué parte del total corresponde a cada variable, y se la
obtiene dividiendo la frecuencia absoluta (fa) por el total de elementos estudiados.
∑ fr = 1
Frecuencia Porcentual (f%): Indica el porcentaje en que se encuentra cada una de las
variables.
Para calcularla sólo hay que multiplicar por 100 a la frecuencia relativa.
f% = fr . 100 ∑ fr = 100%
Frecuencia Acumulada (F): Indican cuántos datos se acumulan hasta una cierta variable; por
ello para calcularla se suman las frecuencias de los valores anteriores.
Fa = Frecuencia absoluta acumulada.
Fr = Frecuencia relativa acumulada.
2
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Tipos de gráficos
a. Gráfico de líneas
¿Cómo se construyen?
Sigue el siguiente proceso:
1º Construye un sistema de coordenadas.
2º Haz corresponder un punto del eje de la abscisa o eje X positivo con los datos de la variable
en estudio, cuidando el orden y la proporción de distancias entre dato y dato.
3º Sobre el eje de la ordenada o eje Y (vertical), ubica los valores de la frecuencia absoluta o
de la frecuencia relativa.
4º Ubica el punto en el primer cuadrante, que represente al par variable y su frecuencia.
Considerando la tabla ubicaremos el punto que representa al par (obrero y su respectiva
frecuencia) y demás pares:
b. Gráficos de barras
Es aquella representación gráfica bidimensional donde los datos son representados por un
conjunto de rectángulos dispuestos paralelamente, de manera que la extensión de los mismos
es proporcional a la magnitud que se quiere representar.
3
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Los rectángulos o barras pueden estar colocados horizontal o verticalmente. En este último
caso reciben también el nombre de gráficos de columnas.
Considerando la lámina del periódico, veremos que los caracteres estadísticos como edad de
los padres, ocupación y deportes que más practican, están representados en gráficos de barras
horizontales.
Considerando la Tabla , su gráfico de barras es el siguiente:
c. Gráfico circular
El gráfico circular es la representación de datos mediante un círculo, donde se hace
corresponder un sector circular con cada una de las variables, de tal manera que el arco del
sector sea proporcional a la frecuencia, para lo cual se hace corresponder el número total de
datos con los 360º que mide la longitud de la circunferencia.
¿Cómo se construye?
Sigue el procedimiento mediante el siguiente ejemplo:
Consideraremos los datos de la tabla que corresponden a una encuesta hecha a 200
alumnos/alumnas, teniendo como carácter estadístico el medio de transporte que usan para ir
de su casa al colegio. La tabla está construida en forma horizontal.
4
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
d. Pictogramas
Observando la lámina del recorte periodístico “Conociendo mejor a papá”, veremos que la
representación gráfica de la frecuencia porcentual de las variables se da mediante imágenes.
También podemos encontrar gráficos con representación de objetos y/o personas, a los cuales
se les denomina Pictogramas.
Ejemplos:
1. Principales pasatiempos
El signo musical representa que el 33,0%
de padres escucha música.
La cuchara nos muestra que a 2,8% de
los padres les gusta cocinar.
La raqueta nos muestra que el 11,2% de
los padres hace deporte.
Así puedes deducir en los demás casos.
5
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Con el fin de que la clasificación sea uniforme, los intervalos se deben construir de tal manera
que el extremo superior de una clase coincida con el extremo inferior de la siguiente. Así, en el
intervalo [40 – 45) se contabilizan todos los pesos desde los 40 kg (incluido este valor) hasta
45 kg (excluido este valor que se contabiliza en la siguiente clase).
Si [a – b) es el intervalo de clase, se tiene que:
a: Límite inferior o valor mínimo que puede tomar un dato.
b: Límite superior que no puede ser igualado ni superado por un dato.
: es marca de clase
Ls: es límite superior
Li: es límite inferior
Ejemplo:
6
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
1° (Recolección de datos)
Durante la preparación para futuras competencias, su entrenador anota cada uno de los
resultados (longitud del lanzamiento en metros) obtenidos en 30 de sus lanzamientos, los que
se muestran a continuación.
58,95 59,26 62,50 68,30 61,50 66,85 58,00 59,04 60,00 67,25
58,60 58, 5 66,00 62,20 70,00 67,25 69,70 69,40 59,30 59,35
63,20 65,65 67,00 69,05 65,40 59,35 64,55 69,00 67,20 68,75
58,00 58,60 58,95 58,95 59,04 59,26 59,30 59,35 59,35 60,00
61,50 62,20 62,50 63,20 64,55 65,40 65,65 66,00 66,85 67,00
67,20 67,25 67,25 68,30 68,75 69,00 69,05 69,40 69,70 70,00
3° Rango
Dato menor: 58.00 Dato mayor: 70.00 Diferencia: 70 – 58 = 12
Por tanto 12 es el rango.
4° Agrupación de datos:
En este caso, como el recorrido es igual a 12, se pueden elegir 6 clases.
7
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Otro ejemplo: Considerando las frecuencias absolutas de los pesos de 72 estudiantes de dos
secciones del primer año de secundaria del colegio.
Polígonos de frecuencia
Cuando construimos el histograma, consideramos las marcas de clase. Si ubicamos los puntos
de las marcas de clase en la base de los rectángulos y unimos dichos puntos con el de la
frecuencia respectiva, estaremos construyendo un polígono, incluida la porción del eje X. A
dicho polígono lo llamaremos Polígono de frecuencia.
8
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Media aritmética
Si tus calificaciones en el área de Matemática referentes a: “Interpreta representaciones
gráficas de distribución de frecuencias”; “Aplica y utiliza algoritmos y procesos para la
elaboración de tablas de frecuencia y gráficos de datos agrupados” y otros indicadores de
participaciones, exposiciones,
son: 10; 10;10; 10; 8;8 ; 6; entonces la media aritmética sería:
̅
Tu promedio sería 8,85
Luego:
Llamamos media aritmética de una serie de N valores, al cociente obtenido al dividir la suma
de dichos valores entre el número total de datos (n).
La denotamos como x , que representa la media aritmética y x1, x2, …, xn son valores dados.
Así tenemos:
El símbolo ∑ se llama sumatoria. Es la letra mayúscula griega sigma, que equivale a nuestra S,
por eso la empleamos para indicar la suma de valores.
La expresión se lee: suma de xi desde i igual a 1 hasta n. Si la desarrollamos, obtenemos:
9
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Ejemplo:
1. Considerando una muestra mayor, tenemos la temperatura de 20 estudiantes,
organizados en la siguiente tabla:
Resolución:
Con el fin de facilitar el cálculo podemos multiplicar cada valor de la variable estadística por su
frecuencia absoluta correspondiente, sumar los resultados y dividir por el tamaño de la
muestra:
Para hallar la media aritmética en datos agrupados utilizaremos la misma fórmula. Por ejemplo:
considerando el peso de 72 estudiantes, de la siguiente tabla, queremos saber: ¿cuál es el
promedio de los pesos, es decir, su media aritmética?
Resolución:
Consideremos las marcas de clase y las frecuencias absolutas. Construiremos una nueva
columna, donde colocaremos los productos de las marcas y frecuencias de cada clase.
10
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Luego:
∑
̅ ̅ ̅
Luego, la media aritmética será 44,29; que significa que el peso promedio de los 72 estudiantes
es de 44,29 kg.
MODA
Todos hemos oído la expresión “está de moda” o “es la moda”. Si buscamos el significado de la
palabra moda, encontramos: “Costumbre o uso que prima en un determinado grupo social”.
En Estadística se mantiene este significado.
Moda es entendida como el valor de la variable estadística que tiene máxima frecuencia. Se
simboliza: Mo
La moda puede no ser única. Así, si hay dos modas, la distribución se llama bimodal, si tiene
tres modas, trimodal, y así sucesivamente. Cuando la variable está agrupada en intervalos de
clase, hablaremos de intervalo modal.
Significado de la Moda: Significa el valor que más número de veces se repite en una
distribución.
Ejemplo:
1. Dadas las edades de un conjunto de niños que viajan en un autobús escolar:
7, 9, 10, 8, 11, 13, 15, 10, 13, 7, 13. ¿Cuál será su moda? MO = 13
2. Consideremos las calificaciones de 30 estudiantes:
Calcular la moda:
Las modas son: MO = 13 y MO = 17, son los valores de la variable que tienen mayor
frecuencia. Es bimodal, significando que la mayor cantidad de veces que se repiten son las
calificaciones de 13 y 17.
11
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Dónde:
M0 es moda
Li : es límite interior del intervalo modal
I: es amplitud de clase
fa: es frecuencia del intervalo modal
Lo que significa que: la edad que más veces se repite entre las 22 personas es
aproximadamente 12.
MEDIANA
Dada una variable estadística, podemos disponer de valores en orden creciente o decreciente.
El valor que ocupa el lugar central se llama mediana. Según esto, podemos definirla como:
Mediana.- Es el valor de la variable estadística que deja igual número de observaciones
inferiores y superiores a ella. La simbolizaremos por Me.
En el caso de que el número de datos sea impar, la mediana coincide con uno de los datos. Si
el número de datos es par, tenemos dos valores centrales; en este caso se toma como
mediana el promedio de los dos.
Significado de la mediana: es el dato que divide en dos partes iguales a toda la distribución.
12
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Ejemplo:
1. Dada la serie estadística correspondiente a los pesos en kilos de nueve niños:
10; 12; 18; 14; 20; 19; 17; 22; 15, calcular la mediana de dichos pesos.
Resolución: primero ordenamos los datos (puede ser en forma ascendente o descendente):
10 – 12 – 14 – 15 – 17 – 18 – 19 – 20 – 22, luego ubicamos el dado central. La media es 17,
entonces: Me = 17
Lo mismo que significa que 4 niños tienen pesos de 10 a 15 kilos y los otros 4 niños tienen
pesos de 18 a 22 kilos.
Lo mismo que significa que el 50% de las personas tienen edades entre 8 y 22 años y el otro
50% de las personas tienen edades comprendidas entre 22 y 60 años.
13
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
14
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
CUANTILES
Constituyen una generalización del concepto de mediana. Así como la mediana divide a la
serie en dos partes con el mismo número de elementos cada una, si la división se hace en
cuatro partes, o en diez, o en cien partes, llegamos al concepto de cuantil.
Hay, principalmente, tres cuantiles importantes: cuartiles, deciles y percentiles.
CUARTILES:
( )
Y el tercer cuartil
( )
Dónde: L = Límite inferior del intervalo de la clase a la que pertenece el cuartil, que es la
clase que deja por debajo de ella el 25% de las observaciones (o el 75%en el caso de ).
I = Amplitud del intervalo.
fm = Frecuencia absoluta de la clase cuartílica.
fi = Frecuencia acumulada del valor anterior a la clase que contiene el cuartil.
DECILES:
Es la segunda clase de cuantiles. Si se divide toda la serie en diez partes iguales tendremos
los deciles.
- El decil 1= , deja el 10%de los valores de la serie por debajo de él.
- Análogamente ocurre con los deciles . El decil 8, por
ejemplo, deja el 80% de la masa de datos investigada por debajo de él.
Las fórmulas para calcularlo son también análogas a las de la mediana.
( ) ( )
( ) ( )
…………………………
( ) ( )
15
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
PERCENTILES
( )
EJEMPLO:
De la siguiente serie hallar el primero y el tercer cuartil, el segundo y el séptimo decil y los
percentiles 8 y 73.
Clase SOLUCIÓN:
20-25 5 5 Cuartiles:
25-30 9 14 Primero se calcula cuál es el intervalo por debajo del cual
queda el 25% de los valores (la cuarta parte). Para ello se
30-35 14 28
aplica la fórmula:
35-40 20 48
40-45 26 74 ( )
45-50 18 92 Como 110/4 = 27,5 la primera frecuencia acumulada que
50-55 7 99 contiene 27,5 elementos es 28, que corresponde a la clase
55-60 11 110 30-35; luego, L=30. Entonces:
Total (n) 110 ( )
( )
Como 3 x 110/4 = 82,5 la primera frecuencia acumulada que contiene 82,5 elementos es 92,
que corresponde a la clase 45-50; luego, L=45. Entonces:
( )
( ) ( )
( ) ( )
Percentiles:
( ) ( )
( ) ( )
Obsérvese que entre los 6 cuantiles calculados en el ejemplo aparecen valores muy parecidos.
En particular se dan siempre las siguientes coincidencias:
El segundo cuartil equivale a la mediana.
El quinto decil y el quincuagésimo percentil se corresponde también con la mediana.
Los percentiles y se corresponde con el primer y tercer cuartil, respectivamente.
16
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
MEDIDAS DE DISPERSIÓN
Nos proporcionan información adicional que nos permite juzgar la confiabilidad de nuestra
medida de tendencia central. Si los datos están muy dispersos la posición central es menos
representativa de los datos, como un todo, que cuando estos se agrupan más estrechamente
alrededor de la media.
Los analistas financieros están preocupados por la dispersión de las ganancias de una
empresa que van desde valores muy grandes a valores negativos. Esto indica un riesgo mayor
para los accionistas y para los acreedores. De manera similar los expertos en control de
calidad, analizan los niveles de calidad de un producto.
RANGO:
Es la diferencia entre el mayor y el menor de los valores observados
Ejemplo:
Distribución de datos simples
Distribución de encuestados según edad: 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
Rango = 63 – 18 = 45 años
Entre el encuestado de mayor edad y el más joven, hay una diferencia de 45 años.
17
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Es la diferencia entre el Q1 y el Q3
Nos indica la dispersión en el 50% central de la distribución
Es más sensible a la concentración de los datos que el recorrido ordinario
Su cálculo es indistinto para datos simples como para datos agrupados.
Ejemplo:
Para datos simples: 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
18
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Varianza
Se basa en las diferencias entre la media aritmética y cada una de las puntuaciones
Es el promedio de los cuadrados de las distancias de las observaciones a partir de la
media (su valor nunca será observaciones a partir de la media (su valor nunca será
negativo).
La fórmula del cálculo dependerá si la distribución es de datos simples o agrupados así
como de si se trabaja con datos simples o agrupados.
Ejemplo:
̅ ̅ ̅
0 2 -2 4 8 ̅
1 5 -1 1 5
2 7 0 0 0
3 4 1 1 4
4 1 2 4 4
5 1 3 9 9
Total 20 30
(n)
Ejemplo:
Intervalo ̅ ̅ ̅
123,5- 3 125,5 -8,8 77,4 232,2
127,5
127,5- 5 129,5 -4,8 23,4 115,2
131,5
131,5- 7 133,5 -0,8 0,64 4,48
135,5
135,5- 4 137,5 3,2 10,24 40,96
139,5
139,5- 3 141,5 7,2 51,84 155,52
143,5
143,5- 2 145,5 11,2 125,84 250,88
147,5
Total (n) 24 799,24
̅
19
MINISTERIO DE EDUCACIÓN, CULTURA, CIENCIA Y TECNOLOGÍA.
INSTITUTO DE EDUCACIÓN SUPERIOR PROFESOR WALTER SERVANDO FONTANARROSA
Ejemplo:
Para datos simples: √ √ √
Ejemplo:
20