0% encontró este documento útil (0 votos)
110 vistas44 páginas

Fundamentos de Estadística Descriptiva e Inferencial

Este documento presenta conceptos básicos de estadística descriptiva e inferencial. Explica las diferencias entre estadística descriptiva, que describe datos de forma general, e inferencial, que estudia muestras para proyectarlas a la población. También define conceptos como serie estadística, clase o intervalo de clase, frecuencia, límites de clase, tabla de datos agrupados y no agrupados, y medidas de posición como la media y la mediana.

Cargado por

Mapy Cuba
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
110 vistas44 páginas

Fundamentos de Estadística Descriptiva e Inferencial

Este documento presenta conceptos básicos de estadística descriptiva e inferencial. Explica las diferencias entre estadística descriptiva, que describe datos de forma general, e inferencial, que estudia muestras para proyectarlas a la población. También define conceptos como serie estadística, clase o intervalo de clase, frecuencia, límites de clase, tabla de datos agrupados y no agrupados, y medidas de posición como la media y la mediana.

Cargado por

Mapy Cuba
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd

Fundamentos de

ESTADISTICA

Dra.Emma Neira Ponce


CLASES DE ESTADISTICA
• DESCRIPTIVA.- Describe en forma general un
conjunto de datos los interpreta y prepara
conclusiones generales (encuesta a todos los
alumnos)

• INFERENCIAL.- Estudia los elementos de una


muestra con el fin de proyectarlos o generalizarlos
a la población (encuesta al 10% de alumnos
NORMAS A RESPETARSE
Limite de clase no debe
superponerse
CLASES FRECUENCIA DE MARCA DE
(SALARIOS) EMPLEADOS CLASE
S/. F1 (X1)
100 - 121 10 115
122 - 134 15 128
135 - 147 20 141
148 - 160 6 154
161 - 173 14 167
65
Valor del
Intervalo es La suma total
Una constante Numero de clases (5)
De frecuencias
SERIE ESTADISTICA
• Una serie estadistica es el agrupamiento de datos en una forma
determinada (a traves de una encuesta, trabajo de
investigación, producción de un producto, 98-99 mes a mes)

– En frecuencia.- sus datos son agrupados en función de una


magnitud, es medible (peso, talla, etc.)

– En el tiempo.- Cuando los datos son agrupados en funcion al


tiempo en que ocurrieron (la inflación, enero 2005 a enero 2007)

– Espacial.- cuando los datos son agrupados en función al lugar en


que se realizaron (Es diferente una encuesta en Ica que en Tacna)
CLASE O INTERVALO DE CLASE
• Es una subdivisión de la característica de la
población.

– Cuando la variable es discreta la clase esta


constituida por numeros enteros ejm. el
número que conforma una familia serán: 2
persona, 3 persona. Etc.

– Cuando la variable es continua la clase tiene


dos limites un inferior y otro superior.
Frecuencia
• Frecuencia es el numero de datos perteneciente a cada
clase
• La Frecuencia Total es la suma de todas las
frecuencias
N + = F1 + F2 + F3 + .........Fn +
N = 8 + 10 + 16 + ……..+2

N = 65

Puede ser expresada de la siguiente forma:


n=7
N = ∑ fi
i=1
Limites de clase
• Los limites de clase son los valores
extremos de una clase.
– Ejemplo
Limite inferior 50.00 – 59.99 Limite Superior

- El limite real o verdadero se obtiene.

(59.99 + 60.00)2 = 59.995


Ejemplo
(60.00+59.99)/2 = 59.995
Limite de clase

CLASES FRECUENCIA DE MARCA DE


(SALARIOS) EMPLEADOS LIMITES REALES o CLASE
S/. F1 frontera de clases (X1)
50.00 - 59.99 8 49.995 - 59.995 54.995
60.00 - 69.99 10 59.995 - 69.995 64.995
70.00 - 79.99 16 69.995 - 79.995 74.995
80.00 - 89.99 14 79.995 - 89.995 84.995
90.00 - 99.99 10 89.995 - 99.995 94.995
100.00 - 109.99 5 99.995 - 109.995 104.995
110.00 - 119.99 2 109.995 - 119.995 114.995
65

(50.00 + 59.99)/ 2 = 54.995


Es el punto medio del intervalo de clase y se obtiene
sumando limite inferior y superior de la clase y
dividio por dos
Tabla de datos no agrupados
• Son aquellas que representa un solo individuo o valor en cada clase (no hay
intervalo de clase), no se pueden clasificar porque no tienen un dato o un
numero mayor o menor, son conocidas como serie simple.
• Ejemplo: presentamos un cuadro que nos muestra el volumen de producción
de una fabrica obtenidas por lineas de producción.

Lineas de
Producción
Producción
Linea de Producción A 254,000
Linea de Producción B 451,544
Linea de Producción C 458,784
Linea de Producción D 45,789
Tabla de datos agrupados
• Son aquellas en que cada clase tiene su
respectiva frecuencia se clasifica en:

– Tabla de datos agrupados de variable discreta


– Tabla de datos agrupados de variable continua
Datos agrupados para variable
discreta
• Se caracteriza porque los datos toman valores exactos su
diferenciación con los datos no agrupados es que tienen un total
• Ejemplo: Lanzar juntas cinco monedas, 1000 veces contándose
unicamente las caras.
Numero de caras Frecuencia
Clase Xi Fi
0 25
1 155
2 325
3 124
4 363
5 8
1000
Frecuencia Relativa
• Es la división entre la frecuencia de clase (fi) y la
frecuencia total (N) y se expresa en porcentajes.
Frecuencia de clase
Numero de caras Frecuencia Frecuencia
Clase Xi Fi Relativa
Pi= fi x 100
0 25 2.5
N
1 155 15.5
2 325 32.5
3 124 12.4
Frecuencia
4 363 36.3 Total
5 8 0.8
1000 100
Frecuencia Acumulada (Fa)
• Es la suma de todas las frecuencias de las clases
anteriores mas la clase en referencia.

La primera clase es 25, no


hay clases anteriores En la segunda clase
se suma 25 + 155 =180

Numero de caras Frecuencia Frecuencia Frecuencia


Clase Xi Fi Relativa (Pi) Acumulada (Fa)
0 25 2.5 25 La suma aculmulada
1 155 15.5 180 Es igual al total de
2 325 32.5 505
3 124 12.4 629
Frecuencias N
4 363 36.3 992
5 8 0.8 1000
1000 100
Frecuencia Relativa Acumulada (Hi)

Numero de caras Frecuencia Relativa Frecuencia Acumulada Frecuencia Relativa


Frecuencia Fi
Clase Xi (Pi) (Fa) Acumulada (Hi)
0 25 2.5 25 2.5
1 155 15.5 180 18
2 325 32.5 505 50.5
3 124 12.4 629 62.9
4 363 36.3 992 99.2
5 8 0.8 1000 100
1000 100
• Las medidas de posición son de dos tipos:
•  
• a) Medidas de posición central: informan
sobre los valores medios de la serie de
datos.
• b) Medidas de posición no centrales:
informan de como se distribuye el resto de
los valores de la serie.
• Medidas de posición central
 
• Las principales medidas de posición central
son las siguientes:
 
• 1.- Media: es el valor medio ponderado de
la serie de datos. Se pueden calcular
diversos tipos de media, siendo las más
utilizadas:
• Media aritmética: se calcula multiplicando
cada valor por el número de veces que se
repite. La suma de todos estos productos se
divide por el total de datos de la muestra:
•  
•  
• Xm = (X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)
• ---------------------------------------------------------------------------------------
• n
• Media geométrica: se eleva cada valor al
número de veces que se ha repetido. Se
multiplican todo estos resultados y al
producto final se le calcula la raíz "n"
(siendo "n" el total de datos de la muestra).
• Media Aritmética para datos no agrupados
•  
• Tenemos las calificaciones de un alumno en los diferentes meses de año en el curso de
Estadística 12, 16, 13, 08, 15, 14 ( 6 calificaciones)
•  
• Luego 12 + 16 + 13 + 08 + 15 + 14 = 13
• 6
•  Media Aritmética para datos agrupados
•  
• Utilizamos la siguiente formula:
•  
• X = ∑fi . Xi
Donde:
• N  
•    Fi = Frecuencia simple
•   
Xi = Marca de clase
N = Valor total de datos
• Mediana: es el valor de la serie de datos que se sitúa
justamente en el centro de la muestra (un 50% de valores
son inferiores y otro 50% son superiores).

• No presentan el problema de estar influido por los valores


extremos, pero en cambio no utiliza en su cálculo toda la
información de la serie de datos (no pondera cada valor
por el número de veces que se ha repetido).
• Mediana para datos agrupados
 

• Utilizamos la siguiente formula:

•  
• Para obtener la mediana en datos agrupados se usa la siguiente fórmula:
• Donde:

L1 = Límite interior de la clase mediana.


N =Número total de datos.
Sf1 = Suma de frecuencia de las clases por debajo de la clase mediana.
FMediana = Frecuencia de la clase mediana.
C = Tamaño del intervalo de la clase mediana.
• Moda para datos agrupados
•  
• Utilizamos la siguiente formula:
•  
•  
•  
•  
•  
• Donde:
L i-1 = Límite real interior de la clase mediana.
ni = Clase modal.
ni+1 = frecuencia simple de la clase precedente a la clase modal
• ni-1 = frecuencia simple de la clase siguiente a la clase modal
• Ci = Intervalo de clase
• Medidas de posición no central
•  
•  Las medidas de posición no centrales
permiten conocer otros puntos característicos
de la distribución que no son los valores
centrales. Entre otros indicadores, se suelen
utilizar una serie de valores que dividen la
muestra en tramos iguales:
•  
• Cuartiles
•  
• Los cuartiles son los tres valores que dividen al conjunto de datos ordenados
en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados
usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana.

• El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto
(25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el
valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de
los datos.
•  
k= 1,2,3
 
n  
k    Fk Donde:
 4
Qk  Lk  * c Lk = Límite real inferior de la clase del cuartil k
fk n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la
clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
• Deciles
•  
• Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al
conjunto de datos ordenados en diez partes iguales, son también un caso
particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen
primer decil, segundo decil, etc.
•  
• Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico .
k= 1,2,3,... 9
 
Donde:
n Lk = Límite real inferior de la clase del decil k
k    Fk n = Número de datos
10
Dk  Lk    *c Fk = Frecuencia acumulada de la clase que antecede a
fk la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
• Centiles o Percentiles
•  
• Los percentiles son, tal vez, las medidas más utilizadas para propósitos de
ubicación o clasificación de las personas cuando atienden características tales
como peso, estatura, etc.
•  
• Los percentiles son ciertos números que dividen la sucesión de datos ordenados
en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en
cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,...
P99), leídos primer percentil,..., percentil 99.
•  

 n  k= 1,2,3,... 99
k   Fk  
Donde:
 100 
Pk  Lk  *c Lk = Límite real inferior de la clase del decil k
n = Número de datos
fk Fk = Frecuencia acumulada de la clase que antecede a
la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Medidas de dispersión
 
Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o
menos concentrados, o más o menos dispersos.
Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las
siguientes :
• Medidas de forma: Grado de
concentración
•  
• Las medidas de forma permiten conocer
que forma tiene la curva que representa la
serie de datos de la muestra. En concreto,
podemos estudiar las siguientes
características de la curva:
• Asimetría
•  Hemos comentado que el concepto de asimetría se refiere
a si la curva que forman los valores de la serie presenta la
misma forma a izquierda y derecha de un valor central
(media aritmética)
• Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene
definido:
•  

• Los resultados pueden ser los siguientes:


•  
•  
• g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda
de la media)
• g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la
media que a su izquierda)
• g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la
media que a su derecha)
• Curtosis
•  
• El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de
la zona central de la distribución.
• Se definen 3 tipos de distribuciones según su grado de curtosis:
•  
• Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta una distribución normal).
•  
• Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores
centrales de la variable.
•  
• Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores
centrales de la variable.
El Coeficiente de Curtosis viene definido por la siguiente
fórmula:

Los resultados pueden ser los siguientes:


g2 = 0 (distribución mesocúrtica).
g2 > 0 (distribución leptocúrtica).
g2 < 0 (distribución platicúrtica).

También podría gustarte