0% encontró este documento útil (0 votos)
46 vistas44 páginas

Fundamentos de Estadística y Análisis

Este documento presenta un análisis estadístico general que incluye definiciones de términos estadísticos clave como población, muestra, variable, datos cualitativos y cuantitativos, y métodos estadísticos como distribuciones de frecuencias y representaciones gráficas. Explica conceptos como estadística descriptiva e inferencial, y cómo agrupar y analizar grandes conjuntos de datos numéricos.

Cargado por

Alejandra Helm
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
46 vistas44 páginas

Fundamentos de Estadística y Análisis

Este documento presenta un análisis estadístico general que incluye definiciones de términos estadísticos clave como población, muestra, variable, datos cualitativos y cuantitativos, y métodos estadísticos como distribuciones de frecuencias y representaciones gráficas. Explica conceptos como estadística descriptiva e inferencial, y cómo agrupar y analizar grandes conjuntos de datos numéricos.

Cargado por

Alejandra Helm
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

ANALÍSIS ESTADÍSTICO

FACILITADOR: JUAN FRANCISCO


CAMPOS HEREDIA
GENERALIDADES
La estadística y sus diversas aplicaciones:
• Medicina, enfermería.
• Agronomía.
• Economía
• La administración de empresas.
• Sociología.
• Mercadotecnia.
PENSAMIENTO ESTADISTICO
Factores del pensamiento estadístico:
• Contexto de los datos.
• Fuente de datos.
• Método de muestreo
• Conclusiones.
• Implicaciones prácticas
X 56 67 57 60 64
y 53 66 58 61 68
METODOS ESTADISTICOS
ESTADISTICA.- Es la designación de una
colección de datos numéricos.
Es un conjunto de datos que pueden ser
ordenados y sistematizados.
Ejemplo:
• Edades de alumnos
• Sexo de alumnos
• Promedio de calificaciones, Etc.
ESTADÍSTICA DESCRIPTIVA E INFERNCIAL

• ESTADISITICA DESCRIPTIVA. La Estadística


Descriptiva o Deductiva trata del recuento,
ordenación y clasificación de los datos
obtenidos por las observaciones. Se
construyen tablas y se representan gráficos
que permiten simplificar la complejidad de los
datos que intervienen en la distribución.
ESTADÍSTICA DESCRIPTIVA E INFERNCIAL

• Estadística Inferencial. La inferencia


estadística es una técnica mediante la
cual se obtienen generalizaciones o se
toman decisiones en base a una
información parcial o completa obtenida
mediante técnicas descriptivas”
POBLACION.
• Es un conjunto de individuos u objetos acerca
del cual se intenta conocer algo.
• conjunto o universo de elementos en estudio
que presentan presumiblemente característi-
cas comunes, ejemplo:
• La población mundial
• La población nacional
• La población del estado de Puebla.
MUESTRA.
El realizar una estadística de toda la población
en ocasiones es muy costoso, por lo que en
estos casos es conveniente hacer un estudio de
una parte de la población a lo que llamaremos
muestra, esta nos serviría para estimar los
resultados que se obtendrían con el estudio
completo.
PARAMETRO POBLACIONAL.
Es una característica medible de una población,
un valor particular que se obtiene por métodos
estadísticos para describir en forma resumida las
características de una población. (Media-
aritmética). A los valores descriptivos obtenidos
de una población se le llaman parámetros.
VARIABLE
Es una característica de cada elemento individual, de
una población o de una muestra, cabe dividirlas en
dos clases:

Cuantitativas.- Son datos numéricos que se obtienen


mediante conteos o mediciones, ejemplo el salarió
de un empleado, el número de artículos producidos
por una maquina, la edad de las personas, etc.

Cualitativas.- Son aquellos datos numéricos que solo


pueden describirse mediante palabras, como la
nacionalidad, religión, estado civil, etc.
Tipos de Datos
Datos cualitativos
• Nominales. Comprenden categorías como el
sexo, color de ojos, campos de estudios,
calificaciones (excelente, bueno, regular), sin
embargo estas cualidades deben ser contadas.
• Jerarquizados. Constan de valores relativos
ejemplo concursos de belleza, florería y
caninos, estos son factibles de numerarlos
primero, segundo tercero, 1, 2, 3.
TECNICAS ESTADISTICAS
• Los gráficos, distribuciones de frecuencias, promedios,
etc., son técnicas de valor práctico para la descripción
de los datos. Sin embargo su mayor utilidad se
encuentra en el análisis de los datos numéricos.
• La estadística reúne un conjunto de procedimientos
para describir y analizar los datos de diversas,
disciplinas esta debe ser neutral y por ello puede
emplearse la misma técnica de muestreo en
economía, finanzas, educación, ingeniería, y otras
disciplinas.
CUADROS ESTADISTICOS
• Los cuadros o las tablas estadísticas pueden
ser las mas útiles desde el punto de vista
práctico por la forma en que se tienen que
presentar los resultados de las investigaciones.
• Se han elaborado ciertas formas típicas de
presentación que se clasifican en tablas o
cuadros y representaciones graficas.
REPRESENTACIONES GRAFICAS.
Es otro método para presentar los datos
mediante gráficos. Los principales gráficos o
diagramas son:
• El diagrama de línea aritmética, los diagramas
de barras,
• los gráficos de dibujos o pictogramas, los
diagramas circulares y los mapas estadísticos.
TOMA DE DATOS
• La toma de datos es la obtención de una colección de los
mismos que no han sido ordenados numéricamente.
• Ejemplo la altura de los estudiantes del salón. El peso de los
niños de un hospital

ORDENACIÓN
• Es una colocación de los datos numéricos tomados en orden
creciente o decreciente de magnitud. La diferencia entre el
mayor y el menor de los números se llama recorrido o
rango, Ejemplo la altura mayor del grupo de estudiantes es
de 1.85 y la menor de 1.60 el rango es de 25 cm.
DISTRIBUCIÓN DE FRECUENCIAS
• Consiste en agrupar los valores iguales (series de
frecuencia), o agrupar los valores en clases de dos
límites prefijados para cada una de ellas, (series de
clase y frecuencias).
• La ordenación tabular de los datos en clases y
frecuencias, se conoce como una distribución de
frecuencias o tabla de frecuencias.
Mujeres

7 7 8 6 7 6 80 6 6 8 7 6 7 9 7 6 7 6 80 6
6 2 8 0 2 8 4 80 6 8 2 6 2 8 2 4 8
6 8 7 7 7 8 10 8 6 7 7 7 8 8 6 7 8 8 12 6
4 0 6 6 6 0 4 8 06 2 2 8 0 0 2 8 8 4 4
DISTRIBUCIÓN DE FRECUENCIAS

• Una serie de frecuencias puede construirse


solamente en aquellos casos en que la información
consta de muchas observaciones pero la variable
toma un número reducido de valores (xi)
• Si disponemos de un gran número de datos es útil
distribuirlos por categorías o clases, y determinar el
número de individuos pertenecientes a cada clase, a
esto se le llama frecuencia de clase (fi).
DISTRIBUCIÓN DE FRECUENCIAS
• Se denominan Frecuencias acumuladas ( F1), a la
suma sucesiva de frecuencias.
• Las frecuencias, es posible y generalmente útil,
presentarlas en términos relativos, calculando la
proporción del total de observaciones lo cual
produce las frecuencias relativas (hi), se obtiene
dividiendo cada frecuencia particular entre la suma
de las frecuencias.
• Las frecuencias relativas también pueden acumularse
produciendo las frecuencias relativas acumuladas
(Hi), .
TABLA DE FRECUENCIAS
Niños Xi
Sin Enfermedad 4
Enfermos 6
Delicados 12
Graves 10
Muy graves
8
Xi = Numero de valores
fi = Frecuencias de clase, No de veces que se repite el evento
Fi = Frecuencias Acumuladas
hi = Frecuencias relativas
Hi = Frecuencias relativas acumuladas
TABLA DE FRECUENCIAS
Pulso mujeres fi Fi hi Hi
60 3 3 .075 .075
64 4 7 0.10 0.175
68 5 12 0.125 0.30
72 8 20 0.20 0.50
76 6 26 0.15 0.65
80 6 32 0.15 0.80
88 5 37 0.125 0.925
96 1 38 0.025 0.95
104 1 39 0.025 0.975
124 1 40 0.025 1

Xi = Numero de valores
fi = Frecuencias de clase, No de veces que se repite el evento
Fi = Frecuencias Acumuladas
hi = Frecuencias relativas
Hi = Frecuencias relativas acumuladas
DATOS AGRUPADOS

Son aquellos que se juntan cuando son muy numerosos y


la variable toma un numero grande de valores distintos.
La elaboración de una distribución de frecuencias,
considerando grupos o clases, debe atender a tres
puntos fundamentales
a) El número de grupos o clases en que se han de
agrupar los datos.
b) Clasificar los datos en los grupos que les corresponde.
c) Conteo del número de caso en cada clase.
DATOS AGRUPADOS

• Generalmente para el agrupamiento de datos en clases, se


siguen las siguientes reglas:
• 1) No deben utilizarse menos de 5 o mas de 20 clases, lo
cual dependerá de la naturaleza de los, datos, su número o
el intervalo que cubran.
• 2) Las clases deben de formarse de tal modo, que todos los
datos se puedan incluir.
• 3) Debe asegurarse de que cada valor observado pueda
ubicarse en una única clase, hay que evitar confusiones
entre limites superiores e inferiores.
• 4) Es aconsejable que siempre que sea posible, los
intervalos de clase se tomen de igual amplitud, que las
amplitudes sean múltiples de 5, 10 o de 100.
DATOS AGRUPADOS

El número preciso de clases que ha de adoptarse


para una variable determinada, depende
muchas veces del juicio personal y de otras
consideraciones relativas, ante esto se puede
aplicar la regla de Sturges, como una guía para
la determinación del numero aproximado de
clases.
• Regla de Sturges: m=1+3.3 log n
• En donde m= numero aproximado de clases
• n= numero total de observaciones
DATOS AGRUPADOS

Una vez determinado el numero de clases o


grupos, debe de obtenerse el rango, amplitud o
recorrido de la variable, que es la diferencia
entre el valor máximo y el valor mínimo
dividido entre el numero de clases,
obteniéndose el valor del intervalo de clase.

I = max – min
m
MEDIDAS DE TENDENCIA CENTRAL

• MEDIA ARITMETICA.
• MEDIANA
• MODA
• MEDIA GEOMETRICA
• MEDIA ARMONICA
MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMETICA. Es la más utilizada. Se
obtiene de dividir, la suma de todos los valores
observados entre el número de ellos.
• Serie simple o de datos no agrupados.
= X1+X2+X3……..Xn
n

= ∑Xi
n
MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMETICA. Datos agrupados
Serie de frecuencias (datos agrupados). Si se
tiene en cuenta que cada valor distinto de Xi de
la variable se repite tantas veces como indica la
frecuencia fi, la suma de todas las observaciones
iguales será igual al producto Xifi.

= Xifi+X2f2+X3f3+……..Xnfn = ∑ Xifi
F1+f2+f3…..fn ∑ fi
MEDIDAS DE TENDENCIA CENTRAL
LA MEDIANA.
La mediana es otra medida de tendencia central, se define la
mediana como el valor tal, que bajo de el se encuentra el 50%
del total de datos, y arriba de él otro 50%.
De acuerdo con esta definición, si los datos de un conjunto
están ordenado por magnitud, entonces la mediana es el valor
central, si el conjunto tiene un número impar, la mediana
coincidirá con el valor central, ejemplo hallar la mediana de los
valores 58, 72, 84, 90, 98., el numero de observaciones es
impar por lo tanto la mediana será el valor 84
Si solo hubiere cuatro observaciones
Md= 72 + 84 = 78por ejemplo 58, 72, 84, 90,
la mediana seria: Serie simple de 2 datos no agrupados
MEDIDAS DE TENDENCIA CENTRAL
Obtención de la mediana por interpolación
1.- Encontrar el número de orden que ocupa la mediana (n/2), el cual se
divide en dos partes iguales a la serie.
2.- Acumular las frecuencias (fi)
3.- Localizar la clase cuya frecuencia acumulada contiene el valor de
n/2. Esta clase se denomina mediana.
4.- Localizar la frecuencia acumulada anterior a la clase mediana (Fa).
5.- Al número de orden de la mediana se le resta la frecuencia anterior
acumulada (n/2 - Fa).
6.- Esta diferencia se divide entre la frecuencia de la clase mediana (fm)
y el cociente obtenido se multiplica por el valor de intervalo (I).
7.- Por último, el producto obtenido se suma al límite inferior de la clase
mediana:
Esto se resume mediante la fórmula: Md= Li + ( n/2 – Fa ) I
fm
MEDIDAS DE TENDENCIA CENTRAL
Obtención de la mediana por interpolación
Li = Límite inferior de la clase mediana
n= número de valores observados
Fa= Frecuencia acumulada anterior a la clase mediana
I= valor del intervalo
fm= frecuencia de la clase mediana Mediana= 65/2 = 32.5

salarios Punto medio fi Fa


Md= Li + ( n/2 – Fa ) I 50.00 - 59.99 54.995 8 8
fm 60.00 - 69.99 64.995 10 18
70.00 - 79.99 74.995 16 34
80.00 - 89.99 84.995 14 48
90.00 - 99.99 94.995 10 58
100.00 - 109.99 104.995 5 63
110.00 - 119.99 114.995 2 65
  594.965 65  
MEDIDAS DE TENDENCIA CENTRAL
LA MODA.
La moda o modo; Mo, es otra medida de tendencia central
y que se define simplemente como el valor que tiene la
frecuencia mayor.
Ejemplo en la tabla siguiente el número de mayor
frecuencia es 16 por tanto la moda es 74.99.

salarios Punto medio fi Fa


50.00 - 59.99 54.995 8 8
60.00 - 69.99 64.995 10 18
70.00 - 79.99 74.995 16 34
80.00 - 89.99 84.995 14 48
90.00 - 99.99 94.995 10 58
100.00 - 109.99 104.995 5 63
110.00 - 119.99 114.995 2 65
  594.965 65  
MEDIDAS DE TENDENCIA CENTRAL
LA MODA.
Cuando los datos están agrupados en clases, la moda se define
como el punto medio de la clase de mayor frecuencia, por lo
tanto debemos considerar que la moda Mo de la tabla es 75 ya
que es la de mayor frecuencia y en segundo lugar podríamos
considerar a 85.

salarios Punto medio fi Fa


50.00 - 59.99 54.995 8 8
60.00 - 69.99 64.995 10 18
70.00 - 79.99 74.995 16 34
80.00 - 89.99 84.995 14 48
90.00 - 99.99 94.995 10 58
100.00 - 109.99 104.995 5 63
110.00 - 119.99 114.995 2 65
  594.965 65  
MEDIDAS DE TENDENCIA CENTRAL
LA MODA.
En este mismo ejercicio por ser una serie de clases y frecuencias
podemos sacar la moda por medio del cálculo de la siguiente
formula:
Mo= Li + ( ∆1 ) I = 70 + ( 6 ) 10 =
Donde :
∆1 + ∆2 6 + 2
Li= Limite inferior de la clase
modal (clase que tiene la máxima
frecuencia) salarios Punto medio fi Fa
50.00 - 59.99 54.995 8 8
∆1= Diferencia entre la mayor 60.00 - 69.99 64.995 10 18
frecuencia y la frecuencia anterior 70.00 - 79.99 74.995 16 34
80.00 - 89.99 84.995 14 48
∆2= Diferencia entre la mayor y la 90.00 - 99.99 94.995 10 58
frecuencia que le sigue 100.00 - 109.99 104.995 5 63
I = Valor del intervalo de clase 110.00 - 119.99 114.995 2 65
  594.965 65  
MEDIDAS DE DISPERSION.

Si los valores observados de las variables están


muy concentrados alrededor del promedio, éste
es muy representativo; pero si aquellos valores
están muy dispersos con relación al promedio,
este es poco representativo.
El significado de promedio gana mucho si lo
respalda una medida de la dispersión de las
observaciones en torno a él, Cuando se quiere
conocer la dispersión de una variable, lo que se
intenta obtener es una medida, que indique el
mayor o menor grado en que están dispersos
los datos.
MEDIDAS DE DISPERSION.

RANGO (RECORRIDO, AMPLITUD, OSCILACION)


Es el diferencial entre el mayor y el menor valor
de los datos observados, sin embargo este no
nos da ninguna información sobre lo
que ocurre con lo valores.
MEDIDAS DE DISPERSION.

DESVIACION MEDIA (D.M)


Se llama desviación respecto a la media a la
diferencia entre cada valor de la variable y la
media (X-x)̄ . La desviación media es una
serie simple, es la media aritmética de todas las
desviaciones respecto a la media, sin tener en
cuenta los signos, es decir, tomados
de su valor absoluto, su formula es :

D.M =(|X-x̄|)
n
MEDIDAS DE DISPERSION.

DESVIACION MEDIA (D.M)


D.M =(|X-x|̄ )
n
Ejemplo si tenemos la serie simple 2,10,12,16
Xi (|X-x|̄ ) x̄ = 40 10
2 -8 4
10 0
D.M= 16
12 2 4
16 6 4
40 16
MEDIDAS DE DISPERSION.

LA VARIANZA Y LA DESVIACION ESTANDAR.


No obstante que la desviación media es una medida
fácil de obtener, tiene el inconveniente de que no
sigue en su proceso un rigor algebraico, por lo tanto,
generalmente se prefiere emplear la varianza o la
desviación estándar, que hacer uso de los cuadrados
de las desviaciones (X - x ̄ )², para evitar que la suma de
las desviaciones sea cero. La suma de los cuadrados
de las desviaciones se divide entre el número de
términos y se obtiene la varianza (σ²). Si al valor de la
varianza le Varianza
extraemos la raíz cuadrada obtenemos la
desviación σ² = ∑(X - x̄ )² Desviación Estándar
estándar n σ=√
MEDIDAS DE DISPERSION.

LA VARIANZA Y LA DESVIACION ESTANDAR.


Ejemplo
Varianza Desviación Estándar
σ² = ∑(X - x̄ )² σ=√
n

Xi X-x̄ (X - x̄ )² Media
2 -8 64 x̄ = 40 =10
10 0 0 4
12 2 4
16 6 36
40 0 104
MEDIDAS DE DISPERSION.

LA VARIANZA Y LA DESVIACION ESTANDAR. Para datos


agrupados ejemplo:
Varianza Desviación Estándar
σ² = ∑(X - x̄ )²fi σ=√
∑fi
punto medio o
marca de clase
clases Xi fi fixi (x-x̄) (x-x̄)² (x-x̄)²fi
40 - 50 45 2 90 -24.5 600.25 1200.5
50.01 - 60 55 8 440 -14.5 210.25 1682
60.01 - 70 65 10 650 -4.5 20.25 202.5
70.01 - 80 75 12 900 5.5 30.25 363
80.01 - 90 85 6 510 15.5 240.25 1441.5
90.01 - 100 95 2 190 25.5 650.25 1300.5
420 40 2780 3 1751.5 6190
Tamaño de la Muestra

Si conocemos el tamaño de la muestra podemos usar la siguiente formula


Niveles o grados de
Población finita confianza Probabilidad de error
Tm= Z² . N . p . q 90% = 1 .68 2% al
e² . (N-1)+ Z² .p . Q 95% = 1.96 5%
99% = 2.58

En donde:
Z² = Nivel de confianza, si tomamos 95% equivale a 1.96
p = Probabilidad de éxito, (Se puede tomar en 40% a 60%) normalmente se
toma el 50%, donde p+q=1, si conocemos (p) podemos sacar q
q = Probabilidad de fracaso
e² = probabilidad de error, se puede tomar del 2% al 5%, normalmente se
toma el 3%
N = Población total
Tamaño de la Muestra

Ejemplo: Se va aplicar un cuestionario en un hospital con 5000


personas de cuanto será nuestra muestra con los siguientes
datos:
nivel de confianza del 95% Población finita
Tm= Z² . N . p . q
Probabilidad de éxito del 60%
e² . (N-1)+ Z² .p . Q
Probabilidad de fracaso ?
Probabilidad de error 3% Población finita
Tm= (1.96)²* 5000*.60 *.40
Población 5000
(.03)²*(5000-1)+ (1.96)²*.60*.40

Población finita
Tm= 3.8416* 5000*.24 = 4609.92 = 851.81
4.49+ 0.921984 5.4119
Tamaño de la Muestra Población Infinita

En donde:
Z² = Nivel de confianza, si tomamos 95% equivale a 1.96
p = Probabilidad de éxito, (Se puede tomar en 40% a 60%)
normalmente se toma el 50%, donde p+q=1, si conocemos (p)
podemos sacar q
q = Probabilidad de fracaso
e² = probabilidad de error, se puede tomar del 2% al 5%,
normalmente se toma el 3%
N = Población total
Prueba piloto de medición.
Para 200 o mas, de 25 a 60 personas o cuestionarios.
Población infinita tm__
Con muestreo aleatorio simple 1024.42
Tm = Z² . p . q (1.96)² x .6 x .4
e² (.03)² ni = 1 + (tm-1) 1 + (1024.42-1)
N 5000
Tamaño de la Muestra Población Infinita

Población infinita
Con muestreo aleatorio simple
Tm = Z² . p . q (1.96)² x .6 x .4 = 1024.42
e² (.03)²

tm__ _tm_
1024.42
ni = 1 + (tm-1) = 1024.42 = 853.63
ni = 1 + (tm-1) 1 + (1024.42-1)
N 1.20
N 5000

Prueba piloto de medición.


Para 200 o mas, de 25 a 60 personas o cuestionarios.

También podría gustarte