UNIVERSIDAD TECNICA ESTATAL DE QUEVEDO.
FACULTAD EN CIENCIAS EN LA SALUD.
CARRERA DE LICENCIATURA EN ENFERMERIA.
BIOESTADISTICA
INTEGRANTES:
✓ ANTE TULPA HECTOR ISAEL.
✓ CHEVEZ GIACOMETTI GENESIS.
✓ DAYANNA MERELO CEDEÑO MARINA.
✓ ESTHER NUÑEZ GOYA JANERLY MABEL.
TEMA:
Medidas de tendencia central y dispersión.
DOCENTE: RIZZO ZAMORA LAUDEN GEOBAKG
Medidas De Tendencia Central
Las medidas de tendencia central son medidas estadísticas que pretenden
resumir en un solo valor a un conjunto de valores. Representan un centro
en torno al cual se encuentra ubicado el conjunto de los datos.
Media La media aritmética se define como la suma de todos
aritmética. los datos dividida entre el número total de estos.
Como habitualmente dispondremos de una tabla de
datos con sus frecuencias, aplicaremos:
1. La media no tiene porqué ser un valor propio de la variable.
2. Es muy sensible a valores extremos en los datos.
3. Se comporta de forma natural en relación a las operaciones
aritméticas.
Mediana
La mediana es aquel valor de la variable estadística
que deja el 50% de observaciones inferiores a él; así
pues, la mediana divide en dos partes iguales a la
distribución estadística.
Dentro de las propiedades de la mediana se pueden
destacar:
1. Como medida descriptiva no se ve tan afectada
como la media por la presencia de valores
extremos.
2. Es de cálculo rápido y de fácil interpretación.
3. Tiene propiedades matemáticas complicadas que
hacen que se utilice poco en inferencia
estadística.
Caso de pocos datos y en número impar. En este caso se
procede a ordenar los datos de menor a mayor, se considera el
valor de la mediana el que corresponde al lugar central.
Caso de pocos datos y en número par. En este caso se procede a
ordenar los datos de menor a mayor, se considera el valor de la
mediana el correspondiente a la semisuma de los dos lugares
centrales.
Ejemplo: La mediana del número de suspensos. (Muchos datos)
Entramos en una clase de 25 estudiantes y preguntamos el
número de suspensos en la última evaluación, hay 4 estudiantes
con 0 suspensos, 2 con 1 suspensos. Como tenemos muchos
datos, los organizamos en la siguiente tabla para calcular la
mediana.
Ejemplo Número de llamadas. En un grupo de
Se define la moda como el valor de la 20 personas se recogen el número de llamadas
variable estadística que tiene la que realizan durante un día. Resultando los
frecuencia absoluta más alta. siguientes valores: 4 personas hacen 1 llamada,
3 personas hacen 2 llamadas, 2 personas hacen
3 llamadas...
Si existen varios valores con esta
característica, entonces se dice que la
distribución tiene varias modas
(plurimodal).
Moda Esta medida de centralización es sin
duda la de más fácil cálculo. Se suele
utilizar como complemento a la media
aritmética y mediana ya que por sí
sola no aporta una información
determinante de la distribución.
No es tan sensible como la
Observa que en este ejemplo tenemos que la distribución es
media aritmética a valores
extremos. bimodal, ya que X1 = 1 y X5 = 5 corresponden con f1 = 4 = f5 .
Siendo ambas el máximo número de llamadas. Compara dicho
dato con lo ya aprendido de la media aritmética y la mediana.
Ejercicios resueltos El número de llamadas telefónicas que reciben al día los 9
Las edades de un grupo de 9 amigas son: 12, integrantes de una familia son:
14, 13, 16, 13, 15, 15, 17 y 13. Calcula la
7, 8, 15, 12, 13, 5, 10, 4, 8
media, mediana y moda.
Calcula la media, mediana y moda.
SOLUCIÓN:
SOLUCIÓN:
UBICACIÓN DE LA MEDIANA
Es el número intermedio de un grupo de números; es decir, la mitad de los números son
superiores a la mediana y la mitad de los números tienen valores menores que la
Paso 1: mediana
Paso 2:
Lo único que debes hacer es organizar los datos de menor a
Identifica cuál número ocupa el puesto del
mayor o de mayor a menor.
centro. En este caso la mediana es 12.
Si la cantidad de datos que tienes es impar,
como en este ejemplo que son 15 edades, es
más fácil identificar el puesto de la mitad.
Pero, si llegas a tener un conjunto de datos
par, haz lo siguiente:
PASO 2
Paso 3:
Imagina que en la lista no hay 15 edades, si no 16. Ubica los
valores de la mitad y súmalos:
11 + 12 = 23
Paso 4:
Divide el resultado en dos.
23 ÷ 2 = 11,5
La mediana es de 11,5.
MEDIDAS DE DISPERSIÓN LA DESVIACIÓN
MEDIA
ABSOLUTA
RANGO
El rango es un valor numérico que La desviación absoluta media es una extensión simple de la
indica la diferencia entre el valor varianza absoluta. Suma las varianzas absolutas y divide el
máximo y el mínimo de una población resultado entre el número de registros. La desviación
o muestra estadística. El rango suele absoluta media es una estadística de error que calcula el
ser utilizado para obtener la dispersión promedio de la distancia ente cada par de puntos de datos
total. reales y ajustados.
fórmula
Para encontrar el rango, restamos el valor mínimo del
conjunto de datos del valor máximo. Por ejemplo, en los Desviación absoluta media =
datos de 2, 5, 3, 4, 5, y 5, el valor mínimo es 2 y el valor ABSOLUTA(Y – Media(Y))/Número de
máximo es 5, entonces el rango es 5 – 2, o 3 observaciones
Varianza Desviación
estándar
Es una medida de la dispersión de los datos, cuanto mayor sea la
dispersión mayor es la desviación estándar.
σ2= varianza de la población
Se utiliza con mayor frecuencia la
S2= varianza de la muestra.
“Desviación Estándar” que es igual a la
Podemos calcular la varianza aplicando cualquiera de las 3 raíz cuadrada de la varianza y se
fórmulas: Por definición de trabajo y abreviada. representa: σ para la población y s para
la muestra. Tanto para encontrar la
varianza como la desviación estándar
necesitamos ayudarnos de un cuadro,
pero también se puede obtener
directamente con las diversas
sumatorias.
APLICACIÓN DE LA DESVIACIÓN ESTÁNDAR
Con el intervalo de confianza Por ejemplo: Si en Chone existen 95.678 planillas de
La desviación estándar es la media consumo de energía eléctrica con un promedio de consumo de
de dispersión más importante 200 Kw. Por mes y la desviación estándar fue de 36 Kw y el
utilizada en la inferencia estadística costo de 1Kw, es de $0,08. Aplicando la regla del 68% y del
mediante el muestreo y la prueba de 95% encuentre el número de planillas, el consumo mínimo y
hipótesis entre otros. máximo y el total que debería recibir la empresa eléctrica.
estándar y luego el Coeficiente de Variación se
Coeficiente de variación: compara donde haya mejor Coeficiente de
Variación existirá mayor variabilidad. El
Indica la magnitud relativa de la
almacén “EL REY” tuvo las siguientes ventas
desviación estándar respecto a la media
diarias en una semas: 2.350, 2.720, 3.460, 1.640,
de la distribución.
2.570, 3.260 y el almacén “LA REINA” en la
semana de ventas tuvo 690; 850; 360; 940;
1.200;560; 830. ¿En qué almacén hubo menor
variabilidad de las ventas?
EL REY s= 674.99 CV= 26.49%
Variabilidad
LA REINA s= 27.47 CV= 35.00%
En dos o más muestras del mismo tamaño y Respuesta: Almacén “EL REY” 26.49%¿; Almacén
de las mismas características se puede “LAREINA” 35,00%. Hubo menor variabilidad en el
encontrar la variabilidad obteniendo la almacén “EL REY
desviación
Error estándar de la Media
Se conoce también como
desviación estándar de la
distribución de las medias
porque esta desviación
estándar indica la precisión
de la media muestral como Cuando se ha muestreado a
estimador puntual partir de una población finita
debe incluirse el factor de
corrección de población finita
Puede omitirse el factor de corrección n <0,05 N, esto es,
cuando el tamaño de la muestra es menor el 5% del
tamaño de la población.
Algunos no lo incluyen porque suponen que la población
es grande o del tamaño infinito y las muestras es bien
pequeña.
Usándola quedaría:
Esta ultima formula es la mas utilizada porque
generalmente se trabaja con la muestra y porque se
aplica el factor de corrección que ayuda a minimizar el
error ya que existe N o población. Con el ejemplo de
ingresos por ventas del vendedor ambulante la
población N=260.
Un administrador toma una muestra n=6 de un conjunto N= 150 cuentas por cobrar. La s=
$.65 y las X=$.200 ¿Cuál será el error de estándar?
Surge el “teorema del limite central” que conduce a la utilidad del error
estándar de la media que dice:
Cuando se aumenta el tamaño de la muestra, la
distribución muestral de la media se aproxima a la relativa
de la distribución normal sin importar la forma de la
distribución normal sin importar a forma de la distribución
de las mediciones individuales de la población.
Puede suponerse que la distribución
muestral de la media es aproximadamente
normal cuando el tamaño de la muestra es
n 30
Si se tiene una muestra grande de n > 30 se
puede utilizar la distribución normal con el
error estándar de la media.
Error de precisión o Error
especifico
En la tabla “t student” donde
Este error podemos representarlo con indica los niveles está el
E=S x̄ t porque interviene el error margen de error, así:
estándar y el valor de t (se lo busca en
la tabla “t student”). El error de precisión
€ es muy útil para los intervalos de
confianza; generalmente cuando n < 30
se usa el g.l (grado de libertad) n-1.
Con el ejemplo de la venta de
agroquímicos donde el “error
estándar” fue de 3,050649361 y
deseamos un intervalo de confianza Si fuese el 90% de nivel de confianza
del 95% y como n=20 buscamos en
la columna del 0.05 en 19 ´porque
grado de libertad n-1 cuando n ≤ 30,
tenemos que es igual e 2,093
entonces el error de precisión es
Error en porcentaje
Podemos obtenerlo aplicando la
fórmula
HÁGALO Y COMPRUEBA
Manteniendo el mismo N=5 n=260. Tomamos de los
rango de 53 pero con n mismo 20 datos de ingresos por
pequeña el error en ventas del vendedor ambulante
porcentaje es bastante los siguientes: 150, 161, 172,
mayor. 194, y 203
Es un error muy pequeño porque n=20 es grande en comparación
con N=260; el rango es pequeño. Si hubiere sido n muy pequeño
por ejemplo de 5 y el mismo rango de 53; E % seria grande.
INTERVALOS DE CONFIANZA PARA LA MEDIA
La media (μ) y la desviación Un intervalo de confianza nos va a
estándar (σ) de una población de permitir calcular dos valores
mediciones son parámetros alrededor de una media muestral
(uno superior y otro inferior).
poblacionales, en cambio que la
media (x̄) y la desviación
estándar (s) de una muestra de
mediciones son estadígrafos o Estos valores van a acotar
un rango dentro del cual, con una
estadísticos muestrales.
determinada probabilidad, se va a
localizar el parámetro poblacional.
Intervalo de confianza = media +- margen de error
En ocasiones también se Como generalmente se trabaja con
emplea la terminología nivel la muestra tenemos:
de significación para el
valor α.
Aplicamos
Lo que realmente interesa para inferir es conocer los
límites de confianza de la muestra y ésta aplicaría a la
población.
Ejemplo. Intervalo de confianza para la media con σ conocida
Se ha obtenido una muestra de 25 alumnos de una Facultad para estimar la calificación
media de los expedientes de los alumnos en la Facultad. Se sabe por otros cursos que la
desviación típica de las puntuaciones en dicha Facultad es de 2.01 puntos.
La media de la muestra fue de 4.9.
1. Intervalo de confianza al 90 %.
2. Intervalo de confianza al 99 %.
SOLUCIÓN EJEMPLO .
1. Intervalo de confianza al 90 %. Usamos la fórmula
Los cuantiles de orden 0.05 y 0.95, que encierran en el centro de la distribución normal un área igual a 0.9 se
muestran en el grafico siguiente:
Por ultimo, sustituyendo los datos en la fórmula del intervalo,
tenemos:
(4,24, 5,56)
2. Intervalo de confianza al 99 %.
De modo similar obtenemos los cuantiles de orden 0.005 y 0.995 que describen en el
modelo normal una confianza del 99 %.
Por ultimo, sustituyendo los datos en la fórmula del
intervalo, tenemos:
Bibliografía
MATEMÁTICAS 2o ESO 1 Antes de empezar. (n.d.).
[Link]
LOMCE/[Link]