0% encontró este documento útil (0 votos)
24 vistas24 páginas

Sesión 01 Estadística y MTC Dispersión Localización

Cargado por

danny95herrera2
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
24 vistas24 páginas

Sesión 01 Estadística y MTC Dispersión Localización

Cargado por

danny95herrera2
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

PRESENTACIÓN

Sesión 1
Conceptos fundamentales de Estadística

Unidad de Ciencias Básicas


Matemáticas - Estadística

INICIAR
ESTADÍSTICA DESCRIPTIVA

El estudio de la estadística descriptiva tiene como objetivo organizar y resumir


información que se obtiene a partir de un conjunto de datos, mediante tablas, y
gráficos.

En los trabajos de investigación o informes el proceso estadístico se construye


teniendo en cuenta los siguientes pasos:

• Recoger la información y tabular los datos.

• Calcular los parámetros de centralización y dispersión.

• Realizar un análisis descriptivo de los datos.


Conceptos básicos

POBLACIÓN: Conjunto o colección de


elementos sobre los cuales se quiere estudiar
alguna característica.
MUESTRA: Subconjunto de datos que
representan al total de una población.
VARIABLES: Una variable aleatoria es una
cualidad o característica mensurable de un
individuo o elemento de un conjunto
determinado, cuya variabilidad se rige por
las leyes del azar.
Las variables aleatorias pueden ser
cualitativas o cuantitativas.
Tipos de variables
MEDIDAS DE TENDENCIA CENTRAL

Al tabular los datos se tiene una visión más amplia sobre ellos, pero
esto no es suficiente, y se necesita conocer otros parámetros que
informen de la tendencia central de los datos, estos son los llamados
parámetros de centralización. Los más utilizados son los siguientes:
Media.

Mediana.

Moda.
MEDIA

La media es el parámetro de centralización más utilizado, su valor es el centro de


los datos. Se suele emplear el símbolo 𝝁 para representar la media poblacional y ഥ
𝒙
para representar la media muestral.

La media aritmética es el valor que tendría cada elemento de la serie de datos si


todos tuvieran el mismo valor.

La media aritmética se calcula promediando todos los datos, así:


𝑛 : número de datos.
σ 𝑥𝑖
𝑥ҧ =
𝑛 𝑥𝑖 : datos.
Ejemplo

Responder la siguiente pregunta:


¿Cuántas horas al día le dedicas al celular?

Posibles respuestas: 2, 4, 6, 8, y 9

Ahora, para determinar la media, se suman los datos recolectados y se dividen en el total de datos. Así:

2 + 4 + 6 + 8 + 9 29
𝑥ҧ = = = 5,8
5 5

Ahora, se hará en Excel.


Ejemplo

Primero, se ingresan los datos (puede ser de manera vertical u horizontal):

Segundo, se ingresa en otra casilla, la fórmula “=PROMEDIO(seleccionar datos)”.

Luego, ENTER.

Cuyo resultado es 5,8.


MEDIANA

La mediana de un conjunto de n datos ordenados de manera ascendente o descendente es el


valor central, es decir, la mediana divide a un conjunto de datos ordenados en dos partes iguales
en cuanto al número de datos. Si n es impar la mediana es el elemento:

𝑀𝑒 = 𝑥𝑛+1
2

El orden del elemento anterior es en relación con su valor. Si n es par, la mediana es la media
aritmética de los dos valores centrales esto es:

𝑥𝑛 + 𝑥𝑛+1
2 2
𝑀𝑒 =
2

La mediana divide el conjunto de datos en partes iguales, es decir, el 50% de los datos se
encuentran sobre la mediana y el 50% por debajo de este valor.
Ejemplo

Responder la siguiente pregunta:


¿Cuántas horas dormiste ayer?

Posibles respuestas (cantidad par): 3, 5, 4, 8 Posibles respuestas (cantidad impar): 5, 5, 8, 7, 6

Ahora, para determinar la mediana, se Ahora, para determinar la mediana, se


organizan los datos. Así: organizan los datos. Así:
3, 4, 5, 8 5, 5, 6, 7, 8

4+5 9 𝑀𝑒 = 6
𝑀𝑒 = = = 4,5
2 2

Ahora, se hará en Excel.


Ejemplo

Primero, se ingresan los datos (puede ser de manera vertical u horizontal):

Segundo, se ingresa en otra casilla, la fórmula “=MEDIANA(seleccionar datos)”. No es relevante en Excel


si la cantidad de datos es
par o impar.

Luego, ENTER.

Cuyo resultado es 4,5.


MODA

La moda de un conjunto de datos es el valor que más veces se repite. En el


caso de variables continuas es difícil que se repitan datos, la moda absoluta es
el valor que más veces se repite. La moda relativa es un valor que sin ser el
que más veces se repite, se repite más veces que el resto de los datos.

Si existen dos valores de la variable que tienen mayor frecuencia absoluta, el


conjunto de datos tendría dos modas. Si ninguno dato se repite, la moda no
existe.
Ejemplo

Responder la siguiente pregunta:


¿Cuántas habitaciones hay en tu casa?

Posibles respuestas: 2, 2, 3, 2, 4, 3, 5, 2, 3, 3, 3

Ahora, para determinar la moda, se determinan las frecuencias de cada valor de variables. Así:
El 2 se repite 4 veces, el 3 se repite 5 veces, el 4 y el 5 se repite una vez. Entonces:
𝑀𝑜 = 3
El 3 es la moda absoluta, mientras que el 2 es la moda relativa.

Ahora, se hará en Excel.


Ejemplo

Primero, se ingresan los datos (puede ser de manera vertical u horizontal):

Segundo, se ingresa en otra casilla, la fórmula “=MODA(seleccionar datos)”.

Luego, ENTER. Cuyo resultado es 3.


MEDIDAS DE DISPERSIÓN

Las medidas de dispersión miden la distancia que existe entre los datos
considerándolos conjuntamente.

Si los valores de los datos son parecidos, las medidas de dispersión tienen valores
pequeños, si los datos son muy diferentes entre sí, las medidas de dispersión tienen
valores grandes.

Las medidas de dispersión más importantes son las siguientes:


Recorrido o rango.
 Desviación estándar .
Varianza.
Coeficiente de variación.
RANGO

Rango o recorrido de una variable es la diferencia entre el valor máximo y el valor


mínimo de los datos observados. Este parámetro informa sobre el recorrido de la variable.
𝑅𝑎𝑛𝑔𝑜 = 𝑑𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟

Ejemplo

Vamos a retomar los datos del ejemplo de la media: 3, 5, 4, 8


𝑅𝑎𝑛𝑔𝑜 = 8 − 3 = 5

Ahora, se hará en Excel.


Ejemplo

Primero, se ingresan los datos (puede ser de manera vertical u horizontal):

Segundo, se ingresa en otra casilla, la fórmula “=MAX(seleccionar datos)-MIN(seleccionar datos)”.

Luego, ENTER.

Cuyo resultado es 5.
VARIANZA

Una manera de evitar el valor absoluto de las desviaciones de todos los datos
respecto a la media es elevándolas al cuadrado, de esta manera los valores negativos
se convierten en positivos. Al promedio de las diferencias cuadráticas de los datos
respecto a la media se le denomina varianza.
La varianza poblacional se representa mediante la letra griega sigma al cuadrado (𝜎 2 ),
la varianza muestral se representa mediante la letra latina S al cuadrado (𝑠 2 ). Las
expresiones matemáticas de la varianza poblacional y muestral son las siguientes:
VARIANZA Y DESVIACIÓN ESTÁNDAR

Varianza poblacional
N es el tamaño de la población y 𝜇 la media aritmética poblacional.

Varianza muestral
n es el tamaño de la muestra y 𝑥ҧ la media muestral.

Desviación estándar poblacional

Desviación estándar muestral


DESVIACIÓN ESTÁNDAR

La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos
están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor
será la dispersión de los datos. Se denotada con el símbolo σ o S dependiendo del conjunto de
datos. Tal como se describió anteriormente.

Para usarlas en Excel, se usan las fórmulas:


COEFICIENTE DE VARIACIÓN

El coeficiente de variación es una medida que se refiere a la


variabilidad en el conjunto de datos. Mide la desviación estándar
en relación con la media.

Esta medida esta expresada como porcentaje %.

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
𝐶𝑉 = × 100 %
𝑚𝑒𝑑𝑖𝑎
Ejemplo

Calcular el coeficiente de variación de las notas obtenidas por un estudioso en


la asignatura de Lógica:

0,8367
𝐶𝑉 = × 100 %
3,83

𝐶𝑉 = 21,8%
PARA RECORDAR

Las fórmulas de Excel son:

MEDIDA FÓRMULA
MODA =MODA(datos)
MEDIA =PROMEDIO (datos)
MEDIANA =MEDIANA (datos)
DESVIACIÓN ESTÁNDAR =DESVEST (datos)
VARIANZA =VAR (datos)
RANGO =MAX (datos)-MIN (datos)
¡Gracias!
FIN

También podría gustarte