Mest1 U1 A1 XXXX
Mest1 U1 A1 XXXX
México
Estadística I
Unidad 1
Actividad 1
MEDIA, MODA Y MEDIANA
DESARROLLO
a) Estadística
b) Estadística descriptiva
c) Estadística inferencial
Es la rama de la Estadística que estudia el comportamiento y propiedades
de las muestras y la posibilidad, y límites, de la generalización de los
resultados obtenidos a partir de aquellas a las poblaciones que representan.
Esta generalización de tipo inductivo, se basa en la probabilidad. También
se le llama también Estadística Matemática, por su complejidad matemática
en relación a la Estadística Descriptiva. Tiene como objetivo, generalizar las
propiedades de la población bajo estudio, basado en los resultados de una
muestra representativa de la población[ CITATION Nol08 \l 1033 ].
d) Probabilidad
El concepto de probabilidad aparece ligado en sus orígenes a los juegos de azar,
razón por la cual se tiene constancia del mismo desde tiempos remotos. A lo largo
de la historia se han hecho muchos y muy diversos intentos para formalizarlo,
dando lugar a otras tantas definiciones de probabilidad que adolecían todas ellas
de haber sido confeccionadas ad hoc, careciendo por tanto de la generalidad
suficiente que permitiera utilizarlas en cualquier contexto. La Teoría de la
Probabilidad nos permitirá la obtención de modelos aleatorios o estocásticos
mediante los cuales podremos conocer, en términos de probabilidad, el
comportamiento de los fenómenos aleatorios[ CITATION Mon07 \l 1033 ].
La teoría de la probabilidad es la parte de las matemáticas que se encarga del
estudio de los fenómenos o experimentos aleatorios. Por experimento aleatorio
entenderemos todo aquel experimento que cuando se le repite bajo las mismas
condiciones iniciales, el resultado que se obtiene no siempre es el
mismo[ CITATION Rin07 \l 1033 ].
e) Combinatoria
La Teoría Combinatoria es la rama de las matemáticas que se ocupa del estudio
de las formas de contar. No existe una clasificación tajante de lo que constituye
una subárea, sino que todas comparten cierto grado de traslape entre sí, al igual
que con otras ramas de la matemática discreta. Diferentes autores proponen
varias divisiones de la combinatoria por lo que cualquier listado es meramente
indicativo[ CITATION Ort09 \l 1033 ].
Es la parte de las Matemáticas que estudia las diversas formas de realizar
agrupaciones con los elementos de un conjunto, formándolas y calculando su
número. Existen distintas formas de realizar estas agrupaciones, según se repitan
los elementos o no, según se puedan tomar todos los elementos de que
disponemos o no y si influye o no el orden de colocación de los
elementos[ CITATION Bjo10 \l 1033 ].
f) Series del tiempo
Las series de tiempo son una de las herramientas matemáticas más básicas y
versátiles en los negocios. Para explicarlo de modo simple, una serie de tiempo
consiste en una serie de puntos de datos indexados en el tiempo. Este tipo de
series, por lo tanto, pueden modelar lo que sea, desde la evolución de las ventas
de una empresa hasta la evolución de los precios de sus productos en base anual,
mensual, diaria o incluso por hora. Las series de tiempo son particularmente
intuitivas, lo que las hace ideales para describir, visualizar, modelar y, por último,
pronosticar un número de variables. Las series de tiempo se utilizan
principalmente con una función descriptiva, ya que pueden condensar una gran
cantidad de información en un solo gráfico o tabla[ CITATION Bar \l 1033 ].
Las series de tiempo a menudo se utilizan también para leer y visualizar datos, así
como para comparar diferentes series. De nuevo, las desventajas de esos gráficos
yace en su aparente simplicidad. Es posible utilizar diferentes técnicas de mapeo
para proporcionar la mejor visualización posible de los datos. Las series de tiempo
a menudo se utilizan para respaldar modelos estadísticos. El objetivo de estos
modelos es doble: explicar el pasado y pronosticar el futuro. Existen tres tipos
principales de pronósticos, cada uno de los cuales tiene finalidades
diferentes[ CITATION Bar \l 1033 ].
Los pronósticos de punto tienen como objetivo proporcionar el "mejor" valor
futuro de una variable de acuerdo con una métrica de error especificada. Es
el caso del pronóstico del tiempo meteorológico, por ejemplo, que para
cada día pronostica un único valor de temperatura. Un pronóstico de punto
no busca representar de modo fiel la evolución de esta variable (el lector
sabe bien que es probable que la temperatura varíe en torno a ese valor
pronosticado), pero sirve como indicación útil para el lector y es una base
sólida para tomar decisiones futuras[ CITATION Bar \l 1033 ].
Los pronósticos probabilísticos proporcionan todas las distribuciones de
probabilidad del valor futuro. A menudo se utilizan intervalos de confianza
para visualizar esos pronósticos, que pueden ser útiles, por ejemplo, para
fines especulativos[ CITATION Bar \l 1033 ].
Los pronósticos generativos hace que la evolución de la variable parezca
"natural" o "plausible", dejando margen para un cierto grado de
contingencia y evolución aleatoria. Esta "perspectiva generativa" puede ser
útil cuando se realizan simulaciones[ CITATION Bar \l 1033 ].
2.- Investiga:
a) La historia de la Estadística.
Otras fuentes señalan que el término Estadística, proviene del alemán statistik,
con Gotfried A. Achenwall, quien en 1752 utilizó por primera vez este término para
esta nueva rama del conocimiento. (Levin y Rubin, 2004)
Cultura babilónica: Alrededor del 3000 a.C., se tiene registro de que los
antiguos babilonios recopilaban datos en tablas de arcilla sobre su
producción agricola y los artículos que vendían o intercambiaban.
8. Marketing: las series de tiempo son muy útiles para predecir ventas. 9.
Telecomunicaciones: análisis de señales.
3. Responde:
a) ¿Cuál es la estadística paramétrica? Menciona 3 ejemplos de métodos
paramétricos.
La estadística paramétrica, como parte de la inferencia estadística, trata de
estimar determinados parámetros de una población de datos. La estimación, como
casi siempre en estadística, se realiza sobre una muestra estadística. Ahora bien,
la estadística paramétrica siempre basa sus cálculos suponiendo que la
distribución de la variable a estudiar es conocida (López, 2019).
La mayoría de procedimientos paramétricos requiere conocer la forma de
distribución para las mediciones resultantes de la población estudiada. Para la
inferencia paramétrica es requerida como mínimo una escala de intervalo, esto
quiere decir que nuestros datos deben tener un orden y una numeración del
intervalo.
b) ¿Cuál es la estadística no paramétrica? Menciona algún método no
paramétrico.
Las pruebas no paramétricas engloban una serie de pruebas estadísticas que
tienen como denominador común la ausencia de asunciones acerca de la ley de
probabilidad que sigue la población de la que ha sido extraída la muestra. Por esta
razón es común referirse a ellas como pruebas de distribución libre.
A continuación, se presenta un esquema grafico donde se muestran algunos tipos
de estudios paramétricos y su equivalente no paramétrico:
Figura 1. Métodos paramétricos y su equivalente no paramétrico. Fuente: Bautista, et. al (2020)
4.- Definir:
a) Inferir
Según la Real Academia Española (2001), inferir significa deducir algo o sacarlo como
conclusión de otra cosa.
Por su parte, según el glosario básico de términos estadísticos del Instituto Nacional de
Estadística e Informática de Perú (INEI,2006), la inferencia estadística es un proceso por
medio del cual se obtienen conclusiones respecto a una población a partir de datos
observados en muestras.
b) Muestra
Según Salazar y del Castillo (2018), una muestra es un conjunto de elementos tomados de
una población de acuerdo a un método previamente establecido conocido como muestreo,
con el fin de obtener conclusiones que son válidas para toda la población.
c) Muestra representativa
Una muestra representativa es aquella que se obtiene de tal manera que todos los elementos
del conjunto tienen la misma oportunidad de ser seleccionados (Johnson y Kuby, 2008)
d) Población.
Según Mario Triola (2013), la población es “el conjunto completo de todos los
elementos que se someten a estudio”; este conjunto incluye a todos los elementos
que se estudiarán.
Por su parte, Salazar y del Castillo (2018) señala que la población es el conjunto
que abarca a todos los elementos cuyas características queremos estudiar o
describir y del cual se necesita establecer conclusiones. Por su tamaño, las
poblaciones pueden ser finitas o infinitas.
N
encuentra la mediana, es la
2
semisuma de las frecuencias
absolutas, f i es la frecuencia
absoluta de la clase mediana,
F i−1 es la frecuencia
acumulada anterior a la clase
mediana y a i es la amplitud de
la clase[ CITATION Ren16 \l
1033 ].
Moda La moda de una distribución Se elige el intervalo de clase
se define como el valor de la de mayor frecuencia:
variable que más se
repite[ CITATION Vel11 \l ∆1
1033 ].
M O=Li +
[ ]
∆ 1+ ∆ 2
⋅c
∑ ( xi −x́)
s = i=1
2
n−1
Para una población:
n
∑ (x ¿¿ i−μ)2
σ 2= i=1 ¿
N
Desviación La raíz cuadrada de la n
estándar varianza se
llama desviación estándar
σ=
√ ∑ ( x i− x́ )2 f i
i=1
N
poblacional y muestral,
respectivamente[ CITATION
Vel11 \l 1033 ].
Para una muestra:
s= √ s2
Para una población:
σ =√ σ 2
Cuartiles Los cuartiles son los tres Para datos agrupados, se
valores de la variable que sigue la misma lógica, dividir
dividen a un conjunto de en cuatro partes.
datos ordenados en cuatro k ⋅N
−Fi−1
4
partes iguales[ CITATION Qk =Li + ⋅a i
fi
Vel11 \l 1033 ].
Rango Es el intervalo entre dos
Inter cuartil cuartiles.
Qk −Qk+1
Coeficient Es una medida relativa que
e de toma en cuenta la dispersión
Variación con respecto a la magnitud
de la media.
Para una muestra:
s
CV = ∗100
|x́|
Para una población:
σ
CV = ∗100
|μ|
a) Media
Es una medida de posición o localización, también conocida como valor promedio
de una variable; proporciona una medida de localización central de los datos ya
sea de una muestra o de una población (Anderson et al., 2008)
b) Mediana
c) Moda
Por otra parte, Salazar y del Castillo (2018) define a la moda como el valor de la
observación que tiene la mayor frecuencia. Es otra medida de tendencia central
con una determinación muy sencilla ya que es fijada por la ubicación del elemento
que más veces aparece en el estudio.
d) Varianza
2 ∑(x i− x́)2
s=
n−1
e) Covarianza
El INEI (2006) define a la covarianza como una medida descriptiva de la asociación lineal
entre dos variables.
∑( x i− x́ )( y i− ý )
s xy =
n−1
Esta fórmula aparea cada x i con una y i. Después se suman los productos
∑( xi −μ x )( y i−μ y )
σ xy =
N
f) Desviación estándar
g) Desviación media
Según Muñoz, Vicente y Muñoz (2010), se define como la media de los valores
absolutos de las desviaciones respecto a la media aritmética; se denota como D x́ y
viene dada por la siguiente fórmula:
r
ni
D x́ =∑ |x i−x́|
i=1 N
h) Desviación típica
i) Medidas de posición
Las medidas de posición o localización resumen características generales de la
ubicación de la distribución de los datos dentro de un conjunto de valores posibles.
Estas pueden ser de tendencia central y no central. (INEI, 2006)
j) Cuartil
Los cuartiles estan definidos como el percentil 25, el percentil 50 y el percentil 75. Las
observaciones arriba del tercer cuartil constituyen el cuarto superior de nuestra serie de
datos, el segundo cuartil coincide con la mediana y el primer cuartil separa el cuarto
inferior de los tres cuartos superiores.
k) Percentil
l) Decil
Medida de posición no central que representan los nueve puntos que dividen la
distribución en diez, de forma tal que dentro de cada una, están incluidos el 10%
de los datos; por tanto, un decil es un valor que representa la décima parte de un
conjunto de información (INEI, 2006)
m) Coeficiente de variación
Según Anderson et al., (2008), el coeficiente de variación es un estadístico descriptivo
que mide qué tan grande es la desviación estándar en relación con la media. Esta
medida se representa como porcentaje y se calcula a través de la fórmula:
( Desviación
Media
estándar
× 100 ) %
n) Diagrama de caja.
Por su parte, Navidi (2006) describe al diagrama de caja como una gráfica que
incluye la mediana, el primero y el tercer cuartil y cualquier dato atípico que se
presente en una muestra.
o) Coeficiente de correlación.
“El coeficiente de correlación lineal r mide la fuerza de la relación lineal entre los
valores cuantitativos pareados x y y en una muestra.” (Triola, 2013)
p) Coeficiente de determinación.
q) Coeficiente de Pearson.
r) Regresión lineal.
s) Diagrama de dispersión
Es una representación gráfica de la relación entre dos variables cuantitativas,
asignándosele a una variable el eje horizontal y a la otra el eje vertical. (Anderson
et al., 2008).
Para Navidi (2006), el diagrama de dispersión es uno de los gráficos más útiles
por los datos bivariados numéricos. Si contamos con datos de pares arreglados
x 1 , y 1 ¿,…( x n , y n ¿, un diagrama de dispersión se construye trazando cada punto en
un sistema coordenado bidi mensional. Losdiagramas de dispersión también son
útiles para resumir datos multivariados cuando cada elemento consta de más de
dos valores construyendo diagramas distintos para cada par de los mismos.
t) Distribución de probabilidad
Para Webster (2000), una distribución de probabilidad es una lista de todos los
resultados posibles de algún experimento junto con las probabilidades de cada
resultsdo. Las distribuciones de probabilidad se clasifican a su vez en
distribuciones discretas y continuas; dentro de las primeras encontramos la
distribución binomial, distribución binomial acumulada, distribución
hipergeométrica y distribución de Poisson. Dentro de las distribuciones de
probabilidad continuas tenemos a la distribución exponencial, distribucion uniforme
y distribución normal.
u) Función de probabilidad
Es la regla que asigna probabilidades a los valores de las variables aleatorias, se
puede expresar en forma de tabla o mediante una fórmula. Se denota f(x) y da la
probabilidad de que x tome un determinado valor de una variable aleatoria. Toda
función de probabilidad debe mostrar las dos propiedades básicas de la
probabilidad, las cuales son: la probabilidad asignada a cada valor de la variable
aleatoria debe estar entre cero y uno y la suma de las probabilidades asignadas a
todos los valores de la variable aleatoria debe ser igual a uno. (Johnson y Kubi,
2012)
v) Función de distribución:
Problema 1:
Calcula todas las medidas de tendencia central y de dispersión, que analizaste en el pdf de
la Unidad 1, del curso de Estadística I.
2 4 7 7 5 9 5 8 3 5 7 3 2
“métodos y técnicas que nos permiten trabajar con las variables, pues hacen que
la recolección e interpretación de datos sea más fácil de manejar” (UnADM, s.f)
x 1+ x 2 +…+ x n
x́=
n
2,2,3,3,4,5,5,5,7,7,7,8,9
13∙ 5
x= =0.65
100
Redondeamos la cifra al entero más cercano: 1
Por tanto eliminamos un dato del extremo superior y uno del extremo
inferior:
2,3,3,4,5,5,5,7,7,7,8
2,2,3,3,4,5,5,5,7,7,7,8,9
2,2,3,3,4,5 , 5 ,5,7,7,7,8,9
Variable Frecuencia
2 2
3 2
4 1
5 3
7 3
9 1
Podemos observar que los valores que más se repiten son el 5 y el 7 por lo tanto,
dichos datos pertenecen a la moda.
Sin embargo, según los autores Johnson & Kuby (2012) cuando en una muestra
dos o más valores están empatados en la frecuencia más alta se considera que no
hay moda.
Medidas de dispersión
Las utilizamos para determinar la variación de los datos respecto al valor central.
(UnADM, s.f.)
Fórmula:
Ramgo=Xmax− Xmin
Buscando el dato con el valor máximo y el dato con el valor mínimo tenemos:
Xmax =9
Xmin=2
Rango=9−2=7
Medida de posición no central integrada por tres valores que dividen el total de
las variables en cuatro partes iguales; por tanto, cada cuartíl representa el 25%
del total. (UnADM, s.f.)
Q1=N ( 25 % )
Q 2=N ( 50 % )
Q3=N ( 75 % )
N=número total de datos
R I =Q3−Q 1
Q 3=3
Q1=7
R I =7−3=4
d) Varianza:
Fórmula:
2 ∑ f ( x−μ )2
σ =
N
Donde:
19.8929089+9.277770888+1.3312544 +0.07096332+10.2253633+8.100805444+14.7932544
σ 2=
13
63.6923077
σ 2= =4.899
13
∑ ( x i−μ )2
σ=
√ N
σ =√ 4.899=2.2134
f) Coeficiente de variación
Sirve para comparar dos variables que tengan unidad de medida diferente. El
coeciente de variación equivale al cociente de la desviación estándar y el
promedio aritmético (UnADM, s.f.)
Fórmula:
σ
Cv= ∙ 100
μ
2.2134
Cv= ∙ 100=42.95
5.1538
Problema 2:
Calcula todas las medidas de tendencia central y dispersión que estudiaste en el pdf de la
Unidad 1, del curso de Estadística 1.
a) Media
Fórmula:
∑ f Xi
μ= i=1
N
En donde X i corresponde a la marca de clase se que se calcula sumando los dos extremos
del intervalo y dividiendo el resultado entre dos, una vez obtenida la marca de clase de cada
uno de nuestros intervalos podemos realizar nuestra tabla de frecuencias de la siguiente
manera:
1 25-37 4 4 31 124
2 37-49 6 10 43 258
3 49-61 17 27 55 935
4 61-73 25 52 67 1675
5 73-85 13 65 79 1027
total 65 4019
La suma de los productos de la marca de clase por su frecuencia es 4019, este dato se
divide entre el número total de datos que es 65:
4019
μ= =61.83
65
b) Mediana
N
( 2)
Me=Li + ( −F
fi
i −1
)
∗ai
Donde:
N
es decir
2
65
=32.5
2
Como el dato no está en nuestras frecuencias acumuladas, buscamos la mediana en el
número siguiente, por tanto ésta se encuentra en la clase 4, intervalo (61-73)
Li= 61
N= 65
F i−1 =¿ 27
f =¿ 25
a i=¿ 73-61=12
65
Me=61+
( 2)
(−27
)
∗12=63.64
25
c) Moda
Donde:
La moda es el dato que más se repite, checando las frecuencias absolutas podemos ver que
la frecuencia más grande es de 25, estando ubicada en la clase 4, por lo que:
Li= 61
f i=¿ 25
f i−1=¿ 17
f i+1=¿ 13
a i=¿ 12
25−17
Mo=61+ ∙12=65.8
( 25−17 )+(25−13)
Medidas de dispersión
a) Varianza
Fórmula:
2 ∑ ( x−μ )2 ∙ f
σ =
N
Nos apoyamos en nuestra tabla de frecuencias, en donde calcularemos la resta de la marca
de clase menos la media elevado al cuadrado y el resultado de ésta operación multiplicado
por la frecuencia:
Sustituyendo en la fórmula:
11223.14
σ 2= =172.66
65
b) Desviación estándar
Fórmula:
∑ ( x−μ )2 ∙ f
σ=
√ N
11223.14
σ=
√ 65
σ =√ 172.66
σ =13.14
c) Coeficiente de variación
Fórmula:
σ
Cv= ∙ 100
μ
13.14
Cv= ∙ 100=21.25
61.83
Problema 3:
4 3 19 17 3 11 8
7 6 2 10 2 9 6
4 24 7 9 9 2 4
7 11 4 7 5 7 9
3 5 11 6 3 5 4
9 3 14 15 11 8 1
Media
Fórmula:
∑ f Xi
μ= i=1
N
En donde X i corresponde a la marca de clase se que se calcula sumando los dos
extremos del intervalo y dividiendo el resultado entre dos, una vez obtenida la
marca de clase de cada uno de nuestros intervalos podemos realizar nuestra tabla
de frecuencias de la siguiente manera:
Lim Interval
Clase Lim Inf Sup o fi xi xi*fi
1 1 4 (1,4) 14 3 35
2 5 8 (5,8) 13 7 84.5
3 9 12 (9,12) 10 11 105
4 13 16 (13,16) 2 15 29
5 17 20 (17,20) 2 19 37
6 21 24 (21,24) 1 23 22.5
42 313
313
μ= =7.45
42
Mediana
N
( 2)
Me=Li + ( −F
fi
i −1
)
∗ai
Donde:
N
hasta la mitad, es decir
2
42
=21
2
Como el dato no está en nuestras frecuencias acumuladas, buscamos la mediana
en el número siguiente, por tanto ésta se encuentra en la clase 4, intervalo (61-73)
Li= 5
N= 42
F i−1 =¿ 14
f =¿ 13
a i=¿ 3
42
Me=5+
( 2)
(−14
∗3=6.62 )
13
Moda
f i−f i−1
Mo=Li+ ∙ ai
( f i−f 1−1 ) +(f 1−f i+1 )
Donde:
Li= 1
f i=¿ 14
f i−1=¿ 0
f i+1=¿ 13
a i=¿ 3
14−0
Mo=1+ ∙ 3=2.02
(14−0 ) +(14−13)
Medidas de dispersión
Varianza
Fórmula:
2 ∑ ( x−μ )2 ∙ f
σ =
N
Nos apoyamos en nuestra tabla de frecuencias, en donde calcularemos la resta de
la marca de clase menos la media elevado al cuadrado y el resultado de ésta
operación multiplicado por la frecuencia:
Sustituyendo en la fórmula:
3350
σ 2= =24.23
42
d) Desviación estándar
Fórmula:
∑ ( x−μ )2 ∙ f
σ=
√ N
3350
σ=
√ 42
σ =4.92
e) Coeficiente de variación
Fórmula:
σ
Cv= ∙ 100
μ
4.92
Cv= ∙ 100=66.05
7.45
Problema 4.
Se realiza una investigación en un Bachillerato tecnológico a 165 adolescentes de 15 a 17
años, donde se les preguntó, el número de horas a la semana (de lunes a domingo) que
pasan viendo videos en la nueva red social Tik Tok.
32 50 51 36 37 23 38 40 30 34 17
39 47 37 30 46 48 44 45 40 29 29
49 32 42 53 33 62 48 57 47 28 40
38 36 37 37 36 40 25 58 45 52 48
37 43 38 39 42 41 33 52 32 42 46
47 52 32 42 23 40 59 46 22 48 45
34 41 26 27 36 38 36 30 31 62 40
34 34 35 40 34 39 46 39 32 46 33
40 40 42 29 38 32 31 37 32 37 33
37 33 46 36 31 40 37 42 41 36 46
35 52 30 58 40 35 61 40 23 50 37
47 31 52 41 55 41 34 37 31 45 53
41 46 29 32 40 43 43 49 32 29 39
29 32 35 47 38 37 46 33 49 41 46
Moda: 38.18
Mediana: 39.26
Rango: 45
Varianza: 133.095
Lim interval
Clase Lim Inf Sup o fi xi xi∗fi x i 2 + fi
1 17 22 (17,22) 2 20 39 760.5
2 23 28 (23,28) 7 26 178.5 4551.75
36713.2
3 29 34 (29,34) 37 32 1165.5 5
66093.7
4 35 40 (35,40) 47 38 1762.5 5
58659.7
5 41 46 (41,46) 31 44 1348.5 5
6 47 52 (47,52) 20 50 990 49005
7 53 58 (53,58) 6 56 333 18481.5
8 59 64 (59,64) 4 62 246 15129
154 5484 215784
Imagen 1. Diagrama Circular. Tiempo que pasa un estudiante en Tik Tok (h). Fuente: elaboracion propia.
45
40
35
30
25
20
15
10
0
(17,22) (23,28) (29,34) (35,40) (41,46) (47,52) (53,58) (59,64)
Imagen 2. Gráfica de barras. Tiempo que pasa un estudiante en Tik Tok (h). Fuente: elaboracion propia.
Ojiva Ascendente
155
135
115
95
75
55
35
15
-5 1 2 3 4 5 6 7 8
-25
Imagen 3. Gráfica de ojiva ascendente. Tiempo que pasa un estudiante en Tik Tok (h). Fuente: elaboracion propia.
De acuerdo con Roldán (2002), la distribucion que se forma con los datos es
de tipo normal o campana normal.
Da 5 ejemplos aplicados a la ciencia, tecnología y/o vida académica, donde se use las
siguientes herramientas para estudios estadísticos:
a) Combinatoria.
1. En informática el análsis combinatorio es ampliamente usado para obtener fórmulas y
estimaciones de algoritmos.
b) Probabilidad
c) Series de Tiempo
CONCLUSIONES
Johnson, R., & Kuby, P. (2012). Estadística Elemental. (11a ed.). Distrito Federal,
México: Cengage Learning.
Laura. (6 de febrero de 2013). Función de distribución. La Guía Matemática.
[Link]
Rendón Macias, M. E., Villasis Keeve, M., & Miranda Novales, M. G. (2016).
Estadistica descriptiva. Revista Alegria Mexico, 397-407.
Sánchez Avillaneda, María del Rocío; Martínez Bravo, Ricardo. Aplicación del
modelo de series de tiempo a la prospección del servicio de referencia en
línea de la Biblioteca-IIMAS-UNAM. // Ibersid. (2009) 35-47. ISSN 1888-
0967. Recuperado de
[Link]
Webster, A.l. (2000). Estadística aplicada a los negocios y la economía. (3ra ed.) Santa
Fe de Bogotá. Colombia: Mc Graw-Hill.
Zhang, X., Zhang, T., Pei, J., Liu, Y., Li, X., & Medrano-Gracia, P. (2016). Time
Series Modelling of Syphilis Incidence in China from 2005 to 2012. PloS
one, 11(2), e0149401. [Link]
Las series de tiempo son fundamentales en la econometría porque permiten explicar y modelar resultados a niveles micro y macroeconómicos. Se utilizan para analizar fenómenos económicos continuos en el tiempo, generando pronósticos y evaluaciones de tendencias económicas que ayudan a comprender cómo ciertas variables afectan el entorno económico a largo plazo .
La bioestadística es fundamental en las investigaciones de salud porque proporciona herramientas analíticas cruciales para el análisis de datos en áreas como la epidemiología y los ensayos clínicos. Como los avances médicos y las decisiones clínicas se apoyan en análisis estadísticos, el conocimiento de la estadística descriptiva e inferencial es indispensable para alcanzar conclusiones válidas sobre la eficacia de tratamientos y el desarrollo de medicamentos .
La teoría combinatoria es una rama de las matemáticas que se ocupa del estudio de las formas de contar. Aunque no tiene una clasificación tajante de lo que constituye una subárea específica, comparte un grado de traslape con otras ramas de la matemática discreta. Así, diferentes autores proponen clasificaciones variadas para su estudio, resaltando su flexibilidad y aplicación en diversas áreas matemáticas .
Para calcular el coeficiente de variación, se divide la desviación estándar entre la media aritmética y se multiplica por 100 para expresar el resultado en porcentaje. Esta medida es útil para comparar la variación relativa de dos o más grupos de datos con diferentes unidades de medida, pues indica el grado de variabilidad en relación a la media del grupo .
La desviación estándar se calcula sacando la raíz cuadrada de la varianza. Es una medida más conveniente que la varianza porque expresa la variabilidad de los datos en las mismas unidades que el conjunto original, en lugar de unidades cuadráticas, lo cual facilita su interpretación y comparación con otros datos .
La inferencia paramétrica ayuda a estimar parámetros poblacionales basándose en una muestra representativa, evitando así la necesidad de estudiar toda la población. Los principales requisitos son conocer la distribución de la variable a estudiar y que los datos posean al menos una escala de intervalo. Esto permite aplicar modelos estadísticos paramétricos que proporcionan estimaciones fiables bajo las suposiciones adecuadas .
La estadística descriptiva se centra en describir, mostrar o resumir la información de un conjunto de datos mediante números, tablas o elementos gráficos sin intentar realizar generalizaciones más allá de los datos observados . Por otro lado, la estadística inferencial estudia el comportamiento de muestras para realizar generalizaciones inductivas y tomar decisiones sobre poblaciones más amplias a partir de la información de las muestras, utilizando la probabilidad como base .
La probabilidad y la estadística están interrelacionadas porque ambas estudian el azar desde el punto de vista matemático: la probabilidad ofrece modelos para entender fenómenos aleatorios y sus consecuencias lógicas, mientras la estadística utiliza estos modelos para comprender y analizar datos concretos. Así, el cálculo de probabilidades es una teoría matemática que se aplica en estadística para dar contenido concreto a las estimaciones y conclusiones basadas en datos .
La moda es una medida de tendencia central válida en datos agrupados porque representa la clase o intervalo que tiene la mayor frecuencia. Se calcula usando una fórmula que implica el límite inferior del intervalo modal, la frecuencia de la clase modal, y las frecuencias de las clases adyacentes. Esto permite identificar el valor más común en un conjunto de datos agrupados y proporciona información sobre la distribución de los datos .
Los analistas financieros utilizan información estadística, como la relación precio-ganancia o el rendimiento de los dividendos, para realizar comparaciones entre el mercado de valores y acciones individuales. Basándose en estos análisis, pueden determinar si una acción está por encima o por debajo de su valor real, lo que ayuda a emitir recomendaciones de compra o venta .