0% encontró este documento útil (0 votos)
103 vistas57 páginas

Mest1 U1 A1 XXXX

El documento presenta una introducción a una unidad sobre medidas de tendencia central y dispersión en estadística. Explica conceptos clave como media, moda, mediana, estadística descriptiva, estadística inferencial, probabilidad y combinatoria. También define series de tiempo y el software estadístico R. El objetivo es mostrar el aprendizaje de conceptos estadísticos fundamentales.

Cargado por

Luisa Mee 666
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
103 vistas57 páginas

Mest1 U1 A1 XXXX

El documento presenta una introducción a una unidad sobre medidas de tendencia central y dispersión en estadística. Explica conceptos clave como media, moda, mediana, estadística descriptiva, estadística inferencial, probabilidad y combinatoria. También define series de tiempo y el software estadístico R. El objetivo es mostrar el aprendizaje de conceptos estadísticos fundamentales.

Cargado por

Luisa Mee 666
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Universidad Abierta y a Distancia de

México

Estadística I

Ciudad de México, Noviembre del 2021

Unidad 1
Actividad 1
MEDIA, MODA Y MEDIANA

DOCENTE: CLAUDIO RAMÓN RODRÍGUEZ MONDRAGÓN


UNIDAD I
ACTIVIDAD 1
INTRODUCCION
El presente trabajo se presenta como evidencia de aprendizaje para la Unidad I de
la asignatura Estadística I perteneciente al programa de Licenciatura en
Matemáticas de la UnADM. El objetivo de este trabajo es mostrar la adquisición de
conocimientos significativos en materia de conceptos sobre estadística y medidas
de tendencia central y dispersión.. La estructura del trabajo es la siguiente: Se
presentara los enunciados de los problemas propuestos, seguido de su solución y
el argumento para llegar al resultado obtenido. Por último, se enunciaran unas
breves conclusiones acerca del tema.

DESARROLLO

1.- Investiga: (realiza una descripción de media cuartilla de cada inciso)

a) Estadística

La estadística es una disciplina científica que se ocupa de la obtención, orden y


análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones
sobre fenómenos observados. consiste en métodos, procedimientos y fórmulas
que permiten recolectar información para luego analizarla y extraer de ella
conclusiones relevantes. Se puede decir que es la Ciencia de los Datos y que su
principal objetivo es mejorar la comprensión de los hechos a partir de la
información disponible. Asimismo, el autor comenta que la estadística NO es una
rama de las matemáticas. Utiliza herramientas de las matemáticas del mismo
modo que lo hace la física, la ingeniería o la economía, pero eso no las hace ser
parte de las matemáticas. Es cierto que tienen una relación estrecha, pero la
estadística y las matemáticas son disciplinas diferentes. ayuda a obtener
conclusiones relevantes para el estudio de todo tipo de agentes como: humanos,
animales, plantas, etc. Generalmente lo hace a través de muestras estadísticas.
[CITATION Est21 \l 1033 ].
La estadística es un área muy amplia y muy diversa de las matemáticas. Sus
aplicaciones han abarcado prácticamente todas las disciplinas del quehacer
humano. La estadística es la ciencia que se encarga de recolectar, organizar,
resumir y analizar datos para obtener ciertas afirmaciones a partir de ellos. En su
perspectiva clásica, la estadística se clasifica en dos grandes ramas llamadas:
estadística descriptiva y estadística inferencial[ CITATION Rin19 \l 1033 ].

b) Estadística descriptiva

Es la rama de la estadística que formula recomendaciones de cómo resumir, de


forma clara y sencilla, los datos de una investigación en cuadros, tablas, figuras o
gráficos. Antes de realizar un análisis descriptivo es primordial retomar el o los
objetivos de la investigación, así como identificar las escalas de medición de las
distintas variables que fueron registradas en el estudio. El objetivo de las tablas o
cuadros es proporcionar información puntual de los resultados. Las gráficas
muestran las tendencias y pueden ser histogramas, representaciones en “pastel”,
“cajas con bigotes”, gráficos de líneas o de puntos de dispersión. Las imágenes
sirven para dar ejemplos de conceptos o reforzar hechos. La selección de un
cuadro, gráfico o imagen debe basarse en los objetivos del estudio[ CITATION
Ren16 \l 1033 ].
En la estadística descriptiva se estudian técnicas que ayudan a describir, mostrar
o resumir la información de un conjunto de datos. Los procedimientos de la
estadística descriptiva ayudan a comprender la información de una manera breve
y resumida, y es particularmente útil cuando la cantidad de datos es grande. Esta
descripción de la información se lleva a cabo a través de números, tablas o
elementos gráficos. Las conclusiones que se obtienen se refieren únicamente a la
muestra observada y no a la población completa[ CITATION Rin19 \l 1033 ].

c) Estadística inferencial
Es la rama de la Estadística que estudia el comportamiento y propiedades
de las muestras y la posibilidad, y límites, de la generalización de los
resultados obtenidos a partir de aquellas a las poblaciones que representan.
Esta generalización de tipo inductivo, se basa en la probabilidad. También
se le llama también Estadística Matemática, por su complejidad matemática
en relación a la Estadística Descriptiva. Tiene como objetivo, generalizar las
propiedades de la población bajo estudio, basado en los resultados de una
muestra representativa de la población[ CITATION Nol08 \l 1033 ].

La estadística inferencial se enfoca en la toma de decisiones o realización de


generalizaciones acerca de las características de todas las observaciones
bajo consideración con base en información parcial o incompleta[ CITATION Por17
\l 1033 ].

d) Probabilidad
El concepto de probabilidad aparece ligado en sus orígenes a los juegos de azar,
razón por la cual se tiene constancia del mismo desde tiempos remotos. A lo largo
de la historia se han hecho muchos y muy diversos intentos para formalizarlo,
dando lugar a otras tantas definiciones de probabilidad que adolecían todas ellas
de haber sido confeccionadas ad hoc, careciendo por tanto de la generalidad
suficiente que permitiera utilizarlas en cualquier contexto. La Teoría de la
Probabilidad nos permitirá la obtención de modelos aleatorios o estocásticos
mediante los cuales podremos conocer, en términos de probabilidad, el
comportamiento de los fenómenos aleatorios[ CITATION Mon07 \l 1033 ].
La teoría de la probabilidad es la parte de las matemáticas que se encarga del
estudio de los fenómenos o experimentos aleatorios. Por experimento aleatorio
entenderemos todo aquel experimento que cuando se le repite bajo las mismas
condiciones iniciales, el resultado que se obtiene no siempre es el
mismo[ CITATION Rin07 \l 1033 ].
e) Combinatoria
La Teoría Combinatoria es la rama de las matemáticas que se ocupa del estudio
de las formas de contar. No existe una clasificación tajante de lo que constituye
una subárea, sino que todas comparten cierto grado de traslape entre sí, al igual
que con otras ramas de la matemática discreta. Diferentes autores proponen
varias divisiones de la combinatoria por lo que cualquier listado es meramente
indicativo[ CITATION Ort09 \l 1033 ].
Es la parte de las Matemáticas que estudia las diversas formas de realizar
agrupaciones con los elementos de un conjunto, formándolas y calculando su
número. Existen distintas formas de realizar estas agrupaciones, según se repitan
los elementos o no, según se puedan tomar todos los elementos de que
disponemos o no y si influye o no el orden de colocación de los
elementos[ CITATION Bjo10 \l 1033 ].
f) Series del tiempo
Las series de tiempo son una de las herramientas matemáticas más básicas y
versátiles en los negocios. Para explicarlo de modo simple, una serie de tiempo
consiste en una serie de puntos de datos indexados en el tiempo. Este tipo de
series, por lo tanto, pueden modelar lo que sea, desde la evolución de las ventas
de una empresa hasta la evolución de los precios de sus productos en base anual,
mensual, diaria o incluso por hora. Las series de tiempo son particularmente
intuitivas, lo que las hace ideales para describir, visualizar, modelar y, por último,
pronosticar un número de variables. Las series de tiempo se utilizan
principalmente con una función descriptiva, ya que pueden condensar una gran
cantidad de información en un solo gráfico o tabla[ CITATION Bar \l 1033 ].
Las series de tiempo a menudo se utilizan también para leer y visualizar datos, así
como para comparar diferentes series. De nuevo, las desventajas de esos gráficos
yace en su aparente simplicidad. Es posible utilizar diferentes técnicas de mapeo
para proporcionar la mejor visualización posible de los datos. Las series de tiempo
a menudo se utilizan para respaldar modelos estadísticos. El objetivo de estos
modelos es doble: explicar el pasado y pronosticar el futuro. Existen tres tipos
principales de pronósticos, cada uno de los cuales tiene finalidades
diferentes[ CITATION Bar \l 1033 ].
 Los pronósticos de punto tienen como objetivo proporcionar el "mejor" valor
futuro de una variable de acuerdo con una métrica de error especificada. Es
el caso del pronóstico del tiempo meteorológico, por ejemplo, que para
cada día pronostica un único valor de temperatura. Un pronóstico de punto
no busca representar de modo fiel la evolución de esta variable (el lector
sabe bien que es probable que la temperatura varíe en torno a ese valor
pronosticado), pero sirve como indicación útil para el lector y es una base
sólida para tomar decisiones futuras[ CITATION Bar \l 1033 ].
 Los pronósticos probabilísticos proporcionan todas las distribuciones de
probabilidad del valor futuro. A menudo se utilizan intervalos de confianza
para visualizar esos pronósticos, que pueden ser útiles, por ejemplo, para
fines especulativos[ CITATION Bar \l 1033 ].
 Los pronósticos generativos hace que la evolución de la variable parezca
"natural" o "plausible", dejando margen para un cierto grado de
contingencia y evolución aleatoria. Esta "perspectiva generativa" puede ser
útil cuando se realizan simulaciones[ CITATION Bar \l 1033 ].

g) Software estadístico “R”


R es un lenguaje de programación que permite realizar análisis de datos
escribiendo scripts y funciones. R es un lenguaje interactivo orientado a objetos,
este ha sido diseñado por estadísticos para los estadísticos. El lenguaje
proporciona objetos, operadores y funciones que hacen que el proceso de
exploración, modelado y visualización de datos sea natural. Los análisis completos
de datos a menudo pueden ser representados en unas pocas líneas de
código[ CITATION Par02 \l 1033 ].
R es un lenguaje Orientado a Objetos: bajo este complejo termino se esconde la
simplicidad y flexibilidad de R. Orientado a Objetos significa que las variables,
datos, funciones, resultados, etc., se guardan en la memoria activa del
computador en forma de objetos con un nombre específico. El usuario puede
modificar o manipular estos objetos con operadores. R posee muchas funciones
para análisis estadísticos y gráficos; estos últimos pueden ser visualizados de
manera inmediata en su propia ventana y ser guardados en varios formatos. El
lenguaje R permite al usuario, por ejemplo, programar bucles (’loops’ en inglés)
para analizar conjuntos sucesivos de datos. También es posible combinar en un
solo programa diferentes funciones estadísticas para realizar análisis más
complejos[ CITATION Par02 \l 1033 ].
h) Estocástica
Se denomina estocástico al sistema cuyo comportamiento es intrínsecamente no
determinista. En términos mucho más sencillos, un proceso estocástico es aquel
que no se puede predecir[ CITATION Edu21 \l 1033 ].
Un proceso estocástico es un conjunto de variables aleatorias que depende de un
parámetro o de un argumento. En el análisis de series temporales, ese parámetro
es el tiempo. Formalmente, se define como una familia de variables aleatorias Y
indiciadas por el tiempo, t. Tales que para cada valor de t, Y tiene una distribución
de probabilidad dada. Es aquel cuyo comportamiento es no determinista, en la
medida que el subsiguiente estado del sistema está determinado tanto por las
acciones predecibles del proceso como por elementos aleatorios[ CITATION
Lop17 \l 1033 ].
De acuerdo con Lopez (2021), existen dos tipos de procesos estocásticos. La
diferencia entre los mismos, tiene que ver con predictibilidad de una serie
temporal:
 Procesos estocásticos estacionarios: Un proceso estocástico estacionario
es aquel cuya distribución de probabilidad varía de forma más o menos
constante a lo largo de cierto periodo de tiempo. Con otras palabras, una
serie de números puede parecer (y ser) caótica pero tomar valores dentro
de un rango limitado. A través de esta información se pueden realizar
modelos que intenten predecir la variable.
 Procesos estocásticos no estacionarios: Un proceso estocástico no
estacionario es aquel cuya distribución de probabilidad varía de forma no
constante. En términos generales, sería impredecible.

2.- Investiga:
a)  La historia de la Estadística.

Aunque no podemos saber con precisión histórica los orígenes mismos de la


estadística, si es posible señalar que desde el origen mismo de la civilización han
existido representaciones gráficas en diversos medios para contar ya sean
personas, animales o cosas. En la isla de Cerdeña, donde se tiene registros
históricos que datan desde el paleolítico inferior, existen monumentos en los
cuales se pueden encontrar grabados de signos que probablemente servían para
llevar la contabilidad del ganado y la caza de los primeros habitantes de aquella
isla (Salazar y del Castillo, 2018).

Ahora bien, el desarrollo del quehacer estadístico inició, según Barreto-Villanueva


(2012) hasta el siglo XVI, con la publicación de Liberde Ludo Aleae de Girolamo
Cardamo. Por su parte, el término Estadística se conoció hasta el siglo XVI,
procedente del italiano statista, o persona dedicada a los asuntos del Estado y
cuyas funciones principales de los gobiernos eran las de establecer registros de
población, de impuestos, de cosechas, entre otros datos necesarios sobre sus
súbditos y sus condiciones materiales de existencia.

Otras fuentes señalan que el término Estadística, proviene del alemán statistik,
con Gotfried A. Achenwall, quien en 1752 utilizó por primera vez este término para
esta nueva rama del conocimiento. (Levin y Rubin, 2004)

Cabe señalar que en Londres, en 1662, existió un mercader de nombre John


Graunt, quien publicó un tratado en el que recopila las cifras brutas de nacimientos
y defunciones ocurridas en dicha ciudad durante 1604 a 1661, relacionándolas con
causas naturales sociales y políticas. Su obra de nombre Natural and Political
Observations upon the Bills of Mortality es considerada el primer trabajo
estadístico formal sobre la población. Por otra parte, personajes como B. Pascal
(1623-1662), C. Huygens (1629-1695) y Abraham de Moive (1667-1754), también
hicieron publicaciones sobre esos temas por lo que podría decirse que tanto en
Londres como en París se estaban construyendo de manera simultanea lo que
hoy conocemos como estadística y probabilidad. (Salazar y del Castillo, 2018)
En el siglo XIX, surge una nueva fase de desarrollo del quehacer estadístico a
partir de la generalización del método científico. Investigadores como Galton y
Pearson, contribuyeron al paso de la estadística deductiva a la estadística
deductiva. Más tarde, Ronald Fisher, considerado por muchos como el “padre de
la Estadística moderna” fue uno de los investigadores más destacados al
incursionar en áreas de conocimiento como la Genética y la Agronomía, haciendo
grandes aportaciones a la Estadística, dotándola de esta manera del estatus de
ciencia que hoy en día tiene. (Barreto-Villanueva, 2012)

Los progresos más recientes en el campo de la Estadística se refieren al ulterior


desarrollo del cálculo de probabilidades, considerándose en esta línea histórica el
trabajo del matemático ruso A. N. Kolmogorov quien desarrolló nuevos métodos
entre los que destacan la Teoría de juegos, la Ley de los grandes números, el
análisis de series temporales, el diseño de muestras, el cálculo de probabilidades,
entre otros. Hoy en día, la estadística con las nuevas tecnologías, el centro de
gravedad de la estadística se aplica a técnicas donde se involucran grandes
masas de datos, considerándose el método estadístico según Salazar y del
Castillo (2018) “un proceso iterativo de búsqueda del modelo ideal”.

b)  Culturas de la antigüedad que tengan registros estadísticos de sus poblaciones.

 Cultura babilónica: Alrededor del 3000 a.C., se tiene registro de que los
antiguos babilonios recopilaban datos en tablas de arcilla sobre su
producción agricola y los artículos que vendían o intercambiaban.

 Cultura egipcia: los antiguos egipcios recopilaban y analizaban datos


referentes a la población y su ingreso mediante la realización continua de
censos.

 Hebros: Según el antiguo testamento, cuando los hebreos huyen de Egipto,


Moisés realiza según las órdenes de Jehová, un gran censo tal como lo
detalla el libro de Números correspondiente al Pentateuco describiendo “por
cabezas los hombres de todos los varones aptos para el servicio de armas
de Israel”.

 Cultura china: se tienen registro de censos ordenados por el emperador


Tao alrededor del 2200 a.C.

 Romanos: ya instaurada la República romana, por el año 500 a.C., se crea


la figura del censor, funcionario que se encargaba de conocer la población
existente distribuida por todo el territorio romano.

c)  Menciona a los grandes matemáticos de todos los tiempos que establecieron a la


Estadística como herramienta al servicio del hombre.

 John Graunt (1620-1674) en 1662 publica su obra “Natural and Political


Observations” donde recopila las cifras de nacimientos y defunciones en
Londres. Se considera el primer trabajo estadístico serio sobre la población
y sienta las bases del análisis de datos.

 Blaise Pascal (1623-1662) estudios sobre la teoría de la probabilidad

 C. Huygens (1629-1695) al igual que Pascal, fue uno de los pioneros en el


estudio de la probabilidad.

 Edmund Halley (1656-1742). Presenta primera tabla de mortalidad para las


compañías de seguros. Se considera como base de los estudios
contemporáneos.

 Galton (1822-1911) generalización del método para estudiar fenómenos


naturales y sociales.

 Pearson (1857-1936) Junto con Galton, se les considera los padres de la


estadística moderna.
 R.A. Fisher. Establece los fundamentos de la estadística actual,
especiamente los métodos de inferencias. (Salazar y del Castillo, 2018)

d)  En la actualidad, menciona cinco estudios científicos en los cuales la estadística es


una ciencia fuerte e indispensable.

1. Bioestadística: La estadística aplicada a las ciencias biológicas dentro de las


cuales se encuentran todas las ciencias de la salud, se denomina
Bioestadí[Link] continuos avances médicos han hecho que esta disciplina sea
fundamental en áreas como la epidemiologia y los ensayos clínicos que involucran
el desarrollo de medicamentos y procesos tecnológicos para el avance de la
medicina. Su importancia radica en que la mayoría de las investigaciones en salud
y las decisiones clínicas se apoyan en análisis estadísticos; por lo que resulta
indispensable conocer elementos básicos tanto de estadística descriptiva como
inferencial (Lam, 2018).

2. Economía: En la ciencia económica se necesitan realizar pronósticos acerca del


futuro a nivel tanto micro como macroeconómico para lo cual, es necesario usar
datos estadísticos, por ejemplo; si se quiere hacer un pronóstico de la tasa de
inflación en un momento dado, los economistas recurren a información estadística
como el IPC, tasa de desampleo y la capacidad de producción (Anderson, Sweeny
y Williams, 2008).

3. Finanzas: Los analistas financieros emplean información estadística como guía


para sus recomendaciones de inversión. Por ejemplo, para comprar o vender
acciones, el analista debe revisar algunos datos financieros como son la relación
precio-ganancia y el rendimiento de los dividendos; al comparar información de
una acción con la informción sobre el promedio en el mercado de valores, puede
obtener las conclusiones necesarias para conocer si una acción está por debajo o
por encima de su valor (Anderson, et al., 2008)

4. Demografía: Es aquella disciplina que estudia a la población en su conjunto y


que necesita la aplicación de técnicas de análisis estadístico que responden a los
fines de los estudios poblacionales por las características de los fenómenos
analizados y a las variables involucradas, por su comportamiento en el tiempo, por
la necesidad de relacionar sus variables entre sí y con variables de otras
disciplinas, además de la necesidad de incorporar análisis de series cronológicas,
estimación de tiempos de espera así como diseño muestral e inferencial. (Alsina,
2010)

5. Marketing: Existen algunos escáneres en las cajas de comercios que pueden


recopilar datos que sirven en una investigación de mercado. Algunos comercios
minoristas pueden vender estos datos para que posteriormente sean procesados y
con ellos se hagan resúmenes estadisticos para que los administradores de las
empresas puedan revisarlos y poder crear una estrategia de promoción y ventas
de ciertos productos.(Anderson et al., 2008)

e)  Investiga 10 procesos científicos modernos, en donde la estadística estudia


estadística descriptiva:

1. Demografía: Censos de población y vivienda

2. Economía: Elaboración de indicadores macroeconómicos.

3. Control de calidad: para conocer la capacidad de un proceso, se utiliza la


estadística descriptiva para advertir la amplitud de la variación natural del proceso
para saber en qué medida tal característica de calidad cumple especificaciones.

4. Marketing: Una empresa quiere conocer las preferencias de los consumidores a


través de datos de ventas.

5. Finanzas: un analista financiero que desea determinar el estado económico de las


empresas participantes en una industria

[Link]ística: estadisticas de morbilidad

7. Bioestadística: Estadísticas de hechos biológicos con trascendencia sanitaria


8. Física: la estadística descriptiva se usa en modelos de termodinámica con
comoplejidad.

9. Área industrial/laboral: Se utilizan estudios de estadística descriptiva para conocer


la edad de los trabajadores para saber cuándo solicitarán su retiro y determinar
cuándo contratar uno nuevo.

10. Psicología: Conocer el porcentaje de persona que sufren depresión en la Ciudad


de México para efectos de determinar las bajas laborales por dicha enfermedad.

f)  Investiga 10 procesos científicos modernos, en donde la estadística estudia


estadística inferencial.

1. Demografía: Conteos rápidos en jornadas electorales

2. Marketing: Encuestas a un grupo reducido de consumidores para conocer sus


preferencias

3. Psicología: cuando se quiere determinar cuál mejor procedimiento de


capacitación laboral que se usan en dos empresas para elevar el rendimiento de
los obreros y poder implantarlo en todas las empresas del país.

4. Negocios: encuestas para inferir las diferencias en comportamiento de


consumidores por género, por niveles educativos, niveles de ingreso, etc.

5. Pedagogía: La estadística inferencial contribuye a la investigación pedagógica


empírica para diseñar programas educativos así como su medición, evaluación y
diagnóstico.

6. Derecho: La estadística inferencial sirve a estudios de prevención de delitos.

7. Epidemiología médica: A partir de datos que otorga la estadística descriptiva


sobre una población determinada afectada por alguna enfermedad, la
epidemiología puede sacar conclusiones sobre las medidas públicas necesarias
para evitar su expansión.

8. Auditorías contables: El muestreo estadístico es un instrumento muy útil que


ayuda al auditor a examinar con eficiencia y eficacia los estados financieros sin
necesidad de evaluar el 100% de los datos contables generados por la empresa
auditada.

9. Finanzas: predicción del comportamiento de la bolsa de valores.

10. Mecánica estadística: aplica la teoría de la probabilidad, hacer predicciones


basadas en las propiedades macroscópicas microscópicas de poblaciones de
partículas.

g)  Investiga 10 procesos de la vida del hombre moderno donde se analizan datos a


través de las Series de Tiempo.

1. Redes de comunicación: En las redes modernas de comunicaciones es


importante poder aplicar modelos estadísticos con series de tiempo para explicar
la relación que existe entre la capacidad de la red, el tráfico y el nivel de
desempeño que la misma puede alcanzar.

2. Economía: a través de las series de tiempo, se pueden explicar , los resultados


de modelos econométricos a nivel micro y macroeconómico para determinar sus
alcances y limitaciones.

3. Epidemiología: Un investigador requiere conocer el número de casos de


influenza observados en un periodo de tiempo determinado y si a estos se les
puede relacionar con algún tipo de estacionalidad.

4. Demografía: se emplea el análisis de series de tiempo para analizar la evolución


de la población, los nacimientos, defunciones, el número de personas con
estudios, etc.
5. Meteorología: para calcular la temperatura máxima diaria.

6. Geofísica: series sismológicas.

7. Química: se recurre a las series de tiempo para conocer la temperatura de un


proceso.

8. Marketing: las series de tiempo son muy útiles para predecir ventas. 9.
Telecomunicaciones: análisis de señales.

10. Economía: indicadores del nivel de producción.

3. Responde:
a) ¿Cuál es la estadística paramétrica? Menciona 3 ejemplos de métodos
paramétricos.
La estadística paramétrica, como parte de la inferencia estadística, trata de
estimar determinados parámetros de una población de datos. La estimación, como
casi siempre en estadística, se realiza sobre una muestra estadística. Ahora bien,
la estadística paramétrica siempre basa sus cálculos suponiendo que la
distribución de la variable a estudiar es conocida (López, 2019).
La mayoría de procedimientos paramétricos requiere conocer la forma de
distribución para las mediciones resultantes de la población estudiada. Para la
inferencia paramétrica es requerida como mínimo una escala de intervalo, esto
quiere decir que nuestros datos deben tener un orden y una numeración del
intervalo.
b) ¿Cuál es la estadística no paramétrica? Menciona algún método no
paramétrico.
Las pruebas no paramétricas engloban una serie de pruebas estadísticas que
tienen como denominador común la ausencia de asunciones acerca de la ley de
probabilidad que sigue la población de la que ha sido extraída la muestra. Por esta
razón es común referirse a ellas como pruebas de distribución libre.
A continuación, se presenta un esquema grafico donde se muestran algunos tipos
de estudios paramétricos y su equivalente no paramétrico:
Figura 1. Métodos paramétricos y su equivalente no paramétrico. Fuente: Bautista, et. al (2020)

c) ¿Comenta el por qué la estadística, depende los estudios de probabilidad?


d) ¿Por qué la Estadística y la Probabilidad van de la mano?
Las dos cuestiones anteriores se responden a continuación:
La Probabilidad y la Estadística se encargan del estudio del azar desde el punto
de vista de las matemáticas:
 La Probabilidad propone modelos para los fenómenos aleatorios, es decir,
los que se pueden predecir con certeza, y estudia sus consecuencias
lógicas.
 La Estadística ofrece métodos y técnicas que permiten entender los datos a
partir de modelos.

De esta manera, el Cálculo de las Probabilidades es una teoría matemática y la


Estadística es una ciencia aplicada donde hay que dar un contenido concreto a la
noción de probabilidad.
En este sentido, el cálculo científico de probabilidades puede ayudarnos a
comprender lo que en ocasiones la intuición nos indica de manera errónea.
Cuando hablamos de estadística, se suele pensar en un conjunto de datos
numéricos presentada de forma ordenada y sistemática. La Estadística se ocupa
de los métodos y procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar los datos (Estadística Descriptiva), siempre y cuando la
variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de
realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de
decisiones y en su caso formular predicciones ( Estadística Inferencial)[ CITATION
Pas08 \l 1033 ].

4.- Definir:

a) Inferir

Según la Real Academia Española (2001), inferir significa deducir algo o sacarlo como
conclusión de otra cosa.
Por su parte, según el glosario básico de términos estadísticos del Instituto Nacional de
Estadística e Informática de Perú (INEI,2006), la inferencia estadística es un proceso por
medio del cual se obtienen conclusiones respecto a una población a partir de datos
observados en muestras.

b) Muestra
Según Salazar y del Castillo (2018), una muestra es un conjunto de elementos tomados de
una población de acuerdo a un método previamente establecido conocido como muestreo,
con el fin de obtener conclusiones que son válidas para toda la población.

c) Muestra representativa
Una muestra representativa es aquella que se obtiene de tal manera que todos los elementos
del conjunto tienen la misma oportunidad de ser seleccionados (Johnson y Kuby, 2008)
d) Población.

Según Mario Triola (2013), la población es “el conjunto completo de todos los
elementos que se someten a estudio”; este conjunto incluye a todos los elementos
que se estudiarán.
Por su parte, Salazar y del Castillo (2018) señala que la población es el conjunto
que abarca a todos los elementos cuyas características queremos estudiar o
describir y del cual se necesita establecer conclusiones. Por su tamaño, las
poblaciones pueden ser finitas o infinitas.

Para Jonhson y Kuby (2008), la población es el conjunto completo de individuos u


objetos de interés para quien obtiene los datos de una muestra; la población debe
defiirse especificando la lista de los elementos que pertenecen a ella. Cuando se
puede enumerar a todos los elementos que la componen se dice que la población
es finita, de lo contrario, estamos ante el caso de una población infinita.

5. Realiza un cuadro comparativo y/u organizativo de:

Fórmulas de Medidas de Tendencia Central y de Medidas de Dispersión, para


población. Y muestra, y para datos agrupados y no agrupados.

Tipo Medida Datos no Agrupados Datos Agrupados


Medidas Media x 1+ …+ x n 1 n x 1 n1 +…+ x k nk k
x́= = ∑ xi x́= =∑ f i xi
de n n i=1 n1 +…+ nk i=1

Tendencia Si el conjunto de datos Cuando la distribución de


corresponde a toda la valores se expresa en una
Central población la media aritmética tabla de intervalos de clase, la
se denota con μ. A μ también media ponderada se aproxima
se le llama media poblacional usando las marcas de
mientras que a x́ se le llama clase[ CITATION Vel11 \l 1033
media muestral[ CITATION ]:
k
Vel11 \l 1033 ].
∑ x ' i ni
i=1
x́ ≈
n1 +…+ nk

Mediana Para un grupo de n datos La mediana se encuentra en


ordenados que conforman el intervalo donde la
una muestra, la mediana M e frecuencia acumulada llega
es el valor que ocupa la hasta la mitad de la suma de
posición central si n es impar, las frecuencias absolutas.
y es el promedio de los dos N
−Fi −1
2
datos centrales si n es M e =Li + ⋅ ai
fi
par[ CITATION Vel11 \l
Donde: Li es el límite inferior
1033 ].
de la clase donde se

N
encuentra la mediana, es la
2
semisuma de las frecuencias
absolutas, f i es la frecuencia
absoluta de la clase mediana,
F i−1 es la frecuencia
acumulada anterior a la clase
mediana y a i es la amplitud de
la clase[ CITATION Ren16 \l
1033 ].
Moda La moda de una distribución Se elige el intervalo de clase
se define como el valor de la de mayor frecuencia:
variable que más se
repite[ CITATION Vel11 \l ∆1
1033 ].
M O=Li +
[ ]
∆ 1+ ∆ 2
⋅c

Donde: Li es el límite inferior


de la clase modal, ∆ 1 es la
diferencia entre la mayor
frecuencia y la anterior, ∆ 2 es
la diferencia entre la mayor
frecuencia y la que le sigue y
c es la amplitud de
clase[ CITATION Fue08 \l 1033
].
Medidas Rango de El rango o recorrido de un El rango o recorrido de un
de variación. conjunto de datos es la conjunto de datos es la
Dispersió diferencia entre el dato diferencia entre el dato mayor
n mayor y el dato y el dato menor[ CITATION
menor[ CITATION Vel11 \l Vel11 \l 1033 ].
1033 ].
Varianza La varianza indica cómo De acuerdo con Veliz (2011),
están dispersos los datos la varianza para datos
respecto de su agrupados se calcula como:
n
media[ CITATION Vel11 \l
∑ ( xi −x́ ) 2 f i
1033 ]. σ =
2 i=1
N
Para una muestra:
n

∑ ( xi −x́)
s = i=1
2
n−1
Para una población:
n

∑ (x ¿¿ i−μ)2
σ 2= i=1 ¿
N
Desviación La raíz cuadrada de la n

estándar varianza se
llama desviación estándar
σ=
√ ∑ ( x i− x́ )2 f i
i=1
N
poblacional y muestral,
respectivamente[ CITATION
Vel11 \l 1033 ].
Para una muestra:
s= √ s2
Para una población:
σ =√ σ 2
Cuartiles Los cuartiles son los tres Para datos agrupados, se
valores de la variable que sigue la misma lógica, dividir
dividen a un conjunto de en cuatro partes.
datos ordenados en cuatro k ⋅N
−Fi−1
4
partes iguales[ CITATION Qk =Li + ⋅a i
fi
Vel11 \l 1033 ].
Rango Es el intervalo entre dos
Inter cuartil cuartiles.
Qk −Qk+1
Coeficient Es una medida relativa que
e de toma en cuenta la dispersión
Variación con respecto a la magnitud
de la media.
Para una muestra:
s
CV = ∗100
|x́|
Para una población:
σ
CV = ∗100
|μ|

6.- Investiga la definición de:

a) Media
Es una medida de posición o localización, también conocida como valor promedio
de una variable; proporciona una medida de localización central de los datos ya
sea de una muestra o de una población (Anderson et al., 2008)

b) Mediana

Medida de tendencia central que divide al conjunto de datos ordenados, en


aproximadamente dos partes: 50% de valores son inferiores y otro 50% son
superiores (INEI, 2006)

c) Moda

La moda de un conjunto de datos cuantitativos es el valor que ocurre con más


frecuencia en dicho conjunto (Devore, 2008)

Por otra parte, Salazar y del Castillo (2018) define a la moda como el valor de la
observación que tiene la mayor frecuencia. Es otra medida de tendencia central
con una determinación muy sencilla ya que es fijada por la ubicación del elemento
que más veces aparece en el estudio.

d)  Varianza

La varianza de un conjunto de datos es una medida de variación igual al cuadrado de la


desviación estándar (Triola, 2013)

Anderson et al., (2008), definen a la varianza como la medida de variabilidad que


utiliza todos los datos y que está basada en la diferencia entre el valor de cada
observación ( x i) y la media, dicha diferencia se le conoce como desviación
respecto a la media y la varianza no es más que dicha desviación elevada al

Si los datos son de una población, el promedio de estas desviaciones al cuadrado


es la varianza poblacional, misma que se denota con la letra σ 2y su fórmula es:
2 ∑( x i−μ)2
σ =
N

Si los datos provienen de una muestra, se calcula la varianza muestral con la


siguiente fórmula:

2 ∑(x i− x́)2
s=
n−1

e)  Covarianza

El INEI (2006) define a la covarianza como una medida descriptiva de la asociación lineal
entre dos variables.

En una muestra de tamaño n con observaciones ( x 1 , y 1 ),( x 2 , y 2 ), etc., la covarianza


muestral se define como sigue:

∑( x i− x́ )( y i− ý )
s xy =
n−1

Esta fórmula aparea cada x i con una y i. Después se suman los productos

obtenidos al multiplicar la desviación de cada x i de su media muestral x́ por la

desviación de la y icorrespondiente de su media muestral ý; esta suma se divide


entre n−1.

La fórmula para calcular la covarianza de una población de tamaño N difiere en la


notación usada para indicar que se está trabajando con toda la población:

∑( xi −μ x )( y i−μ y )
σ xy =
N

Donde μ x es la media poblacional de la variable x y μ y es la media poblacional de

la variable y. La covarianza σ xy está definida para una población de tamaño N.


Si el valor de s xy es positivo, significa que existe una asociación lineal positiva
entre x y y; en otras palabras, a medida que el valor de x aumenta, el valor de y
aumenta. Si s xy es negativo, existe una asociación lineal negativa entre x y y; o

sea, a medida que el valor de x aumenta, el valor de y disminuye. Por último, si s xy


tiene un valor cercano a cero, significa que no hay asociación lineal entre x y y
(Anderson et al., 2008)

f)  Desviación estándar

Se define como la raíz cuadrada positiva de la varianza. Empleamos s para


expresar la desviación estándar muestral y σ para expresar la desviación estándar
poblacional. La desviación estándar se mide en las mismas unidades que los
datos originales lo que facilita la comparación de la desviación estándar con la
media y con otros estadísticos que se miden en las mismas unidades que los
datos originales. (Anderson et al., 2018)

g)  Desviación media

Según Muñoz, Vicente y Muñoz (2010), se define como la media de los valores
absolutos de las desviaciones respecto a la media aritmética; se denota como D x́ y
viene dada por la siguiente fórmula:

r
ni
D x́ =∑ |x i−x́|
i=1 N

h)  Desviación típica

Es la medida de dispersión más importante en estadística; una desviación típica


pequeña significa que todos los valores de la distribución se encuentran próximos
a la media; en cambio, una desviación típica elevada significa la existencia de
valores muy alejados de la media. (Muñoz et al., 2010)

i) Medidas de posición
Las medidas de posición o localización resumen características generales de la
ubicación de la distribución de los datos dentro de un conjunto de valores posibles.
Estas pueden ser de tendencia central y no central. (INEI, 2006)

j)  Cuartil

Como lo señala Devore (2008), en ocasiones necesitamos obtener medidas de ubicación


más finas que la mediana que divide una serie de datos en dos partes iguales; los cuartiles
son los puntos que dividen nuestro conjunto de datos en cuatro partes iguales, conteniendo
de esta manera cada parte un 25% de las observaciones.

Los cuartiles estan definidos como el percentil 25, el percentil 50 y el percentil 75. Las
observaciones arriba del tercer cuartil constituyen el cuarto superior de nuestra serie de
datos, el segundo cuartil coincide con la mediana y el primer cuartil separa el cuarto
inferior de los tres cuartos superiores.

k)  Percentil

Medida de localización que resulta de dividir el conjunto de datos en 100 partes


iguales. Cada parte representa al 1% del total (INEI, 2006)

Un percentil aporta información acerca de la dispersión de los datos en el intervalo


que va del menor al mayor valor de los datos. (Anderson et al., 2008)

l)  Decil

Medida de posición no central que representan los nueve puntos que dividen la
distribución en diez, de forma tal que dentro de cada una, están incluidos el 10%
de los datos; por tanto, un decil es un valor que representa la décima parte de un
conjunto de información (INEI, 2006)

m)  Coeficiente de variación
Según Anderson et al., (2008), el coeficiente de variación es un estadístico descriptivo
que mide qué tan grande es la desviación estándar en relación con la media. Esta
medida se representa como porcentaje y se calcula a través de la fórmula:

( Desviación
Media
estándar
× 100 ) %

n)  Diagrama de caja.

Según el glosario básico de términos estadísticos (2006) el diagrama de caja es


un gráfico del análisis exploratorio de datos que nos permite determinar la simetria
de los datos, ver el grado de variabilidad y detectar aquellos datos que son
diferentes al conjunto de información. Asimismo, resulta un gráfico muy útil para
comparar grupos. Dicho diagrama nos muestra la distancia en que se encuentran
los datos así como su distribución equitativa.

Por su parte, Navidi (2006) describe al diagrama de caja como una gráfica que
incluye la mediana, el primero y el tercer cuartil y cualquier dato atípico que se
presente en una muestra.

Según Anderson et al.(2008), un diagrama de caja es un gráfico que nos permite


resumir los datos con base en la síntesis de cinco números. Para su elaboración
se necesita calcular la mediana y los cuartiles Q 1 y Q3 así como el rango

intercuartílico, RIC = Q3 - Q1.

o)  Coeficiente de correlación.

“El coeficiente de correlación lineal r mide la fuerza de la relación lineal entre los
valores cuantitativos pareados x y y en una muestra.” (Triola, 2013)

Cuando tenemos dos variables cuantitativas, una medida de la asociación o


correlación entre ellas viene dada por el coeficiente de correlación el cual, mide la
relación lineal entre dos variables, que puede tener valores desde -1 hasta +1. Los
valores cercanos a +1 significan una fuerte relación lineal positiva; valores
cercanos a -1 indican una fuerte relación lineal negativa, y valores cercanos a cero
una ausencia de relación lineal. (Anderson et al., 2008)

p)  Coeficiente de determinación.

Es la medida de la proximidad del ajuste de la ecuación de regresión de la


muestra a los valores de la variable independiente. Su valor se obtiene elevando
al cuadrado el coeficiente de correlación, es representado por r 2 y puede tomar

valores entre 0 y 1. (INEI, 2006)

q)  Coeficiente de Pearson.

Se define como el cociente entre la desviación típica y la media aritmética. Es


decir, es el número de veces que contiene la desviación típica a la media. Es una
medida de dispersión muy útil en cuanto otorga la facultad de comparar
distibuciones que no vienen expresadas en las mismas medidas. (Muñoz et al.,
2010)

r)  Regresión lineal.

Una regresión es una técnica que analiza el comportamiento de la variable


dependiente ( y ) a través de un conjunto de variables independientes ( x 1 , x 2 ,… , x p),
con las que se está relacionada. Una regresión será lineal cuando la curva
obtenida mediante el método de mínimos cuadrados sea una recta. Se debe
calcular en primera instancia el coeficiente de la correlacion lineal que permite
determinar la relación entre las dos variables, en caso de que dicha relación
exista, la regresión defie la recta que mejor se ajusta a la gráfica de pares
ordenados (INEI, 2006)

s)  Diagrama de dispersión
Es una representación gráfica de la relación entre dos variables cuantitativas,
asignándosele a una variable el eje horizontal y a la otra el eje vertical. (Anderson
et al., 2008).

Para Navidi (2006), el diagrama de dispersión es uno de los gráficos más útiles
por los datos bivariados numéricos. Si contamos con datos de pares arreglados
x 1 , y 1 ¿,…( x n , y n ¿, un diagrama de dispersión se construye trazando cada punto en
un sistema coordenado bidi mensional. Losdiagramas de dispersión también son
útiles para resumir datos multivariados cuando cada elemento consta de más de
dos valores construyendo diagramas distintos para cada par de los mismos.

t)  Distribución de probabilidad

Según Mario Triola (2013), las distribuciones de probabilidad describen lo que


probablemente sucederá en lugar de lo que en sucedió en realidad; estas distribuciones se
pueden encontrar representadas de manera gráfica o mediante alguna tabla.

La distribucion de probabilidad describe cómo se distribuyen las probabilidades


entre los valores de una variable [Link] el caso de una variable aleatoria
discreta x, la distribución de probabilidad está definida por una función de
probabilidad, denotada por f ( x ) .(Anderson et al., 2008)

Para Webster (2000), una distribución de probabilidad es una lista de todos los
resultados posibles de algún experimento junto con las probabilidades de cada
resultsdo. Las distribuciones de probabilidad se clasifican a su vez en
distribuciones discretas y continuas; dentro de las primeras encontramos la
distribución binomial, distribución binomial acumulada, distribución
hipergeométrica y distribución de Poisson. Dentro de las distribuciones de
probabilidad continuas tenemos a la distribución exponencial, distribucion uniforme
y distribución normal.

u)  Función de probabilidad
Es la regla que asigna probabilidades a los valores de las variables aleatorias, se
puede expresar en forma de tabla o mediante una fórmula. Se denota f(x) y da la
probabilidad de que x tome un determinado valor de una variable aleatoria. Toda
función de probabilidad debe mostrar las dos propiedades básicas de la
probabilidad, las cuales son: la probabilidad asignada a cada valor de la variable
aleatoria debe estar entre cero y uno y la suma de las probabilidades asignadas a
todos los valores de la variable aleatoria debe ser igual a uno. (Johnson y Kubi,
2012)

v)  Función de distribución:

Según la guía matemática (2013), la función de distribución de una variable


aleatoria X, es la función que asocia a cada valor x, la probabilidad acumulada
para todos los valores menores o iguales a x; es decir:
F ( x )=P( X ≤ x)

w)  Función de densidad de probabilidad.

Es la distribución de probabilidad para variables continuas. En las variables


aleatorias discretas la función de probabilidad f ( x ) da la probabilidad de que la
variable aleatoria tome un valor determinado. En las variables aleatorias
continuas, la función de densidad de probabilidad no da la probabilidad
directamente si no que calcula la probabilidad de que la variable tome alguno de
los valores dentro del intervalo que se encuentra bajo la curva de f ( x ) .(Anderson,
et al., 2008)

7.- Desarrollo de problemas:

Problema 1:

Calcula todas las medidas de tendencia central y de dispersión, que analizaste en el pdf de
la Unidad 1, del curso de Estadística I.
2 4 7 7 5 9 5 8 3 5 7 3 2

Medidas de tendencia central

“métodos y técnicas que nos permiten trabajar con las variables, pues hacen que
la recolección e interpretación de datos sea más fácil de manejar” (UnADM, s.f)

a) Media: es la suma de los valores de un conjunto de datos recolectados


dividida entre el tamaño de la muestra (UnADM, s.f)

La fórmula para calcular la media es la siguiente:

x 1+ x 2 +…+ x n
x́=
n

Donde n es el número de datos.

Sustituyendo los valores:

2+4 +7+7+5+ 9+5+8+ 3+5+7+3+2 67


x́= = =5.1538
13 13

Por tanto, la media es 5.1538

b) Media recortada: Es igual que la media aritmética, con la diferencia de que


para calcularla primero se reduce el 5% de los valores en el extremo
superior y el 5% den el extremo inferior (UnADM, s.f.)

Ordenamos los valores en forma ascendente:

2,2,3,3,4,5,5,5,7,7,7,8,9

Para eliminar el 5% para cada uno de los extremos, determinamos cuánto


es el 5% de 13 datos:

13∙ 5
x= =0.65
100
Redondeamos la cifra al entero más cercano: 1

Por tanto eliminamos un dato del extremo superior y uno del extremo
inferior:

2,3,3,4,5,5,5,7,7,7,8

2+3+3+ 4+5+5+ 5+ 7+7+7+ 8 56


x́= = =5.0909
11 11

Por tanto, la media recortada es 5.0909

c) Mediana: valor que divide en dos partes iguales una distribución de


frecuencias dejando igual número de datos del lado derecho y del lado
izquierdo; es decir, es el valor que se encuentra justamente en medio de los
valores ordenados ya sea en forma ascendente o descendente. En caso de
que el total de los datos sea impar se busca el dato que se encuentra
exactamente en medio de la distribución; en caso de que el total de los
datos sea par, tendremos dos valores en medio de la distribución por lo que
se deberá proceder a calcular la media aritmética de ambos valores
(UnADM, s.f.)

Ordenamos nuestros datos de forma ascendente:

2,2,3,3,4,5,5,5,7,7,7,8,9

Al tener un número impar, buscamos el que se encuentra en medio de la


distribución:

2,2,3,3,4,5 , 5 ,5,7,7,7,8,9

Por tanto, la mediana es el número 5.


d) Moda: “valor de la variable que se presenta con mayor frecuencia en un
conjunto de datos” (UnADM, s.f.)

Variable Frecuencia
2 2
3 2
4 1
5 3
7 3
9 1

Podemos observar que los valores que más se repiten son el 5 y el 7 por lo tanto,
dichos datos pertenecen a la moda.

Sin embargo, según los autores Johnson & Kuby (2012) cuando en una muestra
dos o más valores están empatados en la frecuencia más alta se considera que no
hay moda.

Medidas de dispersión

Las utilizamos para determinar la variación de los datos respecto al valor central.
(UnADM, s.f.)

a) Rango: Diferencia entre el valor máximo y el valor mínimo (UnADM, s.f.)

Fórmula:

Ramgo=Xmax− Xmin

Buscando el dato con el valor máximo y el dato con el valor mínimo tenemos:

Xmax =9

Xmin=2

Rango=9−2=7

Por tanto, el rango es de 7.


b) Cuartiles:

Medida de posición no central integrada por tres valores que dividen el total de
las variables en cuatro partes iguales; por tanto, cada cuartíl representa el 25%
del total. (UnADM, s.f.)

Q1=N ( 25 % )
Q 2=N ( 50 % )
Q3=N ( 75 % )
N=número total de datos

Sustituyendo los datos en las anteriores fórmulas:

Q1=13 ( 0.25 ) =3.25

Cuando el resultado es un número decimal, se debe considerar el siguiente


número entero, por lo tanto el primer cuartil corresponde a la posición 4.

Q 2=13 ( 0.50 ) =6.5

Cuando el resultado es un número decimal, se debe considerar el siguiente


número entero, por lo tanto el segundo cuartil corresponde a la posición 7.

Q3=13 ( 0.75 ) =9.75


Variable Posición
2 1 Cuando el resultado es un número decimal, se
2 2 debe considerar el siguiente número entero, por lo
3 3
3 4 tanto el tercer cuartil corresponde a la posición 10.
4 5
5 6
5 7
5 8
7 9
7 10
7 11
8 12
9 13
c) Rango intercuartílico:

Se le conoce también como recorrido intercuartílico y es la diferencia entre el


cuartil superior y el inferior:

R I =Q3−Q 1

Q 3=3

Q1=7

R I =7−3=4

d) Varianza:

Medida de dispersión que nos permite calcular el grado de variabilidad de los


datos con respecto a la media. Dicho cálculo se realiza en unidades cuadradas.
(UnADM, s.f.)

Fórmula:

2 ∑ f ( x−μ )2
σ =
N

Donde:

f es la frecuencia absoluta del dato x


μ es la media aritmética del conjunto de datos.

En el inciso a) calculamos la media que corresponde a 5.1538, por lo que para


calcular la varianza a cada variable le restamos el valor de la media y el resultado
lo elevamos al cuadrado para posteriormente, multiplicarlo por el valor de la
frecuencia absoluta de cada variable:
X fi x i−μ ( x i−μ)2 f (x i−μ)2
2 2 -3.1538 9.94645444 19.8929089
3 2 -2.1538 4.63885444 9.27770888
4 1 -1.1538 1.33125444 1.33125444
5 3 -0.1538 0.02365444 0.07096332
7 3 1.8462 3.40845444 10.2253633
8 1 2.8462 8.10085444 8.10085444
9 1 3.8462 14.7932544 14.7932544

Tabla 1. Cálculos de varianza. Elaboración propia.


Sustituimos los valores en la fórmula:

19.8929089+9.277770888+1.3312544 +0.07096332+10.2253633+8.100805444+14.7932544
σ 2=
13

63.6923077
σ 2= =4.899
13

Por tanto la varianza es de 4.899

e) Desviación estándar: se obtiene al sacar la raíz cuadrada de la varianza.


Esta medida de dispersión resulta más conveniente que la varianza en
cuanto que las unidades que describen la variabilidad son iguales que las
unidades del conjunto original, en lugar de que sean cuadráticas (UnADM,
s.f.)

∑ ( x i−μ )2
σ=
√ N

σ =√ 4.899=2.2134

f) Coeficiente de variación
Sirve para comparar dos variables que tengan unidad de medida diferente. El
coeciente de variación equivale al cociente de la desviación estándar y el
promedio aritmético (UnADM, s.f.)

Fórmula:

σ
Cv= ∙ 100
μ

2.2134
Cv= ∙ 100=42.95
5.1538

Por tanto, el coeficiente de variación es de 42.95

Problema 2:

Observa la siguiente tabla de datos ordenada por intervalos:

Clase Intervalo Frecuencia


1 25-37 4
2 37-49 6
3 49-61 17
4 61-73 25
5 73-85 13

Calcula todas las medidas de tendencia central y dispersión que estudiaste en el pdf de la
Unidad 1, del curso de Estadística 1.

Medidas de tendencia central:

a) Media

Fórmula:

∑ f Xi
μ= i=1
N
En donde X i corresponde a la marca de clase se que se calcula sumando los dos extremos
del intervalo y dividiendo el resultado entre dos, una vez obtenida la marca de clase de cada
uno de nuestros intervalos podemos realizar nuestra tabla de frecuencias de la siguiente
manera:

Clase Intervalo fi FI XI f 1∗X i

1 25-37 4 4 31 124
2 37-49 6 10 43 258
3 49-61 17 27 55 935
4 61-73 25 52 67 1675
5 73-85 13 65 79 1027
total 65 4019

La suma de los productos de la marca de clase por su frecuencia es 4019, este dato se
divide entre el número total de datos que es 65:

4019
μ= =61.83
65

Por tanto, la media para datos agrupados corresponde a 61.83

b) Mediana

La fórmula para calcular la mediana de datos agrupados es la siguiente:

N
( 2)
Me=Li + ( −F

fi
i −1

)
∗ai

Donde:

Li= el límite inferior de la clase mediana


N= número de observaciones en el conjunto de datos
F i−1=¿ frecuencia acumulada por debajo de la clase mediana
f =¿ frecuencia absoluta de la clase mediana
a i=¿ amplitud o intervalo de la clase mediana

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad,

N
es decir
2
65
=32.5
2
Como el dato no está en nuestras frecuencias acumuladas, buscamos la mediana en el
número siguiente, por tanto ésta se encuentra en la clase 4, intervalo (61-73)

Li= 61
N= 65
F i−1 =¿ 27
f =¿ 25
a i=¿ 73-61=12

Aplicando la fórmula tenemos:

65
Me=61+
( 2)
(−27
)
∗12=63.64
25

Por tanto, el valor de la media es de 63.64

c) Moda

La fórmula para calcular la moda en datos agrupados por intervalos es:


f i−f i−1
Mo=Li+ ∙ ai
( f i−f 1−1 ) +(f 1−f i+1 )

Donde:

Li= el límite inferior del renglón donde debe estar la moda


f i=¿ frecuencia del renglón de la moda
f i−1=¿ frecuencia anterior al renglón de la moda
f i+1=¿ frecuencia posterior al renglón de la moda
a i=¿ tamaño del intervalo

La moda es el dato que más se repite, checando las frecuencias absolutas podemos ver que
la frecuencia más grande es de 25, estando ubicada en la clase 4, por lo que:

Li= 61
f i=¿ 25
f i−1=¿ 17
f i+1=¿ 13
a i=¿ 12

25−17
Mo=61+ ∙12=65.8
( 25−17 )+(25−13)

Por lo que el valor de la moda es 65.8

Medidas de dispersión

a) Varianza

Fórmula:

2 ∑ ( x−μ )2 ∙ f
σ =
N
Nos apoyamos en nuestra tabla de frecuencias, en donde calcularemos la resta de la marca
de clase menos la media elevado al cuadrado y el resultado de ésta operación multiplicado
por la frecuencia:

Clase Intervalo f F x f∗x ( x−μ )2 ( x−μ )2∗f


1 25-37 4 4 31 124 950.4889 3801.9556
2 37-49 6 10 43 258 354.5689 2127.4134
3 49-61 17 27 55 935 46.6489 793.0313
4 61-73 25 52 67 1675 26.7289 668.2225
5 73-85 13 65 79 1027 294.8089 3832.5157
Total   65     4019 11223.1385

Sustituyendo en la fórmula:

11223.14
σ 2= =172.66
65

b) Desviación estándar

Fórmula:

∑ ( x−μ )2 ∙ f
σ=
√ N

11223.14
σ=
√ 65

σ =√ 172.66

σ =13.14

c) Coeficiente de variación

Fórmula:

σ
Cv= ∙ 100
μ
13.14
Cv= ∙ 100=21.25
61.83

Por tanto, el coeficiente de variación es de 21.25

Problema 3:

Dado los datos: (no agrupados)

4 3 19 17 3 11 8
7 6 2 10 2 9 6
4 24 7 9 9 2 4
7 11 4 7 5 7 9
3 5 11 6 3 5 4
9 3 14 15 11 8 1

a) Ordénalos por intervalos.

Lim Lim Interval


Clase Inf Sup o
1 1 4 (1,4)
2 5 8 (5,8)
3 9 12 (9,12)
4 13 16 (13,16)
5 17 20 (17,20)
6 21 24 (21,24)

Tabla 2. Intervalos de un conjunto de datos. Elaboración propia

b) Calcula todas las medidas de tendencia central y dispersión que conozcas.

Medidas de tendencia central:

Media

Fórmula:

∑ f Xi
μ= i=1
N
En donde X i corresponde a la marca de clase se que se calcula sumando los dos
extremos del intervalo y dividiendo el resultado entre dos, una vez obtenida la
marca de clase de cada uno de nuestros intervalos podemos realizar nuestra tabla
de frecuencias de la siguiente manera:

Lim Interval
Clase Lim Inf Sup o fi xi xi*fi
1 1 4 (1,4) 14 3 35
2 5 8 (5,8) 13 7 84.5
3 9 12 (9,12) 10 11 105
4 13 16 (13,16) 2 15 29
5 17 20 (17,20) 2 19 37
6 21 24 (21,24) 1 23 22.5
42 313

Tabla 3. Tabla de frecuencias. Elaboración propia.

La suma de los productos de la marca de clase por su frecuencia es 313, este


dato se divide entre el número total de datos que es 42:

313
μ= =7.45
42

Por tanto, la media para datos agrupados corresponde a 7.45

Mediana

La fórmula para calcular la mediana de datos agrupados es la siguiente:

N
( 2)
Me=Li + ( −F
fi
i −1

)
∗ai

Donde:

Li= el límite inferior de la clase mediana


N= número de observaciones en el conjunto de datos
F i−1=¿ frecuencia acumulada por debajo de la clase mediana
f =¿ frecuencia absoluta de la clase mediana
a i=¿ amplitud o intervalo de la clase mediana

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega

N
hasta la mitad, es decir
2
42
=21
2
Como el dato no está en nuestras frecuencias acumuladas, buscamos la mediana
en el número siguiente, por tanto ésta se encuentra en la clase 4, intervalo (61-73)

Li= 5
N= 42
F i−1 =¿ 14
f =¿ 13
a i=¿ 3

Aplicando la fórmula tenemos:

42
Me=5+
( 2)
(−14
∗3=6.62 )
13

Por tanto, el valor de la media es de 6.62

Moda

La fórmula para calcular la moda en datos agrupados por intervalos es:

f i−f i−1
Mo=Li+ ∙ ai
( f i−f 1−1 ) +(f 1−f i+1 )
Donde:

Li= el límite inferior del renglón donde debe estar la moda


f i=¿ frecuencia del renglón de la moda
f i−1=¿ frecuencia anterior al renglón de la moda
f i+1=¿ frecuencia posterior al renglón de la moda
a i=¿ tamaño del intervalo

La moda es el dato que más se repite, checando las frecuencias absolutas


podemos ver que la frecuencia más grande es de 25, estando ubicada en la clase
4, por lo que:

Li= 1
f i=¿ 14
f i−1=¿ 0
f i+1=¿ 13
a i=¿ 3

14−0
Mo=1+ ∙ 3=2.02
(14−0 ) +(14−13)

Por lo que el valor de la moda es 2.02

Medidas de dispersión

Varianza

Fórmula:

2 ∑ ( x−μ )2 ∙ f
σ =
N
Nos apoyamos en nuestra tabla de frecuencias, en donde calcularemos la resta de
la marca de clase menos la media elevado al cuadrado y el resultado de ésta
operación multiplicado por la frecuencia:

Sustituyendo en la fórmula:

3350
σ 2= =24.23
42

d) Desviación estándar

Fórmula:

∑ ( x−μ )2 ∙ f
σ=
√ N

3350
σ=
√ 42

σ =4.92

e) Coeficiente de variación

Fórmula:

σ
Cv= ∙ 100
μ

4.92
Cv= ∙ 100=66.05
7.45

Por tanto, el coeficiente de variación es de 66.05

Problema 4.
Se realiza una investigación en un Bachillerato tecnológico a 165 adolescentes de 15 a 17
años, donde se les preguntó, el número de horas a la semana (de lunes a domingo) que
pasan viendo videos en la nueva red social Tik Tok.

Los resultados arrojaron los siguientes datos (horas a la semana)

32 50 51 36 37 23 38 40 30 34 17
39 47 37 30 46 48 44 45 40 29 29
49 32 42 53 33 62 48 57 47 28 40
38 36 37 37 36 40 25 58 45 52 48
37 43 38 39 42 41 33 52 32 42 46
47 52 32 42 23 40 59 46 22 48 45
34 41 26 27 36 38 36 30 31 62 40
34 34 35 40 34 39 46 39 32 46 33
40 40 42 29 38 32 31 37 32 37 33
37 33 46 36 31 40 37 42 41 36 46
35 52 30 58 40 35 61 40 23 50 37
47 31 52 41 55 41 34 37 31 45 53
41 46 29 32 40 43 43 49 32 29 39
29 32 35 47 38 37 46 33 49 41 46

Con los datos expuestos, Calcular y/o elaborar:

a) Ordénalos por intervalos.

Lim Lim interval


Clase Inf Sup o
1 17 22 (17,22)
2 23 28 (23,28)
3 29 34 (29,34)
4 35 40 (35,40)
5 41 46 (41,46)
6 47 52 (47,52)
7 53 58 (53,58)
8 59 64 (59,64)

Tabla 4. Datos por intervalos. Elaboración propia.

b) La media. Moda, Mediana, Rango, Varianza, Desviación estándar,


Desviación media y Coeficiente de variación.
Media: 35.61

Moda: 38.18

Mediana: 39.26

Rango: 45

Varianza: 133.095

Desviación estándar: 11.53

Desviación media: 7.07

Coeficiente de variación: 32.40

c) Tabla de frecuencias con la información que creas sea la más conveniente,


Diagrama circular, Gráfica de barras, Gráfica de ojiva ascendente.

Lim interval
Clase Lim Inf Sup o fi xi xi∗fi x i 2 + fi
1 17 22 (17,22) 2 20 39 760.5
2 23 28 (23,28) 7 26 178.5 4551.75
36713.2
3 29 34 (29,34) 37 32 1165.5 5
66093.7
4 35 40 (35,40) 47 38 1762.5 5
58659.7
5 41 46 (41,46) 31 44 1348.5 5
6 47 52 (47,52) 20 50 990 49005
7 53 58 (53,58) 6 56 333 18481.5
8 59 64 (59,64) 4 62 246 15129
154 5484 215784

Tabla 5. Tabla de frecuencias. Fuente: elaboración propia.


Tiempo que pasa un estudiante en TikTok (h)

(17,22) (23,28) (29,34) (35,40) (41,46) (47,52) (53,58) (59,64)

Imagen 1. Diagrama Circular. Tiempo que pasa un estudiante en Tik Tok (h). Fuente: elaboracion propia.

Tiempo que pasa un estudiante en TikTok


50

45

40

35

30

25

20

15

10

0
(17,22) (23,28) (29,34) (35,40) (41,46) (47,52) (53,58) (59,64)

Imagen 2. Gráfica de barras. Tiempo que pasa un estudiante en Tik Tok (h). Fuente: elaboracion propia.
Ojiva Ascendente
155

135

115

95

75

55

35

15

-5 1 2 3 4 5 6 7 8

-25

Imagen 3. Gráfica de ojiva ascendente. Tiempo que pasa un estudiante en Tik Tok (h). Fuente: elaboracion propia.

d) Realiza una conclusión de la información que observas en la gráfica de barras.


¿Encuentras alguna característica que se puede analizar?

Es posible analizar la distribucion bajo la que se encuentran distribuidos los


datos. Es una distribución en forma de campana.

e) ¿Cómo se le llamaría a la forma de la distribución de datos en gráfica de


barras?

De acuerdo con Roldán (2002), la distribucion que se forma con los datos es
de tipo normal o campana normal.

8.- Investiga y describe:

Da 5 ejemplos aplicados a la ciencia, tecnología y/o vida académica, donde se use las
siguientes herramientas para estudios estadísticos:

a) Combinatoria.
1. En informática el análsis combinatorio es ampliamente usado para obtener fórmulas y
estimaciones de algoritmos.

2. En la vida académica, en una prueba de selección múltiple que consta de determinadas


preguntas, cada una con un número también determinado de respuestas posibles, donde solo
una es correcta; mediante el análisis combinatorio se puede determinar en cuántas formas
diferentes un estudiante puede escoger una respuesta para cada uno y tener todas las
respuestas correctas.

3. En economía, el análisis combinatorio nos puede servir para construir indicadores de


pobreza multidimensional a través de la inducción y conjetura de elementos tales como el
trabajo, educación, salud y los cambios de atributos en dimiensiones por individuo que
reflejen permutaciones de datos. (Canaviri y Aliaga, 2017)

4. En admnistración, los Procesos de Jerarquización Analítica en el entorno


organizacional, contribuyen a la toma de decisiones dentro de una empresa
mediante el aprovechamiento de los recursos disponibles buscando alcanzar
esquemas de optimización siendo modelado a través de un análsis combinatorio
que represente las relaciones entre necesidades, recursos disponibles y objetivos
establecidos. (Martinez y Muñoz, 2015)

5. En genética por ejemplo, se utiliza el análisis combinatorio para determinar el


comportamiento genético y aptitud combinatoria en cruzas simples con líneas élite
de maíz (Guerrero et al. 2012).

b) Probabilidad

1. Investigación biomédica para determinar la probabilidad de desarrollar alguna


enfermedad.

2. Economía: se puede aplicar la teoría de la probabilidad para minimizar costos en una


empresa.

3. Ciencias actuariales: Estudio de seguros de vida, fondos de pensiones, etc.


4. Finanzas: se usa la probabilidad para conocer las posibles ganacias o pérdidas en una
inversión.

5. Física: el principio de incertidumbre de Heinsberg se basa en la probabilidad.

c)  Series de Tiempo

1. Sociología: para para estimar y pronosticar la migración agrícola de una región


a otra, ya que con series del tiempo se podrán identificar los patrones no
aleatorios.

2. Tecnologías de la información y comunicación: determinar prospectivas en un


software de referencia digital, para extraer las regularidades que se observan en el
comportamiento pasado de una variable y conocer su comportamiento en el
tiempo. (Sanchez y Martínez, 2009)

3. Medicina. Vigilancia de sífilis congénita, primaria, secundaria y terciaria en


China entre 2005 y 2012 cuyo modelo estabéció que se expresaba el carácter
estacional de la incidencia de la sífilis en cada serie con una mayor invidencia en
verano que en invierno.

4. Modelo de Series de Tiempo para la Evolución de la Matrícula del Nivel Medio


Superior de la Universidad Autónoma de Guerrero. (Alvarado y Yopán, 2017)

5. Análisis de series de tiempo en el pronóstico de la demanda de almacenamiento


de productos perecederos con el fin de estimar el volumen de almacenamiento
para prever los requerimientos de instalaciones adicionales, personal y materiales
necesarios para la movilidad de los productos (Contreras, Zúñiga, Flores,
Sanchez, 2016).

CONCLUSIONES

A continuación, se presentara una serie de argumentos a modo de conclusiones


sobre el tema:
 La estadística es una disciplina científica que se ocupa de la obtención,
orden y análisis de un conjunto de datos con el fin de obtener explicaciones
y predicciones sobre fenómenos observados. consiste en métodos,
procedimientos y fórmulas que permiten recolectar información para luego
analizarla y extraer de ella conclusiones relevantes.

 La Estadística descriptiva es la rama de la estadística que formula


recomendaciones de cómo resumir, de forma clara y sencilla, los datos de
una investigación en cuadros, tablas, figuras o gráficos.
 La Probabilidad y la Estadística se encargan del estudio del azar desde el
punto de vista de las matemáticas:
o La Probabilidad propone modelos para los fenómenos aleatorios, es
decir, los que se pueden predecir con certeza, y estudia sus
consecuencias lógicas.
o La Estadística ofrece métodos y técnicas que permiten entender los
datos a partir de modelos.
 Las medidas de tendencia central son medidas estadísticas que pretenden
resumir en un solo valor a un conjunto de valores. Representan un centro
en torno al cual se encuentra ubicado el conjunto de los datos.
 Las medidas de dispersión miden el grado de dispersión de los valores de
la variable. En otros términos las medidas de dispersión pretenden evaluar
en qué medida los datos difieren entre sí.
Referencias:

Anderson, D. R., Sweeny, D. J., & Williams, T. A. (2008). Estadística para


administración y economía.( 10a. ed.). México, D. F.: Cengage Learning.

Alsina, Sara M, (2010), Demografía y Estadística: Reflexiones sobre una necesaria


y delicada convivencia. Instituto de Investigaciones Teóricas y Aplicadas de
la Escuela de Estadística – Facultad de Ciencias Económicas y Estadística
– Universidad Nacional de Rosario. [online]. Recuperado el 22 de octubre
de 2021 de <[Link]
%20Sara%20Demografia%20y%[Link]?
sequence=3&isAllowed=y>

Alvarado-Castro, VM, Yopán-Fajardo, JL. (2017) Un Modelo de Series de Tiempo


para La Evolución de la Matrícula del Nivel Medio Superior de la UAGro.
Revista Iberoamericana de Producción Académica y Gestión Educativa.
ISSN 2002-8412. Recuperado el 18 de octubre de 2021 de
[Link]

Barbier, M. (2021). Series de Tiempo (Cadena de Suministro). Retrieved from


Lokad Quantitative Supply Chain: [Link]
tiempo-en-cadena-de-suministro

Barreto-Villanueva, Adán. (2012). El progreso de la Estadística y su utilidad en la


evaluación del desarrollo. Papeles de población, 18(73), 241-271.
Recuperado el 10 de octubre de 2021, de
[Link]
74252012000300010&lng=es&tlng=es.
Bautista, L., Victoria, E., Vargas, B., & Hernandez, C. (2020). Pruebas estadísticas
paramétricas y no paramétricas: su clasificación, objetivos. Eduacion y
Salud, 78-81.

Bjorner, A., & Stanley, R. (2010). A Combnatorial Miscellany. Cambridge:


Massachusetts Institute of Technology Department of Mathematics.

Canaviri,G. y Aliaga, F.J. (2016). Construcción de un indicador de pobreza


multidimensional mediante análisis combinatorio. Panorama económico.
Volumen 24, pp. 85-104. Recuperado el 10 de octubre de
[Link]
ndicador_de_pobreza_multidimensional_mediante_analisis_combinatorio

Contreras Juárez, A, Atziry Zuñiga, C, Martínez Flores, JL, Sánchez Partida, D,


(2016) Análisis de series de tiempo en el pronóstico de la demanda de
almacenamiento de productos perecederos. Estudios Gerenciales. Volumen
32, Issue 141, páginas 387-396, ISSN 0123-5923, Recuperado el 20 de
octubre de 2021 de [Link]

Devore,J.L(2008). Probabilidad y Estadística para Ingeniería y Ciencias. (7ma ed.).


Distrito Federal, México: Cengage Learning.

Educalingo. (2021). Estocástica. Retrieved from Educalingo:


[Link] Fuenlabrada, S. (2008).
Probabilidad y Estadistica. Mexico: McGraw-Hill.

Guerrero-Guerrero, C, Espinoza-Banda, A, Palomo-Gil, A, Gutiérrez-Del Río, E,


Luna-Ortega, JG, & Rodríguez-Dimas, N. (2012). Comportamiento genético
y aptitud combinatoria en cruzas simples con líneas élite de
maíz. Universidad y ciencia, 28(1), 65-77. Recuperado en 18 de octubre de
2021, de [Link]
29792012000100007&lng=es&tlng=es.

Instituto Nacional de Estadística e Informática de Perú. (2006). Glosario básico de


términos estadísticos. Recuperado el 10 de octubre de:
[Link]
/[Link]

Johnson, R., & Kuby, P. (2012). Estadística Elemental. (11a ed.). Distrito Federal,
México: Cengage Learning.
Laura. (6 de febrero de 2013). Función de distribución. La Guía Matemática.
[Link]

Lam Díaz, R. (2018). Importancia de la bioestadística para la investigación en


salud. Revista Cubana de Hematología, Inmunología y Hemoterapia, 34(3).
Recuperado
de [Link]

Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía.


7ma. ed). Naucalpan de Juárez, México: Pearson Educación.

López, J. F. (2017). Proceso Estocastico. Recuperado de Economipedia:


[Link]

López, J. F. (2019). Estadistica Paramétrica. Recuperado de Economipedia:


[Link]

López, J. F. (2021). Estadistica Descriptiva. Recuperado de Economipedia:


[Link]

Montes Suay, F. (2007). Introducción a la Probabilidad. Valencia: Universitat de


Valencia Departament d’Estadística i Investigacío Operativa.

Navidi, W. (2006). Estadística para ingenieros y científicos. México, D. F.: McGraw


Hill-Interamericana.

Nolberto Sifuentes, V. A., & Ponce Aruneri, M. E. (2008). Estadistica inferencial


aplicada. Lima: Unidad de Post Grado de la Facultad de Educación de la
Universidad Nacional Mayor de San Marcos.

Ortega, J. (2009). Teoria Combinatoria. Mexico: CIMAT.

Paradis, E. (2002). R para principiantes. Montpellier: Universit Montpellier II.

Pastor, M. (2008). Historia de la Estadística. Recuperado de Estadística para


todos: [Link]

Porras Velásquez, A. (2017). Diplomado de Analisis de Informacion Geoespacial:


Estadistica Inferencial. Mexico: Centro de Investigación en Geografía y
Geomática "Ing. Jorge L. Tamayo", A.C.
Real Academia Española (2001) Diccionario de la lengua española (22.ª ed.)
Consultado en [Link]

Rendón Macias, M. E., Villasis Keeve, M., & Miranda Novales, M. G. (2016).
Estadistica descriptiva. Revista Alegria Mexico, 397-407.

Rincón, L. (2007). Curso elemental de Probabilidad y Estadistica. Mexico: UNAM


Facultad de Ciencias.

Rincón, L. (2019). Una introducción a la estadistica inferencial. Mexico: UNAM


Facultad de Ciencias.

Roldan, P. N. (2021). Estadistica. Recuperado de Economipedia:


[Link]

Salazar, C., & Del Castillo, S. (2018). Fundamentos Básicos de Estadí[Link],


Ecuador: sin editorial.

Sánchez Avillaneda, María del Rocío; Martínez Bravo, Ricardo. Aplicación del
modelo de series de tiempo a la prospección del servicio de referencia en
línea de la Biblioteca-IIMAS-UNAM. // Ibersid. (2009) 35-47. ISSN 1888-
0967. Recuperado de
[Link]

Triola F, M. (2013). Estadística.(12da ed). México, Ciudad de México: Pearson


Educación.

UnADM. (s.f). Unidad 1. Estadística descriptiva. Obtenido de Estadística I.


Licenciatura en Matemáticas. DCEIT. Universidad Abierta y a Distancia de
México: [Link]

Véliz, C. (2011). Estadística para la administración y negocios. México:


Pearson.

Webster, A.l. (2000). Estadística aplicada a los negocios y la economía. (3ra ed.) Santa
Fe de Bogotá. Colombia: Mc Graw-Hill.

Zhang, X., Zhang, T., Pei, J., Liu, Y., Li, X., & Medrano-Gracia, P. (2016). Time
Series Modelling of Syphilis Incidence in China from 2005 to 2012. PloS
one, 11(2), e0149401. [Link]

Common questions

Con tecnología de IA

Las series de tiempo son fundamentales en la econometría porque permiten explicar y modelar resultados a niveles micro y macroeconómicos. Se utilizan para analizar fenómenos económicos continuos en el tiempo, generando pronósticos y evaluaciones de tendencias económicas que ayudan a comprender cómo ciertas variables afectan el entorno económico a largo plazo .

La bioestadística es fundamental en las investigaciones de salud porque proporciona herramientas analíticas cruciales para el análisis de datos en áreas como la epidemiología y los ensayos clínicos. Como los avances médicos y las decisiones clínicas se apoyan en análisis estadísticos, el conocimiento de la estadística descriptiva e inferencial es indispensable para alcanzar conclusiones válidas sobre la eficacia de tratamientos y el desarrollo de medicamentos .

La teoría combinatoria es una rama de las matemáticas que se ocupa del estudio de las formas de contar. Aunque no tiene una clasificación tajante de lo que constituye una subárea específica, comparte un grado de traslape con otras ramas de la matemática discreta. Así, diferentes autores proponen clasificaciones variadas para su estudio, resaltando su flexibilidad y aplicación en diversas áreas matemáticas .

Para calcular el coeficiente de variación, se divide la desviación estándar entre la media aritmética y se multiplica por 100 para expresar el resultado en porcentaje. Esta medida es útil para comparar la variación relativa de dos o más grupos de datos con diferentes unidades de medida, pues indica el grado de variabilidad en relación a la media del grupo .

La desviación estándar se calcula sacando la raíz cuadrada de la varianza. Es una medida más conveniente que la varianza porque expresa la variabilidad de los datos en las mismas unidades que el conjunto original, en lugar de unidades cuadráticas, lo cual facilita su interpretación y comparación con otros datos .

La inferencia paramétrica ayuda a estimar parámetros poblacionales basándose en una muestra representativa, evitando así la necesidad de estudiar toda la población. Los principales requisitos son conocer la distribución de la variable a estudiar y que los datos posean al menos una escala de intervalo. Esto permite aplicar modelos estadísticos paramétricos que proporcionan estimaciones fiables bajo las suposiciones adecuadas .

La estadística descriptiva se centra en describir, mostrar o resumir la información de un conjunto de datos mediante números, tablas o elementos gráficos sin intentar realizar generalizaciones más allá de los datos observados . Por otro lado, la estadística inferencial estudia el comportamiento de muestras para realizar generalizaciones inductivas y tomar decisiones sobre poblaciones más amplias a partir de la información de las muestras, utilizando la probabilidad como base .

La probabilidad y la estadística están interrelacionadas porque ambas estudian el azar desde el punto de vista matemático: la probabilidad ofrece modelos para entender fenómenos aleatorios y sus consecuencias lógicas, mientras la estadística utiliza estos modelos para comprender y analizar datos concretos. Así, el cálculo de probabilidades es una teoría matemática que se aplica en estadística para dar contenido concreto a las estimaciones y conclusiones basadas en datos .

La moda es una medida de tendencia central válida en datos agrupados porque representa la clase o intervalo que tiene la mayor frecuencia. Se calcula usando una fórmula que implica el límite inferior del intervalo modal, la frecuencia de la clase modal, y las frecuencias de las clases adyacentes. Esto permite identificar el valor más común en un conjunto de datos agrupados y proporciona información sobre la distribución de los datos .

Los analistas financieros utilizan información estadística, como la relación precio-ganancia o el rendimiento de los dividendos, para realizar comparaciones entre el mercado de valores y acciones individuales. Basándose en estos análisis, pueden determinar si una acción está por encima o por debajo de su valor real, lo que ayuda a emitir recomendaciones de compra o venta .

También podría gustarte