0% encontró este documento útil (0 votos)
35 vistas3 páginas

ESTADISTICA

La estadística es una herramienta clave para el análisis de datos, con orígenes que se remontan a la antigüedad y un desarrollo significativo desde el siglo XVII hasta la actualidad. Existen diferentes tipos de estadísticas, como descriptiva, inferencial y aplicada, que se utilizan en diversas disciplinas para organizar, resumir y analizar datos. Además, se destacan conceptos como medidas de tendencia central y dispersión, que son esenciales para entender la variabilidad y el comportamiento de los datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
35 vistas3 páginas

ESTADISTICA

La estadística es una herramienta clave para el análisis de datos, con orígenes que se remontan a la antigüedad y un desarrollo significativo desde el siglo XVII hasta la actualidad. Existen diferentes tipos de estadísticas, como descriptiva, inferencial y aplicada, que se utilizan en diversas disciplinas para organizar, resumir y analizar datos. Además, se destacan conceptos como medidas de tendencia central y dispersión, que son esenciales para entender la variabilidad y el comportamiento de los datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

DEFINICION: la estadística es una herramienta fundamental en el análisis de datos para

entender mejor el mundo que nos rodea y tomar decisiones informadas basadas en evidencia.
HISTORIA: La historia de la estadística tiene sus orígenes en la antigüedad, cuando los egipcios y los
babilonios recopilaban datos para realizar censos de población y calcular impuestos. Sin embargo, fue
en el siglo XVII, con la publicación del libro "Arte de la Suposición" de John Graunt, cuando se
comenzaron a utilizar métodos más sistemáticos para la recopilación y análisis de datos.

En el siglo XIX, Adolphe Quetelet introdujo el concepto de la "media" como medida de


tendencia central, y Francis Galton desarrolló la idea de la regresión y la correlación. También
en esta época, el matemático Karl Pearson introdujo el coeficiente de correlación y la
distribución de probabilidad normal.
En el siglo XX, la estadística se convirtió en una disciplina altamente desarrollada, con la
creación de técnicas como el análisis de regresión, el análisis de varianza y la inferencia
estadística. Además, se comenzó a utilizar la computación para el análisis de grandes
cantidades de datos.
En la actualidad, la estadística se utiliza en una amplia gama de disciplinas, desde la ciencia y
la medicina hasta la economía y la sociología, y sigue evolucionando con el desarrollo de
técnicas más avanzadas como el aprendizaje automático y la minería de datos
TIPOS DE ESTADISTICAS
1. Estadística descriptiva: Se encarga de organizar, resumir y describir los datos de manera
numérica o gráfica, utilizando medidas como la media, la mediana, la moda, la desviación
estándar, entre otras.
2. Estadística inferencial: Se ocupa de hacer inferencias o deducciones sobre una población a
partir de una muestra, utilizando técnicas como la estimación de parámetros, contrastes de
hipótesis y análisis de regresión.
3. Estadística aplicada: Utiliza los principios estadísticos para resolver problemas concretos
en campos como la economía, la medicina, la sociología, la psicología, entre otros.
4. Estadística matemática: Se enfoca en el desarrollo de métodos estadísticos y en la teoría
que subyace a estos métodos, como la teoría de la probabilidad, la teoría de muestreo y la
teoría de la inferencia estadística.
5. Estadística experimental: Se encarga de diseñar experimentos y recopilar datos de manera
controlada para analizar el efecto de una variable sobre otra.
6. Estadística inferencial bayesiana: Utiliza el teorema de Bayes para hacer inferencias
probabilísticas sobre una población a partir de una muestra.
7. Estadística multivariante: Se encarga del estudio de dos o más variables simultáneamente,
analizando las interacciones y correlaciones entre ellas.
8. Estadística no paramétrica: Se utiliza cuando no se pueden asumir ciertas condiciones
sobre la distribución de los datos, como la normalidad, y se emplean técnicas basadas en
rangos y ordenaciones de los datos.
Estos son algunos de los tipos de estadísticas más comunes, pero existen muchas otras
ramas y aplicaciones dentro de esta disciplina.
DISTRIBUCION DE FRECUENCIA PARA DATOS AGRUPADOS Y NO AGRUPADOS: La
distribución de frecuencia es una manera de organizar y resumir datos para poder analizarlos
de manera más sencilla. Se puede realizar tanto para datos no agrupados, que son aquellos
que se presentan de forma individual, como para datos agrupados, que son aquellos que se
presentan en intervalos o categorías.
Para datos no agrupados, la distribución de frecuencia consiste en contar cuántas veces se
repite cada valor en un conjunto de datos. Por ejemplo, si tenemos datos de las edades de 10
personas, podemos organizarlos en una tabla donde se muestra cuántas veces aparece cada
edad.
Por otro lado, para datos agrupados, la distribución de frecuencia implica organizar los datos
en intervalos o categorías y contar cuántas veces se encuentra cada dato dentro de cada
intervalo. Por ejemplo, si tenemos datos de estaturas de personas y queremos agruparlos en
intervalos de 10 cm, podemos contar cuántas personas tienen estaturas dentro de cada
intervalo.
En ambos casos, la distribución de frecuencia nos permite identificar patrones, tendencias y
características de los datos que estamos analizando. También es útil para la visualización de
los datos, ya que nos permite ver de forma clara cómo están distribuidos los valores en el
conjunto de datos.
MEDIDA DE DISPERSION PARA DATOS AGRUPADOS Y NO AGRUPADOS:
La medida de dispersión para datos no agrupados se puede calcular utilizando la desviación
estándar o la varianza. La desviación estándar es la raíz cuadrada de la varianza y nos da una
idea de cuánto se alejan los datos de la media.
Para calcular la desviación estándar de un conjunto de datos no agrupados, se siguen los
siguientes pasos:
1. Calcular la media de los datos.
2. Restar la media a cada dato para obtener las desviaciones.
3. Elevar al cuadrado cada una de las desviaciones.
4. Sumar todos los cuadrados de las desviaciones.
5. Dividir la suma de los cuadrados de las desviaciones entre el número de datos menos uno.
6. Calcular la raíz cuadrada de este resultado para obtener la desviación estándar.
Por otro lado, para datos agrupados se utiliza el rango intercuartil, que es la diferencia entre
el tercer cuartil y el primer cuartil de los datos.
Es importante tener en cuenta que estas medidas de dispersión nos proporcionan
información sobre la variabilidad de los datos y nos permiten tener una idea de cuánto se
dispersan los datos en torno a la media.
MEDIDAS DE TENDENCIA CENTRAL: Las medidas de tendencia central son valores que
representan el centro de un conjunto de datos. Las principales medidas de tendencia central
son la media, la mediana y la moda.
1. Media: Es el promedio aritmético de un conjunto de datos. Se calcula sumando todos los
valores de los datos y dividiéndolos entre el total de valores. La media es sensible a los
valores extremos y puede no ser representativa si existen valores atípicos en los datos.
2. Mediana: Es el valor que ocupa el lugar central de un conjunto de datos ordenados de
menor a mayor. Si el número de datos es impar, la mediana es el valor que se encuentra en la
posición central. Si el número de datos es par, la mediana es la media de los dos valores
centrales. La mediana es menos sensible a los valores extremos que la media.
3. Moda: Es el valor que se repite con mayor frecuencia en un conjunto de datos. Puede haber
más de una moda en un conjunto de datos, en cuyo caso se dice que los datos son bimodales
o multimodales. La moda es útil para identificar los valores más frecuentes en un conjunto de
datos.
Estas medidas de tendencia central son útiles para resumir y describir la distribución de un
conjunto de datos, permitiendo tener una idea general de la concentración de los datos
alrededor de un valor central.

También podría gustarte