0% encontró este documento útil (0 votos)
55 vistas9 páginas

Matemáticas

La estadística descriptiva es una rama de la estadística que se enfoca en resumir y describir conjuntos de datos mediante el uso de técnicas como medidas de tendencia central, medidas de dispersión, tablas, gráficos y análisis de correlación y regresión. Estas técnicas ayudan a los investigadores a comprender mejor los patrones y tendencias en los datos.

Cargado por

Daniel Espinoza
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
55 vistas9 páginas

Matemáticas

La estadística descriptiva es una rama de la estadística que se enfoca en resumir y describir conjuntos de datos mediante el uso de técnicas como medidas de tendencia central, medidas de dispersión, tablas, gráficos y análisis de correlación y regresión. Estas técnicas ayudan a los investigadores a comprender mejor los patrones y tendencias en los datos.

Cargado por

Daniel Espinoza
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Estadística descriptiva

La estadística descriptiva es una rama de la estadística que se


enfoca en la recopilación, organización, presentación y análisis de
datos. Su objetivo principal es resumir y describir las características
de un conjunto de datos, permitiendo a los usuarios comprender
mejor los patrones y tendencias presentes en ellos.

Las técnicas de estadística descriptiva se utilizan comúnmente en


una amplia variedad de campos, incluyendo la investigación
científica, la economía, las ciencias sociales, la salud pública y la
ingeniería, entre otros.

Algunas de las herramientas y técnicas utilizadas en la estadística


descriptiva incluyen:

1. Medidas de tendencia central: se utilizan para describir la


ubicación central de un conjunto de datos. Las medidas comunes
incluyen la media, la mediana y la moda.

2. Medidas de dispersión: se utilizan para describir la variabilidad o


dispersión de un conjunto de datos. Las medidas comunes incluyen
la desviación estándar, el rango y el coeficiente de variación.
3. Tablas y gráficos: se utilizan para presentar los datos de manera
visual. Las tablas pueden incluir frecuencias y porcentajes, mientras
que los gráficos pueden incluir histogramas, diagramas de caja y
bigotes, y gráficos de dispersión.

4. Análisis de correlación: se utiliza para medir la relación entre dos


variables. Las técnicas comunes incluyen el coeficiente de
correlación de Pearson y el coeficiente de correlación de Spearman.

5. Análisis de regresión: se utiliza para modelar la relación entre dos


o más variables y predecir los valores de una variable en función de
las otras variables.

En general, la estadística descriptiva proporciona una manera


sistemática y rigurosa de analizar y describir los datos, lo que ayuda
a los investigadores y analistas a obtener una mejor comprensión
de los patrones y tendencias presentes en ellos.

Distribuciones de frecuencia para datos


agrupados y no agrupados

Las distribuciones de frecuencia son una herramienta útil en la


estadística descriptiva para resumir y presentar datos. Hay dos
tipos principales de distribuciones de frecuencia: para datos
agrupados y no agrupados.
La distribución de frecuencia para datos no agrupados es una tabla
que muestra el número de veces que aparece cada valor en un
conjunto de datos. Por ejemplo, si tenemos un conjunto de datos
que consiste en las edades de un grupo de personas, la distribución
de frecuencia para datos no agrupados mostraría el número de
personas que tienen cada edad.

La distribución de frecuencia para datos agrupados es similar, pero


se usa cuando los datos se agrupan en intervalos o clases. En este
caso, se divide el rango de los datos en intervalos y se cuenta el
número de observaciones que caen en cada intervalo. Por ejemplo,
si tenemos un conjunto de datos que consiste en las alturas de un
grupo de personas, podemos dividir el rango de alturas en
intervalos y contar cuántas personas tienen una altura en cada
intervalo.

Para crear una distribución de frecuencia para datos agrupados, se


siguen los siguientes pasos:

1. Determinar el rango de los datos y el número de clases o


intervalos que se desean usar.

2. Calcular la amplitud de clase, que es la diferencia entre el límite


superior y el límite inferior de cada intervalo.
3. Crear una tabla que incluya los límites inferiores y superiores de
cada intervalo, así como el número de observaciones que caen en
cada intervalo.

4. Calcular la frecuencia relativa para cada intervalo, que es el


número de observaciones en cada intervalo dividido por el número
total de observaciones.

5. Calcular la frecuencia acumulada para cada intervalo, que es la


suma de las frecuencias de todos los intervalos anteriores, incluido
el intervalo actual.

Las distribuciones de frecuencia son útiles para analizar y resumir


conjuntos de datos, lo que permite a los analistas identificar
patrones y tendencias importantes.

Medidas de tendencia central

Las medidas de tendencia central son estadísticas que se utilizan en


la estadística descriptiva para describir la ubicación central de un
conjunto de datos. Las medidas de tendencia central se utilizan
para resumir los datos en un solo valor que representa el centro de
los datos.

Las medidas de tendencia central más comunes son:


1. Media aritmética: es la medida de tendencia central más
comúnmente utilizada y se calcula sumando todos los valores de un
conjunto de datos y dividiendo por el número total de valores. La
media aritmética es sensible a los valores extremos o atípicos y
puede no ser representativa de todo el conjunto de datos en
presencia de valores extremos.

2. Mediana: es el valor que divide un conjunto de datos ordenados


en dos partes iguales. Si el conjunto de datos tiene un número par
de valores, la mediana es la media de los dos valores centrales. La
mediana es menos sensible a los valores extremos que la media
aritmética y es útil cuando los datos están sesgados o tienen
valores atípicos.

3. Moda: es el valor que aparece con mayor frecuencia en un


conjunto de datos. Puede haber una o varias modas en un conjunto
de datos. La moda es útil cuando se desea conocer el valor más
común en un conjunto de datos.

Cada medida de tendencia central tiene sus propias aplicaciones y


limitaciones, y la elección de una medida depende del conjunto de
datos y del objetivo del análisis. Es importante tener en cuenta que
las medidas de tendencia central proporcionan información sobre
la ubicación central de un conjunto de datos y no proporcionan
información sobre la variabilidad o dispersión de los datos. Por lo
tanto, es importante complementar las medidas de tendencia
central con medidas de dispersión, como la desviación estándar o el
rango intercuartil, para tener una imagen completa de los datos.

Medida de dispersión para datos agrupados


y no agrupados

Las medidas de dispersión se utilizan en la estadística descriptiva


para describir la variabilidad o la dispersión de un conjunto de
datos. Las medidas de dispersión indican cómo se extienden los
datos alrededor de la media o de otro punto central. Hay diferentes
medidas de dispersión para datos agrupados y no agrupados.

Para datos no agrupados, las medidas de dispersión más comunes


son:

1. Desviación estándar: es una medida de la dispersión que indica


cuánto se alejan los valores individuales de la media. La desviación
estándar se calcula encontrando la raíz cuadrada de la varianza del
conjunto de datos.

2. Rango: es la diferencia entre el valor máximo y el valor mínimo


en un conjunto de datos. El rango indica la amplitud total del
conjunto de datos.
3. Varianza: es otra medida de la dispersión que indica cuánto se
alejan los valores individuales de la media. La varianza se calcula
sumando los cuadrados de las diferencias entre cada valor y la
media, y dividiendo por el número total de valores.

Para datos agrupados, las medidas de dispersión más comunes son:

1. Desviación estándar: se calcula utilizando la fórmula de la


desviación estándar para datos agrupados, que tiene en cuenta la
frecuencia de cada intervalo.

2. Coeficiente de variación: es una medida relativa de la dispersión


que se calcula dividiendo la desviación estándar por la media. El
coeficiente de variación se expresa como un porcentaje y se utiliza
para comparar la dispersión de diferentes conjuntos de datos.

3. Rango intercuartil: es la diferencia entre el tercer y el primer


cuartil en un conjunto de datos. El rango intercuartil indica la
amplitud central de los datos y es menos sensible a los valores
atípicos que el rango.

En general, las medidas de dispersión son útiles para comprender la


variabilidad de los datos y para comparar diferentes conjuntos de
datos. Las medidas de dispersión son especialmente útiles cuando
se utilizan en conjunto con medidas de tendencia central, como la
media, la mediana o la moda.
Representación gráfica de frecuencia
acumulada relativa

La representación gráfica de la frecuencia acumulada relativa es un


tipo de gráfico que se utiliza para visualizar la distribución
acumulada de un conjunto de datos. La frecuencia acumulada
relativa es la proporción acumulada de las observaciones que caen
por debajo o por encima de un valor determinado en un conjunto
de datos y se calcula sumando las frecuencias relativas de todas las
observaciones hasta ese valor.

Para crear un gráfico de frecuencia acumulada relativa, se siguen


los siguientes pasos:

1. Se ordenan los datos de menor a mayor.

2. Se calcula la frecuencia relativa de cada valor.

3. Se calcula la frecuencia acumulada relativa de cada valor


sumando las frecuencias relativas de todos los valores anteriores,
incluyendo el valor actual.

4. Se grafica la frecuencia acumulada relativa en el eje vertical y los


valores en el eje horizontal.
Un gráfico de frecuencia acumulada relativa es útil para identificar
patrones en la distribución de un conjunto de datos. Al visualizar la
distribución acumulada, se pueden identificar rápidamente los
valores que tienen una frecuencia acumulada alta o baja y
determinar la proporción de valores que caen por debajo o por
encima de ciertos valores críticos.

En general, los gráficos de frecuencia acumulada relativa son útiles


para analizar la distribución de un conjunto de datos y para
determinar las proporciones acumuladas de observaciones que
caen por debajo o por encima de valores críticos.

También podría gustarte