0% encontró este documento útil (0 votos)
41 vistas10 páginas

Estadistica 2 David

La estadística es una rama de las matemáticas que permite recopilar, organizar y analizar datos para tomar decisiones informadas. Se divide en estadística descriptiva, que resume y presenta datos, y estadística inferencial, que generaliza y toma decisiones basadas en muestras. Incluye conceptos como variables estadísticas, medidas de posición central y no central, medidas de dispersión y métodos gráficos como histogramas y diagramas de Pareto.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
41 vistas10 páginas

Estadistica 2 David

La estadística es una rama de las matemáticas que permite recopilar, organizar y analizar datos para tomar decisiones informadas. Se divide en estadística descriptiva, que resume y presenta datos, y estadística inferencial, que generaliza y toma decisiones basadas en muestras. Incluye conceptos como variables estadísticas, medidas de posición central y no central, medidas de dispersión y métodos gráficos como histogramas y diagramas de Pareto.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

ESTADISTICA 2

¿Qué es la estadística?
La estadística es una rama de las matemáticas que te permite recopilar,
organizar y analizar datos según la necesidad que tengas, por ejemplo: obtener
un resultado, comparar información, tomar mejores decisiones, entre muchas
cosas más.
La estadística se refiere a un conjunto de métodos para manejar la obtención,
presentación y análisis de observaciones numéricas. Sus objetivos son
describir el conjunto de datos obtenidos y tomar decisiones o realizar
generalizaciones acerca de las características de todas las posibles
observaciones bajo consideración. Los métodos estadísticos son ampliamente
utilizados en diferentes áreas del quehacer humano: el gobierno, los negocios,
la educación, la psicología, la sociología, la antropología, las ciencias del
comportamiento, la agricultura, la medicina, la biología y la física, entre otras.
Existen dos grandes ramas en esta disciplina, la estadística descriptiva y
inferencial.
ESTADISTICA DESCRIPTIVA
La estadística descriptiva es la técnica matemática que obtiene, organiza,
presenta y describe un conjunto de datos con el propósito de facilitar el uso,
generalmente con el apoyo de tablas, medidas numéricas o gráficas.
El término estadística descriptiva (en el sentido de contar sustantivos
contables) es una técnica matemática que describe o resume cuantitativamente
las características de una colección de información, mientras que también
puede emplearse el mismo término (en el sentido de contabilizar sustantivos no
numerables) para el proceso de usar y analizar esas técnicas y resultados.

VARIABLE ESTADISTICAS:
Una variable estadística es el conjunto de valores que puede tomar cierta
característica de la población sobre la que se realiza el estudio estadístico y
sobre la que es posible su medición. Estas variables pueden ser: la edad, el
peso, las notas de un examen, los ingresos mensuales, las horas de sueño de
un paciente en una semana, el precio medio del alquiler en las viviendas de un
barrio de una ciudad. se pueden clasificar por diferentes criterios. Según su
medición existen dos tipos de variables:

Cualitativa (o categórica): hace referencia una cualidad, por ejemplo: Color de


cabello (castaño, negro, rubio, etc.)

Cuantitativas (o numérica): variables que toman valores numéricos.


Ejemplos: edad (10,12,18,21,25,etc) continua. Número de postes (1, 2,…).
Discreta.

MEDIDAS DE POSICION CENTRAL

son medidas que tienden a localizar en qué punto se encuentra la parte


central de un conjunto ordenado de datos de una variable cuantitativa. se
dividen en tres tipos:
MEDIDAS DE POSICION NO CENTRAL

Las medidas de posición no central (o medidas de tendencia no central)


permiten conocer puntos característicos de una serie de valores, que no
necesariamente tienen que ser centrales. La intención de estas medidas
es dividir el conjunto de observaciones en grupos con el mismo número de
valores.

Cuartiles

Los cuartiles son los tres valores que dividen una serie de datos ordenada en
cuatro porciones iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los
datos. El segundo (Q2) deja a izquierda y derecha el 50% y coincide con
la mediana. El tercero (Q3) deja a la derecha el 25% de valores. Los tres
cuartiles son:

Percentiles

El percentil es una medida de posición no central. Los percentiles Pi son los 99


puntos que dividen una serie de datos ordenada en 100 partes iguales, es
decir, que contienen el mismo número de elementos cada una. El percentil 50
es la mediana.

Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi es:

Donde Pi es la posición del percentil buscado en la serie ordenada de datos.


Los percentiles están pensados para conjuntos de elementos de más de cien
elementos.

MEDIDAS DE DISPERSION

Las medidas de dispersión o medidas de variabilidad muestran


la variabilidad de un conjunto de datos, indicando la mayor o menor
concentración de datos respecto a las medias de centralización. Se dividen en:

Rango de variación: se trata de un número que indica la distancia entre un


valor máximo y uno mínimo. Dicho valor se toma de una población estadística
determinada y se calcula con base en diferentes factores.

Varianza: esta medida representa la variación que puede sufrir un conjunto de


datos respecto a la media.

Desviación estándar: corresponde a una desviación que es “habitual” entre el


valor y la media. Se trata de un evento más probable y por lo tanto se emplea
como tal en el cálculo de dispersión.

Coeficiente de variación: Esta medida de dispersión se expresa como un


porcentaje que es el resultado de dividir la desviación típica sobre la media del
conjunto.


Desviación típica

La desviación típica es la medida de dispersión (S) asociada a la media. Mide


el promedio de las desviaciones de los datos respecto a la media en las
mismas unidades de los datos.

El cuadrado de la desviación típica es la varianza.

Desviación media

La desviación media es la media de los valores absolutos de la diferencia de


cada valor de la distribución con la media aritmética.

Su fórmula es:

Cuando los datos están agrupados en frecuencias:

La desviación media es igual o menor que la desviación estándar:

No confundir la desviación media con la desviación absoluta de un dato


respecto a la media:
Coeficiente de variación de Pearson

El coeficiente de variación de Pearson (r) mide la variación de los


datos respecto a la media, sin tener en cuenta las unidades en la que están.

El coeficiente de variación, en la mayoría de los casos, salvo en algunas


distribuciones probabilísticas, toma valores entre 0 y 1. Si el coeficiente es
próximo al 0, significa que existe poca variabilidad en los datos y es una
muestra muy compacta. En cambio, si tienden a 1 es una muestra muy
dispersa y la media pierde confiabilidad. De hecho, cuando el coeficiente de
variación supera el 30% (0,3) se dice que la media es poco representativa, al
ser los datos poco homogéneos.

Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para


tenerlo en tanto por cien.

FRECUENCIAS

La frecuencia es una medida que sirve para comparar la aparición de un


elemento Xi en un conjunto de elementos (X1, X2,…, XN). Las frecuencias de
cada elemento se pueden expresar tanto absolutas (número total de
apariciones) como relativas (proporción de apariciones).

Frecuencia absoluta

La frecuencia absoluta (ni) de un valor Xi es el número de veces que el valor


está en el conjunto (X1, X2,…, XN).
Frecuencia absoluta acumulada

La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,…, XN)


es la suma de las frecuencias absolutas de los valores menores o iguales a Xi,
es decir:

Frecuencia relativa

La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a


Xi en el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa es
la frecuencia absoluta dividida por el número total de elementos N:

Las frecuencias relativas son valores entre 0 y 1, 0 ≤ fi ≤ 1. La suma de


las frecuencias relativas de todos los sujetos da 1. Supongamos que en el
conjunto tenemos k números (o categorías) diferentes, entonces:

Si se multiplica la frecuencia relativa por cien se obtiene el porcentaje (tanto por


cien %).

Frecuencia relativa acumulada

Definimos la frecuencia relativa acumulada (Fi) de un valor Xi como


la proporción de valores iguales o menores a Xi en el conjunto de datos (X1, X2,
…, XN). Es decir, la frecuencia relativa acumulada es la frecuencia absoluta
acumulada dividida por el número total de sujetos N:
La frecuencia relativa acumulada de cada valor siempre es mayor que
la frecuencia relativa. De hecho, la frecuencia relativa acumulada de un
elemento es la suma de las frecuencias relativas de los elementos menores o
iguales a él, es decir:

Diagrama de Pareto

El diagrama de Pareto (también llamado diagrama ABC) fue creado por Vilfredo
Pareto, para representar datos cualitativos. El italiano comprobó que el 20% de
la población italiana acaparaban el 80% de riquezas y propiedades.

El principio de Pareto afirma que el 20% de las causas vitales originan


alrededor del 80% de los efectos. O visto desde el punto de vista matemático,
que el 20% de las categorías representan el 80% de las observaciones.

El diagrama de Pareto se construye siguiendo estos dos pasos:

1. Ordenar los datos por frecuencia relativa o absoluta.


2. Representar cada una de las categorías de la variable mediante
un rectángulo proporcional a su frecuencia (como en el diagrama de barras).

Histograma
Un histograma es una representación gráfica de datos agrupados mediante
intervalos. Los datos provienen de una variables cuantitativas continuas.
Gracias a él puedes hacerte rápidamente una idea de la distribución de los
datos o muestra.

También cabe emplear variables cualitativas ordinales, siendo necesario que el


número de datos sea alto.

Un histograma es un conjunto de rectángulos que representan las frecuencias


absolutas de cada uno de los intervalos. Los intervalos abarcan todo el
conjunto sin cortarse, de manera que un elemento está solo en un intervalo.

ESTADISTIXA DIFERENCIAL
Por otro lado, la estadística inferencial es una técnica mediante la cual se
obtienen generalizaciones o se toman decisiones con base en información
parcial o incompleta, obtenida mediante técnicas descriptivas
 Estimación de parámetros. Aquí se toma un estadístico de los datos de la
muestra y se utiliza para hacer una conjetura informada sobre el parámetro
medio de una población. Se utiliza estimadores como el trazado de
probabilidades, los métodos de estimación bayesiana, la regresión por rangos y
la estimación de máxima verosimilitud.
 Intervalos de confianza. Los intervalos de confianza se utilizan para obtener
una estimación por intervalos de los parámetros elegidos. Se utilizan para
descubrir el margen de error en la investigación y determinar si afectará a las
pruebas.
 Análisis de regresión. Es una serie de procesos estadísticos que estiman la
relación entre una variable dependiente y un conjunto de variables
independientes. Este análisis utiliza pruebas de hipótesis para determinar si las
relaciones observadas en los datos de la muestra existen realmente en la
población.
 Prueba de hipótesis. A través de esta prueba se busca responder a
las preguntas de la investigación utilizando datos de la muestra y
haciendo suposiciones sobre los parámetros de la población. Esta prueba
determina si la población medida tiene un valor superior al de otro punto de
datos del análisis. En esta práctica, se intenta hallar el margen de error
multiplicando el error estándar de la media por la puntuación Z. El valor de Z es
el número de desviaciones estándar que están comprendidas entre el promedio
y un cierto valor de una variable determinada o estudiada.

También podría gustarte