Nombre y apellido :________________ GRUPO PARTICULAR-ESTADISTICA I
REBK SHAM
TEMA 2- ORGANIZACIÓN Y PRESENTACION DE DATOS
UNIVARIADOS
DIAGRAMA DE TALLO Y HOJA:
Separa las entradas de datos en dígitos guía (tallos) y dígitos rastreros (hojas) para organizar
las variables cuantitativas en orden ascendente o descendente (Berenson).
Ej: Xi : edades de 10 personas.
Xi = 30;26;15;21;32;41;26;23;16;23
DIAGRAMA DE TALLO Y HOJA ORDENADA
1 56
2 13366
3 02
4 1
DISTRIBUCIONES DE FRECUENCIAS SEGÚN TIPOS DE VARIABLE:
Una distribución de frecuencia es una tabla en la que se resumen los datos según el valor de la
variable o de acuerdo al agrupamiento o categorías, asignando a cada una la cantidad de
elementos observados.
INTERVALOS DE CLASE:
Son categorías en las que se agrupa una variable cuantitativa.
CARACTERISTICAS:
- Tiene límite inferior (Li o Xi-1).
- Tiene límite superior (Ls o Xj).
- Los intervalos son contiguos. El final de uno coincide con el inicio del siguiente.
- Son mutuamente excluyentes. Los valores de la variable solo pueden asignarse a un
intervalo de clase.
CANTIDAD DE INTERVALOS DE CLASE:
- Si n< 100 entonces K= 1+3,32 log n
- Si n≥100 entonces K=√𝑛
Donde “n” es el numero de observaciones de la muestra.
K: cantidad de intervalos.
AMPLITUD DE CADA INTERVALO DE CALSE:
𝑅
Una vez definida la cantidad de intervalos se obtiene la longitud de cada uno haciendo: a=
𝐾
Donde R= Xmax – Xmin.
pág. 1
Nombre y apellido :________________ GRUPO PARTICULAR-ESTADISTICA I
REBK SHAM
PUNTO MEDIO O MARCA DE CLASE DE UN INTERVALO:
Es el promedio entre Li y Ls de cada intervalo. Es el valor que representa los datos contenidos
en cada clase
𝑋𝑗−1+𝑋𝑗
Xi= 2
PROPIEDAD: la distancia entre cada punto medio coincide con la amplitud de los intervalos.
SUBJETIVIDAD DE LA SELECCIÓN DE LOS LIMITES DE CLASE:
La manipulación de los limites inferiores y superiores debe ser flexible y las formulas dadas
para “K” y “a” son a modo de sugerencia.
FRECUENCIAS ABSOLUTAS Y RELATIVAS
FRECUENCIA ABSOLUTA: Es el n° de unidades que se observa para cada valor de la variable o
para cada intervalo de clase.
Se simboliza con “fi” y se verifica que:
𝐾
∑ 𝑓𝑖 = 𝑛
𝑖=1
Donde K es la cantidad de elementos de “Xi” o cantidad de intervalos de clase.
FRECUENCIAS RELATIVAS: representa la proporción de observaciones de cada valor de la
𝑓𝑖
variable o de cada intervalo de clase. Se obtiene del cociente hi= y el total de observaciones
𝑛
(N o n). Se simboliza con “hi” y se verifica que:
𝐾
∑ ℎ𝑖 = 1
𝑖=1
FRECUENCIAS ACUMULADAS
Hi≤ ; Fi≤ : es la sumatoria de frecuencias absolutas o relativas hasta un cierto valor de la
variable o intervalo de clase.
Indica el numero o proporción de observaciones hasta un valor de la variable o hasta el limite
superior de un intervalo.
Fk≤ =∑𝐾
𝑖=1 𝑓𝑖
Hk≤ = ∑𝐾
𝑖=1 ℎ𝑖
pág. 2
Nombre y apellido :________________ GRUPO PARTICULAR-ESTADISTICA I
REBK SHAM
Hi≥ ; Fi≥ : es la diferencia entre el total de observaciones o la unidad (1) y la frecuencia
acumulada ≤ correspondiente al intervalo anterior o al valor anterior de la variable.
Fk≥ =𝑛 − ∑𝐾−1
𝑖=1 𝑓𝑖
Hk≥ = 1 − ∑𝐾−1
𝑖=1 ℎ𝑖
HISTOGRAMAS
Los histogramas son diagramas de barras verticales em los que se construyen barras
rectangulares en los límites de cada clase.
Al graficar histogramas, la variable aleatoria o fenómenos de interés se despliega a lo largo del
eje horizontal; el eje vertical representa el número, proporción o porcentaje de observaciones
por intervalo de clase, dependiendo de si el histograma particular es, respectivamente, un
histograma de frecuencia, un histograma de frecuencia relativa o un histograma de porcentaje.
POLIGONO DE FRECUENCIAS
Un histograma puede transformarse en un polígono de frecuencias, uniendo los puntos
medios de las bases superiores de cada rectángulo, cerrándolo, uniendo el polígono en dos
puntos medios hipotéticos con frecuencias cero, uno antes del primer intervalo y el otro
después del último intervalo.
Si aumentamos el numero de unidades de las muestras y disminuimos la amplitud de los
intervalos el polígono de frecuencia toma la forma de una “curva” que se hace cada vez mas
suave y menos irregular.
pág. 3
Nombre y apellido :________________ GRUPO PARTICULAR-ESTADISTICA I
REBK SHAM
A continuación, podemos observar el polígono de frecuencia obtenido del histograma:
POLIGONO DE FRECUENCIAS ACUMULADAS-OJIVA:
Es la grafica correspondiente a las frecuencias acumuladas “menos que” o “más que”. La
intersección entre las dos ojivas nos permite determinar aproximadamente el valor de la
mediana en forma geométrica.
pág. 4
Nombre y apellido :________________ GRUPO PARTICULAR-ESTADISTICA I
REBK SHAM
GRAFICOS DE BASTONES (para las frecuencias absolutas):
GRAFICOS ESCALONADOS (para las frecuencias acumuladas):
GRAFICOS LINEALES:
Muestran la tendencia en los datos a intervalos idénticos.
Los ejes pueden tener ambos escala decimal, puede tener uno escala decimal y la otra escala
logarítmica (gráficos semilogarítmicos), o pueden tener ambos escalas logarítmicas (grafico
doble logarítmico).
pág. 5
Nombre y apellido :________________ GRUPO PARTICULAR-ESTADISTICA I
REBK SHAM
GRAFICOS DE BARRAS:
Deben construirse horizontalmente cuando las observaciones son los resultados de una
variable categórica. Las barras deben construirse verticalmente cuando las observaciones son
resultados de una variable numérica. Todas deben tener el mismo ancho. Solo el largo puede
diferir.
GRAFICOS CIRCULAR:
Muestran el tamaño proporcional de los elementos que conforman una serie de datos en
función de la suma de elementos. Siempre mostrará una única serie de datos y resulta de
utilidad cuando se desea destacar un elemento significativo.
GRAFICO DE PUNTOS (DISPERSION): muestran la relación entre los valores numéricos de
varias series de datos, o trazan dos grupos de números como una única serie de coordenadas
XY. Este tipo de gráficos muestra los intervalos o agrupaciones, desiguales de datos, y suele
utilizarse para los datos científicos. Al organizar los datos se sitúan los valores X en una fila o
columna y, a continuación, los valores Y correspondientes en las filas o columnas adyacentes.
pág. 6
Nombre y apellido :________________ GRUPO PARTICULAR-ESTADISTICA I
REBK SHAM
DIAGRAMA DE PARETO
Es un tipo especial de grafica de barras verticales utilizado para valores categóricos
(cualitativa) en la que las barras se grafican en orden descendente (modificando el orden
original), y se combinan con un polígono acumulativo en la misma escala.
El eje vertical contiene los porcentajes (de 100 en el extremo superior y 0 en el inferior) y el eje
horizontal contiene las categorías de interés. Las barras igualmente espaciadas también deben
ser de igual ancho y para un impacto visual sugerimos que sean del mismo color.
El punto del polígono de porcentaje acumulativo para cada categoría se centra en el punto
medio de cada barra respectiva. Por lo tanto, al estudiar el diagrama de Pareto debemos
concentrarnos en dos cosas:
- Las magnitudes de las diferencias en las longitudes de las barras correspondientes a las
categorías descendientes.
- Los porcentajes acumulativos de estas categorías adyacentes.
TABLAS DE CONTINGENCIA
Son aquellas que permiten analizar dos variables simultáneamente. También llamadas
tablas de datos cruzados o de doble entrada. Permiten leer información guiándonos por
filas y columnas.
Ejemplo: cantidad de colegios en distintas localidades de salta, clasificadas por públicas o
privadas.
Tipo de Localidades
institución capital oran tartagal Totales
Publico 32 20 22 74
privado 18 10 8 36
totales 50 30 30 110
Con el fin de explorar cualquier relación entre los datos de las filas y los datos de las
columnas, es útil convertir estos resultados en porcentajes basándose en el total global, en
totales de filas o de columnas.
pág. 7
Nombre y apellido :________________ GRUPO PARTICULAR-ESTADISTICA I
REBK SHAM
Tabla de contingencias con porcentajes basados en el total global:
Tipo de Localidades
institución capital oran tartagal Totales
Publico 29.1% 18.2% 20% 67.3%
privado 16.4% 9.1% 7.3% 32.7%
totales 45.4% 27.3% 27.3% 100%
Tabla de contingencias con porcentajes basados en totales de fila:
Tipo de Localidades
institución capital oran tartagal Totales
Publico 43.2% 27% 29.8% 100%
privado 50% 27.8% 22.2% 100%
totales 45.4% 27.3% 27.3% 100%
Tabla de contingencias con porcentajes basados en totales de columnas:
Tipo de Localidades
institución capital oran tartagal Totales
Publico 64% 66.7% 73.3% 67.3%
privado 36% 33.3% 26.7% 32.7%
totales 100% 100% 100% 100%
pág. 8