0% encontró este documento útil (0 votos)
54 vistas8 páginas

Unidad 2

Este documento describe métodos para organizar y clasificar datos, incluyendo distribuciones de frecuencia para variables cualitativas y cuantitativas discretas. Explica cómo construir cuadros de distribución de frecuencia y representarlos gráficamente mediante barras y sectores circulares.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
54 vistas8 páginas

Unidad 2

Este documento describe métodos para organizar y clasificar datos, incluyendo distribuciones de frecuencia para variables cualitativas y cuantitativas discretas. Explica cómo construir cuadros de distribución de frecuencia y representarlos gráficamente mediante barras y sectores circulares.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

UNIDAD II

Organización y clasificación de datos:

Distribución de frecuencias. - Después de la recopilación de datos, es necesario resumirlos y


presentarlos en forma tal que faciliten su comprensión y su posterior análisis y utilización para
ello, se ordenan en cuadros numéricos y luego se representan en gráficos.

Un cuadro numérico debe tener:

- Un título adecuado para evitar confusiones y para expresar brevemente su contenido.


- La fuente de los datos, si no son datos propios.
- Las unidades en que se expresan los datos.

Los cuadros numéricos de una sola variable estadística se denominan distribución de


frecuencias.

En el procedimiento para construir los cuadros de distribución de frecuencia nos referiremos a


muestras, mientras no se diga lo contrario.

Distribución de frecuencias: Variable cualitativa. - Supongamos que en una muestra de n


unidades estadísticas se observan k Categorías o modalidades diferentes c1, c2, … , ck de alguna
variable cualitativa x.

La tabulación de estos n datos, es la distribución de frecuencias por categorías del cuadro 1.1

Frecuencia absoluta (fi). - Es el número de datos observado en cada categoría o modalidad. La


suma de todas las frecuencias absolutas es igual al total n de datos observados.

Frecuencia relativa (hi). – Se define en cada categoría por hi=fi/n. La suma de todas las
frecuencias relativa es igual a uno.

Frecuencia porcentual (pi). - Se define en cada fila por pi=hi*100% el total de la frecuencia
porcentuales es igual a cien.

1.1.- Cuadro distribución de frecuencias para variable cualitativa.

Categoría de la Frecuencia absoluta Frecuencia relativa Frecuencia


variable (X) (fi) (hi) porcentual (Pi)
C1 f1 h1 P1
C2 f2 h2 P2
. . . .

. . . .

. . . .
Ck fk hk Pk
total ∑fi = n ∑hi= 1,00 ∑Pi = 100

Gráficos. - Existe una gran variedad de gráficos para la distribución de frecuencia de variable
cualitativa, las más comunes son la de barras y las de sectores circulares.

Gráfica de barras. - Se llama gráfica de Barras a una representación de rectángulos sobre un


sistema de ejes coordenadas X Y. La altura de los rectángulos será proporcional a la
frecuencias absolutas los rectángulos deben estar separados entre sí.
Entonces sobre eje de ordenadas (0Y) se ubica la frecuencia absoluta, sobre el eje de las
abscisas (0X) se sitúan los datos, en la parte central de la base de los rectángulos.

El lugar de rectángulos se puede emplear directamente líneas verticales, llamados diagrama o


gráfico de bastones o de varillas.

Gráficos de sectores circulares. - Se llama gráficos de sectores circulares o también llamado


pastel.

Por la forma total que se asemeja a una torta de ahí el nombre.

Nótese que existan 5 sectores entre los que está dividido el círculo.

Para obtener este diagrama se considera que el ángulo de cada sector es proporcional a su
frecuencia absoluta. Luego el ángulo correspondiente a un sector se calcula de acuerdo a:

fi
∝i= ∗360 °
n
Donde fi es una frecuencia absoluta y n es la cantidad de datos observados.

Este tipo de diagrama o gráfico es adecuado, siempre y cuando el número de datos no sea
mayor a 6.

Actualmente con el uso de las hojas electrónicas de las computadoras, tales como Excel, es
posible lograr excelentes representaciones gráficas.

Ejemplo. - En una encuesta de opinión de las preferencias de viajar a un país de Sudamérica


por sus playas turísticas:

Brasil (B), Uruguay (U), Argentina (A), 20 personas dieron las siguientes respuestas:

B, U, U, B, A, B, A, U, B, U, A, A, U, B, U, A, B, B, U, B.

¿Construir el cuadro de distribución de frecuencias y graficar utilizando los dos tipos de


gráficos?

Solución:

Cuadro de distribución de frecuencia por sus playas turísticas de un país sudamericano.

Frecuencia absoluta Frecuencia relativa Frecuencia


Valores de X
(fi) (hi) porcentual (Pi)
B (Brasil) 8 0,40 40
U (Uruguay) 7 0,35 35
A (Argentina) 5 0,25 25
total ∑ fi = 20 = n ∑hi = fi /n = 1,00 Pi = 100%
Gráfico de Barras
9

5
Personas

0
B U A
Paises

Gráfico de sectores circulares

Argentina; 25;
25%
Brasil; 40; 40%

Uruguay; 35; 35%

Brasil Uruguay Argentina

fi
144 - 90 = 54 ∝= *360°
n
90 – 54 = 36 f1 8
∝1= =360°= *360=144°
n 20
f2 7
∝2= =360°= *360=126°
n 20
f3 5
90 + 36 = 126 ∝3= =360°= *360=90°
n 20

Distribución de frecuencias. – (variable cuantitativa discreta). - Suponga que se han


recolectado n valores de alguna variable discreta x el procedimiento más simple de organizar
estos n datos, consiste en ordenar esto valores numéricos en forma ascendente.

Si todo los n datos son distinto entre sí, se obtendrá una distribución de frecuencias de n
valores de la variedad x, donde cada uno de estos valores tienen frecuencia igual a uno.
Si algunos valores se repiten y si al terminar el ordenamiento se obtienen K(k≤n) valores
distintos de x, digamos x1, x2, …, xk, con frecuencias absolutas respectivas f1, f2, …, fk, la
distribución de frecuencias de esto n datos se resume en el siguiente cuadro 1.2:

1.2.- Cuadro Distribución de Frecuencia de variable discreta

Valores de la Frecuencias Frecuencias Frecuencias


variable absolutas relativas porcentuales
X1 f1 h1 p1
X2 f2 h2 p2
X3 f3 h3 p3
. . . .

. . . .
Xk fk hk pk
Totales ∑fi=n ∑hi=1,00 ∑pi=100%

Las frecuencias absolutas, relativas y porcentuales poseen, en el caso de la variable discreta y


continua el mismo significado y propiedades, que en el caso de la variable cualitativa.

Cuando es grande el número de datos observados de una variable discretas su organización es


muy engorrosa, en este caso, para resumir los datos y poder calcular las medidas descriptivas,
es conveniente seguir el método de organización de variable continua por intervalos que lo
veremos en los siguientes Capítulos.

Gráfica. - La representación gráfica más común de una distribución de frecuencias de variable


discreta el tipo Bastón que consiste en trazar en cada Valor distinto de la variable, segmentos
de recta proporcionales a su frecuencia, también se puede usar barras rectangulares para
graficar una distribución de frecuencias de variable discreta.

Ejemplo. - Una muestra de 20 Hogares, ante la pregunta del número de hijos por familia
(variable x), sumaron la siguiente respuesta:

2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.

¿Elaborar el cuadro de distribución de frecuencias y graficar con los datos de la tabla?

Solución. - ordenamos estos datos en forma ascendente y obtenemos cinco valores distintos 0,
1, 2, 3, 4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribución de frecuencia de x
la desarrollamos en el siguiente cuadro.

Cuadro Distribución de frecuencias del número de hijos por familia.

Números de hijos Frecuencias Frecuencias relativas Frecuencias


(X) absolutas (fi) (hi) porcentual (pi)
0 1 0,05 5
1 4 0,20 20
2 7 0,35 35
3 6 0,30 30
4 2 0,10 10
Totales ∑fi=20 ∑hi=1,00 ∑pi=100%
Gráfico:

Gráfico de Barras
8

5
Familias

0
0 1 2 3 4

Número de Hijos

(RRII)Distribución de frecuencia por intervalos. - La distribución de frecuencias por intervalos


o clases se usa cuando la variable estadística es continua o cuando el número de valores
distintos de una variable discreta es muy grande. Esta distribución se obtiene dividiendo el
rango de variación de los datos en K intervalos o clase y determinando el número de datos que
contiene cada intervalo.

Cada intervalo o clase Ii, lo tomamos cerrado por la izquierda y abierto por la derecha, esto es
Ii=[Li; Ui[ siendo Li el límite o extremo inferior y Ui el límite o extremo superior del intervalo. El
último intervalo se tomará extremo cerrado, esto es, I k = [Lk ; Uk].

1.3. - Cuadro distribución de frecuencia por intervalos.

Marcas de Frecuencias Simples


Intervalos
Clase Absoluta Relativa Porcentual
(Ii)
(mi) (fi) (hi) (pi)
I1 m1 f1 h1 P1
I2 m2 f2 h2 p2
I3 m3 f3 h3 p3
. . . . .
. . . . .
Ik mk fk hk Pk
Totales - ∑fi=n ∑hi=1,00 ∑pi=100%

Para construir la distribución de frecuencia por intervalos hay varios procedimientos. Por
ejemplo, se recomienda:

Regla 1.- Elegir no más de 20 intervalos ni menos de 5, ya que muchos intervalos pueden
complicar innecesariamente los cálculos de las medidas descriptivas, pocos intervalos podrían
omitir características importantes de los datos. Es bueno elegir todos los intervalos de igual
amplitud A.

Regla 2.- El número de intervalos elegidos, debe dar una distribución de frecuencias modal, es
decir, una distribución cuyas frecuencias van aumentando progresivamente hasta una
frecuencia máxima y luego van disminuyendo también progresivamente.
Construcción del cuadro distribución de frecuencias por intervalos. - Dado n valores de
alguna variable cuantitativa x discreta o continua su procedimiento para construir la
distribución de frecuencia es:

1.- determinar el Rango (R) de variación de los datos que se define por:

R= Xmax – Xmin
Donde Xmax es el dato mayor Y Xmin es el dato menor.

2.- determinar el número de intervalos (k), teniendo en cuenta la Recomendación o regla 1


(R1).

Un valor aproximado del número de intervalo k nos proporciona la regla de Sturges, donde:

K=1+ 3,3 log ( n ) ; n ≥ 10


Redondeando al entero inmediato mayor, por ejemplo:

Si se tiene n = 45 datos sin decimales, entonces:

K=1+ 3,3 log 45K=1+5,455 ≅ 6,4556K=7


Alternativamente se puede utilizar la Regla de Jule K¿ √ n ; 25 ≤n ≤ 400K= √ n=√ 45=6,708
K=6,7 ≅ 7
3.- determina la amplitud A del intervalo, dividiendo el rango entre el número del intervalo
R
esto es: A=
K
R
Si la división A= no es exacta en el número de decimales de los datos, entonces el número
K
A se aproxima por exceso de manera que KA ≥ R .

4.- Determinar los extremos de los intervalos de la siguiente manera.

I 1=¿ ¿

I 2=¿¿

I 3=¿¿

………………………
I k=[ x min +(k−1) A ; xmin + KA]

Marca de clase. - La marca de clase o marca del intervalo Ii=[Li;Ui[ es el número mi, que se
define como el punto medio del intervalo esto es:

Li + U i
mi=
2
La marca de clases el número que representa a todos los datos contenidos en el intervalo.
Gráfica de la distribución por intervalos. - La distribución de frecuencias se representa
gráficamente por medio de un histograma, o de un polígono de frecuencia. A partir del
polígono de frecuencia se puede trazar la curva de frecuencia.

Histograma. - Es una gráfica de barras rectangulares verticales juntas. La base de cada barra es
proporcional a la amplitud del intervalo y la altura es proporcional a sus frecuencias (absoluta,
relativa o porcentual). En el eje horizontal se colocan las escalas de las variables, en eje vertical
se colocan las escalas de las frecuencias. Los números representativo de la escala de los
intervalos son generalmente los números representativos de la escala de los intervalos son
generalmente las marcas de clase de cada intervalo. Aunque también pueden colocarse los
límites de los intervalos.

Polígono de frecuencia. - Es una gráfica poligonal cerrada, que se obtiene uniendo con
segmentos de rectas, los puntos que tienen proporcionalmente como abscisa a la marca de
clase y como ordenada a la frecuencia respectiva, se cierra en ambos extremos en las marcas
de clase adyacente de frecuencia cero.

Ejemplo. – Suponga que se toma un examen de aptitud a todos los aspirantes a puestos de
trabajo en el Servicio General de Identificación Personal (SEGIP). Se elige al azar una muestra
de 50 aspirantes y esto son los resultados:

77, 44, 49, 33, 38, 33, 76, 55, 68, 39, 29, 41, 45 32, 83, 58, 73, 47, 40, 26, 34, 47, 66, 53, 55, 58,
49, 45, 61, 41, 54, 50, 51, 66, 80, 73, 57, 61, 56, 50, 38, 45, 51, 44, 41, 68, 45, 93, 43, 12.

a) ¿Construir el cuadro de distribución de frecuencias?


b) ¿Graficar sus histograma y polígono de frecuencia?
Solución:
1° Cálculo del rango:
R= Xmax – Xmin = 93 - 12 = 81

2° Hallar el Nº de intervalos K Aproximado:


Regla de Sturges :k =1+3,3 log (n¿) ¿k =1+3,3 log (50¿) ¿k =6,6 ≅ 7 Intervalos

3° Hallar la amplitud A:
R 81
A= = =11,57 ≅ 12
K 7

KA ≥ R7∗12≥ 8184 ≥ 81

A) Cuadro de distribución de frecuencia los 50 aspirantes a puestos de trabajo en el


SEGIP.

Marcas de FRECUENCIAS SIMPLES


Intervalos
Clases
(Ii) fi hi pi
(mi)
[12 24[ 18 1 0,02 2
[24 36[ 30 6 0,12 12
[36 48[ 42 16 0,32 32
[48 60[ 54 14 0,28 28
[60 72[ 66 6 0,12 12
[72 84[ 78 6 0,12 12
[84 96] 90 1 0,02 2
Totales - ∑fi=50 ∑hi=1,00 ∑pi=100%
Fuente: SEGIP.

18

16

14

12
fi
10

8
Polígono de frecuencias
6
Histograma
4

Ii, mi

También podría gustarte