0% encontró este documento útil (0 votos)
29 vistas18 páginas

Módulo 1

El módulo de Estadística Descriptiva aborda la recolección, análisis e interpretación de datos para explicar el comportamiento de variables en diversos fenómenos. Se divide en dos ramas: estadística descriptiva, que se centra en la visualización y resumen de datos, y estadística inferencial, que genera modelos y extrae inferencias sobre poblaciones. Se presentan conceptos clave como población, muestra, individuo, y se discuten las variables cuantitativas y cualitativas, así como la importancia de la aleatoriedad en la selección de muestras.

Cargado por

Candela da Silva
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
29 vistas18 páginas

Módulo 1

El módulo de Estadística Descriptiva aborda la recolección, análisis e interpretación de datos para explicar el comportamiento de variables en diversos fenómenos. Se divide en dos ramas: estadística descriptiva, que se centra en la visualización y resumen de datos, y estadística inferencial, que genera modelos y extrae inferencias sobre poblaciones. Se presentan conceptos clave como población, muestra, individuo, y se discuten las variables cuantitativas y cualitativas, así como la importancia de la aleatoriedad en la selección de muestras.

Cargado por

Candela da Silva
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Estadística – Módulo 1

Módulo : Estadísti a
des iptiva de u a va ia le
Introducción

Es una ciencia con base matemática que


tiene que ver con la recolección, análisis e
interpretación de datos, que tiene por
objetivo explicar a partir de estas
actividades, el comportamiento de una o
varias variables de un determinado
fenómeno.
Es una herramienta base para distintas
disciplinas, desde la física hasta las
ciencias sociales, desde las ciencias de la
salud hasta el control de calidad, y es
utilizada para la toma de decisiones en la
La Estadística es:
ejecución de distintos tipos de proyectos
o estudios.

Nos e t a e os e los p i ipios de esta ate ia te ie do p ese te ue, tal ual u i e e g , lo ue


queda sin verse es muy importante y para su comprensión se necesitan herramientas más significativas del
campo de la matemática.

La Estadística Aplicada se divide en dos ramas

Estadística descriptiva Estadística inferencial


•Que se dedica a los métodos de recolección, •Que se dedica a la generación de modelos
descripción, visualización y resumen de asociados a los fenómenos en cuestión
datos originados a partir de los fenómenos teniendo en cuenta la aleatoriedad de las
estudiados. observaciones.
•Los datos pueden ser resumidos numérica o •Se usa para modelar patrones en los datos y
gráficamente. extraer inferencias acerca de la población
•Ejemplos básicos de descriptores numéricos bajo estudio.
son: la media y la desviación estándar. •Estas inferencias pueden tomar la forma de
•Algunos ejemplos gráficos son: histograma, respuestas a preguntas: si/no (prueba de
pirámide poblacional, clústeres, etc. hipótesis), estimaciones de características
numéricas (estimación), pronósticos de
futuras observaciones, descripciones de
asociación (correlación) o modelamiento de
relaciones entre variables (análisis de
regresión).

ISIV-Educación a Distancia Pag. 8


Estadística – Módulo 1

Hay también una disciplina


llamada estadística •la cual se refiere a las bases teóricas de la materia.
matemática,

• también se refiere al resultado de aplicar un algoritmo estadístico


La palabra estadísticas a un conjunto de datos, como en estadísticas económicas,
bioestadísticas, etc.

Iniciaremos el curso con la revisión de algunos términos y conceptos de la estadística descriptiva:

Conceptos
POBLACIÓN:
•es el conjunto de todos los elementos que son objeto de un estudio estadístico.

MUESTRA:
•es un subconjunto de la población. Así, si se estudia el precio de las casas de una
ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad
(sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra)
que se entienda que es suficientemente representativa.

INDIVIDUO:
•son los elementos que conforman una población. Estos elementos portan
información sobre el fenómeno que se estudia. Así, si estudiamos el rendimiento de
los obreros de una fábrica, cada obrero es un individuo; si estudiamos el precio de la
casas de un barrio, cada casa es un individuo.

TAMAÑO:
•es el número de individuos que conforman la muestra.

Cabe acotar, que de acuerdo al tipo de trabajo estadístico:

si se incluye a toda la población estamos


CENSO
ante un CENSO.
La recolección de
datos puede ser de
dos tipos:
si realiza a un subconjunto representativo,
MUESTRA
estamos ante una MUESTRA.

ISIV-Educación a Distancia Pag. 9


Estadística – Módulo 1

Ejemplo 1
•Si se quiere realizar un estudio sobre los operarios de una empresa y sus
rendimientos en las distintas franjas horarias que representan a los distintos turnos,
la población está conformada por todos los operarios de la empresa, cada uno de
ellos es un individuo. Si el estudio se hace a todos los operarios se trata de un censo y
si se toma una muestra representativa, por ejemplo al 25% de los operarios de cada
turno tomados al azar, estamos ante una muestra, el número que conforma el 25 %
de cada turno es el tamaño de la muestra.

•Una muestra se debe elegir de una manera aleatoria que garantice


la fiabilidad del estudio.
•Si dentro del 25 % de los operarios, se eligen a los de mayor edad,
seguramente se obtendrá un resultado parcial o tendencioso.

Importante

Variables cuantitativas y cualitativas


¿Qué es una Variable?
Al realizar un trabajo estadístico, censo o muestra, se estudian diferentes caracteres llamados variables, por
ejemplo: el precio de los automóviles 0 km, el consumo, el color.

Estas variables pueden ser cuantitativas o cualitativas

Una variable es cuantitativa cuando se puede Ej:el precio o el consumo de


asociar a ella una cantidad, discreta o continua. combustibles cada 100 km..
Cuantitativas

Discretas: Ej: número de hermanos (puede


Se le asocia un número entero ser 1, 2, 3....,etc. pero, por
Cuando se miden 1, 2, 8, -4, etc. ejemplo, nunca podrá ser 3,45).
éstas variables,
las cantidades
pueden ser
Es decir que pueden tomar
Continuas:
cualquier valor real dentro de un
Se asocia un número real. intervalo.
Cualitativas

Una variable es cualitativa Ej: el color. (Aunque si a cada color se le


cuando se dice del carácter asocia un número discreto, se la puede
una cualidad no medible. convertir en cuantitativas).

ISIV-Educación a Distancia Pag. 10


Estadística – Módulo 1

Ejemplo 2
•Si tomamos el ejemplo 1, se podrían estudiar las variables edad, sexo, peso,
lugar de nacimiento, etc. Los caracteres edad y peso corresponden a variables
cuantitativas, sexo y lugar de nacimiento son variables cualitativas.
•Otro Ej:la velocidad de un vehículo puede ser 67,3 km/h, 104,35 km/h...etc.).
Cuando se trabaja con variables cuantitativas continuas es conveniente
hacerlo con agrupaciones de datos llamados intervalos.

Las variables también se pueden clasificar en


UNIDIMENSIONALES: BIDIMENSIONALES: PLURIDIMENSIONALES:

•Cuando sólo recogen •Cuando recogen •Recogen información


información sobre una información sobre dos sobre tres o más
característica (por ejemplo: características de la características (por
edad de los alumnos de población (por ejemplo: ejemplo: edad, altura y
una clase). edad y altura de los peso de los alumnos de
alumnos de una clase). una clase).

ANÁLISIS DE
PROBLEMAS:

Problema 1
Un estudio sobre cuál es el equipo profesional argentino que más simpatizantes posee y con el fin de
comprobar que el dicho de que Boca es la mitad más uno del pais se realizó una encuesta a 50
personas de una ciudad que contestaron lo siguiente:

BOCA – RIVER – RIVER – GIMNASIA – INDEPENDIENTE – BOCA – BOCA - SAN LORENZO –


RIVER – RACING – BOCA – RIVER – ESTUDIANTES – RIVER – BOCA – SAN LORENZO – BOCA-
RIVER –RACING – INDEPENDIENTE – RIVER – BOCA – BOCA – VELEZ – RIVER – ESTUDIANTES
– BOCA – VELEZ – BOCA – RIVER – RIVER- ESTUDIANTES – RACING –VELEZ – RIVER – BOCA
– BOCA –INDEPENDIENTE – BOCA – RIVER – RIVER – RACING – SAN LORENZO - ROSARIO –
RACING –BOCA – BOCA – BOCA – RIVER – BOCA.

En este problema se trabaja con una variable cualitativa. “er si patiza te de es una cualidad y lo que
se puede hacer a continuación es un conteo:

EQUIPOS CANT.
BOCA: 17
RIVER: 14
INDEPENDIENTE: 3
SAN LORENZO: 3

ISIV-Educación a Distancia Pag. 11


Estadística – Módulo 1

RACING: 5
VELEZ: 3
ESTUDIANTES: 3
ROSARIO: 1
GIMNASIA: 1

Estos datos pueden graficarse para una mejor visualización. Los valores obtenidos en aquellos equipos
con muy pocos simpatizantes se pueden agrupar en u a atego ía OTRO“ (Co o ejemplo lo vamos a
hacer con los de ROSARIO Y GIMNASIA).

Representaciones Gráficas
Gráfico Circular

SIMPATIZANTES DE EQUIPOS NACIONALES

BOCA:
1
3 1
RIVER:
3
17 INDEPENDIENTE:
5 SAN LORENZO:
RACING:
3
VELEZ:
3
ESTUDIANTES:
14 ROSARIO:

En este tipo de gráficos se destaca el área de cada uno de los equipos, siendo los de mayor
superficie, los de BOCA Y RIVER.

Además, pueden incluir datos muy enriquecedores para el trabajo que se realiza, como por ejemplo
el porcentaje:

SIMPATIZANTES DE EQUIPOS NACIONALES


2% 2%
BOCA:
6% RIVER:
6%
34% INDEPENDIENTE:
10% SAN LORENZO:

6% RACING:
VELEZ:
6%
ESTUDIANTES:
28%
ROSARIO:

ISIV-Educación a Distancia Pag. 12


Estadística – Módulo 1

Observaciones:

 Estos gráficos y una variada gama de alternativas se encuentran en el EXCEL.


 Basta elegir aquel que mejor represente lo que queremos mostrar.
 Sin embargo un alumno los puede construir manualmente y para ello tendrá dos problemas, por
un lado como determinar el área que corresponde a cada dato y el porcentaje que corresponde al
mismo.
 Aplicando Regla de tres simple se solucionan ambos problemas y el porcentaje se puede
determinar con cualquier calculadora.

Por ejemplo: DETERMINAR EL AREA QUE OCUPA UN DATO EN UN GRÁFICO CIRCULAR.

Si consideramos que una circunferencia es un ángulo de 360 grados, en nuestro problema, los 50 datos
recolectados se distribuyen en esos 360 grados y para determinar cuál es el ángulo área que corresponde
a BOCA realizamos:

 50 hinchas------------------ 360°
 17 hinchas de BOCA---- X

Como es un caso de proporcionalidad directa: x= (17 x 360°)/50 = 122,4°

Entonces se construye una circunferencia, se traza un radio y a partir de allí con un transportador
(semicírculo) se traza un ángulo de 122,4° aproximadamente.

Queda determinado el área (sector circular) que corresponde a BOCA. A partir de allí se va realizando el
mismo trabajo para cada equipo y se trazan los ángulos a continuación del último realizado.

Para el cálculo del PORCENTAJE, es similar solo que en vez de usar 360°, usamos 100 que es la unidad de
comparación de esta herramienta.

Ejemplo: (Siempre utilizando el ejemplo de los simpatizantes de los equipos de futbol)

 50 hinchas------------------ 100%
 17 hinchas de BOCA---- X

Como es un caso de proporcionalidad directa: x= (17 x 100)/50 = 34%

Para tener un control sobre los cálculos que realizamos, la suma de todos los porcentajes de nuestro
trabajo debe dar 100%.

Gráfico de barras.
También estos gráficos tienen una variedad de presentaciones, sobresaliendo los de barras verticales u
horizontales. Se adjunta un modelo de muestra:

ISIV-Educación a Distancia Pag. 13


Estadística – Módulo 1

SIMPATIZANTES DE EQUIPOS NACIONALES


18
16
14
12
10
8
6
4
2
0

El grosor de las columnas no tiene relación en este ejemplo con los datos en sí.

Otros tipos de gráficos:


Gráfico de líneas:

SIMPATIZANTES DE EQUIPOS NACIONALES


18
16
14
12
10
8
6
4
2
0

Gráfico de área:

SIMPATIZANTES DE EQUIPOS NACIONALES


18
16
14
12
10
8
6
4
2
0

ISIV-Educación a Distancia Pag. 14


Estadística – Módulo 1

En la actualidad los medios gráficos de comunicación utilizan los pictogramas, basados en dibujos alusivos a
la característica estudiada. Por lo general los pictogramas son más vistosos para representar una situación.

Ejemplos:

Volvemos a nuestro problema anterior:

¿Qué podemos inferir?

¿Es Boca el equipo cuyos simpatizantes son la mitad más uno del país?... ¿es fiable el trabajo realizado?

Cualquier estudiante estará de acuerdo que la muestra para determinar que Boca es el equipo cuyos
simpatizantes son la mitad más uno del país, no es fiable. No se puede generalizar una encuesta a 50
personas de una ciudad para dar una conclusión sobre el tema. También hay que considerar cómo se
eligieron las 50 personas para que el trabajo resulte por lo menos fiable para decir: en nuestro barrio, en
nuestro pueblo, en nuestro lugar de trabajo, Boca no es la mitad más uno del país. Pero generalizar a todo el
país es un trabajo que no tiene sentido.

Problema 2
En una clínica se determinaron las edades de las mujeres que habían dado a luz en el último mes,
resultando los siguientes datos:

23 – 35 - 40 – 29 – 38 – 18 – 19 – 40 – 22 – 26 – 24 – 18 – 25 – 30 – 32 – 20 – 19 – 18
23 – 24 - 23 – 23 – 23 – 40 – 18 – 26 – 23 – 29 – 19 – 25 – 22 – 25 – 33 – 23 – 24 – 24
19 – 26 – 35 – 32 – 21 – 24 – 36 – 25 – 24 – 23 – 26 – 22 – 33 – 32-

¿Qué podemos hacer? Tenemos también 50 datos, pero realizar el conteo por edades es muy engorroso,
por lo tanto aquí es conveniente utilizar intervalos (que agrupan distintas edades)

Pasos a seguir:

a) Buscamos los datos extremos (el menor y el mayor) y determinamos la amplitud de los valores de los
datos y lo llamaremos RANGO:
 Valor menor: 18 años
 Valor mayor: 40 años
 Rango: 40 – 18 = 22

ISIV-Educación a Distancia Pag. 15


Estadística – Módulo 1

b) Dividimos el rango en un número conveniente de intervalos de clase. (entre 5 y 20, dependiendo de la


cantidad de datos). Cada dato debe pertenecer a un solo intervalo.

Además, los puntos medios de cada intervalo deben coincidir con algunos datos. (Cuando las variables
son discretas conviene que las marcas también lo sean, por lo tanto allí se debe tomar una amplitud
impar del intervalo)

Si bien hay varias maneras de calcular el número de intervalos o clases, existe una fórmula llamada
REGLA DE STURGE que permite realizar una aproximación más sistemática.

“i lla a os K al ú e o de i te valos o lases, segú esta fó ula, K se al ula de la siguiente


manera:

(Donde M es la cantidad de datos). La amplitud del intervalo (llamamos


W), se determina con la fórmula:

Si se trabaja con variables discretas (enteras), se redondean los resultados.

Aplicamos estos conceptos a nuestro problema:

Determinamos K:

Como trabajamos con una variable discreta (edad de las madres) se redondea el resultado y se tiene:
(Esto significa que tendremos 7 intervalos de clase)

¿Qué amplitud tendrán los intervalos?

Se redondea: , siempre que trabajemos con cantidades enteras. (discretas).

Con variables discretas (enteras) es conveniente tomar una amplitud de intervalos impar para que
la marca (punto medio del intervalo) se una cantidad entera.

Al redondear y trabajar con cantidades discretas (no decimales), es casi imposible lograr que
coincidan justo al inicio y fin los datos extremos, por lo tanto se pueden hacer correcciones como
agregar un intervalo más, iniciar antes el conteo en el primer intervalo, por ejemplo desde 17 en
este caso.

Si las cantidades son continuas, esto se soluciona pues se trabaja con los decimales y hay una mejor
distribución de los intervalos.

ISIV-Educación a Distancia Pag. 16


Estadística – Módulo 1

c) Realizamos el agrupamiento en intervalos:

Intervalos (K) Conteo Frecuencias Marca


18 a 20 años III III III 9 19
21 a 23 años III III III III 12 22
24 a 26 años III III III III II 14 25
27 a 29 años II 2 28
30 a 32 años III I 4 31
33 a 35 años III I 4 34
36 a 40 años III II 5 37

Este redondeo hacia el entero menor hace que haya un desfasaje de los valores por lo que el último
intervalo en este caso nos queda de mayor amplitud, de manera que no quede ningún dato afuera de la
distribución de intervalos

También se podría agregar un intervalo más aunque el extremo de dicho intervalo sobrepase el mayor valor
de los datos, por ejemplo en este caso podría colocarse un octavo intervalo cuyos extremos serían 39 – 41

Como no hay nada estandarizado, el alumno podrá optar por realizar las aproximaciones de intervalos y
amplitudes de la manera que le resulta más beneficiosa.

A este cuadro de distribución de frecuencias lo vamos a seguir utilizando a medida que ampliemos los
conceptos siguientes:

Conceptos utilizados
CLASE O INTERVALO DE CLASE:
•es un grupo de datos

FRECUENCIA:
•es la cantidad de veces que un dato se repite en el intervalo de clase.

MARCA
•es el punto medio de cada intervalo de clase.

Medidas de tendencia central:


Son valores que indican alrededor de qué dato/s de la variable se
ubican los datos de la muestra. En otras palabras, tiene que ver con
la elección del dato más representativo de la muestra, o cuál es el
En estadística, las que representa mejor al conjunto de datos.
medidas de
tendencia central La media o promedio
Los más
La mediana
usuales son
La moda.

ISIV-Educación a Distancia Pag. 17


Estadística – Módulo 1

La media o promedio:

Indica cuánto habrían valido todos los datos de haber sido todos
iguales. Para calcularla se suman todos los datos y se divide por la
cantidad total de los datos.

Suponiendo un ejemplo simple: las notas de un alumno en una materia han sido en el trimestre: 7 – 8 – 5 – 6
– 9 – 4 – 8 – 9 (8 notas):

¿Cuál es la media o promedio?

Para llevarlo a una fórmula, podemos decir que a cada uno de los datos (notas) se le llama , , ,
….
Los su í di es , , , …., i di a el o de de las otas desde la p i e a a la últi a, sie do el subíndice
que coincide con la cantidad total de datos (notas).


Por lo tanto:

NOTA: Si los datos son cualitativos, la media carece de sentido.

Si los datos están agrupados en intervalos de frecuencia, como en el caso del problema de la edad de las
madres que dieron a luz en un determinado tiempo, entonces la fórmula a utilizar será la siguiente:


∑ ∑
Para ello es importante completar nuestro cuadro que lo habíamos dejado inconcluso:

Intervalos Frecuencias Marca

18 a 20 años 9 19
21 a 23 años 12 22
24 a 26 años 14 25
27 a 29 años 2 28
30 a 32 años 4 31
33 a 35 años 4 34
36 a 40 años 5 37

ISIV-Educación a Distancia Pag. 18


Estadística – Módulo 1

Promedio redondeado = 26

La Moda

Es el valor que se presenta con mayor frecuencia en un conjunto de


datos.

La Mediana

Es el valor central de los datos, una vez ordenados de menor a mayor.


Si el número de datos es par, se toma el valor medio de los dos
centrales.

Si volvemos a nuestros ejemplos:

a) El de los simpatizantes de los equipos de futbol

 MEDIA O PROMEDIO: no tiene sentido pues son variables cualitativas.


 MODA: BOCA (Es el dato que más se repite en la muestra)
 MEDIANA: No tiene sentido porque no se pueden ordenar los datos de menor a mayor y por lo tanto no
podemos encontrar el o los datos que quedan en el centro.

b) Si consideramos el ejemplo de las notas de un trimestre: 7 – 8 – 5 – 6 – 9 – 4 – 8 – 9. Ya se había


calculado la media: 7 (siete)

 MODA: los datos que más se repiten son 8 y 9, pero no tiene sentido para una medida de tendencia
central representativa, ya que hay notas bajas que hacen caer el promedio, generándose mucha
diferencia entre ambas mediciones.
 MEDIANA: Si ordenamos los datos tenemos: 4, 5, 6, 7, 8, 8, 9, 9 (Ordenados de menor a mayor) Como
es un número par de datos, los dos números centrales son el 7 y el 8, por lo que se debe hallar la media
entre ambos números (7+8)/2 = 7,50
 MEDIANA= 7,50

ISIV-Educación a Distancia Pag. 19


Estadística – Módulo 1

c) En el ejemplo de las edades de las madres que dieron a luz en un determinado tiempo:

Intervalos Frecuencias Marca



18 a 20 años 9 19 171 0,18 18%
21 a 23 años 12 22 264 0,24 24%
24 a 26 años 14 25 350 0,28 28%
27 a 29 años 2 28 56 0,04 4%
30 a 32 años 4 31 124 0,08 8%
33 a 35 años 4 34 136 0,08 8%
36 a 40 años 5 37 185 0,1 10%
 (sumas) 50 ////// 1286 1 100%

(La tercera columna se forma multiplicando la frecuencia por la marca de cada intervalo. Al final aparece
1325 que es la sumatoria de dichos productos. La cuarta columna, la de las frecuencias relativas se forma
dividiendo las frecuencias de cada intervalo por la sumatoria de frecuencias: 9/50=0,18. Por último, la
quinta columna es la de los porcentajes que representan los intervalos y se construye multiplicando la
frecuencia relativa por 100. Las frecuencias relativas siempre suman 1 y las porcentuales 100%).

 PROMEDIO 0 MEDIA: Habíamos calculado que el promedio era 26 años.


 MODA: es la marca del intervalo de mayor frecuencia: 25 años.
 MEDIANA: Si son 50 datos ordenados de menor a mayor y por tratarse de una cantidad par de datos,
hay dos de ellos que quedan en el centro, los que están en el lugar 25 y 26.

Para no ordenar toda la serie, podemos determinar que la mediana se encuentra en el tercer intervalo, pues
hasta el mismo se ordenan 35 datos (9+12+14), por lo tanto vamos a ordenar los datos del 3er intervalo cuya
amplitud va desde 24 a 26 años:

El primer dato, será el que se encuentra en el lugar 22, ya que entre el primero y el segundo intervalo suman
21 datos (Observar el cuadro correspondiente):24-24-24-24–24-24-25-25-25-25-26-26-26-26.

En este caso, coinciden los dos números centrales, por lo tanto la mediana es 24

Recuérdese, que si la cantidad de datos es impar, únicamente un dato quedará en el centro del
ordenamiento.

Para un cálculo más preciso y cuando la


cantidad de datos es grande se puede aplicar la
siguiente fórmula para calcular la mediana:

ISIV-Educación a Distancia Pag. 20


Estadística – Módulo 1

Medidas de dispersión

Tienen por objetivo Los datos que se utilizan


Las medidas de
determinar la mayor o menor para el cálculo de
dispersión completan
variación de los datos y dan algunas de ellas surgen
el análisis numérico
una idea de su disposición de la ampliación del
del conjunto de datos
respecto a las medidas de cuadro que venimos
estudiados.
centralización. realizando.

Las más importantes son:

Rango

¿Qué es? Es la diferencia entre el mayor y el menor de los datos.

También recibe el nombre de amplitud o recorrido.

Varianza

¿Qué es? Es la media aritmética de las diferencias al cuadrado da cada dato,


respecto de la media de todos ellos.

∑ ̅
Es decir:

Observaciones:

Se pueden encontrar variaciones de estas fórmulas, que pueden utilizarse, pero no las incluimos en este
material para confundir al alumno.

Además debemos ampliar nuestro cuadro para obtener los valores que necesitamos en estas fórmulas.

La desviación típica (o estándar)

¿Qué es?
Es la raíz cuadrada positiva de la varianza.

O sea que su fórmula es:

∑ ̅ ∑ ̅
√ ó √ ∑

Según el agrupamiento o no de los datos.

ISIV-Educación a Distancia Pag. 21


Estadística – Módulo 1

La desviación me permite calcular la dispersión de los datos, por ejemplo: Si repartiéramos una cierta
ca tidad de di e o e pa tes iguales a pe so as, la edia o p o edio i dica ía lo ue le
correspondería a cada una de las personas para que el reparto sea equitativo. En este caso la desviación
típica sería 0. En cambio a medida que la desviación típica toma valores cada vez mayores indica una cada
vez mayor desigualdad en el reparto.

El coeficiente de variación:

¿Qué es? El conjunto de datos con mayor coeficiente de variación es el más


heterogéneo.

No siempre una mayor desviación típica indica mayor dispersión. La naturaleza de los datos puede hacer
que la comparación absoluta entre desviaciones típicas carezca de sentido.

Por ejemplo, no parece lógico comparar en forma directa la desviación típica de la altura de 100 bebés
recién nacidos con la desviación típica de la estatura de sus padres. En cambio podría realizarse una
comparación relativa de ambas.

Para medir la dispersión relativa de dos conjuntos de datos, puede utilizarse el coeficiente de variación
que se define como:

El conjunto de datos con mayor coeficiente de variación es el más heterogéneo.


̅

Veamos las medidas de dispersión en nuestro ejemplo de las edades de las madres:

Al cuadro que veníamos construyendo, debemos agregarles algunas columnas:

Intervalos Frecuencias Marca


 ̅ ̅ ̅
18 a 20 años 9 19 171 0,18 18% -7 49 441
21 a 23 años 12 22 264 0,24 24% -4 16 192
24 a 26 años 14 25 350 0,28 28% -1 1 14
27 a 29 años 2 28 56 0,04 4% 2 4 8
30 a 32 años 4 31 124 0,08 8% 5 25 100
33 a 35 años 4 34 136 0,08 8% 8 64 256
36 a 40 años 5 37 185 0,1 10% 11 121 605
 (sumas) 50 ////// 1286 1 100% 280 1.616

 MEDIA:
Hemos completado las dos últimas columnas, en una haciendo la diferencia entre las marcas y el
promedio y en la otra, esa diferencia elevada al cuadrado.

Con ello calculamos:

 RANGO: ya lo habíamos calculado al inicio para hallar la amplitud de los intervalos:

ISIV-Educación a Distancia Pag. 22


Estadística – Módulo 1

∑ ̅
 VARIANZA: ∑
∑ ̅
 DESVIACION: √ ∑

La desviación estándar se utiliza para definir los límites entre los cuales un valor de control puede
definirse como aceptable.

Si la media es 26,5 en este trabajo, los valores entre los cuales serán será fiable los valores son: 26,5 ±
5,94. Es decir entre 20,56 y 32,44 (Redondeando: entre 21 y 32 años).

 COEFICIENTE DE VARIACION: ̅

(Este dato nos puede servir para comparar con otra medición. Cuanto más grande es el CV, mayor será la
heterogeneidad de las medidas.)

Trabajo Práctico Nro. 1

Leer completamente el módulo y completar los siguientes ítems:

1- En un censo se toma información sobre las diferentes variables de las personas:


a) Sexo
b) Edad (en años)
c) Peso
d) Altura
e) Nacionalidad
f) Nivel educativo
g) Obra Social
Clasifícalas en cualitativas y cuantitativas y a las cuantitativas en discretas y continuas.

2- Representa gráficamente los siguientes datos: (diagrama de barra y circular)


De los 80 alumnos que cursan Estadísticas, 16 corresponden a la Región del NEA (Nordeste Argentino), 24
de la zona Central y Cuyo, 12 de la zona Patagónica, 8 son del NOA (Noroeste Argentino) y el resto de
Buenos Aires.
El gráfico circular debe tener los porcentajes que representan a cada una de las zonas.

3- La duración en segundos de las llamadas de una empresa telefónica tomadas de una factura son las
siguientes:

120 131 142 157 15 27 94 57 62 12 49 58


149 210 120 131 97 84 61 32 15 7 21 32
238 210 48 56 24 64 139 31 23 58 69 234
13 66 54 214 156 179 231 204 147 32 15 7
64 124 56 73 114 169 201 134 62 93 42 58

ISIV-Educación a Distancia Pag. 23


Estadística – Módulo 1

a) ¿Cuál es valor del rango?


b) Halla mediante la regla de Sturge, el número de intervalos para realizar la distribución de frecuencias.
c) Halla W (amplitud del intervalo)
d) Realizar el conteo de frecuencias.
e) Completar el cuadro de distribución de frecuencias:

Intervalos Frecuencias Marca


 ̅ ̅ ̅

f) Calcular:
1) Promedio (X )
2) Moda
3) Mediana
4) Varianza
5) Desviación Estándar
6) Coeficiente de Variación (CV)
g) Realiza un análisis de lo que resulta del trabajo estadístico.

4- Se ha aplicado un examen compuesto por 90 ítems a 100 alumnos de una escuela, obteniéndose los
siguientes resultados:
Número de ítems Número de
correctos alumnos
0 - 14 10
15 - 29 15
30 - 44 25
45 - 59 20
60 - 74 20
75 - 90 10

a) Forma la tabla de frecuencias y representa gráficamente la situación


5- El gráfico indica el porcentaje de estudiantes ingresantes a una Universidad: Si los mismos fueron 1.890,
¿Cuántos alumnos ingresaron a cada especialidad?

ISIV-Educación a Distancia Pag. 24


Estadística – Módulo 1

6- Es importante que el alumno al finalizar el estudio de este módulo pueda contestarse:


1) ¿Cuál es el objeto de estudio de la estadística?
2) ¿Qué diferencia hay entre la estadística descriptiva y la inferencial?
3) Explicar los términos: individuo, población, muestra, tamaño de la muestra, censo, variable.
4) Diferenciar variables continuas y discretas, unidimensionales, bidimensionales y pluridimensionales.
5) Distinguir y construir distintos tipos de gráficos utilizados para ordenar los datos.
6) Explicar y calcular las medidas de tendencia central: moda, median y media.
7) Calcular las medidas de dispersión de los datos: rango, varianza, desviación estándar o típica.
8) ¿Qué es y cómo se realiza una distribución de frecuencias?

ISIV-Educación a Distancia Pag. 25

También podría gustarte