UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS QUÍMICAS
PLAN DE CONTINGENCIA
MATEMÁTICA
TEMA DE INVESTIGACIÓN
CONCEPTOS GENERALES
ESTADÍSTICA DESCRIPTIVA.
INTEGRANTES:
MELANIE PLUAS GUERRERO.
RUTH SANCHEZ SIGUENCIA.
DOMENICA ALMEIDA ROSALES.
INGRID MAZA MONCADA.
ALLAN GONZALES PLAZA.
DOCENTE:
ING. LAURO FERNANDO SALVATIERRA.
CURSO DE NIVELACIÓN:
VE-17
C1-2021
INVESTIGACION DE PLUAS GUERRERO MELANIE.
Estadística. (Agregar gráfico representativo al concepto)
La estadística (la forma femenina del término alemán Statistik, derivado a su vez del
italiano statista, "hombre de Estado"), es la rama de las matemáticas que estudia la
variabilidad, colección, organización, análisis, interpretación, y presentación de los
datos, así como el proceso aleatorio que los genera siguiendo las leyes de la
probabilidad. Como parte de la matemática, la estadística es una ciencia formal
deductiva, con un conocimiento propio, dinámico y en continuo desarrollo obtenido a
través del método científico formal. En ocasiones, las ciencias fácticas necesitan
utilizar técnicas estadísticas durante su proceso de investigación factual, con el fin de
obtener nuevos conocimientos basados en la experimentación y en la observación. En
estos casos, la aplicación de la estadística permite el análisis de datos provenientes
de una muestra representativa, que busca explicar las correlaciones y dependencias
de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.
Estadística Descriptiva. (Agregar gráfico representativo al concepto)
La estadística descriptiva es una disciplina que se encarga de recoger, almacenar,
ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto de
datos.
La estadística descriptiva es, junto con la inferencia estadística o estadística
inferencial, una de las dos grandes ramas de la estadística. Su propio nombre lo indica,
trata de describir algo. Pero no describirlo de cualquiera forma, sino de manera
cuantitativa. Pensemos en el peso de una caja de verduras, en la altura de una persona
o en la cantidad de dinero que gana una empresa. De estas variables podríamos decir
muchas cosas. Por ejemplo, podríamos indicar que esta o aquella caja de tomates pesan
mucho o pesan menos que otras. Siguiendo con otro
ejemplo, podríamos decir que el ingreso de una empresa varía mucho a lo largo del
tiempo o que una persona tiene una altura promedio.
Estadística Inferencial. (Agregar gráfico representativo al concepto)
Se llama estadística inferencial o inferencia estadística a la rama de la Estadística
encargada de hacer deducciones, es decir, inferir propiedades, conclusiones y
tendencias, a partir de una muestra del conjunto. Su papel es interpretar, hacer
proyecciones y comparaciones.
La estadística inferencial emplea usualmente mecanismos que le permiten llevar a
cabo dichas deducciones, tales como pruebas de estimación puntual (o de intervalos de
confianza), pruebas de hipótesis, pruebas paramétricas (como de media, de diferencia
de medias, proporciones, etc.) y no paramétricas (como la prueba del chi-cuadrado, etc.).
Por ende, la estadística inferencial es sumamente útil en el análisis de poblaciones y
tendencias, para hacerse una idea posible de las acciones y reacciones de la misma de
cara a condiciones específicas. Esto no significa que se las pueda predecir fielmente, ni
que estemos en presencia de una ciencia exacta, pero sí de una aproximación posible
al resultado final.
Muestra. (Agregar 2 ejemplos y gráfico representativo al concepto)
En estadística, una muestra es un subconjunto de casos o individuos de una
población. En diversas aplicaciones, interesa que una muestra sea representativa, y
para ello debe escogerse una técnica de muestra adecuada que produzca una muestra
aleatoria adecuada. También es un subconjunto de la población, y para ser
representativa, debe tener las mismas características de la población. Si se obtiene
una muestra sesgada, su interés y utilidad son más limitados, en función del grado de
sesgos que presente.
Como un subgrupo o subconjunto representativo de la población, extraída
seleccionada por algún método de muestreo, la muestra siempre es una parte de la
población. Si se tienen varias poblaciones, entonces se tendrán varias muestras. La
muestra debe poseer toda la información deseada para tener la posibilidad de
extraerla, y esto solo se puede lograr con una buena selección de la muestra y un
trabajo muy cuidadoso y de alta calidad en la recolección de datos.
Ejemplos de muestra estadística.
1. Supongamos que un investigador debe estudiar la cantidad de personas que,
de un millón de habitantes de una ciudad, poseen título de grado. Para esto,
tomará como muestra la situación de 1000 personas seleccionadas
aleatoriamente entre las diferentes zonas de la ciudad.
A partir de estas 1000 personas escogidas como muestra, el investigador
estimará un promedio y en base a este llegará a una conclusión final.
2. Antes de cualquier proceso electoral, normalmente los medios de
comunicación efectúan encuestas para realizar proyecciones sobre el
candidato más popular.
Al poder solo entrevistar un porcentaje muy pequeño del total, este representa
una muestra de la población votante.
Población. (Agregar 2 ejemplos y gráfico representativo al concepto)
En estadística, una población es un conjunto de elementos o eventos similares que
son de interés para alguna pregunta o experimento. Una población estadística puede
ser un grupo de objetos existentes (por ejemplo, el conjunto de todas las estrellas
dentro de la Vía Láctea) o un hipotético y potencialmente infinito grupo de objetos
concebidos como una generalización de la experiencia (por ejemplo, el conjunto de
todas las manos posibles en un juego de póquer). Un objetivo común del análisis
estadístico es producir información sobre alguna población elegida.
En la inferencia estadística, se elige un subconjunto de la población (una muestra
estadística) para representar la población en un análisis estadístico. La relación entre
el tamaño de esta muestra estadística y el tamaño de la población se denomina
fracción de muestreo. Entonces es posible estimar los parámetros de la población
utilizando las estadísticas de muestra adecuadas.
Ejemplos de población en estadística.
1. Tenemos una población estadística de 150 individuos. Los 150 individuos son
estudiantes de economía de un instituto. Cuando el número de individuos de una
población es reducido, es recomendable utilizar los datos del total de población,
pero en casos más grandes es imposible. Para explicar este caso, imaginemos que
nosotros somos uno de esos 100 estudiante de economía. Nos encargan que
realicemos un estudio sobre qué porcentaje de los alumnos considera que la
economía es interesante y nos dan 10 minutos.
En 10 minutos no podemos buscar a todos los alumnos, ir preguntando a las
distintas clases, en distintos cursos. Así lo que haremos será preguntar a unos
cuantos, por ejemplo, a 13. Esos datos no pueden representar de forma 100%
fiable a la opinión de los 150 individuos, pero sí podrían ofrecernos una idea
aproximada. A estos 13 alumnos es lo que llamamos muestra.
2. Al establecer la cantidad de niños que hay por cada trabajador de una empresa,
los empleados de la empresa representarían la población.
INVESTIGACION DE RUTH SANCHEZ SIGUENCIA.
Variable Estadística. (Agregar gráfico representativo al concepto)
La variable estadística es una característica o cualidad de un individuo que está
propensa a adquirir diferentes valores. Estos valores, a su vez, se caracterizan por poder
medirse.
Por ejemplo, el color de pelo, las notas de un examen, el sexo o la estatura de una
persona, son variables estadísticas.
También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de 22.300
dólares el último año. En este caso, la variable sería el beneficio y estaría medido en
dólares. Ambas variables son del tipo cuantitativo (se expresan con un número)
Variable Estadística Cualitativa. (Agregar 2 ejemplos y gráfico
representativo al concepto)
Una variable cualitativa es un tipo de variable estadística que describe las cualidades,
circunstancias o características de un objeto o persona, sin hacer uso de números.
De esta manera, las variables cualitativas permiten expresar una característica, atributo,
cualidad o categoría no numérica. Por ejemplo, el sexo de una persona es una variable
cualitativa, ya que es masculino o femenino.
Algunas características notables de la variable cualitativa son las siguientes:
No se puede medir numéricamente.
No otorga datos específicos y a veces tampoco un orden.
Especifica una condición, cualidad o característica.
Cuando los valores de dicha variable son solamente dos, se llama dicotómica.
Cuando distingue tres valores o más, se la llama polinómica.
Ejemplos.
1. Suponga que queremos construir un diagrama de barras para las frecuencias relativas de
la variable estrato socioeconómico del apartamento de la base de datos sobre
apartamentos usados en Medellín.
A continuación, se muestra el código necesario para cargar la base de datos aptos2015.
Antes de construir el diagrama de barras solicitado es necesario construir la tabla de
frecuencias para la variable estrato, para esto se usa la función y los resultados se
almacenan en el objeto que contiene las frecuencias absolutas. Para obtener las
frecuencias relativas se usa luego la función.
Se presenta el diagrama de barras solicitado. Se observa que hay pocos apartamentos
(1.15%) pertenecientes al estrato dos, los estratos tres, cuatro y cinco aportan
porcentajes similares a la base de datos y que el estrato 6 es el que más apartamentos
aporta a la base de datos, 34.87%.
2. Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones.
Se ha de tener en cuenta que la altura de cada barra es proporcional al número de
observaciones (frecuencias relativas).
Variable Estadística Cualitativa Nominal (Agregar 2 ejemplos y gráfico
representativo al concepto)
Dentro de las variables estadísticas podemos encontrarnos, por norma general, dos
grandes tipos: cualitativas y cuantitativas.
Así pues, dentro de las variables cualitativas nos encontramos con las nominales. Las
cuales, aunque se expresan también con un nombre, se diferencian de las ordinales, en
que no necesariamente llevan un orden. Por ejemplo, decir que Juan tiene los ojos verdes,
es el caso de una variable nominal. Si tuviéramos una población, ¿cómo podríamos
ordenar los colores? ¿De mayor a menor? Salvo que establezcamos una medida, por
norma general, no podemos ordenar diferentes colores.
A continuación, tenemos varios ejemplos de variables nominativas:
Nacionalidad: Por ejemplo: mexicano, argentino y español.
Sexo: Hombre o mujer.
Religión: Las diferentes religiones.
Representación gráfica.
Imaginemos que estamos en una clase en la que hay 10 alumnos. Queremos saber
cuántos hombres hay y cuántas mujeres hay para conocer la distribución porcentual. Así
pues, tenemos la siguiente tabla:
Número Sexo
1 Hombre
2 Mujer
3 Mujer
4 Hombre
5 Mujer
6 Hombre
7 Hombre
8 Hombre
9 Mujer
10 Mujer
Hay, por tanto, cinco hombres y cinco mujeres. Lo que significa que la distribución es del
50% hombres y del 50% mujeres. Se trata de una variable nominal porque no podemos
ordenarla jerárquicamente.
Variable Estadística Cualitativa Ordinal (Agregar 2 ejemplos y gráfico
representativo al concepto)
Una variable ordinal es un tipo de variable estadística de tipo cualitativo que expresa
con palabras una cualidad de naturaleza ordenable. Es decir, una variable ordinal es una
variable que puede ser ordenada. Así, si decimos que en una carrera de 100 metros lisos
Andrés quedó primero, José segundo y Pablo tercero. Esa posición es ordenable, se
puede ordenar de mayor a menor o de menor a mayor. Es decir, de forma descendente o
ascendente.
Las variables ordinales, a diferencia de las nominales, sí pueden ser ordenadas de forma
jerárquica. Otro ejemplo, en este sentido, podría ser que una lesión es leve, moderada o
grave. La variable es la gravedad de la lesión y se puede ordenar en función de la
gravedad. En caso de que no sea posible ordenarlo de forma jerárquica estaríamos
hablando de una variable nominal.
En lo que sigue vamos a ver varios ejemplos de variables ordinales:
Calificación crediticia: Este será mejor cuanto mayor sea la solvencia según la agencia
de calificación.
Nota de una prueba. Por ejemplo, un examen que se califica como suspenso, aprobado,
notable, sobresaliente y matrícula de honor.
La variable cualitativa ordinal, tiene que graficar sus frecuencias absolutas simples, con
un gráfico de barras separadas.
En el eje de las "x" solo se colocan las categorías de la variable, que en este caso es el
"nivel educativo".
En el eje de las "y" se colocan las frecuencias absolutas simples.
La variable ordinal, tiene frecuencias acumuladas, ya sean absolutas o relativas,
pero estas frecuencias no se grafican.
Variable Estadística Cuantitativa. (Agregar gráfico representativo al
concepto)
Las variables cuantitativas son aquellas variables estadísticas que otorgan, como
resultado, un valor numérico.
Por ejemplo, variables tales como el peso (62 kg, 80 kg), la altura (1,72 cm, 1,85 cm) o
la cantidad de miembros en una familia (2, 3 ó 4), son variables cuantitativas.
Las principales características de las variables cuantitativas son las siguientes:
Expresan sus valores con números.
Son utilizadas generalmente en encuestas o entrevistas.
Utilizan gráficos llamados diagramas integrales y diagramas diferenciales para mostrar la
frecuencia relativa de las variables.
También pueden servirse de diagramas de barra para otorgar cifras.
INVESTIGACIÓN DE DOMENICA ALMEIDA ROSALES.
Variable Estadística Cuantitativa Discreta.
Una variable discreta es aquella que solo puede tomar un número finito de valores entre
dos valores cualesquiera de una característica. Ejemplos:
El número de hijos de una familia.
La cantidad de dedos que tienes en la mano.
El número de faltas en un partido de fútbol.
Número de personas que llegan a un consultorio en una hora.
Variable Estadística Cuantitativa Continua.
Es aquella variable que puede tomar cualquier valor dentro de un intervalo real.
La estatura de tu mejor amigo.
El ancho de una pelota de fútbol.
Volumen de agua en una piscina.
El peso de una persona.
Tablas de frecuencias (absoluta, absoluta acumulada, relativa, relativa
acumulada) para datos no agrupados y datos agrupados.
Datos No Agrupados
Se usa este tipo de tablas cuando se tiene variables cualitativas, o variables
cuantitativas con pocos valores.
Esta tabla está compuesta por las siguientes columnas:
Valores de la variable: son los diferentes valores que toma la variable en el estudio.
Frecuencia absoluta: es la cantidad de veces que aparece el valor en el estudio. La
sumatoria de las frecuencias absolutas es igual al número de datos.
Frecuencia acumulada: es el acumulado o suma de las frecuencias absolutas, indica
cuantos datos se van contando hasta ese momento o cuántos datos se van reportando.
Frecuencia relativa: es la fracción o proporción de elementos que pertenecen a una clase
o categoría. Se calcula dividiendo la frecuencia absoluta entre el número de datos del
estudio.
Frecuencia relativa acumulada: es la proporción de datos respecto al total que se han
reportado hasta ese momento. Es la suma de las frecuencias relativas, y se puede calcular
también dividiendo la frecuencia acumulada entre el número de datos del estudio.
Frecuencia porcentual: es el porcentaje de elementos que pertenecen a una clase o
categoría. Se puede calcular rápidamente multiplicando la frecuencia relativa por 100%.
Frecuencia porcentual acumulada: es el porcentaje de datos respecto al total que se
han reportado hasta ese momento. Se puede calcular rápidamente multiplicando la
frecuencia relativa acumulada por 100%.
Ejemplo:
Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los
siguientes resultados:
Negro Negro Rojo
Azul Amarillo Negro
Amarillo Rojo Azul
Rojo Rojo Rojo
Azul Amarillo Negro
Azul Amarillo Amarillo
Rojo Azul
Con los resultados obtenidos, elaborar una tabla de frecuencias.
Solución:
En la primera columna, colocamos los valores de nuestra variable, en la segunda la
frecuencia absoluta, luego la frecuencia acumulada, seguida por la frecuencia relativa, y
finalmente la frecuencia relativa acumulada. Por ser el primer problema, no haremos uso
de las frecuencias porcentuales.
Frecuencia
Frecuencia Frecuencia Frecuencia
Color relativa
absoluta acumulada relativa
acumulada
Negro 4 4 0,20 0,20
Azul 5 9 0,25 0,45
Amarillo 5 14 0,25 0,70
Rojo 6 20 0,30 1
Total 20 1
Datos Agrupados.
Se usan las tablas de frecuencias con datos agrupados cuando la variable toma un
gran número de valores o es una variable continua. Para ello, se agrupan los
diferentes valores en intervalos de igual amplitud, a los cuáles se les llaman clases.
Aparecen además algunos parámetros importantes:
Límites de clase: cada clase es un intervalo que va desde el límite inferior, hasta el límite
superior.
Marca de clase: es el punto medio de cada intervalo, y representa a la clase para el
cálculo de algunos parámetros.
Amplitud de clase: es la diferencia entre el límite superior y el límite inferior.
Los pasos para elaborar una tabla de frecuencias con datos agrupados,
son los siguientes:
Hallar el rango(R): R = Xmax– Xmin.
Hallar el número de intervalos (K): Si el problema no indica cuántos intervalos usar, se
recomienda usar la regla de Sturgues: K = 1 + 3,322 log(n); siendo n el número de
datos.
Determinar la amplitud de clase (A): A = R/K
Hallar el límite inferior y superior de cada clase, así como las marcas de clase.
Colocar los valores hallados en las columnas de la tabla de frecuencias, con el
siguiente orden: clases (intervalos), marcas de clase, frecuencia absoluta, frecuencia
acumulada, frecuencia relativa, frecuencia relativa acumulada. Además, se puede
colocar la frecuencia porcentual y la frecuencia porcentual acumulada.
Los intervalos no deben superponerse, es decir, deben ser mutuamente excluyentes.
Ejemplo:
Las notas de 35 alumnos en el examen final de estadística, calificado del 0 al 10,
son las siguientes:
0; 0; 0; 0; 1; 1; 1; 1; 2; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 5; 5; 6; 6; 6; 7; 7; 7; 8; 8; 8; 9;
10; 10.
Con los datos obtenidos, elaborar una tabla de frecuencias con 5 intervalos o
clases.
Solución:
Se halla el rango: R = Xmax– Xmin = 10 – 0 = 10.
El número de intervalos (k) lo da el enunciado del problema: k = 5.
Se calcula la amplitud de clase: A = R/k = 10/5 = 2.
Por ultimo hallamos los límites inferiores y superiores de cada clase, y
elaboramos la tabla de frecuencias
Frec.
Marca de Frecuencia Frecuencia Frecuencia
Intervalo relativa
clase absoluta acumulada relativa
acumulada
[0 – 2) 1 8 8 0,229 0,229
[2 – 4) 3 7 15 0,200 0,429
[4 – 6) 5 8 23 0,229 0,658
[6 – 8) 7 6 29 0,171 0,829
[8 – 10] 9 6 35 0,171 1
Total 35 1
Gráficos estadísticos, construcción de histogramas, diagrama de barras,
gráficos circulares, ojivas. (Agregar 1 ejemplo de c/u).
Gráficos estadísticos. - son las distintas maneras de representar series de datos
estadísticos de diverso tipo y origen para mostrar de manera visual cómo evoluciona una
o más variables en comparación con otras.
Los gráficos estadísticos son potentes herramientas para la visualización de datos que
permiten representar de manera accesible información compleja. Consiguen presentar la
información al usuario o lector de manera clara y precisa, facilitando la comparación y la
comprensión de la evolución de distintas variables.
Además, pueden adaptarse al nivel del público al que van dirigido, convirtiéndolos en una
vía de gran utilidad para ofrecer información clara a cualquier persona: desde los lectores
de periódicos y revistas, hasta estudiantes, docentes, divulgadores científicos o directivos
de compañías que desean mostrar el avance de su negocio.
Histogramas: es la representación gráfica en forma de barras, que simboliza la
distribución de un conjunto de datos. Sirven para obtener una "primera vista" general, o
panorama, de la distribución de la población, o de la muestra, respecto a una
característica, cuantitativa y continua.
En un histograma el eje de las “x” (o abscisas) consiste del rango en el cual se encuentran
los datos. Las bases de los rectángulos consisten de los intervalos en los cuales
agrupamos dichos datos.
En el eje de las “y” (u ordenadas) se tiene más opciones, dependiendo estas opciones
se dibuja el tipo de histograma.
Los dos tipos principales de histogramas son los siguientes:
Histograma de frecuencias absolutas: representa la frecuencia absoluta mediante la
altura de las barras.
Histograma de frecuencias relativas: representa la frecuencia relativa mediante la
altura de las barras.
Para construir un histograma se debe seguir los siguientes pasos:
Se dibuja el eje de las abscisas de tal forma que incluya como mínimo el rango de los
datos y, posteriormente, dividimos este rango en los intervalos dados.
Se dibuja el eje de las ordenadas representando las frecuencias absolutas o relativas
según sea el caso.
Se dibujan los rectángulos de anchura igual y proporcional al intervalo y de altura igual a
la frecuencia absoluta o relativa, según sea el caso.
Ejemplo:
Edad Personas
Total:
Histograma De Frecuencias Absolutas:
Histograma De Frecuencias Relativas:
Diagrama de barras: Se utilizan para mostrar la evolución o comportamiento de una
variable en el tiempo. Se compone en un sistema de coordenadas de ejes cartesianos en
el que barras rectangulares horizontales o verticales representan gráficamente la variable
elegida. Este tipo de gráfico es habitual para representar, por ejemplo, los ingresos de una
compañía por trimestres de actividad o la evolución del PIB de un país bien sea anual,
semestral, trimestral. Permite introducir diversas variables y observar su evolución
paralela a lo largo del mismo período de tiempo: en uno de los ejes se establece el tiempo
y el otro se levantan las barras marcando el valor que corresponde a la variable
Gráficos circulares: Permite visualizar las partes de un todo a través de una
circunferencia dividida en sectores o porciones. Por ejemplo, el porcentaje de alumnos de
una clase que realizan una determinada actividad extraescolar: del 100 % de los alumnos,
un 15 % juega al baloncesto, un 10 % aprende programación, un 15 % estudia un idioma,
un 40 % juega al fútbol y el 20 % restante agrupa otras actividades.
Ojivas: La ojiva es una gráfica asociada a la distribución de frecuencias, es decir, que en
ella se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos
valores, en lugar de solo exhibir los números asignados a cada intervalo.
La ojiva apropiada para información que presente frecuencias mayores que el dato que
se está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en
cambio la que se asigna a valores menores, tendrá una pendiente positiva.
Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar
parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas,
existen las ojivas mayores que y las ojivas menores que.
Rango o Recorrido de los datos.
El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto
mayor es el rango, aún más dispersos están los datos (sin considerar la afectación de los
valores extremos). El rango, también es llamado amplitud o recorrido de medida.
Por ejemplo, para una serie de datos de carácter cuantitativo, como lo es la estatura
medida en centímetros, tendríamos:
𝑥1 = 185, 𝑥2 = 165, 𝑥3 = 170, 𝑥4 = 182, 𝑥5 = 155
Es posible ordenar los datos como sigue:
𝑥1 = 155, 𝑥2 = 165, 𝑥3 = 170, 𝑥4 = 182, 𝑥5 =185
Donde la notación x(i) indica que se trata del elemento i-ésimo de la serie de datos. De
este modo, el rango sería la diferencia entre el valor máximo 𝑥(𝑘) Y el mínimo 𝑥(1) ; o, lo
que es lo mismo:
𝑅 = 𝑥(𝑘) − 𝑥(1)
En nuestro ejemplo, con cinco valores, nos da que
𝑅 = 185 − 155 = 30
El rango, amplitud o recorrido, se usa para tener una rápida idea del grado de dispersión
o separación de un conjunto de datos, sin embargo, se quiere conocer con mayor
precisión el nivel de dispersión, se recomienda recurrir a otras medidas estadísticas como
la varianza o la desviación estándar.
INVESTIGACION DE ALLAN GONZALES PLAZA.
Amplitud de intervalos para datos agrupados.
Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos
o clases para así realizar un mejor análisis e interpretación de ellos.
Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos,
se debe determinar la frecuencia absoluta (fi) correspondiente a cada intervalo, contando
la cantidad de datos cuyo valor está entre los extremos del intervalo. Luego se calculan
las frecuencias relativas y acumuladas, si es pertinente.
o Si no se conocen los intervalos, se pueden determinar de la siguiente manera:
Se busca el valor máximo de la variable y el valor mínimo. Con estos datos se
determina el rango.
Se divide el rango en la cantidad de intervalos que se desea tener, obteniéndose así
la amplitud o tamaño de cada intervalo.
Comenzando por el mínimo valor de la variable, que será el extremo inferior del primer
intervalo, se suma a este valor la amplitud para obtener el extremo superior y así
sucesivamente.
Número de intervalos para datos agrupados.
Medidas de tendencia central.
Media Aritmética, fórmula para datos no agrupados y datos no agrupados.
Usando y sin usar tabla de frecuencia.
EJEMPLO:
1. En matemáticas y estadística, la media aritmética, también llamada promedio o media, es
un conjunto infinito de números, es el valor característico de una serie de datos
cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor
esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número
total de sumandos. Cuando el conjunto es una muestra aleatoria, recibe el nombre de
media, siendo uno de los principales estadísticos muéstrales.
DATOS AGRUPADOS.
FORMULA PARA DATOS AGRUPADOS:
DATOS NO AGRUPADOS
FORMULA PARA DATOS NO AGRUPADOS:
Supongamos que nuestras calificaciones en la escuela son:
Asignatura Nota
Matemáticas 7
Educación Física 8
Biología 5
Economía 10
N = número total de asignaturas = 4
Entonces aplicando la fórmula que acabamos de exponer, el resultado sería:
Nuestra nota media será de un 7,5.
Moda, fórmula para datos no agrupados y datos no agrupados. Usando y sin usar
tabla de frecuencia.
EJEMPLO:
1. La moda es el valor que aparece con mayor frecuencia en un conjunto de datos.
Esto va en forma de una columna cuando encontremos dos modas, es decir, dos
datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal
de los datos es en la que encontramos tres modas. En el caso de la distribución
uniforme discreta, cuando todos los datos tienen una misma frecuencia, se puede
definir las modas como indicado, pero estos valores no tienen utilidad. Por eso
algunos matemáticos califican esta distribución como «sin moda».
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.
DATOS AGRUPADOS:
DATOS NO AGRUPADOS:
Sera el dato que más repita en la muestra poblacional, se puede denotar a simple vista,
puede ser bimodal o trimodal (dos modas o tres modas)
Mediana, fórmulas para datos no agrupados y datos no agrupados. Usando y sin
usar tabla de frecuencia.
EJEMPLO:
1. La mediana se representa por el valor de la variable de posición central en un conjunto
de datos ordenados. Se le denota mediana.
DATOS NO AGRUPADOS:
DATOS AGRUPADOS:
INVESTIGACION DE INGRID MAZA MONCADA.
Medidas de Tendencia no Central en Estadística.
Las medidas de tendencia no central permiten conocer puntos característicos de una
serie de valores, que no necesariamente tienen que ser centrales. La intención de estas
medidas es dividir el conjunto de observaciones en grupos con el mismo número de
valores.
Un conjunto de puntuaciones o mediciones puede dividirse en cierto número de partes
iguales mediante la selección de valores que correspondan a una posición determinada
en dicho conjunto.
También llamadas medidas de posición, facilitan la información sobre los datos que se
están estudiando; ya que permiten la ubicación de un conjunto de datos dentro de un
contexto de valores posible. Las medidas de tendencia no central sintetizan el estudio de
una distribución de frecuencias, al resumir estas distribuciones determinando la ubicación
de los valores que dividen un conjunto de observaciones en partes iguales. Las medidas
de tendencia no central dividen los datos de una distribución en partes igual, es decir, en
intervalos que poseen el mismo número de valores; si la distribución comprende muchos
intervalos, se puede repartir la distribución en cuatro, en diez o en cien partes. Las
medidas de tendencia no central son los cuartiles, que dividen la distribución en cuatro
partes; los deciles, que dividen la distribución en diez partes, y los centiles, que dividen la
distribución en cien partes. La distribución de frecuencias se puede representar
gráficamente con una ojiva, la cual es una gráfica lineal que representa las frecuencias
acumuladas o las relativas. El gráfico de la ojiva utiliza en la escala horizontal los intervalos
de clase y en la escala vertical la frecuencia acumulada o la relativa. Las ojivas son
importantes para ubicar el número de valores que se encuentran por debajo de un valor;
por lo que también podemos identificar en el gráfico las medidas de tendencia no central.
Gráficos en Estadística
Los gráficos en Estadística permiten interpretar mejor cierta información, presentándola
más interesante e entendible. A pesar que los gráficos tienen una cantidad limitada de
datos y valores aproximados, permiten potenciar los argumentos y las conclusiones de
una investigación; además de proporcionar una perspectiva general de los resultados. La
presentación de los gráficos en Estadística hace más atractiva la información,
proporcionando en forma general los valores y las relaciones de estos valores que se
obtienen como resultado de una investigación. El uso de los gráficos depende de la
cantidad de datos que presenten; a menor cantidad de datos, mayor es la utilidad del
gráfico utilizado. La ojiva es un polígono acumulado de frecuencia absoluta, relativa o
porcentual y representan segmentos de línea que se dan al unir los puntos formados por
el límite inferior de cada clase con la frecuencia acumulada. La gráfica de la ojiva es
importante ya que permite inferir información que la distribución de frecuencia no muestra;
y así determinar la mediana, cuartiles, deciles y percentiles, de manera aproximada.
Cuartiles.
Son los puntos que dividen a una distribución de valores en cuatro porciones iguales
o intervalos. Se representan por Q1, Q2, Q3 y se ilustran en el esquema siguiente:
A Q1 Q2 Q3 B
0 25% 50% 75% 100%
Debe considerarse la relación que existe entre los centiles, deciles, cuartiles y la mediana;
su relación en forma sinóptica se representa de la manera siguiente:
Cuartil 1: Q1 = C25 (centil 25).
Cuartil 2: Q2 = D5 = Me (centil 50, decil 5 o mediana).
Cuartil 3: Q3 = C75 (centil 75).
Cálculo de los cuartiles.
1. Ordenamos los datos de menor a mayor.
2. Buscamos el lugar que ocupa cada cuartil mediante la expresión
Número impar de datos:
Número par de datos:
Cálculo de los cuartiles para datos agrupados
En primer lugar, buscamos la clase donde se encuentra, en
la tabla de las frecuencias acumuladas.
es el límite inferior de la clase donde se encuentra el cuartil.
es la suma de las frecuencias absolutas.
es la frecuencia acumulada anterior a la clase del cuartil.
es la amplitud de la clase.
Ejemplo de ejercicio de cuartiles:
1. Calcular los cuartiles de la distribución de la tabla:
En primer lugar, crearemos una nueva columna con los valores de la frecuencia
acumulada:
En la primera casilla colocamos la primera frecuencia absoluta.
En la segunda casilla sumamos el valor de la frecuencia acumulada anterior más la
frecuencia absoluta correspondiente y así sucesivamente hasta la última, que tiene que
ser igual a
Cálculo del primer cuartil.
Buscamos el intervalo donde se encuentra el primer cuartil, multiplicando por
y dividiendo por .
Buscamos en la columna de las frecuencias acumuladas el intervalo que contiene
a .
La clase de es:
Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los
siguientes datos:
Cálculo del segundo cuartil.
Buscamos el intervalo donde se encuentra el segundo cuartil, multiplicando por
y dividiendo por .
Buscamos en la columna de las frecuencias acumuladas el intervalo que contiene
a .
La clase de es:
Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los
siguientes datos:
Cálculo del tercer cuartil.
Buscamos el intervalo donde se encuentra el tercer cuartil, multiplicando por
y dividiendo por .
Buscamos en la columna de las frecuencias acumuladas el intervalo que contiene
a
La clase de es:
Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo
los siguientes datos:
DECILES.
Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez
partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales, son también un caso particular de los percentiles. Los
deciles se denotan D1, D2, D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.
k= 1,2, 3... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles:
El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y
es superado por el 60% de las observaciones.
El quinto decil corresponde a la mediana.
El noveno decil supera al 90% y es superado por el 10% restante.
Donde (para todos):
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
o Fórmulas Datos No Agrupados.
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
fórmulas:
Cuando n es par:
Cuando n es impar:
Siendo A el número del decil.
CENTILES O PERCENTILES.
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o
clasificación de las personas cuando atienden características tales como peso, estatura,
etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien
partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes
iguales el conjunto de datos ordenados. Los percentiles (P1, P2... P99), leídos primer
percentil, percentil 99.
Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la
fórmula:
k= 1,2, 3... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones
y es superado por el 40% de las observaciones.
El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.
o Fórmulas Datos No Agrupados.
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
fórmulas:
Para los percentiles, cuando n es par:
Cuando n es impar:
Siendo A, el número del percentil.
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el
percentil 50 y el tercer cuartil con el percentil 75.
EJEMPLO:
Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla:
SALARIOS [Link] Fa
(I. De Clases) Empleados (f1)
200-299 85 85
300-299 90 175
400-499 120 295
500-599 70 365
600-699 62 427
700-800 36 463
Como son datos agrupados, se utiliza la fórmula
Siendo,
La posición del primer cuartil.
La posición del 7 decil.
La posición del percentil 30.
Entonces,
El primer cuartil:
115.5 – 85 = 30.75
Li = 300, Ic = 100, fi = 90
El 7 decil:
Posición:
324.1 – 295 = 29.1
Li = 500, fi = 70
El percentil 30
Posición:
138.9 – 85 = 53.9
fi = 90
Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de
$ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el 70% de
los empleados.
Medidas de dispersión:
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la
variabilidad de una distribución, indicando por medio de un número si las diferentes
puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese
valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la media.
Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la
media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la
suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias
para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviación
media) y otra es tomando las desviaciones al cuadrado (varianza).
o DESVIACIÓN MEDIA.
Es otra medida de dispersión que tiene un significado intuitivo es la desviación media
(Dm), la cual puede visualizarse evaluando la distancia entre cada observación
(puntuación) y la media aritmética. El promedio de estas distancias da una medida
racional de la dispersión de los datos.
Para Datos No Agrupados.
Se emplea la ecuación:
Ejemplo ilustrativo:
Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18
Solución:
Se calcula la media aritmética.
Se calcula la desviación media.
Empleando Excel se calcula de la siguiente manera:
Para Datos Agrupados en Tablas de Frecuencia.
Se emplea la ecuación:
Ejemplo ilustrativo: Calcular la desviación media en base a la siguiente tabla sobre
las calificaciones de un estudiante en 12 asignaturas evaluadas sobre 10.
Cantidad de
Calificación
asignaturas
6 4
7 2
8 3
9 2
10 1
Total 12
Varianza y desviación estándar.
La varianza es la media aritmética de los cuadrados de las desviaciones respecto a la
media aritmética, es decir, es el promedio de las desviaciones de la media elevadas al
cuadrado. La desviación estándar o desviación típica es la raíz de la varianza.
La varianza y la desviación estándar proporcionan una medida sobre el punto hasta el
cual se dispersan las observaciones alrededor de su media aritmética.
Para Datos No Agrupados.
La varianza para una población se calcula con:
I. Para el cálculo de la varianza de una muestra se divide por n-1 en lugar de N, debido a
que se tiene n-1 grados de libertad en la muestra. Otra razón por la que se divide por n-1
es debido a que una muestra generalmente está un poco menos dispersa que la población
de la cual se tomó. Al dividir para n-1 en lugar de N se cumple con la tendencia y sentido
lógico de que la varianza y desviación estándar de la muestra deben tener un valor más
pequeño que la varianza y desviación estándar de la población.
II. En la realidad, salvo indicación expresa, no se calcula la varianza y la desviación estándar
de la población, ya que para ahorrar tiempo, esfuerzo, dinero, etc. es mejor trabajar con
datos que representan a la muestra.
Ejemplo ilustrativo N° 1:
Considere que los siguientes datos corresponden al sueldo de una población: $350, $400,
$500, $700 y $1000
1. Calcular la desviación estándar.
2. ¿Cuál es el intervalo que está dentro de k = 2 desviaciones estándar de la media?
¿Qué porcentaje de las observaciones se encuentran dentro de ese intervalo?
Solución:
1. Para la calcular la desviación estándar se sigue los siguientes pasos:
2. Se calcula la media aritmética.
a) Se aplica la respectiva fórmula para calcular la varianza.
b) Se calcula la desviación estándar.
Empleando Excel se calcula de la siguiente manera:
Cálculo del intervalo de k = 2 desviaciones estándar de la media.
Se transportan 2 desviaciones estándar (2 x $ 237,4868) = $ 474,97 por encima y por
debajo de la media = $ 590
Por lo tanto, se tiene un intervalo desde $ 590 - $474,97 = $ 115,03 hasta $ 590 + $474,97
= $ 1064,97
Aplicando el Teorema de Chebyshev
Interpretación: Se puede afirmar que por lo menos el 75% los sueldos están entre $
115,03 y $ 1064,97
Ejemplo ilustrativo N° 2:
Dos empresas, A y B, venden sobres de café instantáneo de 350 gramos. Se
seleccionaron al azar en los mercados cinco sobres de cada una de las compañías y se
pesaron cuidadosamente sus contenidos. Los resultados fueron los siguientes.
A B
350,14 350,09
350,18 350,12
349,98 350,20
349,99 349,88
350,12 349,95
1. ¿Qué empresa proporciona más café en sus sobres?
2. ¿Qué empresa llena sus sobres de manera más consistente?
Solución:
a) Se calcula las medias aritméticas.
Interpretación: Como la media aritmética de la empresa A es mayor que la de la
empresa B, por lo tanto la empresa A proporciona más café en sus sobres.
b) Se calcula las desviaciones estándar.
Interpretación: Como la desviación estándar de la empresa A es menor a la desviación
estándar de la empresa B, por lo tanto, la empresa A es más consistente al llenar los
sobres de café.
Empleando Excel se calcula de la siguiente manera:
Para Datos Agrupados en Tablas de Frecuencia
La varianza para una población se calcula con:
Ejemplo ilustrativo: Calcular la desviación estándar de los siguientes datos correspondientes a
una muestra.
Calificaciones f
4 3
5 6
6 4
7 13
8 7
10 6
Total 39
Solución:
a) Se llena la siguiente tabla:
Calificaciones f fx
4 3 12
5 6 30
6 4 24
7 13 91
8 7 56
10 6 60
Total 39 273
b) Se calcula la media aritmética.
Para Datos Agrupados en Intervalos.
La varianza para una población se calcula con:
Ejemplo ilustrativo: Calcular la desviación estándar de los siguientes datos
correspondientes a una muestra.
Intervalo f
60-65 5
65-70 20
70-75 40
80-85 27
85-90 8
Total 100
Solución:
a) Se llena la siguiente tabla:
Intervalo f xm f·xm
60-65 5 62,5 312,5
65-70 20 67,5 1350
70-75 40 72,5 2900
80-85 27 82,5 2227,5
85-90 8 87,5 700
Total 100 7490
b) Se calcula la media aritmética.
c) Se calcula la desviación estándar.
Diagrama de tallo y hojas.
En el diagrama de tallo y hojas cada dato representa su valor y, a la vez, ocupa un espacio
de forma que se obtiene simultáneamente la presentación de
los datos y distribución gráfica.
En este diagrama cada valor se descompone en 2 partes: el primero o primeros dígitos
(el tallo) y el dígito que sigue a los utilizados en el tallo (las hojas) Por ejemplo, el valor 32
puede descomponerse en un tallo de 3 y una hoja de 2; el valor 325 puede
descomponerse en un tallo de 32 y una hoja de 5; el valor 3256 puede descomponerse
en un tallo de 325 y una hoja de 6. Cada tallo puede ocupar una o más filas. Si un tallo
ocupa una sola fila, sus hojas contendrán dígitos del 0 al 9; si ocupa dos filas, la primera
fila contendrá dígitos del 0 al 4 y la segunda fila del 5 al 9.
La ventaja de este diagrama es que refleja a primera vista las mismas
impresiones gráficas que el histograma sin necesidad de elaborar el gráfico. También
tiene la ventaja de conservar los valores originales de los datos.
Ejemplo ilustrativo:
A 40 estudiantes se les pidió que estimen el número de horas que habrían dedicado a
estudiar la semana pasada (tanto en clase como fuera de ella), obteniéndose los
siguientes resultados:
30 30 32 32 35 35 35 35
36 37 38 39 39 40 45 45
47 47 47 48 48 49 50 50
50 52 54 55 55 56 56 56
58 58 58 58 58 60 60 65
Elaborar un diagrama de tallo y hojas.
Solución:
A fin de elaborar el diagrama de tallo y hojas se ordena los datos con los dígitos iniciales
de cada uno, las decenas (tallos) a la izquierda de una línea vertical, y a la derecha de
esa recta el último dígito de cada dato, en este caso la unidad, conforme recorren los
datos en el orden en que fueron anotados.
3 0022555567899
4 055777889
5 000245566688888
6 005
Interpretaciones: Hay 13 estudiantes que dedican entre 30 y 39 horas semanales a
estudiar, 9 estudiantes que dedican entre 40 y 49 horas semanales a estudiar, 15
estudiantes que dedican entre 50 y 59 horas semanales a estudiar y existen 3 estudiantes
que se dedican entre 60 y 65 horas semanales a estudiar.
En GeoGebra se elabora de la siguiente manera:
a) En Entrada se escribe las primeras letras de diagrama.
b) Se selecciona la opción Diagrama Tallo y Hojas. Se escribe los datos
c) Enter.
d) Para editar. Clic derecho en el diagrama.
e) Seleccionar Propiedades de Objeto para visualizar la ventana de Preferencias.
f) Seleccionar Texto. Escoger Mediano.
g) En color seleccione el que desee.
h) Cerrar la ventana de preferencias.