PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
SEDE MANABÍ
CARRERA AGROINDUSTRIA
TRABAJO
MANUAL DE MANEJO DE EXCEL E INFOSTAT EN LA ESTADÍSTICA
ASIGNATURA
ESTADÍSTICA
AUTOR
MOLESTINA REYES RAQUEL STEFANIA
DOCENTE ASIGNATURA:
JESÚS CHAVARRIA
FEBRERO 2024
HISTOGRAMA-POLIGONO DE FRECUENCIA
Para poder desarrollar un histograma junto con un polígono de frecuencia en Excel se realizará
de la siguiente manera:
1. Primero se debe tener una tabla de datos con las que se desarrollara el histograma.
INT.CLASES HISTOGRAMA
30-40 23
40-50 18
50-60 15
60-70 19
70-80 23
80-90 19
90-100 22
100-110 10
110-120 19
2. Luego iremos a la pestaña insertar, haremos en clic en insertar grafico de columnas y
hacemos clic en el primer grafico que sale.
3. Nos va a salir un cuadro blanco, porque todavía no hay datos seleccionados. Luego en
la parte superior haremos clic en seleccionar datos.
4. Luego se aparece un cuadro donde seleccionaremos los datos que tenemos presente y
le agregamos un nombre a la serie.
5. Hacemos clic en agregar y se aparcera un cuadro que dice modificar serie, donde dice
nombre de serie colocamos HISTOGRAMA y en la parte inferior donde dice valores de
serie hacemos clic al cuadrado con una flecha y seleccionamos la información que
tenemos.
6. Luego haremos clic en aceptar, en la parte izquierda donde dice etiqueta del eje
horizontal, hacemos clic donde dice editar y seleccionaremos en este caso del ejemplo
los intervalos de clases y tendremos un gráfico de barras normal.
7. Luego hacemos clic en una de las barras del gráfico y aparecerá de lado derecho una
ventana que dice formato, como queremos que se juntes las barras, donde dice ancho
de intervalo vamos a ponerle 0 y las barras se juntaran.
8. Luego en la misma venta que se abrió iremos a donde dice borde, luego vamos a darle
clic donde dice línea solida con el fin de poder diferenciar cada barra del grafico y le
pondremos un color diferente del que ya tenemos, en este caso yo le pondré amarillo,
para que la línea se pueda ver mejor, vamos donde dice ancho y le subimos hasta que
se pueda visualizar la línea.
9. Luego vamos a incluirle una línea de frecuencia, volvemos a hacer clic en seleccionar
datos y hacemos clic donde dice agregar, le ponemos en nombre de serie Polígono y
seleccionamos los mismos valores anteriores.
10. Nos van aparece otras columnas, vamos a seleccionar las columnas que aparecieron y
seleccionamos cambio de grafico.
11. Después de que se abra la ventana de cambiar tipo de gráfico, en la parte inferior
hacemos clic donde polígono columna agrupada.
12. Luego de hacer clic en columnas agrupadas, hacemos clic en la figura línea con
marcadores.
13. Y entonces tenemos nuestro histograma con polígono de frecuencia.
14. Y por último hacemos clic en el gráfico y hacemos clic donde sale un signo más de color
verde, luego le vamos agregar al gráfico: ejes, títulos de eje, etiqueta de datos y
leyenda.
15. Y estaría terminado el histograma junto al polígono de frecuencia.
GRAFICA DE PASTEL
Para hacer la gráfica de pastel vamos a utilizar los mismos datos de la explicación anterior
1. Seleccionamos todos los datos, luego vamos a la pestaña de insertar y hacemos clic en
grafico circular.
2. Después de que se abra la gráfica circular, haremos clic en el signo + de color verde.
3. Luego de que se abra la venta de los elementos de gráfico, vamos agregarle etiqueta
de datos por lo cual los datos se pondrán dentro de la gráfica.
4. También le podemos cambiar la leyenda y ponerla en el lado derecho.
5. En la gráfica hay un valor que no se puede observar debido al color, entonces le
cambiamos el color para que se visualice mejor.
6. Y está listo el grafico de pastel.
CÁLCULOS DE NUMERO DE DATOS, LÍMITE INFERIOR, LÍMITE SUPERIOR, RANGO, NUMERO
DE CLASE Y AMPLITUD DE CLASE
1. Primero tenemos que tener los datos ordenados, en este caso usare los siguientes:
2. Luego para poder llevar de una manera ordenada, vamos hacer un cuadro con la
información que vamos a calcular, de la siguiente manera.
3. El número de datos es lo permite saber cuántos datos hay en total en nuestra
tabla y lo que vamos hacer es seleccionar la celda donde vamos a poner el
resultado y escribiremos el comando CONTAR y seleccionaremos todos nuestros
datos y sale el resultado.
4. Luego vamos a calcular el límite inferior de la data que es el valor mínimo que hay en
la data. Seleccionamos la celda donde ira el resultado y ponemos el signo = y el
comando MIN y seleccionamos toda la data y nos da el resultado.
5. Vamos a calcular el límite superior que es valor más alto que hay en la data.
Seleccionamos la celda donde ira el resultado, ponemos el signo = y luego el
comando MAX y seleccionamos toda la data y nos da el resultado.
6. Vamos a calcular el rango de la data que es igual al límite superior menos el límite
inferior. Seleccionamos la celda donde ira la respuesta, ponemos = y
seleccionamos el límite superior, agregamos el signo – y seleccionamos el límite
inferior y da el resultado.
7. Luego para sacar el número de clase, vamos aplicar la regla de Sturges, se aplica la
formula y se selecciona el número de datos que se calculó anteriormente. Se aplica
de la siguiente manera.
NOTA: En la fórmula de la regla de Sturges se agregó el comando REDONDEAR.MAS con el fin de que
nos dé un numero entero
8. Vamos a calcular el tamaño o amplitud de clase la cual es la división entre el rango
y numero de clase. Seleccionamos la celda donde ira el resultado y ponemos el
signo =, seleccionamos el rango, agregamos el signo / de división y seleccionamos
el número de clases y da el resultado.
9. Y tenemos ya completa los resultados que necesitábamos de la data.
CÁLCULO DE INTERVALO DE CLASES Y FRECUENCIAS
1. Para poder obtener los cálculos de intervalos y frecuencias, haremos una tabla para
poder organizar los resultados que obtendremos de la data y se hará de la siguiente
manera:
2. Para comenzar a realiza el número de clases empieza con 0 para arrancar con la clase
0, por ende, en el límite inferior y superior ira 0.
3. En el número de clase de 1, el límite inferior será el resultado que obtuvimos en la
tabla anterior que seria 10.
4. Para sacar el límite superior del número de clase 1, se suma el límite inferior y el
tamaño de clase o amplitud que se calculó en la tabla anterior.
5. El segundo número de clase será el mismo resultado que nos dio en el límite superior
del primer grupo de numero de clase, por ende, se coparía el mismo resultado.
6. Y para el límite superior será lo mismo que el anterior, se sumará el límite inferior del
número de clase 2 con el tamaño de amplitud o clase.
Nota: Cabe aclarar que dio 19 y no 20 debido a los decimales
7. Y así sucesivamente se hará para todos los números de clase, tanto en límite inferior y
límite superior.
8. Ahora sacaremos la frecuencia absoluta, para la frecuencia absoluta pondremos en la
celda un corchete, luego el signo = y, escribimos el comando FRECUENCIA,
seleccionamos nuestra data, ponemos punto y coma y seleccionamos todos los datos
del límite superior.
9. Luego de eso iremos a la parte inferior derecha de la celda y arrastraremos hacia
abajo, para que se haga automáticamente.
10. Pero los resultados que nos dieron no están bien como tal, entonces se va a
seleccionar todos los datos de la frecuencia absoluta y en la fórmula de la primera
celda ser hará clic en CONTROL, SHIFT Y ENTER al mismo tiempo y nos da los
resultados correctos.
11. Para la frecuencia absoluta acumulada, ponemos en la primera celda el 0 que es el que
da comienzo a la tabla y luego para la frecuencia absoluta acumulada del número de
clases 1 sumamos la frecuencia absoluta acumulada que en este caso seria 0 más la
frecuencia absoluta del número de clases 1.
12. Para la frecuencia absoluta acumulada del número de clases 2, sumamos la frecuencia
absoluta del número de clase 2 con la frecuencia absoluta acumulada del número de
clase 1.
13. Y así sucesivamente se hará en todos los numero de clase.
14. Para la frecuencia relativa se dividirá cada frecuencia absoluta con su total o el número
de datos.
15. Para el número de clase 2 se hará lo mismo, dividiremos su frecuencia absoluta con su
total o número de datos.
16. Y así se hará sucesivamente con todos los datos para obtener la frecuencia relativa, la
suma de todo deberá darnos 1.
17. Para calcular la frecuencia relativa acumulada, ponemos 0 que es el que da el
comienzo y para sacar la frecuencia relativa acumulada del número de clase 1 es la
suma de la frecuencia relativa acumulada que en el inicio será 0, junto con la suma de
la frecuencia relativa del número de clase 1.
18. Para la frecuencia relativa acumulada del número de clase 2, sumamos la frecuencia
relativa acumulada del número de clase 1 junto con la frecuencia relativa 2.
19. Y así sucesivamente se hará con todos los numero de datos para la frecuencia relativa
acumulada.
20. Y así se obtiene la tabla completa con todos los valores de intervalos y frecuencias.
MEDIANA, MEDIA, MODA
1. Empezaremos sacando la media y usaremos los datos del ejercicio anterior.
Primero haremos una tabla para tener una mejor organización.
2. Para la media, haremos clic en la celda donde ira la respuesta y ponemos el signo =
y el comando PROMEDIO y seleccionamos toda nuestra DATA.
3. Para sacar la media ponemos el signo = y el comando MEDIANA y seleccionamos
toda la data.
4. Para sacar la moda, pondremos el signo = y el comando MODA.
5. Y se tiene el cuadro completo.
VARIANZA, DESVIACION ESTANDAR, COEFICIENTE DE VARIACION Y COEFICIENTE DE
ASIMETRIA Y CURTOSIS
1. Usaremos la siguiente tabla para sacar los datos.
2. Haremos una tabla para tener un mayor orden.
3. Para sacar la varianza se usaremos el comando VAR.S y seleccionaremos la data. Se
usa esa función cuando se calcula la varianza en función a una muestra.
4. Para la desviación estándar usaremos el comando DEVEST.M y seleccionaremos
toda nuestra data. Con esto sabremos la dispersión de los valores con respeto a la
media.
5. Para el coeficiente de variación tendremos que dividir la desviación estándar por el
promedio de la data y multiplicado por 100. Se multiplica por 100 ya que el
coeficiente es un porcentaje.
Nota: Por ser mayor a 30 y menor a 70 los datos son heterogéneos por lo tanto la media no es
representativa
6. Para el coeficiente de asimetría se usará el comando COEF.ASIMETRIA y
seleccionaremos la data.
NOTA: Como es negativo el coeficiente de asimetría los valores coeficiente los datos se agruparán
hacia un lado en este caso a la derecha
7. Para sacar la curtosis, usaremos el comando CURTOSIS y seleccionaremos la data
NOTA: Como la curtosis es negativa indica una distribución mas plana de lo normal
PRUEBA T PARA MEDIAS DE DOS MUESTRAS EMPAREJADAS
1. Para sacar la prueba t usaremos la siguiente data.
2. Iremos a la pestaña de Datos y haremos clic en análisis de datos.
3. Luego se nos abre una ventana y haremos clic en prueba t para muestras
emparejadas.
4. Luego se nos abre otra ventana y pondremos los rangos para la variable 1 y 2 y se
pondrán de la siguiente manera: se seleccionará los 3 primeros datos y luego los 3
de abajo que serán los tratamientos 1 y 2.
5. Luego en opciones de salida hacemos clic en hoja nueva y la información saldrá en
una hoja nueva.
6. Y sale la información en una hoja nueva con los resultados de la prueba de t.
NOTA: Como en P no salieron valores menores a 0.05 significa que los tratamientos no tienen
diferencias estadísticas entre ellas
PRUEBA DE T PARA MUESTRAS DE VARIANZA IGUALES
8. Para esta muestra haremos los mismos pasos que la anterior, pero vamos a elegir
la opción de PRUEBA DE T PARA MUESTRAS DE VARIANZA IGUALES
9. Luego seleccionaremos los tratamientos 1 y 2, como en el ejercicio anterior.
10. Hacemos clic en aceptar y nos salen los resultados.
PRUEBA DE T PARA DOS MUESTRAS SUPONIENDO VARAINZAS DESIGAULES
11. Para esta muestra haremos los mismos pasos que la anterior, pero vamos a elegir
la opción de prueba de t para dos muestras suponiendo varianzas desiguales.
12. Luego seleccionaremos los tratamientos 1 y 2, como en el ejercicio anterior.
13. Hacemos clic en aceptar y nos sale el resultado.
ESTADISTICA DESCRIPTIVA
1. Para sacar la estadística descriptiva de la data, vamos a análisis de datos y haremos clic
en la opción de estadística descriptiva
2. Luego pondremos en rango de entrada y seleccionaremos los datos del tratamiento
desde el nombre, como vamos a poner el nombre haremos clic en ROTULOS EN
PRIMERA FILA y también hacemos clic en RESUMEN ESTADÍSTICO.
3. Hacemos clic en aceptar y nos sale los resultados.
ANÁLISIS DE VARIANZA DE UN FACTOR
1. Iremos a análisis de datos y haremos clic en la opción análisis de varianza de un factor.
2. En rango de entrada seleccionaremos toda la información que seria los tratamientos,
la replicas y la perdida por calentamiento; haremos clic en rótulos en la primera fila
porque van los nombres.
3. Hacemos clic en aceptar y nos saldrá los resultados.
NOTA: Según el resultado de probabilidad demuestra que hay diferencias entre grupos
MEDIDAS DE RESUMEN EN INFOSTAT
1. Primero copiaremos la data de Excel para pasarla a Infostat.
2. Luego en infostat, haremos clic en archivo y ponemos nueva tabla.
3. Cuando se abra la ventana haremos clic en donde dice columna 1 y pondremos pegar
incluyendo nombre de columna.
4. Luego que se haya pegado la tabla, iremos a estadística y haremos clic en medidas de
resumen.
5. Luego se abrirá una ventana y pondremos los datos de perdida por calentamiento
dentro de las variables.
6. Luego de hacer clic en aceptar, nos saldrá otra ventana y escogeremos las siguientes
opciones.
7. Luego damos clic en aceptar y saldrán los resultados.
8. Para poder tener unas medidas de resumen completas vamos agregar los tratamientos
en criterios de clasificación.
9. Ponemos aceptar y nos abrirá otra ventana, pondremos las siguientes opciones.
10. Ponemos aceptar y nos saldrá los resultados de las medidas de resumen.
ANALISIS DE VARIANZA EN INFOSTAT
1. Usaremos los mismos datos e iremos a estadística y podremos la opción análisis de
varianza.
2. Luego se abrirá una ventana y pondremos los datos de perdida por calentamiento en
variables dependientes y los tratamientos en variable de clasificación.
3. Luego se abrirá otra ventana y en la pestaña modelo escogeremos las siguientes
opciones.
4. Después en la ventana comparaciones haremos clic en las siguientes opciones.
5. Ponemos aceptar y saldrá los resultados.
NOTA: Los valores de R están bien que significa que estamos trabajando con un buen modelo ya que el máximo es
1. Por el valor de p significa que hay diferencias altamente significativas y la letra A significa que es el mejor
tratamiento
PRUEBAS DE FRIEDMAN
1. Primero copiaremos en infostat la data que vayamos a usar, iremos a análisis de
estadística y escogeremos la opción de Análisis de la varianza no paramétrica y
usaremos el método de Friedman.
2. Luego se abrirá una ventana, donde pondremos el Color T1 y T2 en variables por
tratamiento.
3. Ponemos el nivel de alfa en 0.05.
4. Ponemos aceptar y nos saldrá los resultados.
COEFICIENTE DE CORRELACION
1. Vamos a usar la siguiente data para sacar el coeficiente de correlación.
2. Luego iremos a análisis de datos y escogeremos la opción de coeficiente de
correlación.
3. Luego se abre una ventana y en rango de entrada seleccionaremos toda la data,
también seleccionaremos la opción rótulos en la primera fila
4. Ponemos aceptar y nos saldrá los resultados.
NOTA: La relación entre sacarosa y perdida de calentamiento es de 8% significa que el otro
92% depende de otras variables
5. Ahora sacaremos un modelo grafico de la predicción de los datos, seleccionaremos la
data e iremos a insertar e iremos a gráficos.
6. Luego se abrirá una ventana de gráficos y seleccionaremos el gráfico de dispersión .
7. En el grafico haremos clic en el signo + y haremos clic en títulos de ejes y pondremos
los nombres en los ejes.
8. Luego haremos clic en línea de tendencia y pondremos más opciones.
9. Luego nos abrirá una ventana en la parte derecha y pondremos las siguientes
opciones.
NOTA: Se elige la polinómica porque es la que mayor sumatoria de cuadrado tiene
10. Y nos dará las siguientes formulas en el modelo de predicción.
11. Ahora para sacar el modelo predictivo de cada porcentaje de sacarosa usaremos la
fórmula que obtuvimos y la aplicaremos de la siguiente manera.
12. Y así sacaremos para cada porcentaje de sacarosa, también sacaremos los promedios y
podremos comparar los resultados de los promedios con las predicciones.