Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
ASIGNATURA: ESTADISTICA I
UNIDAD I: ESTADÍSTICA DESCRIPTIVA
OBJETIVOS PARTICULARES.
- Analizar los resultados obtenidos de un conjunto de datos, utilizando las medidas
descriptivas.
- Utilizar la estadística descriptiva como herramienta de obtención de información
en la muestra, utilizando las fórmulas correspondientes.
- Demostrar ética y responsabilidad en la presentación de resultados obtenidos con
las medidas descriptivas, usando paquetes estadísticos.
CONTENIDOS
1.1. Introducción. Importancia. Rama de la estadística.
1.2. Recopilación y presentación de datos. Tablas de frecuencia.
1.3. Gráficos: Diagrama de tallo y hojas, histograma, diagrama de barra, ojiva,
diagrama de pastel.
1.4. Medidas de tendencia central para datos agrupados y no agrupados. Media,
mediana, moda, media cuadrática
1.5. Medidas de dispersión: Rango, varianza, desviación estándar, coeficiente de
dispersión.
1.6. Otras medidas: Percentiles, cuartiles, deciles, coeficiente de asimetría,
coeficiente de curtosis.
Recopilado por: Lic. Ana Gabriela Moreno Ulloa.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
Introducción
Desde inicios de la década de los ochenta del siglo pasado y hasta lo que ha transcurrido del
siglo XXI la industria mundial ha puesto una enorme atención en el mejoramiento de la
calidad. Se ha dicho y escrito mucho acerca del “milagro industrial” en Japón, que comenzó a
mediados del siglo XX. Los japoneses lograron el éxito en donde otras naciones fallaron, a
saber, en la creación de un entorno que permita la manufactura de productos de alta calidad.
Gran parte del éxito de los japoneses se atribuye al uso de métodos estadísticos y del
pensamiento estadístico entre el personal gerencial. [1]
El uso de métodos estadísticos en la manufactura, el desarrollo de productos alimenticios, el
software para computadoras, las fuentes de energía, los productos farmacéuticos y muchas
otras áreas implican el acopio de información o datos científicos. Por su puesto que la
obtención de datos no es algo nuevo, ya que se ha realizado por más de mil años. Los datos
se han recabado, resumido, reportado y almacenado para su examen cuidadoso. [1]
La recopilación y el análisis de datos son fundamentales en la ciencia e ingeniería. Al analizar
los datos recopilados en experimentos, los científicos descubren los principios que
gobiernan el mundo físico y los ingenieros aprenden cómo diseñar nuevos productos y
procesos importantes. Una dificultad muy importante que se presenta con los datos
científicos es que éstos se encuentran sujetos a variaciones aleatorias o incertidumbre. Es
decir, cuando se repiten las mediciones científicas cada vez salen un poco diferentes. Lo
anterior plantea un problema: ¿Cómo se pueden obtener conclusiones de los resultados de
un experimento cuando éstos pueden ser diferentes? Para analizar esta pregunta, es esencial
contar con cierto conocimiento estadístico. La estadística se dedica a la recopilación, el
análisis y la interpretación de datos con incertidumbre. Los métodos de la estadística
permiten que los científicos e ingenieros diseñen experimentos válidos y obtengan
conclusiones confiables a partir de datos obtenidos. [3]
El vocablo statistik proviene de la palabra italiana statista (que significa “estadista”). Fue
utilizada por primera vez por Gottfried Achenwall (1719-1772), un profesor de Marlborough
y de Göttingen. El Dr. E. A. W. Zimmerman introdujo el término statistics (estadística) a
Inglaterra. Su uso fue popularizado por sir John Sinclair en su obra Statistical Account of
Scotland 1791-1799 (“Informe estadístico sobre Escocia 1791-1799”). Sin embargo, mucho
antes del siglo XVIII, la gente ya utilizaba y registraba datos. [2]
La historia del desarrollo de la teoría estadística y su práctica es larga; Mucha gente ha
contribuido al estudio de la misma con refinamientos e innovaciones que, en conjunto,
constituyen la base teórica. Estas técnicas son tan diversas que los estadísticos, por lo
general, las dividen en dos grandes categorías: estadística descriptiva y estadística
inferencial. [2]
Recopilado por: Lic. Ana Gabriela Moreno Ulloa.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
Estadística Descriptiva
1.1. Recopilación y presentación de datos.
1.2. Tablas de frecuencia.
1.3. Gráficos: Diagrama de tallo y hojas, histograma, diagrama de
barra, ojiva, diagrama de pastel.
La mayor parte de la información estadística en periódicos, revistas, informes de empresas
y otras publicaciones consta de datos que se resumen y presentan en una forma fácil de leer
y de entender. A estos resúmenes de datos, que pueden ser tabulares, gráficos o numéricos
se les conoce como estadística descriptiva. [6]
Al proceso de realizar un estudio para recolectar datos de toda una población se le llama
censo. Al proceso de efectuar un estudio para recolectar datos de una muestra se le llama
encuesta muestral. Una de las principales contribuciones de la estadística es emplear datos
de una muestra para hacer estimaciones y probar hipótesis acerca de las características de
una población mediante un proceso al que se le conoce como inferencia estadística. [6] Esta
última se desarrollará más adelante en el curso.
Recopilación y presentación de datos.
La estadística es el arte y la ciencia de recolectar, analizar, presentar e interpretar datos. Casi
todos los estudiantes de áreas relacionadas con los negocios o la economía necesitan tomar
un curso de estadística. [6]
Los datos consisten en hechos/informaciones y cifras que se recolectan y analizan. Las
cuatro escalas de medición que se usan para obtener datos sobre una determinada variable
son nominal, ordinal, de intervalo y de razón. La escala de medición para una variable es
nominal cuando los datos son etiquetas o nombres que se usan para identificar un atributo
de un elemento. La escala es ordinal si los datos presentan las propiedades de los datos
nominales y tiene sentido hablar del orden o jerarquía de los datos. La escala es de intervalo
si los datos presentan las propiedades de los datos ordinales y los intervalos entre valores
se expresan en términos de una unidad fija de medición. Por último, la escala de medición es
de razón si los datos presentan las propiedades de los datos de intervalo y tiene sentido
hablar de la razón entre dos valores. [6]
Para los propósitos del análisis estadístico, los datos son clasificables en cuantitativos y
cualitativos. Los datos cualitativos emplean etiquetas o nombres para identificar un atributo
en cada elemento. Los datos cualitativos emplean las escalas de medición nominal u ordinal
Recopilado por: Lic. Ana Gabriela Moreno Ulloa.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
y pueden ser no numéricos o numéricos. Los datos cuantitativos son valores numéricos que
indican cuánto o cuántos. Los datos cuantitativos emplean las escalas de medición de
intervalo o de razón. Las operaciones aritméticas usuales sólo tienen sentido si los datos son
cuantitativos. Por tanto, los cálculos estadísticos usados para datos cuantitativos no siempre
son apropiados para datos cualitativos. [6]
Ejemplos:
Datos cuantitativos: edad, peso, estatura, etc.
Datos Cualitativos: Color de piel, color de ojos, sexo, etc.
Muestreo:
Como se ha mencionado, los métodos estadísticos están basados en la idea de analizar una
muestra tomada de una población. Para trabajar con esta idea, la muestra se debe elegir de
manera adecuada. Por ejemplo, digamos que se quiere conocer la estatura de los estudiantes
de la Escuela, al considerar una muestra de 100 estudiantes. ¿Cómo se deben elegir los 100
estudiantes que se medirían? Algunos métodos son malos. Por ejemplo, elegir a los
estudiantes de las listas del fútbol americano y de los equipos de basquetbol daría como
resultado una muestra que indudablemente no representaría la distribución de estatura de
la población de estudiantes. Usted podría pensar que sería razonable usar alguna muestra
convenientemente obtenida; por ejemplo, todos los estudiantes que viven en cierta área o
todos aquellos que se inscribieron en el curso de estadística para la ingeniería. Después de
todo, no hay razón para pensar que la estatura de estos estudiantes debiera ser diferente de
la estatura, en general, de los estudiantes. Sin embargo, muestras así no son ideales, porque
pueden volverse engañosas en formas no previstas. Los mejores métodos del muestreo
implican el muestreo aleatorio. Hay muchos métodos diferentes del muestreo aleatorio, el
básico es el muestreo aleatorio simple. [3]
Ejemplo:
Para entender la naturaleza de una muestra aleatoria simple, piense en una lotería. Imagine
que se han vendido diez mil billetes y que se eligen cinco ganadores.
¿Cuál es la manera más justa de elegir a los ganadores?
Es colocar todos los boletos en un recipiente, mezclarlos y extraer cinco de ellos uno tras
otro. Los boletos premiados constituyen una muestra aleatoria simple de la población de
diez mil billetes de la lotería. Cada boleto es igualmente probable de ser uno de los cinco
boletos extraídos. Es importante indicar que cada conjunto de cinco boletos que se puede
formar del total tiene la misma probabilidad de ser el grupo que se extrae. Esta idea
constituye la base de la definición de una muestra aleatoria simple. [3]
Recopilado por: Lic. Ana Gabriela Moreno Ulloa.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
[3]
Ejemplo:
Un geólogo pesa una roca varias veces en una balanza analítica. Cada vez, la balanza da una
lectura ligeramente diferente. ¿Bajo qué condiciones se pueden considerar estas lecturas
como una muestra aleatoria simple? ¿Cuál es la población?
Solución: Si las características físicas de la balanza permanecen iguales cada vez que se pesa,
se puede considerar que las mediciones se hacen bajo condiciones idénticas, entonces las
lecturas se pueden considerar como una muestra aleatoria simple. La población es
conceptual. Consta de todas las lecturas que la balanza en principio podría producir.
Una población es un conjunto de todos los elementos que se está estudiando, acerca de los
cuales se intentan sacar conclusiones. Se debe definir esa población de modo que quede claro
cuándo cierto elemento pertenece o no a la población. Para un estudio de mercado la
población puede estar constituida por todas las mujeres residentes dentro de un radio de 25
kilómetros con centro en la ciudad, que tengan un ingreso familiar anual entre $20,000 y
$45,000 y hayan cursado por lo menos 11 años de educación formal. Una mujer que viva en
el centro, con ingresos familiares de $25,000 y estudios universitarios completos podría ser
parte de esa población, mientras que una mujer residente en otra ciudad o que tenga
ingresos familiares de $7,000 o con cinco años de estudios profesionales, no se consideraría
miembro de la población.
Una muestra es una colección de algunos elementos de la población, no de todos. La
población de la investigación de mercado son todas las mujeres que cumplen con los
requisitos anteriores. Cualquier grupo de mujeres que cumpla con tales requisitos puede
constituir una muestra, siempre y cuando el grupo sea una fracción de la población completa.
Una porción grande de relleno de frambuesas con sólo algunas migajas de corteza es una
muestra de tarta, pero no es una muestra representativa debido a que las proporciones de
los ingredientes no son las mismas en la muestra que en el todo.
Una muestra representativa contiene las características relevantes de la población en las
mismas proporciones en que están incluidas en tal población. Si la población de mujeres del
ejemplo es un tercio de afroamericanas, entonces una muestra representativa en términos
de raza tendrá también un tercio de afroamericanas.
Recopilado por: Lic. Ana Gabriela Moreno Ulloa.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
Tablas de frecuencia.
Los datos pueden organizarse de muchas maneras. Se puede, simplemente recolectar y
mantenerlos en orden. O, si las observaciones están hechas con números, se puede hacer una
lista de los datos puntuales de menor a mayor según su valor numérico. Pero si los datos
consisten en trabajadores especializados (como carpinteros, albañiles o soldadores) de una
construcción, o en los distintos tipos de automóviles que ensamblan todos los fabricantes, o
en los diferentes colores de suéteres fabricados por una empresa dada, se debe organizar de
manera distinta. Se necesitará presentar los datos puntuales en orden alfabético o mediante
algún principio de organización. Una forma común de organizar los datos consiste en
dividirlos en categorías o clases parecidas y luego contar el número de observaciones que
quedan dentro de cada categoría. Este método produce una distribución de frecuencias, que
se estudiará más adelante. Organizar los datos tiene como fin permitir ver rápidamente
algunas de las características de los datos recogidos. Se busca cosas como el alcance (los
valores mayor y menor), patrones evidentes, alrededor de qué valores tienden a agruparse
los datos, qué valores aparecen con más frecuencia, etc. Cuanta más información de este tipo
se puede obtener de una muestra, mejor se entenderá la población de la cual proviene, y
mejor será la toma de decisiones. [5]
¿Qué es una tabla de frecuencia?
Una tabla de frecuencia muestra de forma ordenada un conjunto de datos estadísticos y a
cada uno de ellos le asigna una frecuencia, que en pocas palabras, son las veces que se repite
un numero o un dato.
Tipos de frecuencias:
Frecuencia absoluta: son el numero de veces que se repite un numero en un conjunto de
datos.
Frecuencia absoluta acumulada: es la suma de las frecuencias absolutas.
Frecuencia relativa: corresponde a las veces que se repite un numero en un conjunto de
datos respecto al total, pero se expresa en porcentaje (%).
Frecuencia relativa acumulada: es la suma de las frecuencias relativas.
Pasos para construir una tabla de frecuencia:
Paso 1: reunir los datos.
Paso 2: crea una tabla. En la primera columna, ubica los datos de menor a mayor. En la
segunda columna escribe la cantidad de veces que se repite cada nota y llama a estos datos
de frecuencia absoluta (fa). Hasta aquí se tiene una tabla de frecuencias sencillas.
Recopilado por: Lic. Ana Gabriela Moreno Ulloa.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
Para una tabla de frecuencia absoluta acumulada debes de seguir a los pasos siguientes:
Paso 3: Suma los valores en diagonal (la maestra te muestra como en la pizarra, pon
atención.)
Paso 4: sigue sumando los números en diagonal hasta completar la columna, para saber si
los datos son correctos la ultima suma debe de dar igual al número de datos recolectados.
Copia el ejemplo de la pizarra.
Pasos para construir una tabla de frecuencia relativa y la frecuencia relativa absoluta:
La frecuencia relativa se expresa en porcentajes. A partir de los datos obtenidos y usando la
tabla anterior, se debe agregar otra columna la cual se llamará frecuencia relativa (Fr).
Paso 5: toma cada dato de la frecuencia absoluta y divídelo entre el número total de datos.
Realiza la división hasta obtener todos los datos. Al final la suma debe darte 1. Si la suma te
da 0.98 o un numero similar no es para preocuparse ya que se puede aproximar a 1.
Paso 6: para la frecuencia relativa acumulada se deben de sumar los datos en diagonal, como
se hizo en el paso 4. El primer número siempre va a ser igual al primer dato de la frecuencia
relativa. Por último, suma los números de la columna hasta llegar al ultimo valor que debe
de ser 1.
Paso 7: agrega otra columna y toma cada valor de la columna frecuencia relativa y
multiplícala por 100.
Paso 8: agrega otra columna y realiza el paso 3 pero ahora con la frecuencia relativa en
porcentaje. Esta columna se llamarla frecuencia relativa acumulada (Fa).
Copia el ejemplo de la pizarra.
Recopilado por: Lic. Ana Gabriela Moreno Ulloa.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
Bibliografía.
[1] - Mayers, Walpole. (1999). Probabilidad y Estadística para ingenieros. México. Sexta
edición. Editorial Prentice Hall.
[2]- Richard I. Levin. (2004). Estadística para administración y economía. Séptima edición.
[3]- William Navidi. (2006). Estadística para ingenieros y científicos. primera edición en
español por McGRAW-HILL/INTERAMERICANA EDITORES, S.A. DE C.V.
[4]- Montgomery, Douglas C. y Runger, Georg C. (1996). Probabilidad y Estadística aplicadas
a la ingeniería. México. Primera edición. Editorial, McGraw Hill.
[5] - Scheaffer, Richard L. y McClave, James T. (1993). Probabilidad y Estadística para
Ingeniería. México. Editorial Iberoamérica
[6]- Anderson Sweeney y Williams. Estadística para administración y economía.
Recopilado por: Lic. Ana Gabriela Moreno Ulloa.