Tema 1. Introducción A La Estadística
Tema 1. Introducción A La Estadística
ESTADÍSTICA
EJEMPLO 1.1 Para determinar la opinión del público acerca de la continuación de cierto programa
gubernamental, un entrevistador pregunta “¿Piensa que este programa derrochador se debería detener?”.
Explique por qué esta pregunta quizá no obtendrá la información deseada.
2
EJEMPLO 1.2 Para estudiar la reacción de los consumidores en relación con un nuevo producto alimenticio, se
realiza una encuesta casa por casa, todos los días durante la mañana, sin repetir la visita en caso de que nadie se
encuentre en casa. Explique por qué esto puede generar información equivocada.
Los procedimientos y análisis que aparecen en estadística caen en dos categorías generales, descriptiva e
inferencial, dependiendo del propósito del estudio.
ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva comprende aquellos métodos usados para organizar y describir la información
recabada. La estadística descriptiva es el proceso de recolectar, agrupar y presentar datos de una manera tal que
describa fácil y rápidamente dichos datos. Esperamos saber cómo son las cosas mediante la estadística
descriptiva.
La estadística descriptiva comprende las técnicas que se emplean para resumir y describir datos
numéricos. Son sencillas desde el punto de vista matemático y su análisis se limita a los datos coleccionados sin
inferir en un grupo mayor. El estudio de los datos se realiza con representaciones gráficas, tablas, medidas de
posición y dispersión.
ESTADÍSTICA INFERENCIAL
El trabajo de un investigador no ha llegado a su fin cuando ha concluido con la función descriptiva. Por el
contrario, está frecuentemente más cerca del principio, que del fin de su tarea. La razón de esta afirmación es
obvia cuando consideramos que el propósito de su investigación es a menudo explorar hipótesis de naturaleza
general, más que simplemente comparar unas cuantas muestras.
De allí que la estadística inferencial comprende aquellos métodos y técnicas usados para hacer
generalizaciones, predicciones o estimaciones sobre poblaciones a partir de una muestra.
El problema crucial de la estadística inferencial es llegar a proposiciones acerca de la población a partir de
la observación efectuada en muestras bajo condiciones de incertidumbre. Ésta comprende las técnicas que
aplicadas en una muestra sometida a observación, permiten la toman de decisiones sobre una población o
proceso estadístico. En otras palabras, es el proceso de hacer predicciones acerca de un todo basado en la
información de una muestra.
La habilidad para hacer generalizaciones sobre la población a partir de una muestra es un aspecto
importante en estadística. Las decisiones e inferencias se basan en información limitada e incompleta; los
3
métodos de la estadística inferencial y el conocimiento obtenido al usarlos, nos permiten utilizar información
disponible limitada, para entender y tratar con las incertidumbres de este mundo cambiante y azaroso.
La confiabilidad de una inferencia es un aspecto fundamental de la estadística inferencial. Una inferencia
es confiable si se puede depender de ella con una cierta seguridad, ya que no puede describirse con exactitud una
característica de una población si la inferencia no es confiable. La teoría de la probabilidad debe usarse al
determinar la confiabilidad de una inferencia.
EJEMPLO 1.4 Suponga que 1.000 autos son de fabricación reciente y que no se sabe cuántos tienen defectos en
la dirección. Para estimar el porcentaje de autos con sistema direccional defectuoso en esta población,
inspeccionaremos una muestra de 10 unidades. Si se encuentra que dos de ellas tienen sistema direccional
defectuoso, podremos inferir usando la inducción que 20%, es decir, 200 de los 1.000 automóviles, tienen fallas en
el sistema direccional; la proporción de sistemas direccionales defectuosos en la muestra es un ejemplo de un
estadístico; su valor es 0,20. El porcentaje de automóviles, en esta población, que tienen el sistema direccional
defectuoso es un ejemplo de un parámetro.
EJEMPLO 1.5 Las situaciones siguientes, que son paralelas a las situaciones del ejemplo 1.3, requieren
estadística inferencial.
1. Un jugador de boliche quiere estimar la oportunidad que tiene de ganar un torneo próximo con base en su
promedio de la temporada actual y en los promedios de sus futuros contrincantes.
2. Con base en una encuesta de opinión, a un político le gustaría calcular la oportunidad de reelegirse en las
próximas elecciones.
3. Con apoyo en la variación de sus calificaciones de exámenes en la primera cuarta parte del curso de
cálculo. María desea predecir la que tendrá en las calificaciones de exámenes de la segunda cuarta parte
del curso de cálculo.
4. El señor Morales desea calcular el monto semanal promedio que gastará en comestibles el año próximo,
tomando como base sus facturas de comestibles del último año.
EL LENGUAJE DE LA ESTADÍSTICA
Como todas las ciencias, la estadística tiene su lenguaje propio. Comencemos analizando una diferencia
básica en estadística, como lo es la que existe entre una población y una muestra.
Una población es el total de la información o de los objetos de interés para un estadístico en una
investigación particular. Es el conjunto completo de individuos, objetos, o medidas que poseen alguna
característica común observable. Así, todos los ciudadanos de un país en edad de votar constituyen una población.
Una muestra es cualquier subconjunto de una población. La mayoría de los estudios estadísticos, se realizan
no sobre la población, sino sobre un subconjunto o una parte de ella, llamado muestra, partiendo del
supuesto de que este subconjunto presenta el mismo comportamiento y características que la población. En
general el tamaño de la muestra es mucho menor al tamaño de la población.
EJEMPLO 1.6 Un fabricante de calentadores quiere determinar si los consumidores están satisfechos con la
hechura de sus aparatos; con ese propósito localiza a 5.000 de sus 200.000 clientes y les pregunta: “¿Está
satisfecho con la hechura del calentador que compró?”. Identificar la población y la muestra.
4
Variable aleatoria: Si los valores numéricos que toma una variable provienen de factores fortuitos y si un
determinado valor no se puede predecir exactamente con anticipación, esa variable se denomina variable
aleatoria.
Variable Categórica o Cualitativa: las variables categóricas son aquellas que están definidas por la clase o
categorías que la componen. Las categorías pueden ser naturales o nominales, como al definir la variable sexo,
lugar de residencia, estado civil, una marca, o arbitrariamente como la clasificación de alturas de plantas bajas,
medianas y altas. Las variables categóricas también reciben el nombre de variables cualitativas. Por ejemplo una
persona puede o no estar empleada, una planta puede o no tener flores, etc.
Ordinales: son cualidades que representan un orden y jerarquía. Ej. Nivel educacional, días de la semana,
calidad de la atención, nivel socioeconómico.
Variable Numérica o Cuantitativa: las variables numéricas son aquellas que, como su nombre lo indica, se
expresan por un número. Se debe distinguir aquí entre un número que se obtiene simplemente por conteo y un
número que resulta de efectuar mediciones.
Variable Discreta: las variables que surgen como conteos o por asignación de ciertos códigos numéricos a
las categorías de las variables cualitativas se denominan variables discretas. Las variables discretas solo toman un
número finito de valores, generalmente valores enteros. Algunos ejemplos de variables discretas son: cierta
enfermedad por establecimiento rural, espigas por plantas, alumnos residentes por colegio, personas por
vivienda, personas asociadas a una mutual, socios de una cooperativa, etc.
Variable Continua: las variables que surgen de mediciones efectuadas sobre cada unidad experimental
(personas, animales, etc.) se denominan variables continuas. Algunos ejemplos: supongamos que un odontólogo
plantea como objetivo determinar la eficiencia de un programa de salud. Le interesa particularmente estudiar, en
una determinada zona escolar, la relación entre la edad de los niños y la cantidad de piezas dentarias obturadas.
La edad de los niños puede ser expresada en años, meses, días, etc., por lo cual es un ejemplo típico de variable
continua. En cambio, la variable cantidad de piezas obturadas surge de realizar un conteo en la boca de cada uno
de los niños y sólo puede tomar valores enteros. Esta es luego, una variable discreta.
EJEMPLO 1.7 Imaginemos una firma industrial comprometida en la producción de aceros especiales para la
industria espacial. Entre sus productos hay tornillos para los cuales existen estrechos márgenes de tolerancia con
respecto a la anchura. Como parte de los procedimientos del control de calidad, se selecciona un número de
tornillos de la producción diaria y se mide cuidadosamente. Estos tornillos constituyen la muestra. La variable es
el ancho del tornillo. Los datos están constituidos por las medidas de todos los tornillos que conforman la
muestra.
Cuando los datos son manipulados de acuerdo con ciertas reglas pueden obtenerse algunas características
representativas de la totalidad, tales como el ancho “promedio” de los tornillos; con lo cual podemos decir que se
trata de una variable cuantitativa continua, y el valor numérico resultante constituye un estadístico. La población
en la cual estamos interesados, es la producción completa diaria de la fábrica. El ancho “promedio” de todos los
tornillos producidos en un día constituye un parámetro. Nótese que es bien improbable que el parámetro sea
5
conocido siempre, ya que para lograrlo se requerirá la medición de cada tornillo producido durante el día. Esto
resultará antieconómico, entre otras cosas, por lo cual es raro que se emprenda un estudio exhaustivo de las
poblaciones. En consecuencia los parámetros poblacionales son poco conocidos; pero, como veremos, son
estimados frecuentemente a partir de muestras estadísticas.
APLICACIONES DE LA ESTADÍSTICA
El término “statistical literacy” ha ido surgiendo de forma espontánea entre los estadísticos y educadores
estadísticos, para resaltar el hecho de que la estadística se considera hoy día como parte de la herencia cultural
necesaria para el ciudadano educado. Watson (2006) propone la siguiente jerarquía de niveles de cultura
estadística útil para evaluar la comprensión de los estudiantes:
El desarrollo del conocimiento básico de los conceptos estadísticos y probabilísticos.
La comprensión de los razonamientos y argumentos estadísticos cuando se presentan dentro de un
contexto más amplio de algún informe en los medios de comunicación o en el trabajo.
Una actitud crítica que se asume al cuestionar argumentos que estén basados en evidencia estadística.
La estadística puede presentarse en diferentes niveles de dificultad matemática y puede estar dirigida
hacia aplicaciones en distintos campos de la investigación. De acuerdo con esto, se han escrito muchos libros de
texto sobre estadística empresarial, estadística educativa, estadística médica, estadística psicológica,..., e inclusive
sobre estadística para historiadores.
Virtualmente cada área de la investigación científica puede beneficiarse del análisis estadístico. Para quien
formula las políticas económicas y para quien asesora al presidente y a otros funcionarios públicos sobre
procedimientos económicos apropiados, la estadística ha demostrado ser una herramienta valiosa. Las decisiones
sobre las tasas tributarias, los programas sociales, el gasto de defensa y muchos otros asuntos pueden hacerse de
manera inteligente tan sólo con la ayuda del análisis estadístico. Los hombres y mujeres de negocios, en su eterna
búsqueda de la rentabilidad, consideran que la estadística es esencial en el proceso de toma de decisiones. Los
esfuerzos en control de calidad, minimización de costos, combinación de productos e inventarios, y una gran
cantidad de otros asuntos empresariales, pueden manejarse efectivamente a través del uso de procedimientos
estadísticos comprobados.
Para quienes están en el área de la investigación de mercados, la estadística es de gran ayuda en el
momento de determinar qué tan probable es que un producto nuevo sea exitoso. La estadística también es muy
útil para evaluar las oportunidades de inversión por parte de asesores financieros. Los contadores, los jefes de
personal, y los fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del análisis estadístico.
Incluso un investigador en el campo de la medicina, interesado en la efectividad de un nuevo medicamento,
considera la estadística una aliada imprescindible.
6
Así pues, la teoría general de la estadística es aplicable a cualquier campo científico en el cual se hacen
observaciones. El estudio y aplicación de los métodos estadísticos son necesarios en todos los campos del
conocimiento, sean éstos de nivel técnico o científico.
NÚMEROS.
¿Qué es un número? Para algunas personas es un símbolo que denota cantidad de cosas, con el cual se
pude sumar, restar, dividir y multiplicar. Pero en verdad es eso y mucho más. Los números se utilizan de diversas
formas con muy variados propósitos. Para designar (número nominal). Para representar la posición en una serie
(número ordinal). Para representar una cantidad (número cardinal).
Identificar el tipo de número que se utiliza es muy importante cuando se tiene que realizar análisis
estadísticos. Por lo general estos números constituyen la materia prima o datos que se utilizan en estos análisis y
resultan de la operación de medir o de contar. Por ejemplo, si usted mide la estatura de una persona se supone
que usted utiliza alguna unidad de medida sea metro o pies y así obtiene la característica: Talla. Además puede
estar interesado en conocer el total de hermanos que esa misma persona tiene y en este caso lo que se hace es
contar el número de hermanos y anotar el número correspondiente (número cardinal). Si nos interesa el lugar
que ocupa entre los hermanos (número ordinal).
Pero hay situaciones en las cuales, la dimensión cuantitativa de la característica que se observa no es
evidente. Por ejemplo, si usted tiene un conjunto de mujeres que constituyen una asociación y le interesa conocer
la marca de perfume preferido por ellas. ¿Puede en efecto medir el tipo de perfume? Esta es una cualidad y no
podemos medirla de la forma como lo hicimos con la estatura o el número de hermanos; se adopta un
procedimiento un poco diferente. Primero se definen las categorías que constituidas por los diferentes tipos de
perfume y después se determina por cada mujer, cuál es la categoría preferida. Con el fin de facilitar las cosas se
puede identificar cada categoría con un símbolo, letra o número. Y de esa manera se puede contar cuántas
mujeres se identifican con cada una de las categorías. Si se utilizan números, es importante destacar que esos
números cumplen la función de sustituir o representar una palabra y por consiguiente no deben ser utilizados para
ejecutar operaciones aritméticas como sí lo haríamos con los números que representan la estatura o el número de
hermanos, según los primeros dos casos ilustrados.
DATOS
Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensión
arterial sistólica, etcétera). Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es
medir, es decir, asignar valores a las variables incluidas en el estudio.
MEDICIÓN
Es la observación de un fenómeno o propiedad, y la asignación de un número o categoría, como forma de
representar ese fenómeno. Suele usarse el término observar como sinónimo de medir. Por ejemplo, pesar un
objeto es observar una propiedad, su peso, y asignarle un número, el número de kilogramos que pesa. Determinar
el estado civil de una persona también es efectuar una medición, que consiste en clasificar esa propiedad en una
de varias categorías: soltera, casada, etc.
MEDIDA
Es el número o categoría que se asigna al medir un fenómeno. Un sinónimo de medida es observación.
LAS ESCALAS
Cuando medimos, asignamos números a objetos o sucesos de acuerdo con un conjunto de reglas
predeterminadas. Esas reglas predeterminadas hacen que los números que se utilizan puedan representar
7
diferentes niveles de información numérica. Según el tipo de número que tenemos así será el tipo de operaciones
aritméticas que se pueden efectuar legítimamente y eso es lo que determina el tipo de escala que tenemos que
utilizar.
Una de las formas más comunes de clasificar las escalas es en Categóricas (ordinales y nominales) y
Numéricas (de razón y de intervalo).
Las escalas categóricas sólo asignan una categoría, o clasifican el fenómeno o propiedad que se mide. Las
Ordinales se distinguen de las nominales, en el hecho que sus valores tienen un orden natural.
Las escalas numéricas asignan números. Si la escala tiene un cero absoluto, la escala es de razón, si el cero
es arbitrario, la escala es de intervalo.
La escala nominal consiste en un conjunto de números que se utilizan para representar diferentes
categorías, clases o palabras. Los números en dicha escala no tienen propiedades cuantitativas y solamente
identifican, son datos que pueden denominarse datos de frecuencia, datos enumerativos, datos de atributos o
datos de categoría. Las únicas relaciones matemáticas adecuadas a las escalas nominales son las de equivalencia
(=) o no equivalencia (≠). Es decir que esos números en la escala, no representan un orden o dirección. Es decir,
ésta es una forma de observar o medir en la que los datos se ajustan por categorías que no mantienen una
relación de orden entre sí (color de los ojos, sexo, profesión, número de camiseta en un equipo de fútbol, número
de cédula de identidad, etcétera).
Las escalas ordinales representan un nivel de medición inmediatamente superior al de la escala nominal.
En este caso, las clases o categorías no sólo son diferentes entre sí sino que también tienen una cierta relación
entre ellas. Unas son mayores que o menores que otras (X < Z) o (Z > X), se trata de declaraciones tales como más
que, mayor que, antes de, después de. Los números no representan una cantidad pero si un orden, es decir una
posición en una serie ordenada sin determinar cuánta diferencia existe entre las posiciones sucesivas en la escala.
Entonces hablamos del primero, el segundo, el tercero, el cuarto, etc. La Clasificación de películas por una
comisión especializada, etapa de desarrollo de un ser vivo, Madurez de una fruta al momento de comprarla. Etc.
Las escalas de intervalos y de cocientes o razones representan los niveles más altos de mediciones
científicas y utilizan números cardinales. Una característica básica de éstas es que las diferencias iguales entre
puntos de cualquier parte de la escala son iguales entre sí. La diferencia entre el kilómetro 5 y el 7 es igual a la
diferencia entre el kilómetro 101 y 103. Con estos números se pueden realizar todas las operaciones aritméticas.
Estas escalas se distinguen una de la otra por la posición que se le asigna al cero.
En la escala de intervalos el cero se determina de manera arbitraria y no representa la ausencia completa
del atributo que se mide. Por ejemplo, el año cero no significa que no existe tiempo antes de ese año, tampoco
cero grados centígrados no significa que no hay temperatura. Por ejemplo: Sobrepeso respecto de un patrón de
comparación. Nivel de aceite en el motor de un automóvil medido con una vara graduada. Etc.
En cambio en el caso de las escalas de razón el cero representa la ausencia del atributo o característica
medida, cuando decimos que la longitud es de cero, lo que significa es que no hay longitud, si el saldo de la cuenta
bancaria es cero significa que no hay capital, etc.
Una regla importante para los investigadores consiste en procurar que al hacer una medición, esta se
realice en el nivel de medición más elevado posible. Primero porque da lugar a una mayor variedad de
posibilidades al momento de realizar los análisis estadísticos y en segundo lugar porque, de ser necesario, una
medición realizada en un nivel superior puede transformarse en una medición a un nivel inferior. En cambio, no es
posible hacer la misma operación en la dirección contraria.
Cuando nos referimos a las variables, mencionamos que estas pueden ser continuas o discretas, de la
misma manera, las escalas pueden ser continuas o discretas. Son discretas porque los valores que puede asumir
en un intervalo no son ilimitados, puede recordarse el caso de medir el número de hijos, todos los hijos son
8
iguales y cada uno representa una unidad de conteo por lo que la escala no puede tener valores intermedios como
0.5 hijos, es decir que la medida es exacta.
En cambio en las escalas continuas, los valores que pueden existir en un intervalo en particular son
infinitos. Por ejemplo podemos decir que una persona pesa 56. 876 kilogramos pero igual puede ser más exacto y
decir que pesa 56.8765493 kilogramos. Es decir entre 56.8 y 56.9 kilogramos existe un número infinito de valores
que pueden hacer mucho más exacta la medición. Por lo que la medición en una escala continua es una
aproximación. Lo que la caracteriza es una unidad de medida que permanece idéntica a lo largo de toda la escala.
Por ejemplo podemos utilizar una de los siguientes: el metro, el centímetro, el milímetro, etc. Sigue siendo una
aproximación siendo que si tuviésemos un instrumento más riguroso se podría lograr una medida más exacta.
Las escalas categóricas sólo asignan una categoría, o clasifican el fenómeno o propiedad que se mide. Las
Ordinales se distinguen de las nominales, en el hecho que sus valores tienen un orden natural. Las escalas
numéricas asignan números. Si la escala tiene un cero absoluto, la escala es de razón, si el cero es arbitrario, la
escala es de intervalo.
Por ejemplo, al determinar el color de ojos de una persona se está midiendo en una escala categórica
nominal, su fecha de nacimiento se mide en escala categórica ordinal. Su temperatura corporal, en grados
centígrados, se mide en una escala numérica de intervalos. Su peso, en escala numérica de razón. En esta escala
tiene sentido decir que una persona tiene el doble de peso que la otra.
REDONDEO
Esto nos lleva a otro asunto de importancia práctica y tiene que ver con el redondeo de números. Pues si
tengo una medida de peso como 56.7890 kilogramos y la quiero comparar con otra que es 45.3 kilogramos, surge
la pregunta respecto a la exactitud de la medida. ¿Debo suponer que 45.3 es exacta es decir que representa
45.300000000 hasta el infinito? Y ¿cómo debo entender el valor 56.7890, será que corresponde a 56.7890000000
hasta el infinito? Una solución práctica al dilema es proceder al redondeo de los números entendiendo que en
escalas continuas, siempre se tiene una aproximación en la medición.
Otro ejemplo que muestra la utilidad del redondeo se observa al considerar el resultado de dividir 20
entre 3 que da como resultado 6.6666666666+. ¿Cuántos lugares decimales deben de utilizarse? Se sugiere que
sean hasta dos lugares más de los que había en los datos originales. Si son unidades enteras, se redondea hasta el
segundo decimal, si son datos que incluyen décimas se redondea hasta el tercer decimal, etc.
¿Cómo se determina el último número en la serie? Si el resto que aparece después de la última cifra a
utilizarse es mayor de 5 se aumentará hasta la cifra inmediatamente superior. Si el resto que aparece es menor de
5 se deja la cifra sin modificación 7.658 se convierte en 7.66 y 7.653 se convierte en 7.65. De igual forma 4.432 se
convierte en 4.43.
¿Qué sucede si el número que aparece inmediatamente después de la última cifra a utilizar es 5?
Si es 5 más un resto por muy pequeño que sea, se debe aumentar a la cifra inmediatamente superior. Si es
casi, pero no rigurosamente 5 la cifra permanece sin alteración. Pero si es exactamente 5 y no existe un resto, se
redondea la cifra al número par más próximo. Si es un número par no sufre alteración, si es impar se le suma uno
para convertirla en par.
7.655102 se convierte en 7.66 tiene un resto representado por .000102
7.664999 se convierte en 7.66 el tercer dígito no es rigurosamente 5.
8.635000 se convierte en 8.64 por ser 5 exacto se redondea al par más
próximo. 5.545000 se convierte en 5.54 pues el número es par.
EJEMPLO 1.8 En qué escala de medida están basadas las respuestas al siguiente cuestionario.
A. ¿Cuál es su ocupación?
9
B. ¿Cuál es su nombre?
C. ¿Cómo compara este curso con otros que ha tomado?
D. ¿Cuál es su estatura?
E. ¿Cuál es su peso?
1. De las siguientes afirmaciones ¿cuál se asemeja más a los conceptos: un parámetro, un dato, una inferencia a
partir de datos, un estadístico?
- Según estudios, se producen más accidentes en el centro de Caracas a 35 km/h que a 65 km/h.
- En una muestra de 250 empleados, se obtuvo un sueldo promedio de $150.000
- La tasa de nacimiento en el país aumentó en 5% con relación al mes precedente.
- Las edades son 85, 36, 57, 24
- Se sabe que el 55% de las personas en Chile son varones.
- Según datos de años anteriores se estima que la temperatura máxima de este año aumentará en un 5%.
2. De los siguientes enunciados ¿cuál probablemente usa la estadística descriptiva y cuál, la estadística inferencial?
- Un médico general estudia la relación entre el consumo de cigarrillo y las enfermedades del corazón.
- Un economista registra el crecimiento de la población en un área determinada.
- Se desea establecer el promedio de bateo de un equipo determinado.
- Un profesor de expresión oral emplea diferentes métodos con cada uno de sus 2 cursos. Al final del curso
compara las calificaciones con el fin de establecer cual método es más efectivo.
- Edad
- Clasificación de la edad en: niño, joven, adulto y adulto mayor.
4. De cada una de las siguientes situaciones responda las preguntas que se plantean:
- Un fabricante de medicamentos desea conocer la proporción de personas cuya hipertensión (presión alta)
puede ser controlada con un nuevo producto fabricado por la compañía. En un estudio a un grupo de 13.000
individuos hipertensos, se encontró que el 80% de ellos controló su presión con el nuevo medicamento.
- Según una encuesta realizada a 500 adultos mayores de la comunidad de Santiago de Chile, reveló que en
promedio realizan 6 visitas anuales al consultorio. En vista de los resultados el ministerio de salud deberá
aumentar los recursos en un 10%.
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) Identifique el parámetro de interés.
d) Identifique el estadístico y su valor.
e) ¿Se conoce el valor del parámetro?
Más ejercicios de Repaso de este tipo, ejercicios del capítulo 1. Libro Webster Allen. Estadística Aplicada a
los negocios y a la economía.
LA INVESTIGACIÓN ESTADÍSTICA
Una investigación se puede denominar “estadística” cuando las hipótesis son afirmaciones relativas a la
distribución de una o más variables aleatorias. En estas investigaciones pueden identificarse, entre otros, los
siguientes componentes:
• Un universo: un conjunto de entidades (personas, seres vivos, objetos inanimados) respecto de los
cuales se desea conocer alguna o algunas de sus características.
• Variables: características medibles que poseen todas las unidades del universo.
• Objeto de la investigación: no consiste en identificar las entidades del universo con ciertas
características, sino que se trata de resumir información acerca de la distribución de dichas características en la
población.
• Procedimiento de recolección: es posible conocer, mediante un procedimiento adecuado, el valor de la o
las variables de algunas o de todas las entidades del universo.
• Restricciones: en cuanto a los recursos disponibles (humanos, técnicos, financieros) y en cuanto a la
oportunidad en que deben darse a conocer los resultados de la investigación, lo que obliga a elegir, entre varias
estrategias alternativas, la que resulte más eficiente.
Las actividades que involucra una investigación estadística pueden clasificarse con arreglo a diversos criterios. Uno
de ellos se relaciona con el orden cronológico en que deben ser realizadas. En este sentido, puede hablarse de tres
grandes etapas o fases:
- Planificación: Objetivos de la investigación, Universo, unidad a investigar y unidad de observación,
Experiencias en investigaciones similares, Marco legal aplicable, Procedimientos de recolección, Métodos de
recolección, Instrumentos de captura, Calendario de operaciones, Presupuesto, Niveles de desagregación, Marco
de muestreo, Diseño muestral, Variables de relevamiento, Categorías de respuesta para las variables de
relevamiento, Plan de tabulados, elaboración del instrumento de captura, Tamaño de la muestra, Prueba piloto,
Evaluación de la prueba piloto, rediseño del instrumento de captura.
- Ejecución y procesamiento: Cartografía, Equipos de encuestadores y supervisores, Asignación de cargas
de trabajo y distribución del material, Manejo de los cuestionarios, Realización de las encuestas, Programación
para el ingreso de datos, Programación para la tabulación, Crítica y codificación, Ingreso de datos, Concentración
de la información
- Análisis y divulgación: Consistencia interna y de completitud, Comparación con otras fuentes, Análisis
estadístico, Tabulados finales, Informe final, Publicación y difusión de los resultados, Informe técnico.
Las actividades que se incluyen en estas fases siguen un orden temporal, en algunos casos, con actividades
que requieren para su iniciación la finalización previa de otras. En otros casos, en cambio, las actividades pueden ir
en paralelo o con un importante período de solapamiento. Algunas veces, el orden temporal de las actividades
está condicionado más por los recursos humanos disponibles que por la lógica de las previaturas. En estos casos se
vuelve clave la tarea de planificación para evitar una prolongación innecesaria de la investigación, y así ganar en
oportunidad en la presentación de los resultados.
La división en tres fases es totalmente convencional. En muchas investigaciones estadísticas las mismas
personas trabajan en todas o la mayor parte de las actividades, las cuales se solapan tanto como es posible para
ganar en oportunidad. La división en fases se realiza exclusivamente para facilitar la presentación de los conceptos
involucrados.
12
Cuadros Estadísticos
Un cuadro estadístico es el arreglo ordenado de los datos procesados para facilitar la lectura e
interpretación de los mismos. Representan la síntesis de los pasos de recopilación, elaboración y
análisis de los datos. Su buena presentación transmite la calidad de los procedimientos previos y
aclara el significado del material. Una presentación pobre, no sólo perjudica la claridad de la
información, sino que tiende a destruir el efecto del trabajo realizado. El cuadro estadístico se
estructura desde el punto de vista de la utilidad que preste al usuario común, es decir, que quien lo
diseña debe colocarse en el lugar del usuario de la información.
Gráficos Estadísticos
Una vez recolectados los datos, éstos pueden consolidarse y resumirse para mostrar la
siguiente información:
• ¿Qué valores de la variable han sido medidos?
• ¿Con qué frecuencia se presenta cada uno de los valores?
Para este fin, se puede construir una tabla estadística que se puede usar para mostrar los
datos gráficamente como una distribución de datos.
Un gráfico estadístico es una representación visual de una serie de datos estadísticos. Es una
herramienta muy eficaz, ya que un buen gráfico:
Capta la atención del lector.
Presenta la información de forma sencilla, clara y precisa.
No induce a error.
Facilita la comparación de datos y destaca las tendencias y las diferencias.
Ilustra el mensaje, tema o trama del texto al que acompaña.
El tipo de gráfica que se escoja depende del tipo de variable que se haya medido.
13
1. Líneas de división
horizontales: Sirven
como ayuda visual para
poder relacionar la
altura de las columnas o
de los Marcadores de un
gráfico de líneas, con
una escala de medida
(representada por el Eje
vertical con la etiqueta
nº 9). Se pueden activar
también unas líneas de
división verticales que
son especialmente útiles
en gráficos de línea
o de áreas, pues
estos, al contrario que
los de columnas, no
establecen una relación
visual clara con el Eje
horizontal (representado por la etiqueta nº 6).
2. Título del gráfico: Nombre o descripción que podemos darle al gráfico en general.
3. Marcadores: Son elementos visuales (círculos, cuadrados, etc.) que enfatizan la situación de un punto
de datos en un gráfico de línea. Se pueden desactivar y tener un formato distinto al de la línea.
4. Etiquetas de datos: Informan del valor numérico que está representando una serie determinada en un
punto concreto. Si se activan, hacen innecesarias las Líneas de división horizontales (ver etiqueta nº 1) y
el Eje vertical (ver etiqueta nº 9).
5. Leyenda: Cuando el gráfico representa varias Series de forma simultánea (ver etiqueta nº 8), tienen
como misión posibilitar la identificación y distinción entre ellas. Se puede activar, desactivar y cambiar
de posición.
6. Eje horizontal: Títulos dispuestos de forma horizontal que frecuentemente representan las
"categorías" en las que se distribuyen los datos o el tiempo a través del cual suceden.
8. Series: Elementos visuales que representan el valor de un punto de datos. Pueden adoptar
múltiples formas: columnas en 2D (así se le llaman cuando son verticales), barras en 2D (así se le llaman
cuando son horizontales), cilindros 3D, conos 3D, pirámides 3D, áreas, líneas, superficies, burbujas, etc.
14
9. Eje vertical: Títulos dispuestos de forma vertical a modo de escala, que sirven como referencia visual
para valorar las "categorías" o los valores que toma una variable a lo largo del tiempo.
10. Título del eje vertical: Informa de la naturaleza del Eje vertical.
La tabla estadística es una lista de las categorías siendo consideradas junto con una medida
de la frecuencia con que se presenta cada valor. Se puede medir “la frecuencia” en tres formas
diferentes:
Gráfico de Barras
Vertical: las distintas categorías están situadas en el eje horizontal y las barras de frecuencias
crecen verticalmente.
15
Horizontal: las categorías se sitúan en el eje vertical y las barras crecen horizontalmente.
Suelen usarse cuando hay muchas categorías o sus nombres son demasiado largos.
EJEMPLO 1.11
Una bolsa de dulces de cacahuate M&M’S contiene 21 dulces con los colores: Café, Verde, Café, Azul,
Rojo, Verde, Rojo, Café, Amarillo, Anaranjado, Verde, Azul, Café, Azul, Café, Azul, Anaranjado, Azul,
Café, Anaranjado, Amarillo. Represente los colores de caramelos de la bolsa en un gráfico de barras.
7
6
5
4
3
2
1
0
Café Verde Anaranjado Amarillo Rojo Azul
EJEMPLO 1.12
El número de estudiantes matriculados en tres especialidades de administración de empresas en una pequeña
universidad privada en dos años distintos, se presenta en la tabla siguiente: Año
Especialidad
Represente los datos en un gráfico de barra: 2000 2005
a. Agrupado Finanzas 160 250
b. Apilado Marketing 140 200
Contabilidad 100 150
a.
300
250
200
150 2000
2005
100
50
0
Finanzas Marketing Contabilidad
17
b.
700
600
500
400 Contabilidad
300 Marketing
200 Finanzas
100
0
2000 2005
Bidireccional:
Tiene orientación horizontal y contiene dos series de datos cuyas barras de frecuencias
crecen en sentidos opuestos. Las más comunes son las pirámides de población.
Casos Especiales:
Polígono de Frecuencias:
Pictograma:
Un pictograma es un gráfico
que representa mediante figuras o
símbolos las frecuencias de una
variable cualitativa o discreta. Al igual
que los gráficos de barras suelen
usarse para comparar magnitudes o
ver la evolución en el tiempo de una
categoría concreta.
Cartograma:
El círculo (o torta) representa la totalidad que se quiere observar (en el ejemplo, total de
viajeros hospedados en hoteles) y los segmentos (o trozos de la torta) también llamados sectores,
que parten del centro representan la proporción de cada categoría de la variable (en el ejemplo, tipo
de hotel) respecto del total. Suele expresarse en porcentajes.
19
Para realizar un gráfico de torta o pastel, debemos calcular la frecuencia relativa, el porcentaje y el ángulo te cada
categoría, donde:
EJEMPLO 1.13
El gerente de una universidad pidió una desagregación de los gastos de viaje de los profesores que asistían
a diversas reuniones profesionales. Se observó que el total de los gastos ascendió a 5400 dólares, de los cuales
1647 estaba representado por los costos de transporte, 1350 por los costos de alojamiento, 648 por los gastos de
alimentación, 1080 por los gastos de matrícula y el resto por costos varios. Represente en un gráfico de torta estos
gastos.
Frecuencia Frecuencia
Categoría Porcentaje Angulo
Absoluta Relativa
Transporte 1647 0,31 31 110
Alojamiento 1350 0,25 25 90
Alimentación 648 0,12 12 43
Matrícula 1080 0,20 20 72
Varios 675 0,13 13 45
5400
20
Varios
13%
Transporte
30%
Matrícula
20%
Alojamiento
25%
Alimentación
12%
Gráfico de Línea
EJEMPLO 1.13
La evolución de las lluvias durante el año 2017 se presenta en la siguiente tabla:
Meses Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
mm 42,6 17,8 82,2 107 115,4 38 86 129,4 32,2 166,2 65 55,4
180
160
140
Lluvia en mm
120
100
80
60
40
20
0
Histograma:
Se usa para representar las frecuencias de una variable cuantitativa continua. En uno de los
ejes se posicionan las clases de la variable continua (los intervalos o las marcas de clase que son los
puntos medios de cada intervalo) y en el otro eje las frecuencias. No existe separación entre las
barras.
Gráfico de Dispersión:
Un gráfico de dispersión muestra en un eje cartesiano la relación que existe entre dos
variables. Este gráfico nos informa del grado de correlación entre las dos variables, es decir, nos
muestra si el incremento o disminución de los valores de una de las variables, denominada variable
independiente y que se suele representar en el eje horizontal, altera de alguna manera los valores de
22
Ojiva:
Los ejemplos aplicados para los gráficos de variables cuantitativas: Histograma, Polígono de
Frecuencias para variables continuas, de dispersión y Ojivas, se realizarán en el tema donde se hace
uso de ellos de manera práctica.
Ejemplo 1.14:
Representa los datos de la siguiente tabla de frecuencias, que corresponden a los colores
preferidos de los niños del primer grado de una institución educativa, en un diagrama de barras.
Colores ROJO BLANCO NEGRO AMARILLO VERDE
Frecuencia (No. de Niños) 10 8 16 12 4
24
Para barras agrupadas, selecciona las categorías para que en el gráfico se presenten en el eje
horizontal una categoría y en la leyenda la otra.
Ejemplo 1.15: Realiza un recuento de los siguientes datos, que corresponden a los juguetes favoritos de
30 niños de preescolar y realiza un gráfico de barras y uno de sectores o de torta.
25
Pelota, máscara, pelota, máscara, bicicleta, máscara, bicicleta, bicicleta, máscara, videojuego,
máscara, máscara, videojuego, máscara, pelota, videojuego, pelota, videojuego, pelota, pelota,
videojuego, pelota, máscara, videojuego, videojuego, pelota, videojuego, bicicleta, videojuego,
bicicleta.
Ejemplo 1.16: La distribución del gasto en Bolívares por concepto de alimentación semanal de una
familia viene dada por los siguientes porcentajes: carne, 2800; charcutería y embutidos, 1400; pastas y
cereales, 800; verduras y hortalizas, 1000; frutas, 1200, y otros 500. Construye un diagrama de sectores
o de pastel.
Ejemplo 1.17: Los siguientes datos, resumen las aficiones deportivas de un grupo de 60 personas. Dibuja
un diagrama de sectores y de barras de la distribución. Fútbol 20, Baloncesto 15, Ciclismo 12, Natación
10, Otros 3.
Ejemplo 1.18: Se realizó una encuesta a un grupo de 28 jóvenes sobre el número de horas que dedican
diariamente a hacer deporte, y se obtuvieron los siguientes resultados: 3 4 2 0 1 2 2 1 0 1 1 2 0 4 3 1 4 3
2 0 0 2 3 2 2 1 2 1. Realiza el conteo correspondiente y representa la información en un gráfico de barras
(columna).
Ejemplo 1.19: La profesora de Lengua ha contabilizado el número de faltas de ortografía que han
cometido los alumnos de un grupo de 3er. grado, en un trabajo que le han entregado, y estos son los
resultados: 3, 4, 5, 1, 0, 2, 4, 3, 6, 3, 4, 5, 2, 6, 4, 3, 5, 4, 5, 2, 1, 0, 1, 1, 5, 6, 4.
a) Construye la tabla de frecuencias absolutas y relativas. b) ¿Qué porcentaje de alumnos cometieron 4
faltas? d) ¿Qué porcentaje de alumnos cometieron menos de 5 faltas? e) ¿Qué porcentaje de alumnos
cometieron 6 o menos faltas?
Ejemplo 1.20: Utilizando un diagrama de línea represente la deuda externa de América Latina cuyos
valores en millones de US$ son:
Año 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982
Deuda en
55,4 68,5 82,9 98,3 119,1 141,6 169,2 207,1 279,1 312,0
Millones de US$
Sueldos diario en US$ 25-50 51-75 76-100 101-125 126-150 151-175 176-200 201-225 226-250
Hombres 202 231 687 833 375 192 101 38 21
Mujeres 99 202 246 121 96 35 21 8 4