1.
Introducción a la recopilación de datos
Desde tiempos remotos han existido formas simples de estadística. En aquel
entonces se utilizaban representaciones gráficas y otros símbolos tallados en
distintos materiales (piedras, pieles, maderas) para contar el número de
personas o animales. Por ejemplo, los babilonios usaban pequeñas tablillas de
arcilla para recopilar datos sobre la producción agrícola y los
egipcios analizaban los datos de su población. En China existían registros
numéricos similares y los griegos llevaban a cabo censos cuya información se
utilizaba para cobrar impuestos.
En la Edad Media las instituciones eclesiásticas llevaban registros de los
nacimientos, muertes y matrimonios. Muchos años después, en 1662, apareció el
primer estudio estadístico importante de una población titulado Observations on
the London Bills of Mortality. A partir de ahí, distintas aportaciones de hombres
como Bayes, Pafnuty, Chebyshev, entre otros, fomentaron el desarrollo de esta
disciplina: la estadística.
Esta Unidad comienza con la forma de clasificar los datos, para después hacer
una revisión de cómo organizarlos y finalmente, estudiar las representaciones
gráficas de los datos ya organizados.
Es importante que reflexiones sobre las siguientes preguntas:
¿Cuál es la definición de estadística?
¿En qué situaciones se aplica?
Aunque en un principio parezca que no estás familiarizado con el término
estadística, la verdad es que de manera cotidiana se pueden observar sus
aplicaciones, como en el caso de los medios de comunicación.
De igual manera, al abrir un periódico podrás encontrar gráficas o resultados como
los que se muestran en la siguiente ilustración.
¿Se te ocurre alguna otra situación donde se utilice la estadística?
Como puedes observar, convivimos diariamente con esta disciplina y con base en
esto reflexiona sobre las siguientes preguntas:
¿Podrías definir la estadística?
¿Cómo la definirías?
Existen varias definiciones de estadística, pero a continuación te presentamos dos
de ellas:
La primera dice:
Concepto Clave
La estadística actual es el resultado de la unión de dos
disciplinas que evolucionaron independientemente hasta confluir
en el siglo xix: La primera es el cálculo de probabilidades que
nace en el siglo XVII como teoría matemática de los juegos de
azar. La segunda es la estadística (o ciencia del Estado, del
latín status), que estudia la descripción de datos y tiene raíces
más antiguas. La integración de ambas líneas del pensamiento
da lugar a una ciencia que estudia cómo obtener conclusiones
de la investigación empírica mediante el uso de modelos
matemáticos. (Peña, 1972, citado por Monroy, 2008, p. 23).
Como puedes ver la definición anterior está muy completa aunque es un poco
larga y una definición más corta, sería la siguiente:
Concepto Clave
“Ciencia que utiliza conjuntos de datos numéricos para obtener a partir de ellos
inferencias basadas en el cálculo de probabilidades” (Colegio 24hs, 2004, p.
10).
La importancia de la estadística radica en que es utilizada prácticamente en
cualquier área del conocimiento y en todo tipo de industria.
Un ejemplo de su aplicación lo puedes ver en la siguiente tabla, en donde se
muestran las estadísticas finales del grupo 5°A del Bachillerato UVEG.
Alumnos aprobados 28
Alumnos reprobados 0
Calificación promedio 92
2. Fuentes y tipos de datos
Fuentes de datos
La estadística es una herramienta que ayuda a analizar datos para poder
interpretarlos y tomar decisiones, pero te has puesto a pensar:
¿De dónde se obtienen estos datos?
Los datos con los que se trabajará se pueden obtener de diferentes fuentes y
dependiendo de su origen se clasifican en:
Fuentes primarias.
Son los datos que se obtienen directamente del lugar donde se produce el
hecho a estudiar, es decir, los consigue directamente la persona que hace
el estudio del lugar donde se generan los datos.
La persona que va a realizar el estudio sobre el estatus
socioeconómico de una población, elabora y aplica una encuesta
para identificar el nivel de ingresos en la población.
Fuentes secundarias.
Es información que se obtiene por medio de investigaciones o estudios
efectuados con anterioridad y pueden ser elaborados por una persona u
organización.
Se pueden consultar datos sobre el número de trabajadores en el
sector de manufactura en el INEGI.
Tipos de datos
Dependiendo de la
información que queramos
analizar, tendremos que
trabajar con diversos tipos
de datos, los cuales pueden
tomar diferentes valores, por
lo que se les conoce
como variables.
Existen dos formas de
clasificar las variables
Cierre
La estadística descriptiva se encarga de la recolección, organización, análisis
e interpretación de los datos que contienen información sobre las características
o el comportamiento del objeto de estudio.
La estadística inferencial, por otro lado, se encarga de realizar estimaciones o
supuestos sobre una población usando la información contenida en una
muestra de la población.
En esta Unidad también aprendiste que las características de una muestra o una
población se representan mediante variables que, dependiendo de la naturaleza
de los datos, pueden ser cuantitativas (si se les puede asignar un número)
o cualitativas (si no se les puede asignar un número).
En esta Unidad se estudiaron dos formas de organizar los datos: distribuciones
de frecuencia simple y distribuciones de frecuencia con intervalos.
La primera se utiliza cuando el caso de estudio contiene pocas observaciones que
se repiten con reiteración. Para los datos que prácticamente no se repiten se
observó la improcedencia de aplicar una distribución de frecuencias simple y se
recomendó organizarlos en una distribución de frecuencias con intervalos o
clases.
Un intervalo o clase permite agrupar datos dentro de límites establecidos. Los
límites de un intervalo se conocen como límites inferior y superior,
respectivamente. Se introdujeron conceptos como: marca de clase, frecuencia
absoluta, frecuencia relativa, frecuencia acumulada, porcentaje relativo y
porcentaje acumulado que contribuyeron al análisis y a la interpretación de los
datos.
Sin embargo, la organización de los datos en distribuciones de frecuencia no fue el
único propósito de esta Unidad. La representación gráfica de la información
también fue un objetivo central. Gráficos como el polígono de frecuencias, el
histograma, el polígono de frecuencias acumuladas, el polígono de porcentajes
acumulados y la gráfica de sectores, fueron los tipos de gráficas estadísticas que
se revisaron durante la actividad. Las gráficas estadísticas son un complemento
importante de las distribuciones de frecuencia y en general, de los estudios
estadísticos por su fácil comprensión e interpretación.
En esta Unidad conocerás tres conceptos muy importantes en cualquier estudio
estadístico: la moda, la media aritmética y la mediana, los cuales sirven para
representar un conjunto de datos mediante un valor único y se conocen
como medidas de tendencia central.
Otros conceptos que estudiarás son las medidas de dispersión: rango,
varianza, desviación media y desviación estándar, encargadas de analizar el
comportamiento de los datos desde la perspectiva de cómo se dispersan y cuyo
objetivo es representar la variabilidad de un conjunto de datos, es decir, cómo se
dispersan en torno a un valor central: la media aritmética.
1.1 Moda
1.2 Media aritmética
1.3 Mediana
Las medidas de tendencia central, como lo indica su nombre, buscan encontrar el valor medio de
un grupo de datos y por ello con frecuencia son utilizadas en la vida diaria.
Al final del año, en las escuelas dan las calificaciones de cada una de las materias cursadas. Un
alumno tomó sólo cuatro materias y obtuvo lo siguiente:
Matemáticas para Administradores 9.2
Gestión de la Calidad 7.3
Introducción a Visión de Negocios 8.5
Contabilidad Financiera 9.4
Para determinar su desempeño académico en general, en la escuela obtienen
el promedio o media aritmética de esas cifras. El procedimiento para hallar el promedio es sumar
todas sus calificaciones y luego dividir el resultado entre el número de calificaciones:
Concepto Clave
Las medidas de tendencia central sirven para calcular el valor medio de una serie de datos y son
las siguientes:
Media
Mediana
Moda
Cuando se trabaja con todos los datos de una población se les llama parámetros, pero si se trabaja
sólo con una muestra de la población se llaman estadísticos y su simbología es diferente.
Parámetro (población) Estadístico (muestral)
Media
Mediana
Moda Mo mo
Las medidas de dispersión, como su nombre lo indica, sirven para calcular qué tan alejados o
dispersos se encuentran los datos con respecto a su media. Al igual que las medidas de tendencia
central son conocidas como parámetros si se trabaja con una población, o estadístico si se trabaja
con una muestra.
Existen diferentes medidas de dispersión y entre las más importantes se encuentran:
Rango
Varianza
Desviación estándar
La simbología de algunas de las principales medidas de dispersión varía, dependiendo si son
parámetros o estadísticos.
Parámetro (población) Estadístico (muestral)
Varianza
Desviación estándar
En esta Unidad estudiaste las medidas de tendencia central que tienen como objetivo calcular el
valor medio de un conjunto de datos. Estas medidas son:
Mediana
Moda aritmética o Mediana
promedio
Es el dato u Es el dato tal que, antes
Es un valor típico
observación que y después de él, se
o promedio
más veces se encuentra el 50 % del
alrededor del
presenta en el total de los datos
cual se agrupan
experimento o previamente
los datos.
situación. ordenados.
La elección de su aplicación dependerá de la naturaleza de los datos o de la forma en que se
utilicen. Sin embargo, aunque al usar las medidas de tendencia central se puede obtener el valor
medio de los datos, éstos no arrojan información acerca de qué tan dispersos se encuentran los
datos respecto al valor medio. Esta característica estadística se obtiene aplicando las medidas de
dispersión, cuyo objetivo es representar la variabilidad de un conjunto de datos, es decir, cómo se
dispersan en torno a un valor central: la media aritmética. Las medidas de dispersión que revisaste
son el rango, la desviación media, la varianza y la desviación estándar.
Desviación
Rango Desviación media Varianza
estándar
Es la diferencia
que existe Significa el Es el
entre el dato promedio de las promedio de
mayor y el diferencias entre los cuadrados Representa
dato menor, es los datos u de las la raíz
decir, observaciones del diferencias cuadrada de
representa qué conjunto respecto de los datos la varianza.
tanto variaron a la media con respecto
los datos del aritmética. a la media.
conjunto.
Ante la naturaleza aleatoria de una gran cantidad de fenómenos presentes en la
vida, es necesario calcular la frecuencia con que ocurren esos eventos. Debido a
esto surge la probabilidad.
La teoría de la probabilidad matemática proporciona las bases científicas
para medir la incertidumbre, con el propósito de analizar la
información y tomar mejores decisiones o interpretar de manera adecuada
los datos que se nos presentan.
En esta Unidad estudiarás los conceptos básicos de la teoría de la probabilidad y
aprenderás a calcularla aplicando los principios, leyes y teoremas que la rigen.
1. Reglas de probabilidad
En la vida diaria escuchamos muy a menudo el término probabilidad. Por ejemplo, cuando en el
pronóstico del clima dicen existe una probabilidad del 90 % que llueva; o cuando se hacen
afirmaciones en el ámbito de la economía como hay grandes probabilidades de que Grecia no
pague sus deudas.
A continuación, conocerás la historia de Alma y el problema al que se enfrenta. A lo largo de esta
Unidad encontrarás material que te ayudará a resolverlo.
Cada año, durante el mes de febrero, se instala una pequeña feria en el pueblo de
San José del Llano, donde vive Alma, quien espera con ansias la llegada de ese
evento porque le encantan los juegos de azar.