PROBABILIDAD Y ESTADÍSTICA
ESTADÍSTICA
OBJETIVO DE LA ASIGNATURA
• Obtendrás conclusiones en base a datos parciales de diversos
géneros de eventos y calcularás las probabilidades de ocurrencia de
los mismos.
Objetivo de la Unidad
• Conocerás los fundamentos de la Estadística y aprenderás el manejo
de las Variables y Representaciones.
DEFINICIÓN
• Estadística: Es un método científico que recopila, organiza, analiza e
interpreta los datos obtenidos para tener conocimiento de los hechos
pasados, para prever situaciones futuras y tomar decisiones en base a la
experiencia.
• Estadística Descriptiva: Es aquella cuyo objetivo es describir
cuantitativamente una serie de personas, animales o cosas, su estudio
incluye las técnicas de colectar, presentar, analizar e interpretar datos.
Esta parte de la estadística es la que estudiaremos en el presente curso de
probabilidad y estadística , será la que nos auxilie a resolver preguntas de
investigaciones como las siguientes: ¿Cómo ordenar los datos y analizarlos
adecuadamente? ¿Qué tipo de representación gráfica es más conveniente utilizar
para presentar los datos? ¿Cuál es la media aritmética o promedio de los datos
obtenidos? ¿Qué tan dispersos están los datos con respecto a otra muestra?
CONCEPTOS BÁSICOS
• Población: Es el conjunto de todos los elementos, medidas, individuos y
objetos que tienen una característica en común, pero en muchas ocasiones
debido a limitaciones de tiempo o de recursos no se puede trabajar con la
totalidad de la población.
• Muestra: Es la parte de una población que podemos utilizar para obtener
conclusiones de toda una población sin tener que analizar su totalidad.
La muestra elegida debe cumplir con ciertos requisitos indispensables:
• a) Validez. Debe representar a la población, esto es, ha de pertenecer a
ésta y ser elegida al azar o 67en forma aleatoria, para que todos los
elementos de la población tengan la misma probabilidad de ser
considerados.
• b) Confiable. Los resultados que se obtengan deben poder generalizarse a
toda la población con cierto grado de precisión.
• c) Práctica. Debe ser sencilla de llevar acabo.
• d) Eficiente. Debe proporcionar la mayor información con el menor costo.
• Describe los valores que pueden tomar las siguientes variables y escribe si
ésta es, una variable categórica nominal, categórica ordinal, numérica
discreta o numérica continua:
a) El Género (sexo) de cada alumno del grupo de quinto semestre.
Variable: __________________________________________
b) La cantidad de estudiantes en cada grupo de una escuela:
Variable: _________________________________________
c) El Peso de los niños mexicanos de 6 años.
Variable: ________________________________________
d) Tipo de material con el que se construyen los techos de las viviendas de una
localidad.
Variable: ________________________________
e)El número de naranjas producidas por cada naranjo en una huerta.
Variable: _______________________________________
f) La cantidad de afecto o amor que siente un niño por su mamá.
Variable: ______________________________________
g) El tiempo de reacción de una sustancia química en el laboratorio.
Variable: ______________________________________
• NOTACIÓN SISTEMATIZADA
• En estadística, por lo general, trabajamos con datos agrupados resultantes
de medir una o más variables. Con gran frecuencia, los datos se obtienen
de las muestras y en ocasiones de las poblaciones. Para fines
matemáticos, generalmente se utiliza la letra mayúscula X y a veces la Y,
para representar la(s) variable(s). Así, si estuviéramos midiendo la edad de
los sujetos, haríamos que X represente la variable “edad”. Si existen
muchos valores de la variable agregamos un subíndice al símbolo X.
Ilustramos este proceso en la siguiente tabla, la cual contiene las edades de
seis sujetos:
• La primera columna es el número del sujeto, la segunda el símbolo del
dato, la tercera es el valor del dato
1 X1 8
2 X2 10
3 X3 7
4 X4 6
5 X5 10
6 X6 12
• X o Y representa la variable medida.
• N representa el número total de sujetos o datos.
• Xi es el i-ésimo dato, donde i puede variar de 1 a N
CÁLCULOS
• Una de las operaciones que se realizan con más frecuencia en estadística
consiste en sumar todos o una parte de los datos que pertenecen a una
distribución. Como no es práctico escribir “suma de todos los datos” cada
vez que se necesite emplear esta operación, particularmente en las
ecuaciones, se utiliza una abreviatura simbólica. La letra griega mayúscula
sigma ( Σ) indica la operación de sumatoria. La frase algebraica utilizada
para la sumatoria es:
∑ X lo que nos indica que se suman los valores de X
• DISTRIBUCIONES DE FRECUENCIAS
• La Tabla de Distribución de Datos o Tabla de Distribución de Frecuencias,
además de ser un instrumento útil para resumir un conjunto de datos
obtenidos en una investigación, es una herramienta muy importante con
que cuenta la estadística para realizar las observaciones de manera rápida
y sencilla.
• Para construir dicha Tabla realizaremos siete pasos y para tu mejor
aprendizaje, desarrollaremos un ejemplo con una variable numérica
continua, ya que deseamos conocer el “tiempo en minutos que emplearon
para estudiar” 50 estudiantes en la materia de estadística
• PASO UNO: TOMA Y ORDENACIÓN DE DATOS:
• La recopilación de los datos consiste en asistir al grupo de estudiantes y
obtener los valores mediante una pregunta abierta sobre el tiempo en
minutos que emplearon para estudiar el tema de estadística o si
desconfiamos, podemos medir directamente el tiempo durante las
asesorías que emplearon cada uno de los alumnos al estudiar estadística.
En resumen para recopilar los datos debemos "asistir" al lugar donde
vamos a 'tomar" o "levantar" los datos. Esto puede ser mediante
entrevistas, cuestionarios, observaciones o mediciones directas a los
individuos o cosas que corresponda nuestra variable.
• Supongamos que los 50 datos obtenidos en nuestra variable: tiempo de
estudio de la materia de estadística en minutos fueron los siguientes y que
corresponden a los 50 estudiantes:
75 60 80 67 81 71 74 63 72 70
76 62 82 63 81 66 78 68 80 74
67 74 84 70 63 77 68 82 74 72
76 64 75 80 69 85 71 79 60 74
83 75 67 72 78 64 77 81 76 70
• La Ordenación de los datos consiste en colocar los datos tomados en orden
creciente (de menor a mayor) o decreciente (de menor a mayor). Y se
anota la DISTRIBUCIÓN DE FRECUENCIAS
MINUTOS CONTEO FRECUENCIA MINUTOS CONTEO FRECUENCIA
60 // 2 74 ///// 5
62 / 1 75 /// 3
63 /// 3 76 /// 3
64 // 2 77 // 2
66 / 1 78 // 2
67 /// 3 79 / 1
68 // 2 80 /// 3
69 / 1 81 /// 3
70 /// 3 82 // 2
71 // 2 83 / 1
72 /// 3 84 / 1
85 / 0
TOTAL 50
• PASO DOS: RANGO.
• El rango o recorrido es la diferencia que hay entre el dato mayor y el menor.
Una vez que se ordenaron los datos en forma creciente obtenemos el rango
85 que es el dato mayor
60 que es el dato menor
25 será el rango o recorrido
• PASO TRES: INTERVALOS DE CLASE.
• Cuando se tiene un gran número de datos, se recomienda distribuirlos en
clases o categorías llamadas intervalos de clase o celdas. Para decidir la
cantidad de intervalos de clase que se van a utilizar (o número de clases) y
la amplitud de los intervalos (o ancho del intervalo) se siguen las siguientes
operaciones:
• Primero el NÚMERO DE CLASES o INTERVALOS se obtienen con la
fórmula:
• Q = 1 + 3.322 (log. n) donde n es el número de datos y log. Es el logaritmo
de dicho número. Siguiendo el ejemplo el resultado es: 6.64 redondeado a
7.
• Resulta claro que si lo ancho del intervalo es de 4 y el número de intervalos
son 7; (4 ) (7) = 28 se cubrirá todo el rango que es de 25.
• PASO CUATRO: TAMAÑO DEL INTERVALO DE CLASE.
• Con los datos del ejemplo, el dato más bajo es el 60 y como el ancho del
intervalo es de 4, su límite superior será de 64. El siguiente intervalo sería
64 más 4 del ancho del intervalo nos da 68 como limite superior y así
sucesivamente. ...
• 60 a 64
• 64 a 68
• Intervalos 68 a 72
• 72 a etc…
• PASO CINCO: MARCA DE CLASE.
• La marca de clase es el punto medio del intervalo de clase y se obtiene
sumando los límites reales inferiores más los límites reales superiores,
dividiendo el resultado entre dos.
Límite Inferior Límite Superior Marca de Clase
60 64 62
64 68 66
68 72 70
72 76 74
76 80 78
80 84 82
84 88 86
• PASO SEIS: FRECUENCIA RELATIVA.
• La Frecuencia Relativa, es la frecuencia que se representa con un Tanto
por Ciento ( % ) y se obtiene al dividir la frecuencia de un intervalo de clase
entre el total de frecuencias de todas las celdas por cien. La frecuencia
Relativa se emplea para mostrar la proporción o porcentajes de los valores
incluidos en los intervalos de clase, por lo que también se le llama
Distribución Porcentual.
Límite Frecuencia Frecuencia
Inferior Límite Superior Marca de Clase Absoluta Relativa
60 64 62 6 12%
64 68 66 6 12%
68 72 70 8 16%
72 76 74 11 22%
76 80 78 8 16%
80 84 82 9 18%
84 88 86 2 4%
TOTAL 50 100%
• PASO SIETE: TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
• Los polígonos de frecuencia también se construyen a partir de datos con
variables cuantitativas o numéricas y se puede realizar a partir de un
histograma si se desea.
• Una vez trazado el histograma, se localizan los puntos medios o marcas
de clase en la parte superior de cada uno de los rectángulos o intervalos de
clase. Se trazan segmentos de recta que unen cada punto medio de cada
uno de los intervalos.
• ACTIVIDADES DE APRENDIZAJE. Realizar un ejercicio completo de
distribución de frecuencias a partir de los datos de la estatura en
centímetros, de 20 estudiantes.
193 191 190 166 176
181 162 190 194 189
162 170 192 173 175
160 161 177 176 160
BIBLIOGRAFÍA:
www.estadisticaparatodos.es
Jardines del moral 3317000
Plaza San Miguel 3318000
WhatsApp Escolar 477-916-70-79