0% encontró este documento útil (0 votos)
113 vistas43 páginas

Clase 1

Este documento presenta la estructura de un curso de Probabilidades y Estadística dividido en tres unidades. La primera unidad cubre conceptos básicos de estadística descriptiva en cuatro clases. La segunda unidad se enfoca en probabilidades en cinco clases. La tercera unidad trata sobre inferencia estadística en tres clases. El documento también define conceptos clave de estadística como población, muestra, parámetros, estadígrafos y variables.

Cargado por

Victor Muñoz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
113 vistas43 páginas

Clase 1

Este documento presenta la estructura de un curso de Probabilidades y Estadística dividido en tres unidades. La primera unidad cubre conceptos básicos de estadística descriptiva en cuatro clases. La segunda unidad se enfoca en probabilidades en cinco clases. La tercera unidad trata sobre inferencia estadística en tres clases. El documento también define conceptos clave de estadística como población, muestra, parámetros, estadígrafos y variables.

Cargado por

Victor Muñoz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Curso: Probabilidades y Estadística.

Clase 1: Estadística Descriptiva


Conceptos básicos.
Estructura del curso

Clase 1: Estadística Descriptiva-Conceptos Básicos.

Clase 2: Estadística Descriptiva –MTC y Posción.


Unidad 1: Estadística Descriptiva
Clase 3: Estadística Descriptiva-Medidas de Dispersión.

Clase 4: Estadística Bivariada.

Clase 5: Repaso Estadística Univariada y Bivariada.

Clase 6: Solemne.
Curso Unidad 2: Probabilidades Clase 7: Conceptos básicos de probabilidades.

Clase 8: Variable Aleatoria Discretas y Continuas.

Clase 9: Distribuciones Discretas.

Clase 10: Distribuciones Continuas.

Clase 11: Inferencia Estadística-Intervalos de Confianza.


Unidad 3: Inferencia Estadística
Clase 12: Inferencia Estadística-Hipótesis.

Clase 13: Solemne.


Resultado de Aprendizaje de la Clase
• Diferenciar técnicas estadísticas para analizar problemas de
carácter industrial.
¿Por qué es importante este tema?

Es importante el tema debido a que la toma de decisiones


depende exclusivamente de una óptima interpretación.
Áreas de aplicación de la Estadística
– Gobierno.
– Negocios.
– Ciencias Sociales.
– Ingeniería.
– Ciencias Físicas y Naturales.
– Control de Calidad.
– Procesos de Manufactura.
– Muchos otros campos de la actividad intelectual.
Estadística
La estadística , se divide en (Devore, J. 1998):

• Estadística descriptiva: se refiere a la recopilación y descripción


de un grupo de datos.

• Probabilidades e inferencia estadística: esta área se preocupa


del proceso para lograr generalizaciones acerca del todo
(población), examinando una parte de ella (muestra). Esto es lo
que se observa en todos los estudios que se realizan y que
permiten inferir características y comportamientos de la
población de acuerdo a una muestra.
Estadística Descriptiva
Ejemplo:
“La gerencia de recursos humanos de una importante empresa,
señala que un tercio de sus trabajadores que ocupan el cargo de
asistente, son mujeres”

El objetivo específico del estudio es la descripción de la característica


principal de los datos obtenidos de todos los individuos que
componen la colectividad, que es objeto de estudio.

La gerencia en este caso particular tiene datos de todos los


asistentes de la empresa y uno de estos datos es el género del
trabajador. No siendo necesaria la aplicación de una muestra para
desarrollar el estudio.
Estadística Inferencial
Ejemplo:

“El Banco Central estimó que los hogares chilenos destinan el 46%
de sus ingresos a pagar deudas. Se estima además que el
endeudamiento de los hogares chilenos aumentara anualmente en
un 18%”

En este caso se selecciono una muestra por parte del Banco Central,
el cual extendió sus conclusiones a todos los hogares del país,
definiendo una predicción futura del 18% en endeudamiento
Definiciones Importantes
• Población: es la colección de todas las posibles mediciones u
observaciones que pueden hacerse de una variable bajo
estudio.
Definiciones Importantes
• Se clasifica en dos categorías:

 Finita: es aquella que incluye una cantidad limitada


contable de observaciones, individuos o medidas.
Definiciones Importantes
 Infinita: es aquella que incluye un gran conjunto de
observaciones o mediciones que no pueden alcanzarse por
conteo. Al menos, hipotéticamente, no existe límite en
cuanto al número de observaciones que el experimento
puede generar.

• Muestra: es un subconjunto de la
población.
Definiciones Importantes
• Parámetros: Son las medidas con las que representamos y
describimos la información poblacional, permitiendo la
caracterización de tal población.

• Estadígrafos: Son las medidas con las que representamos y


describimos la información en la muestra, permitiendo la
caracterización de dicha muestra.
Definiciones Importantes
• Censo: es un método de recolección de datos, mediante el cual la
información se obtiene de la totalidad de los elementos que
componen la población o universo bajo estudio. Un censo debe
cumplir las condiciones de universalidad (censar a todos los
elementos de la población) y simultaneidad (realizarse en un
momento determinado). Un censo es equivalente a una
fotografía de la población bajo estudio.

Uno de los más conocidos, es el censo poblacional


Definiciones Importantes
Muestra Representativa:

Cuando es complejo censar, por motivos de costo y tiempo, se hace


necesario contar con una muestra representativa.

Esto consiste en escoger un volumen grande de información, que


sea lo suficientemente adecuada, donde las características de los
elementos o individuos elegidos en la muestra, deben ser parecidos
a los de la población.
Variable Estadística

Al analizar una determinada población o muestra, observamos


ciertas características o propiedades.
Por ejemplo, de los estudiantes de este curso, se puede estudiar: la
edad, nivel socioeconómico, número de hermanos, número de hijos,
etc.

A cada una de estas características, le llamamos variable.


Clasificación de las variables
Las variables se pueden clasificar en:

• Variables cualitativas: Se les conoce también como atributos, e


indican una propiedad o cualidad de la característica que se está
estudiando. Estas variables tienen como característica que no
pueden ser medidas, se expresan con conceptos o palabras, pero
nunca con números

Por ejemplo: género, profesión,


nivel de estudios, color de pelo, etc.
Clasificación de las variables
Las variables cualitativas, se subdividen en:

Nominales: cuando la medición de las cualidades no presenta un


orden jerárquico

Ejemplos: estado civil, profesión, género

Ordinales: cuando la medición de las cualidades presentan un orden


jerárquico descendente o ascendente.

Ejemplos: nivel de satisfacción de los clientes, nivel de estudios


Clasificación de las variables
• Variables cuantitativas: Son características susceptibles de ser
medidas, es decir, se les puede asignar una cantidad. Estas
variables, generalmente se definen comenzando por “número
de…”

Por ejemplo: número de hijos, número de integrantes de la


familia, número de productos, etc.
Clasificación de las variables
Las variables cuantitativas, se subdividen en:

Discreta: cuando la variable toma sus valores en número enteros.

Ejemplos: número de hijos, número de protestos

Continua: cuando la variable toma sus valores en un rango de los


números reales

Ejemplos: ingreso familiar, estatura, temperatura, peso


Variables Unidimensionales,
Bidimensionales y Multidimensionales
• Variables unidimensionales: sólo recogen información sobre una
característica de la población o muestra.

Ejemplo: profesión de los trabajadores de una empresa


Variables Unidimensionales,
Bidimensionales y Multidimensionales
• Variables bidimensionales: recogen información sobre dos
características de la población o muestra.

Ejemplo: Profesiones según género al interior de una empresa


Variables Unidimensionales,
Bidimensionales y Multidimensionales
• Variables multidimensionales: recogen información de tres o
más características

Ejemplo: Ganancia anual (en millones) según el número de


vendedores y el precio del producto
Tablas de Distribución de Frecuencias
La tabla de distribución de frecuencias corresponde a una tabla
estadística que tiene como finalidad presentar, en forma ordenada,
los valores que toman las diferentes características, de tal forma, que
el analista pueda tener una visión en conjunto de los datos de
clasificación.

Las tablas de distribución de frecuencias a utilizar para la


organización de los datos dependerá principalmente de la
numerosidad de los mismos, si son pocos la tabulación será por valor
y se denomina “tabla de distribución de frecuencia por valor”, de ser
muchos datos será una tabulación por intervalos y de denomina
“tabla de distribución de frecuencia por intervalo”
Distribución de Frecuencias
Una distribución de frecuencias en su forma completa tiene la
siguiente estructura:

Identificación de la variable Información de la variable


De la tabla anterior podemos definir la simbología a utilizar en una tabla
de distribución de frecuencias:
Tabulación de datos por valor
Este tipo de tabulación agrupa los datos de la población o muestra,
según los distintos valores que toma la variable. Para ello, es
necesario que las variables no tomen muchos valores diferentes.

Ejemplo:
El gerente de una Empresa, solicita al jefe de planta, un estudio del consumo
diario de energía durante el mes de Marzo del presente año. Los resultados
obtenidos del consumo (kw/hr) son los siguientes:

Con la información, se pide ordenar los datos en una tabla de distribución de frecuencias
por valor.
Tabulación de datos por valor
Para realizar la tabulación de datos por valor, lo primero, es identificar que existen
8 marcas de clase diferentes de un total de 30 valores (n), que corresponden en
detalle a:
5, 6, 7, 8, 9, 10, 11 y 12 respectivamente

Consumo Energía (Kw/hr) ni Ni fi Fi

5 2 2 0,066 0,066
6 3 5 0,100 0,166
7 4 9 0,133 0,299
8 5 14 0,166 0,465
9 6 20 0,200 0,665
10 5 25 0,166 0,831
11 3 28 0,100 0,931
12 2 30 0,066 1,000

30 1,000
Tabulación de datos por intervalo
Cuando las observaciones de un estudio toman muchos valores, es conveniente
agrupar los datos en intervalos.

Ejemplo:
Se quiere analizar el perfil de los clientes de una empresa dedicada a las
inversiones. Para esto se ha realizado una encuesta a 30 clientes en relación a sus
ingresos mensuales en miles de pesos, obteniendo los siguientes resultados:

1.150 1.480 1.570 1.710 1.920


1.530 1.160 1.600 1.810 1.980
1.200 1.590 1.860 1.520 1.480
1.390 1.400 1.640 1.770 1.490
1.200 1.420 1.450 1.200 1.982
1.370 1.160 1.730 1.620 1.010
Tabulación de datos por intervalo
Paso 1: Se identifica la variable

x: Ingreso mensual de 30 clientes de una empresa financiera en miles de pesos

Tipo de variable: cuantitativa continua

Se decide el tipo de tabulación, en este caso será por intervalos, porque la


información queda más resumida.

Paso 2: Se determina el valor mínimo y máximo que toma la variable en estudio

Valor mínimo: 1.010 Valor máximo: 1.982


Tabulación de datos por intervalo
Paso 3: Se determina el Rango = Valor máximo – Valor mínimo
Rango = 1.982 – 1.010 = 972

Paso 4: Se determina el número de intervalos “K”


Para determinar cuantos intervalos se ocupan, existen distintos métodos, como
por ejemplo:

• K es arbitrario (lo decide quien realiza el estudio)


• 2k ≥ n
• K = 1 + 3,322*log(n)

Siendo esta última la formula o regla de Sturges, la que se utilizará en este curso.
Tabulación de datos por intervalo
K = 1 + 3,322*log(30) = 5,9 = 6 intervalos

Paso 5: Se determina la amplitud del intervalo “C”, que es la diferencia entre el


límite superior e inferior de una clase.

𝑅𝑎𝑛𝑔𝑜 972
C= = = 162
𝐾 6

Paso 6: Crear los intervalos


Tabulación de datos por intervalo
Paso 7: Se determinan las marcas de clases mi

𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 − 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜


mi=
2

Intervalos
mi
Li Ls

1.010 1.172 1.091

1.172 1.334 1.253

1.334 1.496 1.415

1.496 1.658 1.577

1.658 1.820 1.739

1.820 1.982 1.901


Tabulación de datos por intervalo
Paso 8: Como el valor del límite superior de un intervalo coincide con el límite
inferior del siguiente intervalo, se decide en que intervalo se va a considerar ese
valor. Para realizar esto, existen dos criterios

Tabulación superior: Se incluye en el respectivo intervalo el límite superior,


excepto en el primer intervalo que también se incluye el intervalo inferior.

Tabulación inferior: Se incluye en el respectivo intervalo el límite inferior, excepto


en el último intervalo que también se incluye el intervalo superior
Tabulación de datos por intervalo
Con tabulación superior:

Intervalos
mi ni Ni fi Fi
Li Ls

( 1.010 1.172 ) 1.091 4 4 0,133 0,133

) 1.172 1.334 ) 1.253 3 7 0,100 0,233

) 1.334 1.496 ) 1.415 8 15 0,267 0,500

) 1.496 1.658 ) 1.577 7 22 0,233 0,733

) 1.658 1.820 ) 1.739 4 26 0,133 0,867

) 1.820 1.982 ) 1.901 4 30 0,133 1

30 1
Representación gráfica de los datos
Al representar en una gráfica la información concentrada en la tabla de
frecuencias, se ésta en presencia de un recurso visual que nos permite tener
una idea clara, precisa, global y rápida acerca e las observaciones de una
muestra o población.

Existen muchos tipos de gráficas en las que se pueden representar la


frecuencia absoluta (ni), relativa (fi) y acumulada (Ni) y con ellas podemos
estimar algunos valores con la simple observación.
Representación gráfica de los datos
Para variables cualitativas, se usan:
• Gráficos de Barras
• Pictogramas
• Gráfico de Torta, Circular o Sectores
Representación gráfica de los datos
La tabulación por atributos de las preferencias de los adultos mayores a ciertas actividades
destinadas a su recreación aparece representada en la tabla y grafica siguiente:

Actividad ni fi (%)
Danza 37 11.1%
Pintura 65 19.4%
Música 46 13.9%
Ajedrez 93 27.8%
Bordado 19 5.6%
Tejido 74 22.2%
Total 334 100.0%
Representación gráfica de los datos
Para variables cuantitativas discretas,
se usan:
• Gráficos de Barras
• Gráfico de Torta, Circular o Sectores
• Gráficos Escalera
Representación gráfica de los datos
Para variables cuantitativas continuas, se usan:
• Histogramas
• Polígonos de Frecuencia
• Ojivas
Representación gráfica de los datos
Para variables cuantitativas continuas, se usan:
• Histogramas
• Polígonos de Frecuencia
• Ojivas
Representación gráfica de los datos
Para variables cuantitativas continuas, se usan:
• Histogramas
• Polígonos de Frecuencia
• Ojivas
Conclusión
La tabulación de datos es muy importante para poder realizar
estudios sobre una variable. Cuando los datos están agrupados y
trabajamos con un mayor volumen de información, el utilizar
intervalos, permite tener conclusiones más específicas de grupos de
datos.
La construcción de las tablas es esencial para poder calcular
medidas de tendencia central, posición y dispersión de los datos. Y
así poder obtener información relevante para la toma de
decisiones.
Bibliografía
Bibliografía obligatoria:
• Cánavos, George. Probabilidad y Estadística. Mc. Graw Hill, 1999.
México 2. Miller, Irwin. Estadística matemática con aplicaciones.
Prentice Hall, 2000. México.
• Montgomery, Douglas C. Probabilidad y Estadística aplicadas a la
Ingeniería. Editorial Mc. GRAW-HILL, México, 2002.
Bibliografía Complementaria:
• Murray Spiegel: Estadística. Mc Graw Hill. México, 2003.
• César Pérez López. Estadística - Problemas resueltos y
aplicaciones. Editorial Pearson Educación S.A. Madrid, 2003.
• Devore, Jay L. Probabilidad y Estadística para Ingeniería y
Ciencias. Editorial Thomson. México, 2005.

También podría gustarte