UNIDAD N1
INTRODUCCIN A LA ESTADSTICA 1.- ESTADSTICA 1.1 Concepto.- Se entiende por estadstica a los mtodos cientficos mediante los cuales podemos recolectar, organizar, analizar, resumir y presentar informes de datos numricos relativos a un conjunto de individuos u observaciones las cuales nos permiten sacar conclusiones y tomar decisiones lgicas basadas en dichos anlisis. Dichos mtodos cientficos consisten en la utilizacin de tablas y grficos mediante los cuales se procesa la informacin. 1.2 Poblacin y Muestra.- Poblacin o Universo se define como un conjunto de elementos que poseen algunas caractersticas determinadas y que constituyen un objeto de estudio, es decir que el total de observaciones susceptibles de ser registradas o empadronadas, se les denomina Poblacin. Muestra.- Es la recoleccin de observaciones provenientes de una poblacin la cual posee una caracterstica definida. Toda caracterstica de una muestra se la conoce con el Nombre de "Estadgrafo" Ejemplo.- La media Aritmtica de una muestra es un estadgrafo. 1.3 Clasificacin de la Estadstica.- Existen dos clases o tipos de estadsticas las cuales son: Estadstica Descriptiva y Estadstica Inductiva. a) Estadstica Descriptiva.- Es la descripcin de los datos mustrales que son objeto de estudio mediante la utilizacin de ciertos tipos de indicadores. Los datos mustrales se pueden recopilar de dos formas: 1) Cuando se consideran a todos los elementos de la poblacin se denomina "CENSO" 2) Cuando se realiza una seleccin al azar de los elementos de la poblacin se denomina "MUESTREO" b) Estadstica Inductiva.- Conocida tambin con el nombre de estadstica "INFERENCIAL", est basada en una serie de teoras e hiptesis acerca del comportamiento de un fenmeno observado. En este tipo de estadstica, muchas decisiones son tomadas en condiciones de incertidumbre por lo cual es preciso utilizar el trmino de probabilidades.
elaborado por: msc. gustavo roger gomez suarez
1.4) Aplicaciones.- La utilizacin de datos estadsticos es de vital importancia en todos los campos de la ciencia donde esta sea aplicada como ser: Estadstica en las Empresas.- Ayuda a econmicas y financieras para el futuro. tomar decisiones
Estadstica en la Medicina.- Ayuda a conocer la efectividad de los medicamentos y los efectos secundarios que producen. Estadstica en la Educacin.- Ayuda a decidir sobre el empleo de los mejores mtodos de enseanza. Estadstica en la Agricultura.- Ayuda a conocer el efecto de diferentes tipos de semillas e insecticidas que van a ser utilizados. Estadstica en la Veterinaria.- Ayuda a producir ganado de mejor calidad y peso. 2.- Variables.- Son smbolos o signos que pueden tomar algn valor o infinitos valores en una muestra, dentro de un intervalo determinado. En estadstica existen dos tipos de variables que son: a) Variables Ordinales.- Son las cuales estn sujetas a una ordenacin cualitativa y no a una mediacin cuantitativa; Ejemplo el grado de cultura de una persona (Muy culta, regularmente culta, poco culta etc.) b) Variables Cardinales.- Son las que estn sujetas a una medicin cuantitativa y no a una ordenacin cualitativa y pueden ser de dos tipos: Discretas y Continuas. 2.1 Variables Discretas.- Son aquellas que pueden tomar algn valor especifico dentro de un intervalo determinado, es decir que solamente pueden tomar valores de nmeros enteros. Tambin podemos decir que son el resultado de "CONTAR". Ejemplo: Nmeros de estudiantes de Estadstica I ; 70,80,90 etc. 2.2 Variables Continuas.- Son aquellas que pueden tomar cualquier valor dentro de un intervalo determinado es decir, que toman valores de nmeros fraccionados. Tambin se puede decir que son el resultado de "MEDIR". Ejemplo: La estatura y el peso de los estudiantes de Estadstica I ; 70,5 ; 83,6 etc. 3.-Investigacin Estadstica.- En toda investigacin cientfica es importante definir el marco de referencia del estudio, y el grado de requerimiento de la informacin, para lo cual se establecen ciertos parmetros o etapas de la investigacin.
elaborado por: msc. gustavo roger gomez suarez
3.1 Etapas de la Investigacin Estadstica.- Existen cuatro etapas : a) Recoleccin de datos mediante tcnicas definidas como ser: Encuestas, Censos, Muestreos, etc, para la obtencin de datos fidedignos. b) Elaboracin, ordenacin, y reduccin de los datos para ayudar a su estudio. c) Anlisis de los datos para la obtencin de medidas estadsticas como ser: Medidas de Tendencia Central y Medidas de Dispersin. d) Interpretacin de los resultados obtenidos para conclusiones y emitir recomendaciones y diagnsticos. sacar
4.- Tabulacin de Datos.- Los datos obtenidos en base a las diferentes tcnicas como ser: Censo, Muestreo, etc. Se elaboran y se clasifican para obtener series estadsticas, tablas y distribuciones de frecuencias. 4.1 Representacin Tabular.- Una vez los datos han sido recolectados y seleccionados es necesario presentarlos de tal forma que sean de fcil comprensin, para su posterior anlisis e interpretacin. Para ello se elaboran cuadros numricos, tablas de frecuencia y se los representa en distintos tipos de grficos como ser: Barras, Crculos, Histogramas, Polgonos de frecuencia, Pictogramas, Ojivas, etc. 4.2 Distribucin de Frecuencias.- Es una tabla donde se agrupan todos los valores posibles para una variable y se registran los nmeros de valores observados correspondiente a cada clase. Los datos organizados en una tabla de distribucin de frecuencia se llaman "Datos Agrupados", mientras que los datos sin organizar se denominan Datos Sencillos. 4.2.1 Elementos del Cuadro de Distribucin de Frecuencia 1) Valor mximo y valor mnimo de un conjunto de datos .- Se trata de determinar el valor superior e inferior de un conjunto de observaciones para lo cual es conveniente ordenar los datos en forma ascendente o descendente para una fcil identificacin de los valores mximos y mnimos.
elaborado por: msc. gustavo roger gomez suarez
Ejemplo.- Dadas las notas obtenidas por 15 estudiantes de Estadstica I . 40 30 85 75 95 50 65 10 45 20 70 15 90 25 35 Ordenacin Ascendente: 10-15-20-25-30-35-40-45 50-65-70-75-85-90-95 V. MAX = 95 V. MIN = 10
2) Rango o recorrido de la variable (R).- Es la diferencia entre el valor Mximo y el valor Mnimo en una serie de datos. R= V.MAX. - V.MIN. => 95-10 = 85 R = 85
3) Amplitud de intervalos (C).- Es el tamao o medida que existe entre el limite inferior y el limite superior de cada nmero de intervalo. La amplitud de cada intervalo puede ser constante o variable. En una serie donde se precisa determinar intervalos, uniformes existen dos formas de clculo: a) De acuerdo a un nmero fijo de intervalos: R C = NI => R --NI = Rango o recorrido = Nmero de intervalos fijos
b) De acuerdo al nmero de intervalos ideales(Regla de Sturges) R C = 1 + 3,3222 Log N R C = => 1+(3.3222 LOG 15)
donde N = Nmero de observaciones 85 = 17.32 1+(3.3222 X 1.1761) C = 17
4.-Nmero de Intervalos (NI).- Es la cantidad de clases o categoras que resulta del procesamiento de una distribucin de frecuencia. Un cuadro de distribucin de frecuencia convencional, no debe excederse de 20 intervalos de clases. Cuando el nmero de intervalos es desconocido se busca la cantidad ideal de intervalos mediante la formula siguiente: NI = R --C => NI = 85 ---- = 5 17 NI = 5
elaborado por: msc. gustavo roger gomez suarez
Nota.- El nmero de intervalos siempre deber ser expresado en valores enteros. 5) Rango o Recorrido Ideal (RI).- Muchas veces el recorrido existente, no es el ms adecuado para una distribucin por lo cual se tiene que encontrar un Recorrido Ideal para dicha distribucin que acte en funcin de la Amplitud y del Nmero de intervalos de la distribucin. El proceso de clculo se lo efecta mediante la siguiente formula: RI = C x NI => 17 x 5 = 85 RI = 85
Nota.- El valor del RI debe ser > = R; caso contrario se deber redondear el valor de C al numero entero siguiente. 6) Margen de Desplazamiento (MD).-En la mayora de los casos la informacin no se encuentra centralizada, por lo que se corre el riesgo de cargar mayor informacin a uno de los extremos; para lo cual la informacin es centralizada mediante el margen de desplazamiento en base a la formula siguiente: MD = RI-R ----2 => 85-85 ----2 = 0 MD = 0
7) Limite Inicial de los Intervalos de Clases (Li).- Se obtiene disminuyendo al valor mnimo, el valor del margen de desplazamiento obtenido. LI = V.MIN - MD => 10 - 0 = 10 LI = 10
8)Limite Final de Intervalos de Clases (LF).- Se obtiene aumentando al valor mximo, el valor del margen de desplazamiento obtenido. LF = V.MAX + MD => 95 + 0 = 95 LF = 95
9) Limites Reales de cada Intervalo de clase.-Se obtiene sumando al limite inicial, la amplitud de intervalos obtenido. Existen dos tipos de limites de cada intervalo que son: Limite Inferior (Y'i-1) y el Limite Superior (Y'i). El lmite superior de un intervalo de clases es el lmite inferior de la siguiente clase o intervalo.
elaborado por: msc. gustavo roger gomez suarez
NI (Y'i-1)(Y'i) 1 10 27 2 27 44 44 61 3 61 78 4 5 78 95
=> => => => =>
Y'1-1 Y'2-1 Y'3-1 Y'4-1 Y'5-1
+ + + + +
C C C C C
= = = = =
Y'1 Y'2 Y'3 Y'4 Y'5
=> => => => =>
10 27 44 61 78
+ + + + +
17 17 17 17 17
= = = = =
27 44 61 78 95
10) Marca de Clases o Punto Medio (Yi).- Es el valor central de cada intervalo de clases y se obtiene dividiendo entre dos la suma del valor del limite inferior mas el valor del limite superior de cada intervalo de clases. Y'i-1 + Y'i Yi= 2 NI Y'i-1 Y'i Y'i 1 10 27 18.5=> 44 35.5=> 2 27 3 44 61 52.5=> 4 61 48 69.5=> 95 86.5=> 5 78
=>
Y1 = 10+27 2 Y2 = 27+44 2 Y3 = 44+61 2 Y4 = 61+78 2 Y5 = 78+95 2
A todo este procedimiento realizado se lo conoce con el nombre de Representacin Tabular. Los procedimientos adicionales a utilizarse posterior a esta Representacin se los conoce como Distribucin de Frecuencia. Ejercicio N2 En base a las notas obtenidas del ejercicio anterior se pide elaborar una nueva tabla de distribucin de frecuencia para una serie de 8 intervalos de clases de Amplitud Constante. 2) R = V. MAX - V.MIN => 95-10 =85 R 85 3) C=----- => ------ = 10.62 11 NI 8 R 85 4) NI =---- => ---- =7.33 8 (NO) Por que sabemos que: NI=8 C 11
elaborado por: msc. gustavo roger gomez suarez
5) RI =C X NI => 11 X 8 = 88 RI - R 88-85 6) MD =------- => ------ = 1.5 2 2 7) LI = V.MIN - MD 8) LF = V.MAX + MD => 10-1.5 = 8.5
=> 95+1.5 = 96.5
REPRESENTACION TABULAR NI (Y'i-1) (Y'i) Yi fi...etc. 1 8.5 19.5 14 C =11 2 19.5 30.5 25 C =11 3 30.5 41.5 36 C =11 4 41.5 52.5 47 C =11 5 52.5 63.5 58 C =11 6 63.5 74.5 69 C =11 7 74.5 85.5 80 C =11 8 85.5 96.5 91 Frecuencia Absoluta (fi).- Es el nmero de observaciones que se repiten dentro de cada intervalo de clase. Se obtiene mediante el recuento y clasificacin de los datos en la que al final la suma total de la frecuencia encontrada, ser igual al nmero total de observaciones estudiadas. fi= N =15 (Continuamos con la tabla original:) NI(Y'i1)(Y'i) Yifi hi h% FiA HiAH%AFIDHID HI%D 1 10 2718.5 40.2727 4 0.27 2715 1.00100 2 27 4435.5 30.2020 7 0.47 4711 0.73 73 3 44 6152.5 20.1313 9 0.60 60 8 0.53 53 7869.5 30.2020 12 0.80 80 6 0.40 406 4 61 5 78 9586.5 30.2020 15 1.00100 3 0.20 20 151.00100 fi=> N => 15
elaborado por: msc. gustavo roger gomez suarez
Frecuencia Relativa (hi).- Es el cociente que resulta de dividir cada una de las frecuencias absolutas entre el nmero total de observaciones. Todas las frecuencias relativas deben ser menores que la unidad y la suma total de ellos, da como resultado el valor de la unidad. h1 = hi= fi fi => fi N h2 = 4 15 3 15 = 0.27 = 0.20 etc......
Frecuencia Relativa Porcentual (hi %).-Es una nueva forma de expresar la frecuencia relativa y a la vez toma las mismas caractersticas de esta. Su forma de clculo es tan sencilla que simplemente resulta de multiplicar por 100 la frecuencia relativa obtenida. La suma del total de frecuencias relativas porcentuales, ser igual al 100% h1 % = 0.27 x 100 = 27 hi% = hi x 100 h2 % = 0.20 X 100 = 20 etc.....
Frecuencias Acumuladas.-Todas las frecuencias: Absolutas, Relativas, y Porcentuales se pueden expresar en valores acumulados, es decir que la suma de las distintas frecuencias hasta un valor determinado, se denomina frecuencia acumuladas y pueden ser de dos tipos; Frecuencia Acumuladas Ascendente y Frecuencia Acumuladas Descendente. a)Frecuencia Acumuladas Ascendente.-Es la sumatoria acumulativa de los valores de las frecuencias a partir de los intervalos inferiores y dirigida hacia los intervalos superiores es decir que se debe comenzar a partir del 1 intervalo; hacia el ultimo intervalo de clase. - En el caso de las frecuencias absolutas, el ltimo ser igual al nmero total de observaciones. - En el caso de las frecuencias relativas, el ltimo valor ser igual a la unidad. - En el caso de las frecuencias porcentuales, el ltimo valor ser igual al 100% Ejemplo F1A F2A H1A H2A = = = = f1 f1 h1 h1 = + = + 4 f2 = 4 + 3 = 7 etc...... 0.27 h2 = 0.27 + 0.20 = 0.47 etc......
elaborado por: msc. gustavo roger gomez suarez
H1%A = h1% = 27 H2%A = h1% + h2% = 27 + 20 = 47 etc.... - Otra forma: H1%A = H1A X 100 = 0.27 X 100 = 27 H2%A = H2A X 100 = 0.47 X 100 = 47 b) Frecuencias Acumuladas Descendente.- Es la diferencia acumulativa de las frecuencias a partir del numero total de observaciones (en frecuencias absolutas) y de la unidad (en frecuencias relativas)y dirigidos hacia los intervalos superiores; tambin se puede comenzar desde el ltimo intervalo de clase, sumando acumulativamente hacia intervalos inferiores. - En el caso de las frecuencias absolutas el primer valor ser igual al total de observaciones. - En el caso de las frecuencias relativas el valor del primer intervalo ser igual a la unidad. -En el caso de las frecuencias porcentuales el valor del primer intervalo ser igual al 100% Ejemplo.F5D = F5 = 3 F5D = F5 + F4 = 3 + 3 = 6 etc..... H5D = h5 = 0.20 H5D = h5 + h4 = 0.20 + 0.20 = 040 etc.... H5%D = h5% = 20 H5%D = h5% + h4% = 20 + 20 = 40 etc.... - De otra forma: H5%D = H5D X 100 = 0.20 X 100 = 20 H4%D = H4D X 100 = 0.40 X 100 = 40 4.2.2 Reglas Generales para Formar una Tabla de Distribucin de Frecuencia.1 Ordenar los datos en forma ascendente o descendente e Identificar el valor mximo y mnimo de las observaciones. 2 Hallar el rango o recorrido. 3 Encontrar la amplitud de intervalos de clases. 4 Determinar el nmero de intervalos en caso de no conocerlo 5 Encontrar el rango ideal bajo la siguiente condicin: RI > = R En el caso que no se cumpla la mencionada condicin, se deber ajustar la amplitud de intervalos (C) al nmero entero inmediato superior.
elaborado por: msc. gustavo roger gomez suarez
Ej.(R=85; NI=7;
85 C= ----- = 12.14 13; RI = 13 x 7 = 91 > 85) 7
6 Hallar el margen de desplazamiento. 7 Hallar los lmites iniciales y finales para la distribucin 8 Hallar los lmites superiores e inferiores para cada uno de los intervalos de clase. 9 Hacer el conteo de las observaciones que se encuentran dentro de cada intervalo y formar una tabla de distribucin de frecuencias Absolutas, Relativas, y Porcentuales. 5.-Representacin Grfica Coordenadas Rectangulares.- Las distribuciones de frecuencias se representan mediante diferentes tipos de grficos en el plano de los ejes cartesianos. Los intervalos de clases se representan en el plano horizontal, eje de las Abscisas (Variable X) y las diferentes distribuciones de las frecuencias Absolutas se las representa en el plano vertical, ejes de las Ordenadas (Variable Y). Y ORDENADAS (VERTICAL)
>X ABSCISAS (HORIZONTAL) Tipos de Representacin Grficas.- Existen Representacin Grfica que son: Histograma, Frecuencia y Curva de Frecuencia. 3 tipos Polgono de de
a) Histograma.- Es una serie de rectngulos expresados en el primer cuadrante de los ejes de las coordenadas cartesianas, donde cada uno de los rectngulos, representa las Frecuencias Absolutas de un determinado intervalos de clase. El conjunto total de los rectngulos forma el total de observaciones estudiadas. b) Polgono de Frecuencia.- Es la unin de los puntos centrales del histograma es decir las distintas marcas de clases, mediante lneas quebradas que se prolongan a una marca de clases inmediatamente superior e inferior,En la practica para obtener rpidamente un polgono de frecuencia, se transfiere la informacin del histograma de un area de la curva quebrada hacia el polgono de frecuencia.
elaborado por: msc. gustavo roger gomez suarez
c) Curvas de Frecuencia.- Al igual que con el histograma, el polgono de frecuencia es utilizado para formar una curva de frecuencia. En la prctica se transfiere toda la informacin existente en el polgono de frecuencia haciendo pasar una curva suavizada, por los puntos medios o marcas de clase.
4.5 4 3.5 3 2.5 2 1.5 1 0.5 0
fi
10
27
(yi-1) (yi)
44 61 (y'-1) (y')
78
95
Tipos de Curvas de Frecuencias.-Las frecuencias Absolutas (Simples) se pueden clasificar de acuerdo a su punto mximo y de acuerdo a su estructura. a) De acuerdo a su Punto Mximo se clasifican en Unimodal, Bimodal, y Multimodal. a.1) Curva Unimodal.- Se denomina a la curva de frecuencia que se registra en un solo vrtice. a.2) Curva Bimodal.- Es cuando la curva de frecuencia se registra en dos vrtices. a.3) Curva Multimodal.- Es cuando la curva de frecuencia se registra en mas de dos vrtices.
elaborado por: msc. gustavo roger gomez suarez
b) De acuerdo a su Estructura se clasifica en Positiva, Simtrica Negativa, y Curva Simtrica.
Simtrica
b.1) Asimtrica Positiva.- Es cuando la curva se desplaza hacia la derecha. b.2) Asimtrica Negativa.- Es cuando la curva se desplaza hacia la izquierda. b.3) Simtrica Perfecta.- Es cuando la curva se desplaza hacia ambos lados del punto mximo.
Las Frecuencias Absolutas Acumuladas Ascendentes y Descendente,se las puede representar mediante diferentes tipos de curvas denominadas OJIVAS las cuales se clasifican en funcin a la marca de clases y en funcin de los limites reales. a) En funcin a las marcas de clases se clasifican en Ojivas Suavizadas Ascendente y Ojivas Suavizadas Descendente. a.1) Ojivas Suavizadas Ascendentes.- La representacin grfica se la efecta en base a la frecuencia absoluta acumulada ascendente en relacin con la marca de clases.
20 15 10 5
Fi
0 1 18.5 2 35.5 3 52.5 4 69.5 5 86.5
Yi
elaborado por: msc. gustavo roger gomez suarez
a.2) Ojivas Suavizadas Descendente.- La representacin grfica se la realiza en base a la frecuencia absoluta acumulada descendente, en relacin con la marca de clases.
20
Fi
15 10 5 0 1 18.5 2 35.5 3 52.5 4 69.5 5 86.5
Yi b) En funcin a los limites reales de los intervalos de clase.Se clasifican en Ojivas escalonadas ascendentes y Ojivas escalonadas descendente. b.1)Ojivas Escalonadas Ascendente.-La representacin grfica se la efecta en base a las frecuencias absolutas acumuladas ascendente con relacin a los limites reales de los intervalos de clase.
Fi
(Yi-1) (Y)
b.2)Ojivas Escalonada Descendente.-La representacin grfica se la realiza en base a las frecuencias absolutas acumuladas descendente con relacin a los limites reales de los intervalos de clase. Fi
(Yi-1) (Y)
elaborado por: msc. gustavo roger gomez suarez
- Las Frecuencias Relativas Porcentuales(Simples).- Se las puede representar mediante diagramas de forma circular tomando como referencia que el total de la circunferencia es igual al 100% de la informacin . Dicha representacin grfica se la conoce con el nombre de Ciclograma.
0.20
0.27
hi
0.20 0.20 0.13
5.2 Otras Grficas .- Cuando se trabaja con datos no tabulados, a veces es necesario la graficacin con la finalidad de una mejor interpretacin de la informacin. Para este caso se pueden utilizar diagramas de bases simples, barras compuestas, barras proporcionales etc.
FIN
elaborado por: msc. gustavo roger gomez suarez