Estadistica
• Es la ciencia que se ocupa de organizar y analizar los que datos que provienen
de las muestras y también de realizar inferencias acerca de la población que
estas proceden.
• Es un conjunto de técnicas.
• Resumir y transformar la información en cuantitativa.
• Trabaja con la población no le interesa el sujeto individual y trabaja con
OM
variables( 2 o modalidades) deja de lado a las constantes (una característica
fija).
Estadística descriptiva
Es la mas antigua y la más fácil de utilizar ya que sabiendo las 4
operaciones básicas de la matemática se puede llevar a cabo. Obtiene, resume
.C
y transforma la información los datos para que se pueda interpretar la info.
(1era parte de la materia)
DD
Estadística inferencial
(2da parte de la materia) es mas compleja ya que se basa en las
teorías de las probabilidades y puede inferir conclusiones validas para toda la
población. BUSCA GENERALIZAR LOS RESULTADOS.
LA
- Unidad de análisis son los individuos que pueden ser (plantas/objetos) de
los cuales queremos obtener la información.
- Población: siempre está asociada al conjunto de individuos. Todos en una
población tenemos al menos una característica en común por eso es una
FI
población. Pueden ser finitas o infinitas. Finitas es cuando conocemos su
tamaño. Infinita es cuando no podemos conocer su tamaño (ejemplo si
quisieras saber todos los promedios de los estudiantes de psico del pasado,
presente y futuro.
- Población de individuos: es el conjunto de los elementos sobre los cuales se
observan al menos una característica de interés. (ADOLESCENTE DE CABA)
- Población de observaciones: es el conjunto de todos los valores que puede
tomar una variable estadística sobre la población de individuos. ( la edad de
los adolescente de CABA)
Muestra
Parte o subconjunto de la unidad de análisis de una población (marco de
referencia). Las poblaciones por lo general son muy numerosas entonces lo
Este archivo fue descargado de [Link]
que se hace es una muestra. Ejemplo voy a sacarme sangre y solo toman
una muestra. Tiene que ser representativa y es al alzar. (Básquet)
Muestra de individuos: es una parte o subconjunto de una población de
individuos.
Muestra de observaciones: es el conjunto de valores que toma una variable
estadística sobre una muestra. Es el subconjunto de la población de
observaciones.
PARAMETRO
OM
Es una propiedad descriptiva de la población. Por lo general su valor no es
conocido por el investigador y es a lo que se quiere llegar. (Parámetro seria
tiempo promedio).
Estadístico es una propiedad descriptiva de una muestra por lo
general su valor es conocido por el investigador por la info que presenta
.C
muestra. Variable porque depende de la muestra que salga seleccionada.
Estimador es un estadístico que se utiliza para conocer el valor de un
DD
parámetro desconocido.
Si no se tienen parámetros poblaciones se calcula con el estadístico.
Variable
LA
Propiedad o cualidad de los individuos de una población y nos interesa
estudiar porque cada individuo presenta distintas modalidades. Ej: sexo,
edad, tipo de trastorno.
Variable estadística: es una representación de una variable. Se obtiene
FI
mediante algún procedimiento de medición. Gracias a la
operacionalización de las variables sabemos que registrar y que modo.
Variable que no directamente observables: constructos teóricos
“construcciones teóricas”.
Modalidad es cada uno de las maneras que se representa una
característica. Ej estado civil modalidades casado, soltero.
Mutuamente excluyentes (CADA OBSERVACION INCLUIDA A UNO Y SOLO
UNA CLASE) y exhaustivas(UNA CLASE POR MODALIDAD).
• Las variables se van a clasificar dependiendo el valor que tomen en
VARIABLE CUALITATIVA son características que indican atributos o cualidades
no puede ser cuantificadas y no tienen ningún tipo de orden. Nos va a indicar si
los elementos son diferentes o iguales .Ninguna es mejor que la otra. EJEMPLO
SEXO,TIPO DE TRANSTORNO.
Este archivo fue descargado de [Link]
Variable CUASI CUANTITATIVA sus valores indican orden o jerarquía pero no
cantidad. Ademas de informar si los elementos son diferentes o iguales
también no va a indicar el grado que posee. Siempre suele por arracar con
rango de o nivel de entre otras. Ejemplo: Nivel de escolaridad.
Variable Cuantitativa expresan cantidad numéricas. Podemos indicar
cantidad. Ejemplo EDAD, PUNTAJE DE TEST DE PUNTACION.
Se puede clasificar en discretas ( los valores son puntos aislados y el valor es
consecutivo de otro valor, no se permiten decimales) Ejemplo CANTIDAD DE
OM
SUICIDIOS. NUMERO ENTERO.
Continuas: Pueden tomar cualquier valor dentro del intervalo numérico.
Ejemplo test de alcoholemia.
Medición la medición es relacionar un sistema relacional empírico con un
sistema relacional numérico mediante reglas determinadas. (ASIGNAR ELEMENTOS DE
.C
UN CONJUNTO DE CARACTERISTICAS).
NIVELES DE MEDICION: Existen 4 NIVELES de medición, a medida que se avanza va
incorporando las propiedades del otro. Los modelos desarrollados se la llaman escala.
DD
Nivel nominal este nivel lo único que puede hacer es nominar algo, designar atributo.
La relación entre los valores es que vamos a saber si son iguales o diferentes.
CUALITATIVA.
LA
NIVEL ORDINAL Este nivel se puede nominar y además va a establecer un orden o una
jerarquía de los valores. Permite saber si algo es mayor o menor. CUASICUANTITATIVA
NIVEL INTERVALAR Incluye unidad de medida. Permite saber la distancia entre los
valores pero el 0 es no es arbitrario. El 0 no esta tomado como ausencia de
FI
característica. 0 grados
NIVEL DE RAZON Permite establecer proporciones. El 0 es absoluto se plantea como
ausencia de características. 0 hijos.
UNIDAD 2
Matriz de datos: cada fila representa a un individuo y cada columna es un aspecto del
individuo que posee la info de interés.
Cuando la info recolectada es muy grande se hace difícil poder interpretarla por eso se
utilizan las distribuciones de frecuencia que son agrupaciones de los datos en tablas o
gráficos para poder ver la información de una manera mas directa y práctica. Esta
compuesto por los valores de la variable y las veces que estos se repiten. Podemos
observar como se distribuyen los datos a lo largo del recorrido de la variable, donde
están los concentrados y los extremos. Hay diferentes tipos de frecuencia.
Este archivo fue descargado de [Link]
Frecuencia absoluta es la cantidad de veces que se repite determinada modalidad de
la variable. La suma de todas siempre debe ser igual al total de las observaciones .
Frecuencia relativa se obtiene al % la FA por el total de los elementos de una muestra.
NO PUEDE DARSE frecuencia negativas ni mayores a 1. Sus valores siempre varian
entre 0 y 1.
Frecuencia porcentual es la relativa multiplicada por 100. Siempre tiene que dar 100%.
Frecuencia Acumulada es la cantidad de observaciones acumuladas hasta
determinado modalidad de la variable. TIENE SENTIDO SOLO en medición
OM
ordinal,intervalar y de razón.
Podemos comparar grupos de tamaño similar frecuencia absoluta y tamaños distintos
frecuencia relativa o porcentual.
• Los gráficos son la posibilidad de presentar los valores de las frecuencias de una
manera mas directa y de fácil interpretación.
.C
CUALITATIVAS A NIVEL NOMINAL: DIAGRAMA CIRCULAR O PICTOGRAMA O
DIAGRANA DE BARRAS.
DD
CUASICUANTITATIVAS A NIVEL ORDINAL: DIAGRAMA DE RECTANGULOS.
CUANTITATIVA DISCRETAS Diagrama de barras o POLIGONO DE FRECUENCIAS,
Diagrama de tallo y hoja, o diagrama de puntos.
CUANTITATIVA CONTINUA Histograma, POLIGONO DE FRECUENCIAS.
LA
UNIDAD 3
FI
Los gráficos no son resúmenes estadísticos porque se presenta toda la información
recogida. Siempre es mas practico tener la información resumida. Los resúmenes
estadísticos resumen la información contenidas en las observaciones realizadas en los
individuos de una muestra. Es una característica de las distribuciones frecuenciales,
dan una idea del comportamiento de los datos. Se intenta resumir lo que paso en la
muestra con respecto a la variable que interesa
Medidas de tendencia central Resume en un solo valor de la variable la tendencia
general que se observa en la distribución de frecuencia. Se utilizan índices para
conocer este valor general. Se miden en la misma unidad de medida que la variable.
MODA es el valor mas frecuente observado, variable con mayor frecuencia absoluta.
Puede darse de 2 tipos de moda: amodal misma distribución y bimodal es cuando se
presenta 2 valores con misma y máxima frecuencia. Se utiliza cuando se quiere
explicar rápidamente lo que es una medida de t c, cuando se quiere conocer el valor
mas usado y se la puede utilizar en cualquier tipo de variable.
Este archivo fue descargado de [Link]
MEDIANA es una puntación superada por la mitad de las observaciones pero no por la
otra mitad . Se puede utilizar cuando se presenten puntajes extremos. La desventajas
es que no permiten demasiados operaciones algebraicos. Se presenta cuando la
distribución presenta intervalos abiertos. Puede darse 2 casos : observaciones impares
se saca el valor extremo y cuando son pares se utiliza la media.
MEDIA ARIMETRICA es el índice mas utilizado, se representa con la letra x, es el
promedio que se obtiene dividiendo los valores observados por el numero de ellas. Si
tenemos valores extremos se altera mucho. Se utiliza en variable cuantitativas. A nivel
intervalar
OM
5 propiedades
1) La suma de las puntuaciones diferenciales son igual a 0.
2) Si sumamos una constante (un numero cualquiera) al conjunto de
puntuaciones la media va a quedar aumentada en el valor de la constante.
3) Lo mismo para que si multiplicamos por una constante la media va a quedar
.C
multiplicada por la misma constante.
4) Siempre el valor obtenido tiene que ser dentro del campo de la variabilidad ( si
tengo media 2 3 4 no puede dar 6)
DD
5) La media arimetrica de una constante siempre es igual a la constante.
Medidas de Variabilidad
LA
ES UNA UNIDAD MAS DE MEDIDA MAS ESPECIFICA. Dos conjuntos de datos con igual
media puede significar situaciones diferentes. Se refiere a cuan dispersos o
concentrados se encuentra .Esta propiedad nos indica cuanto difieren los valores entre
si, refiere al grado de concentración de las observaciones. Cuestionan la
representividad de las MTC. Expresan hete o homo de la distribución. Hay menor
FI
variabilidad si hay mayor concentración de los casos en uno o unos pocos valores de la
variable. MAS HOMOGENEOS. Hay mayor variabilidad mayor dispersión de los casos
en el recorrido de los valores de la variable. Mas HETERO. No toman como referencia a
la media AMPLITUD TOTAL , ENTRIOPIA Y SEMIINTERCUARTIL.
Diferentes medidas que señalan la variabilidad (cuantitativas)
Entropia moda y entropía relacionadas, extracción al azar. MAS ENTROPIA MENOS
REPRESENTATIVA MODA.
RANGO diferencia entre el mayor y menor valor. Diferencia entre los valores extremos.
No es muy utilizado ( cuestiona media)
Amplitud semi cuartil diferencia entre el primer y el tercer cuartil % por 2.
Varianza por las compensación + y – una manera de solucionar el problema es
tranformar las diferencias elevándolas al cuadrado. Es una distancia promedio al
Este archivo fue descargado de [Link]
cuadrado. Siempre es positiva, toma valores + o igual a 0. A MAYOR DESVIO O
VARIANZA MENOS REPRESENTATIVA LA MEDIA, MAS HETEROGENA.
Desviación típica deriva de la varianza, es la raíz cuadrada de la varianza, es una
distancia pero si estar elevada al cuadrado, no se puede calcular si no tiene varianza.
La varianza y el desvió se miden en la misma unidad que la variable y cuestionan a la
representatividad de la media.
Coeficiente de variación cuando el desvio y varianza no son adecuados aparece CV. ES
ADIMENSIONAL ( no tiene unidad de medida) y se utiliza para comparar medias
OM
diferentes y variable de distintas naturalezas. Se utiliza en variable cuantitativas y a
nivel de razón. Tambien cuestiona la media entonces a mayor CV MENOS
REPRESENTATIVA LA MEDIA. Se calcula desviación estándar % media y se la multiplica
por 100.
.C
MEDIDAS DE POSICION O CUANTILES
Sirven para entender como se sitúa una puntuación con respecto a su grupo de
DD
referencia indiciando que % de la muestra queda por debajo de un valor determinado
de la variable. – SE MIDEN EN LA MISMA UNIDAD QUE LA VARIABLE. – SE PUEDE
CALCULAR A PARTIR DE NIVEL ORDINAL. – SIEMPRE SON VALORES DENTRO DEL
RECORRIDO DE LA VARIABLE.
Centiles o Percentiles: son 99 valores de la variable que van a dividir a la distribución
LA
de la frecuencia en 100 secciones, cada sección le corresponde una centésima. Son lo
mas utilizados en psico. Los centiles se simbolizan con la letra C o P Y tienen un
subíndice que es k, centil k, el valor K es el rango percentilar que es el porcentaje de
observaciones que es superado por un valor de la variable.
FI
Deciles 9 valores de la variable que dividen en 10 secciones, Cuartiles son 3 que
dividen en 4.
ASIMETRIA Cuando se concentran los valores mas bajo de la variable, asimetría +.
MODA MENOR QUE MEDIA. Cuando se concentran los valores mas altos la asimetría es
-. MODA MAYOR QUE LA MEDIA. Si es simétrica es 0, nula. Coinciden la moda,
mediana y media.
Curtosis: grado de apuntamiento de la curva.
Puntuaciones típicas se obtiene dividiendo puntuación diferencia y la desviación típica
(PUNTAJE Z) ADIMENSIONAL. Tiene características de tendencia central. Indican
cuantas desviaciones estándar por encima o por debajo de la media ubica el valor.
Tomar una puntación Z es simplemente asignar los datos en una distribución cuya
media sea 0 y desviación estander 1.
Este archivo fue descargado de [Link]
ESTADISTICA INFERENCIAL ( SEGUNDA PARTE DE LA MATERIA)
Se llama así porque a través de sus procedimientos realizamos inferencias
a nivel poblacional y para hacerlas se basa en la probabilidad.
Modelo teórico describen el comportamiento de la variable, describe como se
comportaría la variable de interés. Un modelo es una construcción teórica.
Lo que se quiere expresar se puede expresar mejor con la frecuencia relativa teórica,
porque es supuesta, son postuladas y le vamos a llamar probabilidades. La
probabilidad de un valor de la variable es la proporción de casos que se espera que ese
OM
valor. UN VALOR DE LA VARIABLE QUE NO PUEDE SER OBSERVADO ES IGUAL A 0.
LOS POSIBLES PERO RARO TENDRAN VALOR CERCANO A 0. Y LO QUE SEGURAMENTE
SE VAN A DAR TIENEN VALOR CERCANO A 1.
A partir de aquí se va a empezar a trabajar con variables aleatorias, es decir, que
.C
depende del azar.
La probabilidad tiene las mismas propiedad que la frecuencia relativa, no puede ser
negativo, la suma tiene que dar 1.
DD
En los modelos de probabilidad la media se obtiene sumando los productos de los
valores de la variable por sus correspondientes probabilidades. La varianza se obtiene
sumando los cuadrados de los desvíos a la media por la probabilidad correspondiente.
Y el desvió, todos estos parámetros.
LA
MODELO BINOMIAL es un modelo de probabilidades ( estos describen el
comportamiento de distintos tipos de variable). Se aplica para las variables
cuantitativas discretas. Tiene 2 parametros que son N ( Cantidad de ensayos) y P
(probabilidad de éxito) también Q que es la probabilidad de fracaso. (Se obtiene q
haciendo 1 – P), saber que cantidad de ensayos son éxito o fracaso en el experimento
FI
dicotómico ( porque tiene 2 opciones). Las variables dicotómicas admiten dos valores
que habitualmente se dan entre 0 y 1. Los valores de una variable binomial se van a
dar entre 0 y N. Se van a expresar como N+1. Se tienen que dar dos condiciones para
aplicar el modelo binomial : estabilidad que es CUANDO LA PROBABILIDAD DE ÉXITO
DEBE PERMANECER CONSTANTE EN LAS OBSERVACIONES N. Y la otra es la
independencia QUIERE DECIR QUE LOS ENSAYOS TIENEN QUE SER INDEPENDIENTES,
NO ESTAN CONDICIONADOS ENTRE SI.
MODELO NORMAL es un modelo de distribución muy utilizado en psicología y se da
en variables cuantitativas continuas. Sus parámetros son la media y el desvió
poblacional . En psicología tenemos varias variables que se ajustan a este modelo
(inteligencia). La curva normal tiene forma de la campana de GAUSS en la cual los
valores de mayor frecuencia van estar ubicados en el medio. Un desvió por encima y
por debajo de la media 68% dos desvió por encima y por debajo 95%.
Este archivo fue descargado de [Link]
Propiedades: es simétrica (la % en 2 y nos quedan dos partes iguales) con respecto a
una valor central en donde coinciden las moda , media y mediana.
Es asintótica quiere decir que la curva no va a tocar el ejes de la x salvo en infinito.
La mas importante es aquella con media 0 y desviación típica 1 .
Los puntos de inflexión van a estar dado por un desvió por encima y uno por debajo de
la media poblacional (1;-1). En una distribución sesgada a la izq la media es menor que
la mediana por ende a la derecha la media es mayor que la mediana.
PARAMETROS: SE SIMBOLIZAN CON LETRAS GRIEGAS (MEDIA POBLACIONAL O
OM
VARIANZA POBLACIONAL.
ESTADISTICO: SE CALCULA A PARTIR DE LAS OBSERVACIONES MUESTRALES ( MEDIA
MUESTRAL, VARIANZA MUESTRAL).Un estadístico también es una variable
La media muestral es una variable y tiene su propia distribución de probabilidad. Es
una distribución teorica que asigna una probabilidad a cada uno de los valores que
.C
pueda tomar la media muestral. Cuanto mas grande N de la muestra mas se parecerá a
la media muestral. Sigue la distribución normal con media igual a 0 y desviación típica
1.
DD
CONTRASTE DE HIPOTESIS
No toda muestra sirve para hacer inferencias se necesita que sea representativa, es el
instrumento estadístico que permite evaluar a partir de los datos de una muestra, la
LA
veracidad de las afirmaciones hechas sobre una población.
Hipótesis científica: es una afirmación a una o varias características de una población.
Es necesaria transformarla en una hipótesis estadística tiene que ser completamente
equivalente a la original pero represetentada de modo tal que sea factible analizar los
FI
datos mediante un método de inferencia y poder determinar su veracidad. ES
IMPORTANTE DEFINIR LA VARIABLE.
TEORIA DE CONTRASTE DE HIPOTESIS
En la prueba de hipótesis podemos decir que es en donde se realizan avances en la
ciencia. Se plantea 2 hipótesis mutuamente excluyentes
HIPOTESIS NULA: Es la única que vamos a poder rechazar o no rechazar. Todo el
procedimiento recae sobre ella. Cuando se mantiene es porque nada cambia.
HIPOTESIS ALTERNATIVA: Complementaria a la anterior, es la que propone el
investigador.
La característica que tienen los contraste de hipótesis es que a partir de la información
que provee una muestra hace que sea posible que la decisión tomada fuera errónea.
Depende de la muestra. Es posible cometer dos error que son:
Este archivo fue descargado de [Link]
Error de tipo 1, rechazar la hipótesis cuando es verdadera. Se denomina nivel de
significación. ALFA 0,05 a 0,01 son los valores habituales.
Error tipo 2, aceptar la hipotesis nula cuando es falsa. Se denomina BETA. Su valor no
puede ser fijado a priori depende del tamaño de la muestra.
Por controlar estos error es necesario basarlo en una serie de supuestos.
Regla de decisión los contraste de hip tienen una regla de decisión que permite
determinar si la hipotesis nula debe ser rechaza o no. Depende del estadístico de
prueba, de su distribución, del tipo de hip alternativa y también del ALFA .
OM
ZONA DE RECHAZO es el conjunto de valores del estadístico de prueba que hacen que
se decida si rechazar la hip nula o no. También existe una zona de aceptación que es el
conjuntos de valores estadísticos que hacen que se decida no rechaza hip nula.
Valor P: Implica hallar nuestro valor hipotetico si la hip nula fuera cierta.
SI EL VALOR P ES MAYOR AL NIVEL DE SIGNIFICACION SE ACEPTA LA HIP NULA POR LO
.C
TANTO SE RECHAZA LA ALTERNATIVA.
SI EL VALOR P ES MENOR AL NIVEL DE SIGNIFICACION SE RECHAZA LA HIP NULA.
DD
Contraste de hip para la media con sigma desconocido. El estadístico de prueba deja
de tener distribución normal y pasa a tener una distribución de probabilidad que se la
denomina T DE STUDENT depende de un solo parámetro que se denomina grados de
libertad, en este caso los grados de libertad son N-1.
LA
COEFICIENTE DE CORRELACION R DE PEARSON
Representado habitualmente con la letra R mide la relación lineal (asociación) entre 2
variables cuantitativas. Puede valer entre -1 y 1, no tiene unidad de medida. Si el valor
FI
del coeficiente se acerca a uno o a menos uno es FUERTE.
SI SE ACERCA A 0 LA INTENSIDAD ES DEBIL.
SI ES 0 ES QUE SON INDEPENDIENTES.
Cuando el COEFICIENTE es + es directa y cuando es – es inversa.
SOLO SE PUEDE DECIR SI SON DIRECTAS O INVERSAS LAS ORDINALES Y
CUANTITATIVAS. A LAS CUALI SOLO LE INTERESA SABER SI SON FUERTE O DEBILES.
Este archivo fue descargado de [Link]
OM
.C
DD
LA
FI
Este archivo fue descargado de [Link]