ESTADISTICA APLICADA A
LA PSICOLOGÍA.
INFERENCIAL.
LAURA GUERRERO CALDERÓN
JAIME Y BEGOÑA SEP-DIC 2021
Tema 1. Conceptos fundamentales de estadística inferencial.
Presentación de los contenidos
Una variable tiene efecto sobre otra, si hay diferencia entre sujetos. Estas son las hipótesis que
se contrastan con los modelos estructurales o de efectos.
El modelo de regresión (análisis de regresión): modelos predictivos. Una variable explica otra.
Por ejemplo, un test de aptitudes.
1. Conceptos.
➢ Población y muestra
• La población o universo (N) se define como el conjunto de elementos (sujetos,
objetos, entidades abstractas, etc.) definido por una o más características, en común.
Dependiendo del número de elementos pueden ser finitas o infinitas.
• Tamaño de muestra: determinar antes de comenzar la investigación para evitar
pérdida de recursos y obtener información fiable.
• La muestra (n) es un subconjunto de unidades o elementos de análisis de una
(pertenecientes) población, que son representativas (cantidad idónea) de las
características (número) de dicha población.
1
La muestra tiene que ser representativa. Por ejemplo,
calidad de vida en enfermos con Alzheimer, conjunto de
personas con Alzheimer que vive en el entorno familiar
(estas son las características que definen mi población)
esto determina los criterios de inclusión en la muestra.
➢ Parámetro y estadístico
• Parámetro: es una medida cuantitativa (valor, medida, número o indicador)
representativa de una población en una variable concreta. Es un valor numérico que
describe una característica de una población. Su valor es desconocido, pero constante
o fijo para cada población. Se supone un valor constante.
• Estadístico: es una mediad cuantitativa (valor, mediad, número o indicador) que
describe a una muestra determinada en una variable concreta. Su valor es conocido y
variable, dependiente de la muestra en la que se calcula.
➢ Inferencia estadística.
Definición de estadística: es la ciencia que se encarga de recoger, ordenar y analizar los datos
de una muestra extraída de cierta población y que, a partir de esa muestra, valiéndose del
cálculo de probabilidades, se encarga de hacer inferencias acerca de la población. (Amón, 1993).
Líneas de desarrollo de la Estadística.
Históricamente, la estadística ha tendido a dividirse en dos grandes ramas:
• Descriptiva: está relacionada con el resumen y organización de datos, su
representación gráfica y el cálculo de sus valores representativos (estadísticos). Tiene
como objetivo el estudio de los estadísticos de las muestras.
• Inferencial: Está relacionada con el proceso de emplear un número reducido de datos
para tomar decisiones y efectuar descripciones generales. Tiene como objetivo
fundamental conocer un conjunto de objetos (población) a partir de un subconjunto
del mismo (muestra); es decir, inferir los parámetros de la población a partir de los
estadísticos de las muestras.
2
Inferencia estadística: consiste en extraer conclusiones de tipo general, referidas a
propiedades de la población, a partir de datos concretos –estadísticos-, obtenidos en
una muestra representativa de esa población. Esto exige la utilización de, por un lado,
procedimientos que nos ayuden a efectuar este salto (inducción, inferencia, análisis)
de lo particular a lo general, y por otro, procedimientos que nos garanticen que la
inducción efectuada se apoya en una buena base (selección, muestreo).
Inferir es ir de algo concreto, como es una muestra, hasta algo más general, el estudio de la
población. Ir de lo articular a lo general, lo que se materializa en el proceso inductivo.
o Razonamiento deductivo: proceso por el que se atribuye a lo particular las
propiedades de lo general (general → particular).
o Razonamiento inductivo: proceso que consiste en afirmar que lo que es cierto en
algunos casos lo es también en todos (particular → general). Se conoce también como
proceso de generalización.
En la inferencia, el hecho de no conocer el conjunto total hace que todas las conclusiones que
se extraigan utilizando este razonamiento contengan incertidumbre. El papel de la Estadística
inferencial va a consistir en cuantificar esta incertidumbre. Por lo tanto, estas inferencias
nunca serán exactas, siempre habrá un margen de error que controlaremos mediante la
probabilidad; aunque nunca alcanzaremos una probabilidad de cometer error igual a cero,
intentaremos que sea la menor posible.
2. Muestreo y tipos de muestreo
• Muestreo: se define como la selección de un subconjunto de unidades o elementos de
análisis que se consideran representativos de la población a la que pertenecen, con la
finalidad de estudiar las características de la población.
También puede definirse como el proceso seguido para extraer una muestra de una
población. Es necesario, ante todo, utilizar muestras representativas del total de la
población objeto de estudio. El tamaño de muestra debe determinarse antes de
comen zar la investigación para evitar la pérdida de recursos y obtener información
fiable.
3
➢ Muestreo probabilístico o aleatorio. (técnicas)
Son los métodos basados en el principio de equiprobabilidad, es decir, aquellos en los que
todos los individuos de la población tienen la misma probabilidad (conocida o calculable) de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles
muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Son las más
recomendables.
Como ventajes: son los más rígidos, evitan sesgos y aseguran la representatividad de la
muestra extraída.
Como inconvenientes: son muy costosos y en cuento a su técnica de muestreo: presentan
✓ Muestreo aleatorio simple.
o Procedimiento. (extracción de elementos)
1. A cada unidad de la población se le asigna un número, es decir, se
enumera la población de 1 a N, asignando un ordinal a cada elemento.
Después se fija el tamaño muestral (número de personas que
formaran parte de la muestra. (n)
2. Se genera una secuencia de números aleatorios igual al tamaño de la
muestra determinado por el medio elegido. (bolas dentro de una
bolsa, tabla de números aleatorios o por un programa informático).
3. Las unidades que tienen asignados los números generados son
incluidas en la muestra.
o Tipos.
▪ Muestreo aleatorio con reposición: los elementos son repuestos a la
población. La población (N) es siempre constante.
▪ Muestreo aleatorio sin reposición: los elementos no son repuestos a
la población. Considera la población (N) como infinita.
o Ventajas: es un procedimiento sencillo.
o Inconvenientes: tiene poca utilidad práctica cuando el tamaño de la
población es muy grande porque el coste en recursos es elevado.
✓ Muestreo aleatorio sistemático.
o Procedimiento.
1. A cada unidad de la población se le asigna un número, es decir, se
enumera la población de 1 a N, asignando un ordinal a cada elemento.
Después se fija el tamaño muestral (número de personas que
formarán parte de la muestra)
2. Se calcula el llamado coeficiente de elevación (k), siendo k el resultado
𝑁
de dividir el tamaño de la población entre el tamaño de la muestra k= 𝑛
3. Se elige al azar un número (i -i/a-), que se denomina de origen o
arranque. El número i será un número entre 1 y k. (i≤k)
4. Se incluirán en la muestra las unidades que ocupan los lugares i, i + k, i
+2k, i + 3k, … i + (n-1) k.
Ej. K = 21/3 = 7.
i/a=2 (arranque)
i/a +k → 2+ 7 = 9,
i/a + 2k → 2 + 2*7= 16. Las personas que componen nuestra muestra son 2, 9 y 16.
Solo se puede usar si la población es finita →K = N/n → 360 /18 = 20 → K = 20 a = 3
a, a + k, a + 2k, a +3k, …, a +(n-1) → 3, 23, 43, 63, 83, …. 343((3+(360-20)))
4
o Ventajas: proporciona muestras más representativas que el aleatorio
simple, porque asegura que en la muestra aparecerán elementos de la
población de todas las clases.
o Inconvenientes: cuando en la disposición ordenada de los elementos de la
población existe una periodicidad coincidente con el de la muestra, este
procedimiento proporcionará muestras sesgadas. (prohibido en las poblaciones
ordenadas).
✓ Muestreo aleatorio estratificado.
o Procedimiento.
1. Se subdivide la población en subgrupos o estratos que poseen gran
homogeneidad respecto a alguna característica (por ejemplo, el sexo, el
estado civil, la profesión, lugar de residencia, etc.)
Principios:
- Homogeneidad entre los elementos de la población dentro de los
estratos.
- Heterogeneidad entre los estratos.
Es decir, (1) se subdivide la población en subgrupos o estratos, de tal forma
que exista una gran variabilidad (heterogeneidad – fuera-) entre los estratos y
muy poca variabilidad (homogeneidad -dentro-) entre los elementos de la
población, dentro de los estratos.
(2) Después se enumeran a los participantes dentro de cada estrato, de 1 a N.
(3) Se calcula la proporción de cada estrato. Es decir, se calcula la distribución
del tamaño de la muestra en los diferentes estratos, lo que se conoce como
afijación. Afijación: distribución del tamaño de la muestra en los diferentes
estratos. Criterios:
- Afijación igual: mismo número de elementos muestrales en cada
estrato. N= 10 → 5 y 5 (h/m) fijación es igual.
- Afijación proporcional: número de elementos muestrales en función
del tamaño de cada estrato en la población. N= 10 →6/4 (m/h)
fijación proporcional – muestra más representativa.
2. (4) Se selecciona aleatoriamente las unidades de análisis dentro de cada
estrato de la muestra, utilizando el muestreo aleatorio simple o
sistemático.
o Ventajas: proporciona muestras más representativas cuando en la población
existen grupos diferenciados porque asegura que todos los estratos estén
representados en la muestra.
o Inconveniente: exige un conocimiento detallado de la población para definir y
separar los estratos, y para decidir la muestra que se ha de seleccionar en cada
estrato.
5
✓ Muestreo aleatorio por conglomerados.
o Procedimientos.
1. Se selecciona aleatoriamente como unidades muestrales un número
de conglomerados, grupo de elementos de la población que forma
una unidad, hasta alcanzar el tamaño muestral establecido.
Principios.
- Heterogeneidad entre los elementos de la población dentro
de cada conglomerado.
- Homogeneidad entre los conglomerados.
Es decir, se subdivide la población en subgrupos o conglomerados,
de tal forma que exista una gran variabilidad (heterogeneidad)
dentro de cada conglomerado, entre los elementos y muy poca
variabilidad (homogeneidad) entre los conglomerados.
2. Se incluyen en la muestra todos los elementos de análisis
pertenecientes a los elegidos o se eligen de manera aleatoria dentro
de cada conglomerado.
o Ventajas: se utiliza cuando es imposible o poco práctico elaborar un listado
completo de los elementos de la población.
o Inconvenientes: exige un conocimiento detallado de la población para
identificar los conglomerados.
➢ Muestreo no probabilístico o no aleatorio.
Métodos donde no todos los individuos de la población tienen la misma probabilidad de ser
seleccionados (no se basan en el principio de equiprobabilidad).
Los inconvenientes que presenta son: ser menos rigurosos, no garantizar la representatividad
de la muestra, poder dar lugar a datos sesgados y tener una capacidad limitada para plantear
conclusiones generales. Pueden ser adecuados para estudios exploratorio (en fases
preliminares).
✓ Muestreo por Cuotas. (es lo mismo que la fijación proporcional en el caso del estratificado)
o Procedimiento.
1. Se fijan las cuotas (variables de interés), número de unidades de análisis
que reúnen determinadas características.
2. Se incluyen en la muestra los primeros elementos de análisis que se
encuentren y que cumplan las características fijadas.
o Ventajas: facilita el reclutamiento de la muestra.
o Inconvenientes: exige el conocimiento de los grupos de interés y de las
unidades de análisis para los fines de la investigación.
✓ Muestreo de conveniencia.
o Procedimiento.
1. Se incluyen en la muestra los elementos de análisis disponibles. Se utilizan
como muestra los individuos a los que se tiene fácil acceso (los profesores
de universidad emplean con mucha frecuencia a sus propios alumnos). Un
caso particular es el de los voluntarios.
o Ventajas: facilita el reclutamiento de la muestra
o Inconvenientes: no existe control sore la representatividad de la muestra.
6
✓ Muestreo de bola de nieve.
o Procedimiento.
1. Se identifican algunas unidades de análisis.
2. Estas unidades de análisis conducen a otras, y estas a otras, y así hasta que
se consigue una muestra de acuerdo con el tamaño fijado.
o Ventajas: adecuado cuando se seleccionan muestras en poblaciones de difícil
acceso, como poblaciones marginales.
o Inconvenientes: no existe control sobre la representatividad de la muestra.
3. La lógica de la inferencia estadística.
Dentro de la inferencia estadística, existen dos acciones principales que se llevan a cabo:
• Estimación de parámetros: asignar a una población las propiedades obtenidas en una
muestra extraída de dicha población. (tema2)
• Contraste de hipótesis: comprobar si una afirmación sobre una propiedad poblacional
puede ser mantenida a partir de la información obtenida en una muestra extraída de
dicha población. (tema3)
4. Distribuciones muestrales.
• Definiciones.
o Parámetro: valor numérico que describe una característica de una población:
- Valor desconocido. // - Valor constante o fijo.
o Estadístico: valor numérico que describe una característica de una muestra. Se
calcula a partir de datos muestrales, por lo que es conocido. Tiene un valor
variable que depende de la muestra en la que se calcula (variable aleatoria).
o Estimador: es un estadístico utilizado para conocer el parámetro desconocido
de la población. Para cada parámetro pueden existir diferentes estimadores.
“Es una variable aleatoria (estadístico) formada por los valores de
determinado estadístico obtenido a partir de las infinitas muestras del mismo
tamaño n que se pueden extraer de una población”.
o Estimación: proceso que consiste en atribuir a un parámetro el valor tomado
por su correspondiente estadístico.
o Distribución muestral del estadístico: distribución de probabilidad de un
estadístico en la que se conoce la probabilidad asociada a cada valor.
Distribución teórica que asigna una probabilidad concreta a cada uno de los
valores que puede tomar un estadístico en todas las muestras del mismo
tamaño que es posible extraer de una determinada población. Las
distribuciones muestrales son constructos matemáticos teóricos y no se
pueden general empíricamente. Cada distribución muestral representa a un
estimador y es específica para él.
Sus características son:
- Forma: distribuciones teóricas a la que se acomoda o ajusta cada
estimador (z, t,x2, F).
- Media o valor esperado de la distribución muestral, que
generalmente coincide con el parámetro.
- Varianza de la distribución muestral.
7
Error típico del estadístico: desviación típica de la distribución
muestral. Se obtiene calculando la raíz cuadrada de la varianza de la
distribución muestral.
Forma Varianza
Media
8
Ejemplos. Cálculo de la Distribución muestral de la Media.
Calcular la media de la media (media de
distribución muestral). → 3
Calcular la varianza en muestra (varianza de la
distribución muestral) 2 → 0.33
Calcular la deviación típica → 6.12
Obtenemos la distribución del estadistico media.
Calculamos la media y desviación típica de la distribución muestral del estadístico media.
Ejercicios Técnicas de muestreo.
Seminario 1. Contextualización del análisis de datos en el proceso de investigación:
la fase estadístico-analítica.
9
Tema 2. Estimación de parámetros.
1. Concepto.
• Estimación de parámetros: consiste en plantear propiedades de la población a
partir de la información obtenida en una muestra. Se asigna valores a los
parámetros de la población a partir de los datos obtenidos en una muestra.
Por lo tanto, la estimación es el proceso por el cual se determina el valor de un
parámetro desconocido a partir del estadístico conocido de una muestra. Existen dos
tipos: la estimación puntual de parámetros y la estimación intervalar o por intervalos
de parámetros.
2. Estimación puntual.
• Estimación puntual: consiste en asignar a un parámetro poblacional el valor
concreto del correspondiente estadístico utilizado como estimador, obtenido en
una muestra perteneciente a dicha población. El valor muestral concreto
dependerá del método de estimación:
o Método de los momentos. Igualar las características muestrales a las
características de la población.
o Máxima verosimilitud: elegimos, dentro de la muestra, la estimación del
parámetro cuya probabilidad de ser cierta sea máxima.
o Mínimos cuadrados. (tema5, regresión).
3. Propiedades de los estimadores.
• Carencia de sesgo: Un estadístico es un estimador insesgado si se espera que su
valor esperado coincida con el valor del parámetro que se estima. Ofrece, en
promedio, estimaciones correctas. Expectativa o esperanza matemática o valor esperado
Media = E
La media, la cuasivarianza y la proporción son estimadores insesgados. La varianza
y el coeficiente de correlación de Pearson son estimadores sesgados
• Consistencia: Un estadístico es un estimador consistente del parámetro si
conforme aumenta el tamaño de la muestra, aumenta la probabilidad de que el
estadístico utilizado como estimador coincida con el parámetro estimado.
La media, la cuasivarianza y la proporción son estimadores consistentes. La
varianza es un estimador consistente de la varianza poblacional, dado que a
medida que se incrementa el tamaño de la muestra, el sesgo disminuye.
• Eficiencia: Un estimador es más eficiente cuanto menor es su varianza. Una mayor
eficiencia indica que el estadístico varía menos de muestra en muestra El
estimador es más eficiente que si:
La media es un estimador más eficiente que la mediana para estimar la media
poblacional. La varianza es más eficiente que la cuasivarianza como estimador de
la varianza.
10
• Suficiencia: Un estimador es suficiente si para estimar el parámetro utiliza toda la
información muestral relacionada con el parámetro. Y, por lo tanto, la estimación
del parámetro no puede ser mejorada considerando otros aspectos de los datos
no incluidos en el estimador.
La media, la varianza (sesgada -varianza- e insesgada -cuasivarianza-) y la proporción
son estimadores suficientes de sus respectivos parámetros
Un estadístico es tanto mejor estimador de un parámetro cuanto mayor número de
propiedades cumple.
4. Estimación por intervalos.
• Estimación por intervalos: consiste en obtener un rango de valores entre los que
se espera que se encuentre el verdadero valor del parámetro con una probabilidad
determinada.
Precisión de las estimaciones
• Error muestral: es la diferencia, en valor absoluto, entre el valor del estimador y el
valor del parámetro.
• Error muestral máximo de la estimación : distancia máxima que, con una
determinada probabilidad, esperamos que exista entre el valor del estadístico
utilizado como estimador y el verdadero valor del parámetro estimado.
• Intervalo de confianza (IC): rango de valores incluidos. Son los segmentos
(pictórica) en el continuo o en el rango de valores (numérica)incluidos del
segmento, en el que en algún punto se halla el valor del parámetro.
• Límites del intervalo de confianza (Li y Ls): los dos valores de los extremos que
delimitan el intervalo de confianza.
• Nivel de confianza (−): es la probabilidad de que el intervalo de confianza
incluya el verdadero valor del parámetro estimado.
• Nivel de riesgo o de significación (): Probabilidad de que el intervalo de
confianza no incluya el verdadero valor del parámetro. Riesgo de error de la
estimación.
11
• Características de los intervalos de confianza.
o Garantizar una alta probabilidad de incluir al parámetro estimado.
o Proporcionar una precisión de la estimación aceptable: tamaño de la muestra.
Niveles de confianza: 95% - 99
Niveles de significación: 0,05 - 0,01
Intervalos de confianza para los parámetros:
- Media.
- Proporción
- Varianza
- Correlación
- Diferencia de medias: M.
- Independientes y relacionadas.
- Razón entre varianzas
12
Ejemplo: distribución de parámetros
Media en una prueba de aptitud espacial de la población de alumnos de 2º de Psicología.
1. Estimación puntual.
2. Estimación por intervalos: Cálculo del Intervalo Crítico (IC)
a. Nivel de significación o riesgo de error: (α=.05)
b. Distribución muestral:
Media en una prueba de aptitud espacial de la población de alumnos de 2º de Psicología
1. Estimación puntual.
2. Estimación por intervalos: Cálculo del Intervalo Crítico (IC) - Nivel de significación o
riesgo de error: (α=.05)
a. Distribución muestral:
Ejercicio Distribuciones muestrales y estimación de parámetros.
Seminario 2. Los modelos estadísticos en el análisis de datos.
13
Tema 3. Contraste de hipótesis.
1. Concepto.
El contraste de hipótesis, también conocido como prueba de significación o prueba estadística,
consiste en comprobar si una proposición (afirmación) sobre una propiedad de la población
(forma o valor de un parámetro) puede ser aceptada a partir de la información obtenida en
una muestra perteneciente a dicha población. También puede definirse como el proceso de
decisión en el que una hipótesis estadística se pone en relación con los datos obtenidos en una
muestra para determinar si es compatible con ellos.
2. Supuestos: Contrastes paramétricos y no paramétricos.
Se conoce como supuesto al Conjunto de condiciones que se han de establecer y que se han
de cumplir para poder determinar la distribución de probabilidad en la que se basará la
decisión del contraste. Existen varios supuestos de análisis, los cuales pueden agruparse en:
- Supuestos acerca de la forma de distribución de la población de partida (normal
(supuestos de normalidad, etc.)
- Supuestos acerca de las características de la muestra utilizada y de los datos (nivel de
medida de las variables, número de casos, independencia de las observaciones,
homogeneidad de las varianzas, etc.).
Dependiendo del cumplimiento o no de los supuestos, del objetivo de la prueba y del tipo de
variable, podemos diferenciar entre contrastes paramétricos y contrastes no paramétricos.
• Contrastes paramétricos.
1) Contrastan hipótesis referidas a un parámetro poblacional.
2) Requieren el cumplimiento de determinados supuestos.
3) Analizan datos cuantitativos (escala de medida de intervalo o razón)
• Contrastes no paramétricos.
1) Contrastan hipótesis no referidas a un parámetro poblacional.
2) No requieren el cumplimiento de determinados supuestos.
3) Analizan datos ordinales y nominales
3. Lógica del contrate de hipótesis.
Una hipótesis es una conjetura acerca de la relación entre dos o más variables, la cual
responde a las preguntas planteadas por los problema u objetivos de la investigación. El
planteamiento o la formulación de hipótesis consiste en definir el problema de la forma más
simple posible y como una proposición lógica afirmativa. Existen dos tipos de hipótesis.
- Hipótesis científica: es un enunciado acerca de la relación entre dos o más variables.
- Hipótesis estadística: es una proposición referida bien a la forma de distribución de
probabilidad, bien al valor o valores de los parámetros que la definen, o bien a ambos.
➢ Planteamiento de hipótesis estadísticas.
Se formulan dos hipótesis estadísticas de forma conjunta, las cuales son complementarias y
mutuamente excluyentes.
o Hipótesis nula (H0): Hipótesis que se somete a contraste. Sobre la que
se toman las decisiones, la que se acepta o rechaza. Siempre recoge la
14
igualdad. Esta hipótesis se acepta cuando NO hay efectos significativos
de la VI en la VD (como las medias son iguales, la VI no tiene efectos
significativos).
o Hipótesis alternativa (H1): Hipótesis complementaria a la hipótesis
nula, e incluye todo lo que la hipótesis nula excluye. Se acepta cuando
SÍ hay efectos significativos de la VI en la VD (como las medias son
distintas, la VI si tiene efectos significativos).
Dependiendo de los signos que queden en las hipótesis, tendremos diferentes tipos de
contrastes.
o Contraste bilateral o no direccional.
No se plantea la dirección en la que se puede producir un resultado
muestral incompatible con la proposición establecida en H0.
o Hipótesis unilateral o direccional.
Se plantea la dirección en la que se puede producir un resultado
muestral incompatible con la proposición establecida en H0
➢ Obtención de evidencia empírica: el estadístico de contraste.
Estadístico de contraste: es el resultado muestral que proporciona información empírica en
relación con la proposición realizada en la hipótesis nula. Este estadístico es una variable
aleatoria con una distribución muestral conocida, a partir de la cual se va a tomar la decisión
respecto a la hipótesis nula en el contraste de hipótesis.
Estadístico − Parametro
Estadístico de contraste = Error típico
➢ Toma de decisión: reglas de decisión.
Las reglas de decisión son los criterios utilizados para decidir si la hipótesis nula ha de ser
aceptada o rechazada, a partir de la distribución muestral del estadístico de contraste. Estas
reglas son dos y ambas deben coincidir en su decisión: rechazar o aceptar la hipótesis nula.
• Puntos críticos: intervalo de confianza (IC)
o Región crítica o de Rechazo: valores de la distribución muestral del estadístico
de contraste que se alejan mucho de la media de la distribución de Ho, por lo
que es poco probable que ocurran si Ho es verdadera. Estos valores de
estadístico de contraste llevan a rechazar la hipótesis nula.
o Región de Aceptación: valores de la distribución muestral del estadístico de
contraste próximos a la media de la distribución de Ho, por lo que es probable
que ocurran si Ho es verdadera. Estos valores de estadístico de contraste
llevan a aceptar la hipótesis nula.
15
Delimitación de las regiones de aceptación y rechazo: nivel de significación ().
• Nivel crítico o probabilidad asociada al estadístico de contraste (p)
representa el nivel de significación, es decir, riesgo de error más
pequeño con el que se puede rechazar Ho con el estadístico de
contraste obtenido:
o Si el nivel crítico (p) es mayor que alfa () fijado a priori, no se
rechaza Ho, se acepta.
o Si el nivel crítico (p) es menor o igual que alfa () fijado a
priori, se rechaza.
Por lo tanto, la decisión estadística es:
• Rechazar H0: Si el valor de tal estadístico de contraste se encuentra en la zona crítica o
su probabilidad asociada es menor que el nivel de significación fijado.
o Hay evidencia empírica suficiente para decidir que esa hipótesis es falsa.
o Se puede afirmar, con un riesgo de p de equivocarse, que la hipótesis nula es
falsa.
• Aceptar H0: Si el valor de tal estadístico de contraste se encuentra en la zona de
aceptación o su probabilidad asociada es menor que el nivel de significación fijado.
o La hipótesis nula es compatible con los datos empíricos.
o No hay evidencia suficiente para decidir que es falsa.
16
4. Tipos de error, potencia y tamaño del efecto
• Error tipo I: Rechazar una H0 que es verdadera.
o Probabilidad de cometer Error tipo I: .
o Fijada por el investigador.
• Error tipo II: Aceptar una H0 que es falsa.
o Probabilidad de cometer Error tipo II: .
o Depende de:
▪ El verdadero valor de la media de la distribución de H1.
▪ El valor de .
▪ El error típico de la distribución muestral del estadístico: tamaño de la
muestra (n).
• Potencia del contraste (1-):
o Probabilidad de rechazar H0 que es falsa.
o Depende de:
▪ El verdadero valor de la media de la distribución de H1.
▪ El valor de .
▪ El error típico de la distribución muestral del estadístico: tamaño de la
muestra (n).
El último elemento a tener en cuenta en el contraste de hipótesis es el tamaño del efecto:
Medida del grado de discrepancia entre la H0 y la evidencia muestral.
• Corregir incidencia de:
o Nivel de significación () fijado.
o Tamaño de la muestra (n).
CONTRASTES DE HIPOTESIS PARA LOS PARÁMETROS
• MEDIA • CORRELACIÓN • DIFERENCIA DE MEDIAS: M. INDEPENDIENTES Y RELACIONADAS
• RAZÓN ENTRE VARIANZAS • DIFERENCIA ENTRE PROPORCIONES.
17
Ejemplo de: Contraste de Hipótesis.
1ª Hipótesis. Se quiere comprobar si existen diferencias significativas en aptitud espacial
en función del sexo (entre varones y mujeres).
Determinar:
1. Nivel de significación: (α=.05).
2. Parámetro sobre el que se va a realizar el contraste: δ= µg1-µg2 (diferencia de medias
para muestras independientes)
3. Distribución muestral:
➢ 1º. Planteamiento de las hipótesis estadísticas:
o Bilateral o no direccional:
➢ 2º. Cálculo del estadístico de contraste (to):
➢ 3º. Toma de decisión: (α = 0,05)
o Puntos críticos (tc).
18
2ª Hipótesis. Se quiere comprobar si el nivel en aptitud espacial de los varones es
significativamente superior al de las mujeres.
Determinar:
1. Nivel de significación: (α=.05).
2. Parámetro sobre el que se va a realizar el contraste: δ= µg1-µg2 (diferencia de medias
para muestras independientes)
3. Distribución muestral:
➢ 1º. Planteamiento de las hipótesis estadísticas:
o Unilateral o direccional:
➢ 2º. Cálculo del estadístico de contraste (to):
➢ 3º. Toma de decisión: (α = 0,05)
o Puntos críticos (tc).
19
➢ 3º. Toma de decisión: (α = 0,05)
o Probabilidad asociada (p).
Estimación diferencia.
Comparación estimación
Seminario 3. Fases en el análisis de datos para la comprobación de hipótesis
de investigación.
Ejercicio Contraste de Hipótesis.
20
Prácticas 1. Ejemplo contraste t diferencia de medias para muestras independientes
En un estudio, se ha tratado de comprobar si existen diferencias en función del sexo en el recuerdo de material
presentado de forma auditiva. Para comprobarlo se seleccionó una muestra de 56 estudiantes (28 varones y 28
mujeres). La presentación del material, una lista de 15 objetos de uso cotidiano se realizaba a través de unos
auriculares. Posteriormente, se pedía a los participantes en el estudio que escribieran en un folio en blanco el
mayor número posible de objetos que se le habían presentado, teniendo en cuenta que los errores no penalizaban
negativamente. La puntuación en la prueba era el número de objetos recordados correctamente. A continuación, se
presentan los resultados obtenidos.
varón 9,00
varón 3,00
varón 7,00
varón 9,00
varón 11,00
varón 3,00
varón 10,00
varón 7,00
varón 12,00
varón 9,00
varón 8,00
varón 13,00
varón 7,00
varón 2,00
varón 6,00
varón 7,00
varón 9,00
varón 6,00
varón 8,00
varón 11,00
varón 7,00
varón 5,00
varón 4,00
varón 3,00
varón 5,00
varón 4,00
varón 2,00
varón 3,00
mujer 9,00
mujer 8,00
mujer 7,00
mujer 9,00
mujer 6,00
mujer 11,00
mujer 10,00
mujer 7,00
mujer 8,00
mujer 11,00
mujer 8,00
mujer 8,00
mujer 12,00
mujer 10,00
mujer 5,00
mujer 7,00
mujer 9,00
mujer 4,00
mujer 11,00
mujer 2,00
mujer 8,00
mujer 5,00
mujer 7,00
mujer 8,00
mujer 5,00
mujer 10,00
mujer 6,00
mujer 3,00
21
A partir de estos resultados, ¿se puede afirmar que existen diferencias entre varones y
mujeres? (=0,05)
a) Indica qué modelo y técnica de análisis vas a utilizar. Justifica tu respuesta.
b) Plantea las hipótesis estadísticas.
c) Comprueba los supuestos e indica si se cumplen o no, incluyendo las representaciones
gráficas y los estadísticos que lo reflejen. Si no se cumplen toma las decisiones que consideres
oportunas.
d) Incluye la tabla de descriptivos con número de casos, medias y desviaciones típicas.
e) Plantea la conclusión a la que llegarías, reflejándolo con los resultados obtenidos.
f) Representa gráficamente los resultados. Procura que los gráficos tengan una presentación
atractiva.
22
Practica 2. Ejemplo contraste t diferencia de medias para muestras relacionadas
Un psicólogo especializado en investigación comercial quiere determinar si la publicidad en los
periódicos incide en el nivel de ventas. Para realizar este estudio elige, de manera aleatoria, 14
artículos de una determinada marca cuyos precios son competitivos, y registra la cantidad
vendida de cada producto durante un periodo de una semana. Luego, sin modificar el precio,
coloca un anuncio en un periódico, donde promociona los 14 artículos. De nuevo, registra la
cantidad vendida durante la semana posterior a la aparición del anuncio. A continuación, se
presentan los resultados:
A partir de estos resultados, ¿puede afirmar el psicólogo que la publicidad ha sido eficaz?
(=0,05)
a) Indica que técnica de análisis vas a utilizar. Justifica tu respuesta.
b) Plantea las hipótesis estadísticas.
c) Comprueba los supuestos e indica si se cumplen o no, incluyendo las representaciones
gráficas y los estadísticos que lo reflejen. Si no se cumplen toma las decisiones que consideres
oportunas.
d) Incluye la tabla de descriptivos con número de casos, medias y desviaciones típicas.
e) Una vez obtenidos los resultados, plantea la conclusión a la que llegarías, reflejándolo con
los resultados.
f) Representa gráficamente los resultados. Procura que los gráficos tengan una presentación
atractiva
23