0% encontró este documento útil (0 votos)
32 vistas18 páginas

Proyecto Final

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
32 vistas18 páginas

Proyecto Final

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

MINISTERIO DE EDUCACIÓN

DIRECCIÓN REGIONAL DE EDUCACIÓN DE ANCASH

INSTITUTO DE EDUCACIÓN SUPERIOR TECNOLÓGICO PÚBLICO


“ELEAZAR GUZMÁN BARRÓN”

PROGRAMA DE ESTUDIOS
COMPUTACIÓN E INFORMATICA

PROYECTO DE INVESTIGACIÓN
DEL ANALISIS DE LA
SUPERVIVENCIA EN EL TITANIC

PRESENTADO POR:
NUÑEZ TRUJILLO MARITA ISABEL
ALBERTO MINAYA FERNANDO RENE

HUARAZ – ÁNCASH – PERÚ


2022
INDICE

1 OBJETIVOS 1

1.1 Alumnos 2

1.2 Datos 2

2 PREGUNTAS, ACTIVIDADES Y GESTIÓN DE LA CLASE 3

2.1 Distribución pasajeros según supervivencia 3

2.2 Distribución de pasajeros según la clase social 4

2.3 Distribución de pasajeros según la pervivencia y clase social 4

2.4 Distribución Condicional 5

3 ESTRATEGIAS INTUITIVAS EN EL ESTUDIO DE LAS TABLAS DE CONTINGENCIA 14

3.1 Estrategias Parcialmente Correctas 14

3.2 Estrategias incorectas 14

4 ANALISIS DEL CONTENIDO ESTADISTICO 15

4.1 Aplicación de estadistica 15

4.2 Conceptos y Propiedades 15

4.3 Notaciones y Representaciones 16

4.4 Tecnicas y Procedimientos 16

4.5 Actitudes 16
SUPERVIVENCIA EN EL TITANIC

1. OBJETIVOS:
En este proyecto se trabajará con el contexto de los datos de los supervivientes
durante la tragedia del Titanic. Estos datos servirán para trabajar el tema de
tablas de contingencia, distribuciones conjuntas de datos, distribuciones
marginales y distribuciones condicionales. También sepodrán trabajar el uso de
determinadas representaciones gráficas para describir relaciones entre variables
categóricas.
Por último, se verán pruebas de contraste de asociación entre dos variables
categóricas como el test de Chi-cuadrado y medidas de asociación, como el
coeficiente Phi o la V de Cramer. Se podrá trabajar estos conceptos desde el
punto de vista de cálculo manual y desde el uso desoftware estadístico como
SPSS. Se manejan también algunos applets disponibles en Internet.
El principal fin del proyecto es dar a conocer algunos procedimientos para
analizar la asociación entre dos variables cualitativas. Nos parece importante
este punto en un momento en que los métodos de investigación cualitativos
cobran gran importancia y en que algunos investigadores pudieran equiparar
estos métodos a “no uso de la estadística”. Los métodos de análisis de datos
cualitativos son muy numerosos en estadística y, en particular, en casi cualquier
investigación es muy posible obtener una tabla de contingencia, incluso hay
investigaciones que se basan únicamente en este tipo de análisis.
Por otro lado, las tablas de contingencia constituyen un método usual de
presentar la información estadística en la prensa o Internet, por lo que algunos
autores (por ejemplo, Schield, 2006) incluyen la interpretación correcta de éstas
como un componente de la cultura estadística. Sin embargo, dichas tablas
reciben poca atención en la enseñanza universitaria, pues se supone que su
lectura e interpretación son habilidades adquiridas por los estudiantes.
Más concretamente, en este proyecto se persiguen los siguientes objetivos:

• Saber interpretar una tabla de contingencia. Comprender los conceptos


de distribución conjunta de frecuencias, distribución marginal y
distribución condicional.
• Saber calcular probabilidades a partir de datos representados en una tabla
de contingencia: probabilidad simple, compuesta y probabilidad
condicionada.
• Saber representar gráficamente datos de variables cualitativas, mediante
el diagrama de barras adosadas y gráfico de mosaicos.
• Trabajar el concepto de asociación con variables cualitativas; diferenciar
la asociación de la independencia y comprender las propiedades de la
independencia.
• Saber realizar un contraste de Chi-cuadrado, para estudiar la asociación
entre variables.
• Saber calcular algunas medidas de asociación, diferenciando las que son
adecuadas para tablas 2x2 o tablas rxc y las que son simétricas o no
simétricas.
• Saber interpretar los resultados numéricos de dichas medidas de
asociación.

1.1 Alumnos
El proyecto puede ser utilizado con alumnos de Bachillerato y alumnos
universitarios dentro del tema de estadística descriptiva variable,contraste Chi-
cuadrado y medidas de asociación. No necesita mucha formalización, pues los
cálculos son sencillos, sobre todo si se dispone de software adecuado.

1.2 Los datos


En este proyecto se trabajarán con los datos de los pasajeros del Titanic. Estos
datos están disponibles en Internet (por ejemplo, en
www.statsci.org/data/general/titanic.txt). Se puede pedir a los alumnos que
busquen estos datos, o se puede dar preparada la matriz de datos. Se puede
iniciar el tema dando los datos resumen (en forma de tablas de contingencia, o
incluso para que ellos mismos construyan la tabla) o bien se puede iniciar el
proyecto directamente con el fichero en formato .sav para trabajar con SPSS.
2. Preguntas, actividades y gestión de la clase
Se comenzará el proyecto hablando de la tragedia del Titanic, que seguramente
la mayor parte de los alumnos conocen. Los alumnos pueden buscar información
en Internet, traer leído algunos de los artículos, e incluso podrían ver alguna de
las películas recientes sobre el tema.
Podemos comenzar con la siguiente
introducción:

1. El 10 de abril de 1912, el Titanic


zarpaba con 1317 pasajeros a bordo,
ante la admiración de una
muchedumbre de curiosos que
contemplaban atónitos como
aquella mole de acero se alejaba majestuosamente del puerto.
Cinco días después los medios de comunicación de todo el mundo se hicieron
eco de la increíble noticia: el barco más grande jamás construido yacía a casi
cuatro mil metros de profundidad.
Sólo 451 pasajeros, lanzados a los escasos 20 botes de madera se salvaron.
Otros 862 se congelaban antes de que el Carpathia, el buque más cercano,
llegara al rescate. El naufragio de ese mítico buque dejó tras de sí una larga
lista de preguntas sin respuesta. ¿Qué porcentajede pasajeros sobrevivió y
que porcentaje murió?
Los estudiantes prepararían una tabla de frecuencias simple (Tabla9.1) para la
variable sobrevive, con las frecuencias absolutas y el porcentaje. Podrían a partir
de ella calcular la probabilidad simple de supervivencia.

Distribución de pasajeros según supervivencia


Frecuencia Porcentaje
Sobrevive 451 34,3
No sobrevive 862 65,6
Total 1313 100,0

2. Las convenciones sociales y los comportamientos individuales hicieron que


esta terrible desgracia no se cebará en todos por igual. En este proyecto
vamos a estudiar si la tasa de supervivencia del pasaje estaba asociada al
precio de la travesía (1ª, 2ª, 3ª clase).
En primer lugar, vamos a obtener datos sobre cuántos pasajeros viajaron en
cada una de las clases. Se inicia este estudio simplemente construyendo la
distribución de frecuencias simple para la variable clase. Se pide a los alumnos
que calculen la frecuencia absoluta y el porcentaje de pasajeros en cada una de
las clases.

Distribución de pasajeros según clase social

Frecuen Porcent
cia aje
Primera clase 322 24,5
Segunda clase 280 21,3
Tercera clase 711 54,2
Total 1313 100,0

3. Hasta ahora hemos tratado con variables de una en una, es decir, hemos
visto cuantos han sobrevivido, y cuántos había en cada clase, pero como
hemos dicho, queremos analizar si el precio de la travesía estuvo relacionado
con el hecho de haberse salvado. Es decir, queremos estudiar la relación
que hay entre estas dos variables. Para empezar, vamos a rellenar la tabla
9.3 (usaremos sólo las frecuencias absolutas).
Se presenta a los alumnos la estructura de la tabla de contingencia, y se rellena
con los datos conocidos hasta el momento, el total de pasajeros que sobrevivió
y el total de pasajeros dentro de cada clase. Se pide a los alumnos que
completen la tabla con los datos disponibles, quedando de la forma que aparece
en la Tabla 9.4. Se puede hacer observar que la suma de los totales por filas y
por columnas coinciden con el total de pasajeros.

Distribución de pasajeros según supervivencia y clase social


Sobrevive No sobrevive Total
Primera clase 322
Segunda clase 280
Tercera clase 711
Total 451 862 1313
Distribución de pasajeros según supervivencia y clase social
Sobrevive No sobrevive Total
Primera clase 194 128 322
Segunda clase 119 161 280
Tercera clase 138 573 711
Total 451 862 1313

4. La tabla 9.4 representa al mismo tiempo la frecuencia absoluta de las dos


variables y se denomina distribución conjunta de variables o tabla de
contingencia. Aprenderemos a obtener otras distribuciones de una sóla
variable a partir de la tabla.
En la tabla presentamos las variable X, con j valores, x1, x2, …, xj yla variable Y,
con k valores, y1, y2, …, yk. Se define la distribución conjunta de frecuencias de
X e Y como la distribución de frecuencias de todos los pares de valores (x,y).
Cada celda contiene la frecuencia absoluta quecorresponde a los valores de la
variable que aparecen en su fila y sucolumna.

Una vez comprendido el concepto de frecuencia doble, se explica a los alumnos


los conceptos de distribuciones marginales, que en este ejemplo corresponden
al total de pasajeros en cada clase y el total de pasajeros que sobrevivieron (ya
representadas por los alumnos). A partir de una distribución conjunta de
frecuencias se puede definir la distribución marginal de X como la distribución de
los valores de X independientementede los valores de Y. Igualmente se puede
definir la distribución marginal de Y como la distribución de los valores de Y
independientemente de los valores de X.
Se sigue con el concepto de distribución condicional: A partir de una distribución
conjunta de frecuencias se puede definir la distribución condicional de X dado Yi
como la distribución de los valores de X cuando Ytoma el valor Yi. Habrá tantas
distribuciones condicionales de X como
valores tenga Y. Igualmente se podrían definir las distribuciones condicionales
de Y. En nuestro caso se pueden definir cinco distribuciones condicionales:
• La distribución condicional de “sobrevive” para los pasajeros enprimera;
la distribución condicional de “sobrevive” para los pasajeros en segunda
y la distribución condicional de “sobrevive” para los pasajeros en tercera.
• La distribución condicional de “clase” para los pasajeros que sobrevivieron
y la distribución condicional de “clase” para los pasajeros que no
sobrevivieron.
A continuación, como ejemplo, se muestra la distribución condicional de
“sobrevive” para los pasajeros en “tercera clase” (Tabla 9.6). Del mismomodo se
calcularían el resto.

Distribución condicional
Sobrevive No sobrevive Total
Tercera clase 138 573
711

5. Hasta aquí hemos sido capaces de resumir la información a través de una


tabla. Vamos a representar ahora gráficamente estos datos.
Se explica a los alumnos el diagrama de barras adosadas, resaltando el hecho
de que se puede realizar utilizando las frecuencias o los porcentajes. Se pide a
los alumnos que lo realicen, quedando un gráfico como la Figura 9.1. En dicha
figura se observa mucho mayor número de ahogados en tercera clase. Pero la
figura muestra sólo las frecuencias absolutas.

Diagrama de barras adosadas

El diagrama de barras apiladas (Figura 9.2) y el gráfico de mosaicos (Figura 9.3)


dan una mejor información. En el gráfico de barras apiladas se muestra una barra
por cada valor que tome la variable Y, las cuales, a su vez, se dividen en distintos
colores que representa a cada valor de lavariable X. Representa la frecuencia
Diagrama de barras adosadas

Respecto al gráfico de mosaicos, por un lado, la altura de las bandas verticales


indica el número total de pasajeros de cada clase (mayor número en tercera, y
en primera y segunda clase con un número parecido. Dentrode cada banda la
anchura de la categoría muestra la proporción (frecuencia relativa condicional)
de supervivientes y ahogados en cada una. La proporción de supervivientes
disminuye notablemente de primera a tercera clase.

6. Para saber si dos variables están relacionadas, la estrategia correcta más


utilizada será comparar las distribuciones condicionales. Es decir, lo que nos
interesa, es comparar la distribución condicional de “clase” para los sujetos
que sobrevivieron con la distribución condicional de “clase” para los sujetos
que no sobrevivieron. El problema que tiene esta comparación es que al no
haber el mismo número de personas que
sobrevivieron y que no sobrevivieron, resulta difícil hacer esta comparación con
las frecuencias absolutas.
Estudiando los gráficos y tablas anteriores, podemos discutir con los alumnos
cómo tendrían que distribuirse las personas que sobrevivieron y no
sobrevivieron en las diferentes clases. A continuación, intentamos llevara la idea
de frecuencia esperada en caso de independencia.

7. En realidad, si sabemos que, si en el total del pasaje un 34,3 sobrevivió, esta


proporción se debería contemplar en cada una de las clases.
¿Cuántas personas tendrían que sobrevivir en cada clase para “respetar”
este 34?4%?
Pedimos a los alumnos que estimen la proporción de supervivientesen cada
clase. Quedaría una tabla como la 9.9 (redondeamos al número entero más
próximo). Si la tabla 9.9 muestra la cantidad de personas que debería sobrevivir,
pedimos que completen la tabla con los que no sobrevivirían, si se distribuyeran
los supervivientes por igual entre lasdiferentes clases.

Frecuencias esperadas en caso de independencia


Sobrevive No sobrevive Total
Primera clase 110 322
Segunda clase 96 280
Tercera clase 244 711
Total 451 862 1313

Frecuencias esperadas en caso de independencia


Sobrevive No sobrevive Total
Primera clase 110 212 322
Segunda clase 96 184 280
Tercera clase 244 467 711
Total 451 862 1313

8. Se ha construido una tabla que refleja la cantidad de personas de cada clase


que hubiesen sobrevivido si la tasa de supervivencia hubiera sido igual entre
las clases. Estos números se denominan “frecuencia esperada en caso de
independencia”.
Se introduce a los alumnos el concepto de frecuencia esperada en
Se puede comprobar con los alumnos que el resultado aplicando dicha fórmula
es igual que el obtenido anteriormente (salvo redondeo delos decimales).

Cálculos para determinar χ2


Sobrevive No sobrevive Total
Primera clase 64,14 33,28 322
Segunda clase 5,51 2,87 280
Tercera clase 46,04 24,05 711
Total 451 862 1313

χ2= 64,14+33,28+5,51+2,87+46,04+24,05 = 175,89

Con el estadístico Chi-cuadrado se obtiene una medida de diferencia entre las


frecuencias esperadas y las frecuencias observadas. Observamos las siguientes
propiedades de este estadístico: El valor que se obtiene de χ2 (Chi-cuadrado) es
difícil de interpretar, ya que este valor tiene un mínimo (0, en caso de
independencia absoluta) pero no un máximo, por lo general cuanto más se aleje
este valor del 0, hay una mayor dependencia. Una de las propiedades de este
valor es que cuantas más celdas haya en la tabla, este valor aumenta, pero
también influyen los valores de la diferencia.
Para solucionar esto se han propuesto otros estadísticos, basados en
χ2, que permiten estudiar la asociación y son más fácilmente interpretables.
Hay dos clases de estadísticos de este tipo, los utilizados en tablas 2x2, y los
estadísticos que se utilizan en tablas rxc, siendo el número de filas o de columnas
mayor que dos. En este caso estamos trabajando con una tabla usaremos el
coeficiente V de Cramer, que se calcula en la forma siguiente:

n(L −1)

Siendo n el tamaño de la muestra y L = mínimo (filas, columnas). Parael ejemplo


que estamos tratando, quedaría de la siguiente forma

175,89
1313(2 −1)

Para interpretar el valor de la V de Cramer debemos tener en cuenta que un valor


V=0 es indicativo de asociación nula y V=1 indica una asociación perfecta entre
las variables analizadas. Para interpretar los valores intermedios de V, podemos
seguir las recomendaciones de Cohen (1988), donde sugiere que un valor de 0,1
representa una intensidad de la relación débil; un valor de 0,3 representa una
intensidad media; y un valor de 0,5 nos informa de una intensidad alta. En
nuestro caso podemos afirmarque hay una asociación de intensidad media entre
el precio pagado por el pasaje y el hecho de haber sobrevivido a la tragedia.
Otro estadístico que se podría aplicar en tablas de este tipo (tablasrxc), es
el coeficiente de contingencia de Pearson, el cual se calcula mediante la
siguiente formula:

Este coeficiente cuando vale 0 indica independencia absoluta, pero elmáximo, cuando
la tabla tiene c columnas y r filas es:

Max {C}=

Para el ejemplo que estamos tratando, estos valores (el del estadístico
C y el valor de su máximo), quedaría de la siguiente forma:
C = 0,3437
Max{C} = 0,7071
Por tanto, en el ejemplo, alcanza la mitad del valor máximo, y denuevo
indica una intensidad de asociación moderada.
9. Como sabes, una de las “normas” a la hora de realizar una operación de
rescate es “salvar primero a mujeres y niños”. Vamos a analizar también si
siguieron esta norma con las mujeres en el salvamento organizado en el
Titanic. Para ello, utilizamos el fichero de datos disponible en Internet y el
programa SPSS.
Se iniciaría el análisis abriendo el fichero Titanic.sav y pidiendo la tabla de
contingencia de la variable genero*sobrevive. Con ayuda del menúAnalizar –
Estadísticos descriptivos - Tablas de contingencia, tomando la variable
“Sobrevive” en columnas y la variable “genero” en filas, obtendríamos la Tabla

10. Igual que hemos hecho anteriormente, en lugar de comparar las frecuencias
absolutas, vamos a analizar los porcentajes.
Se obtendría la Tabla 9.15, en la que se presentan las distribuciones
condicionadas por filas e igualmente se obtendrían las distribuciones
condicionales por columna, analizando con los alumnos las diferenciasentre
ambas tablas. Se discute cuál de las dos opciones resulta más informativa para
la pregunta que nos estamos haciendo.

Distribución de género entre supervivientes y ahogados

Mujer si no Total
Si Recuento 308 154 462
% de genero 66,7% 33,3% 100,0%
No Recuento 143 708 851
% de genero 16,8% 83,2% 100,0%
Total Recuento 451 862 1313
% de genero 34,3% 65,7% 100,0%

11.Vamos a representar gráficamente esta información a través de undiagrama


de barras agrupado y un diagrama de mosaicos. ¿Qué observas en estos
gráficos?
Se realizarían el gráfico de barras apilado y mosaicos (Figuras 9.5 y 9.6). En
ambos gráficos observamos mucha mayor proporción de mujeres salvadas; en
el gráfico de mosaicos observamos también la mayor frecuencia de hombres en
el pasaje. Por ello concluimos que se dio prioridad a las mujeres en el
salvamento.

Gráfico de barras apilado

12. Quedaría por calcular los estadísticos de asociación para analizar la


intensidad de esta relación. Calcula el estadístico Chi-cuadrado, así como las
medidas de asociación adecuadas a las tablas 2x2. ¿Qué conclusiones
extraes?
En este caso estamos en una tabla de contingencia 2x2, donde, además de la
intensidad de la asociación se puede definir el signo. Para este tipo de tabla
podemos diferenciar dos tipos de asociación: directa e inversa.La asociación
directa se da cuando la gran mayoría de las frecuencias se
concentran en las celdas f11 (presencia de los dos caracteres) y f22 (ausencia de
los dos caracteres). Por el contrario, la asociación inversa se da cuandola gran
mayoría de las frecuencias se concentran en las celdas f12 y f21 (presencia de un
carácter, y ausencia del otro carácter). En nuestro ejemplo (Tabla 9.15),
podemos observar cómo hay diez veces más sujetos en las celdas f11 y f22 que
en las celdas f12 y f21, por lo que podríamos concluir que hay una dependencia
directa entre ser mujer y la supervivencia.

Para obtener las medidas de asociación se utiliza SPSS u otro programa similar,
como Statgraphics. El Coeficiente Phi de Pearson para tablas 2x2, se define de
la forma siguiente:

= ((f f − f f )2n)/(f . f . f .1 f . ) ( f f − f f )2
f1. f2. f .1 f .2
Este coeficiente toma valores entre -1 y 1:

• El valor máximo (1) se obtiene cuando la dependencia es directa y


perfecta, todos los casos están en las celdas f11 y f22. Si el coeficiente es
positivo, la dependencia es directa y más alta cuanto más seacerque a 1.
• El valor mínimo (-1) se obtiene cuando la dependencia es inversa y
perfecta, todos los casos están en las celdas f12 y f21. Si el coeficiente es
negativo, la dependencia es inversa y más alta cuanto más se acerque a
-1
• El valor 0 se obtiene cuando hay independencia.
Los resultados obtenidos para los datos de la tabla 9.15 se muestranen la
tabla 9.16. El valor Chi cuadrado es muy improbable para 1 g.l., porlo cual
podemos rechazar la independencia entre las variables. Se observa un valor Phi
de Pearson intermedio (intensidad de la relación media) y positivo (lo que informa
de dependencia directa).

Coeficientes para tablas 2x2 (ser mujer-supervivencia)

valor
Chi-cuadrado 330,15
Phi de Pearson 0,501
Riesgo Relativo (columnas) 2,5904
Riesgo Relativo (filas) 2,4959
Razón de productos cruzados 9,9021

Otro coeficiente para tablas 2x2 es el riesgo relativo, que se puede calcular por filas y
por columnas.
a. Algunas dificultades y errores previsibles
Como hemos comentado en proyectos anteriores las investigaciones
sobre estrategias intuitivas de los estudiantes para la detección de
la asociación indica que, con frecuencia, algunas de dichas
estrategias son improductivas para la detección de la asociación,

3. ESTRATEGIAS INTUITIVAS EN EL ESTUDIO DE LAS TABLAS DE


CONTINGENCIA:

En la investigación de Estepa (1993) se analizaron con detalle las


estrategias usadas intuitivamente por los estudiantes pre
universitarios en elanálisis de tablas de contingencia, encontrando
las siguientes;

Estrategias correctas
1. ST.1. Comparar todas las distribuciones de frecuencias relativas
condicionales de una variable para los distintos valores de la otra
variable. Se puede intercambiar el papel de filas y columnas

2. ST.2. Comparar todas las frecuencias relativas condicionadas de


una variable para un único valor con la marginal correspondiente de
la otra variable. Pues si las variables son independientes estas
distribuciones han de coincidir.

3. ST.3. Comparación de posibilidades, comparando las frecuencias


de casos a favor y en contra de B en cada valor de A. Esta estrategia
es correcta porque la razón de posibilidades es formalmente
equivalente a la probabilidad.

Estrategias Parcialmente Correctas, Generalmente Porque Se Usa


Frecuencias Absolutas En Lugar De Relativas:

1. ST.4. Comparar la distribución de frecuencias absolutascondicionales


con la frecuencia absoluta marginal correspondiente.
2. ST.5. Comparar las frecuencias absolutas condicionadas la una conla
otra.
3. ST.6. Comparar la suma de frecuencias en las diagonales. En este caso
el alumno usa la estrategia descrita por Piaget, siendo correcta, sólo en el
caso de que la tabla tenga igual las frecuencias marginalespara la variable
independiente.

Estrategias incorrectas: cuando el estudiante usa sólo una parte de


los datos o usa una estrategia que no tiene que ver con la asociación.

1. ST.7. El uso único de la celda de mayor frecuencia. En este caso el


alumno no utiliza toda la información presente en el problema, tan sólo la
celda más sobresaliente.
2. ST.8. El uso de sólo una distribución condicional. En este caso el alumno
no ve el problema como un problema de comparación de probabilidades.
3. ST.9. Comparar frecuencias dobles con el número total de
observaciones o bien frecuencias marginales entre sí.
4. ST.10. Otros procedimientos incorrectos. En casos esporádicos se usan
procedimientos, o no relacionados con las frecuencias de la tabla, por
ejemplo, plantear una ecuación

4. ANÁLISIS DEL CONTENIDO ESTADÍSTICO


En este proyecto podemos identificar, explícita o implícitamente, los
siguientes contenidos:
1. Aplicaciones de la Estadística:
• Análisis de variables cualitativas;
• Estudio de asociación entre variables;
• Tasas de supervivencia; determinación de factores de riesgo;
• Pruebas de hipótesis sobre la asociación estadística.
2. Conceptos y propiedades:
• Tabla de contingencia. Distribuciones dobles y
marginales,distribuciones condicionales;
• Probabilidades simples, compuestas y condicionales;
• Frecuencias absolutas y porcentajes; frecuencias relativas
dobles,marginales y condicionales;
• Frecuencias esperadas y observadas;
• Asociación e independencia. Propiedades relacionadas con
la independencia;
• Cálculo del estadístico Chi-cuadrado; distribución y grados
de libertad;
• Medidas de asociación para tablas rxc. estadísticos C de
contingencia y V de Cramer. Valores posibles e
interpretación;
• Asociación en tablas 2x2, Signo de la asociación. Medidas
de asociación para tablas 2x2, Coeficiente Phi, Riesgo
relativo. Razón de productos cruzados. Valores posibles e
interpretación;
3. Notaciones y
representaciones
• Palabras como frecuencia esperada, observada.
• Símbolos como X2. Expresiones y fórmulas usadas en los
cálculosde los diferentes coeficientes;
• Tablas de contingencia:
• Applets;
• Diagrama de barras adosado y apilado; gráfico de mosaico.
4. Técnicas y procedimientos
• Elaboración de tablas de doble entrada;
• Interpretación de tablas; elaboración de conclusiones a
partir delanálisis de tablas;
• Elaboración de argumentos y conclusiones a partir del
análisis dedatos obtenidos;
• Cálculo de estadísticos de asociación para variables
cualitativas einterpretación de sus resultados;
• Realización de contraste Chi- cuadrado.
5. Actitudes
• Reflexión sobre los prejuicios sociales;
• Valoración de la estadística para la comprobación de hipótesis;
• Valoración de la estadística en el uso de datos cualitativos;
• Diferenciación entre asociación y causalidad;
• Concienciación de sesgos en el estudio de la asociación.

También podría gustarte