RAC
Trabajo. Parte 1
Datos Titanic
Instrucciones generales:
• El trabajo es grupal, de 3 integrantes.
• Anote, en la carátula, los integrantes que desarrollaron esta tarea.
• Entregue un informe word y el script de Google colab correspondiente del
procesamiento.
• El enuncia se entrega el 21 de noviembre del 2022
• La solución debe devolverse el viernes 2 de diciembre del 2022
El RMS Titanic fue un transatlántico británico, el mayor barco de pasajeros del mundo en el
momento de su terminación, que se hundió en la noche a la madrugada del 15 de abril de 1912
durante su viaje inaugural desde Southampton a Nueva York. En el hundimiento del Titanic
murieron 1514 personas de las 2223 que iban a bordo, lo que convierte a esta tragedia en uno
de los mayores naufragios de la historia ocurridos en tiempo de paz. El dataset en donde se
analizarán diferentes interpretaciones estadísticas son basadas en un conjunto de datos que
describen a los pasajeros que estuvieron en ese viaje del transatlántico
Se describen los nombres de las columnas de los datos Titanic
PassengerId: ID del pasajero
Survived: Si sobrevivió (1: sobrevivió, 0 murió)
Pclass: Clase del pasajero (1, 2, 3)
Name: Nombre del pasajero
Sex: Sexo del pasajero (Female, male)
Age: Edad del pasajero
SibSp: Número de parientes (Hermano, hermana, hermanastras, hermanastro, esposa o esposa)
Parch: Número de parientes (Madre, padre, hijo, hija, hijastro, hijastra)
Tickect: Numero de tickect o boleto
Fare: Tarifa del pasaje
Cabin: Número de cabina del pasajero
Embarked: Datos del puerto del embarque (C = Cherbourg, Q = Queenston, S = Southapmtpon)
RAC
La base de datos Titanic se encuentran en los siguientes enlaces:
Excel
https://1drv.ms/x/s!AqeEhfUIuvnvisYCDv1QdTc70BlS3Q?e=Lw3tgZ
Csv
https://1drv.ms/u/s!AqeEhfUIuvnvisYEtkeGm9qHzqoxzw?e=BfVH5V
Objetivo general:
Identificar qué características clasifican a un pasajero que sobrevivió o no sobrevivió al naufragio,
y cual o cuales son las más relevante estadísticamente.
Objetivos específicos
1. Describir el comportamiento de cada una de las variables unidimensionalmente
2. Describir la relación entre características relevantes, de acuerdo al objetivo general
3. Obtener hallazgos que entreguen información sobre la clasificación de pasajeros, es decir,
respecto a si sobrevivió o no.
Así como entender el comportamiento de las características de los pasajeros, con detalle,
y además obtener “hallazgos” para dar respuesta al objetivo general. Puede hacer
supuestos para interpretar, discutir y entregar la conclusión respectiva.
Resuelva las siguientes preguntas:
1. Describa en que escala están cada una de las columnas o características de la base de
datos Titanic3. ¿Cuántos datos hay (filas)?
“Sea detallado en su respuesta, justificando la clasificación que usted entregue”
2. (Sobre objetivo 1) Para cada una de las características de los pasajeros, construya sus
distribuciones de frecuencias, grafique adecuadamente y realice interpretaciones.
“A cada tabla y/o gráfico acompañe el cálculo de medidas de tendencia central,
dispersión, posición, curtosis y asimetrías apropiadamente. Puede hacer supuestos para:
interpretar, discutir y entregar la conclusión sobre esta pregunta respectiva”
3. (Sobre objetivo 2) Analizar convenientemente las características de los pasajeros para
lograr dar respuesta al objetivo general. Interprete, discuta, realice supuestos si es
necesarios para concluir.
RAC
“En esta parte, puede usar tablas bidimensionales, diagramas de dispersión, box plot. Por
ejemplo, para graficar una variable unidimensionalmente y/o también cruzar mediante un
box plot una característica cuantitativa con una categórica (sobrevivir o no).
Alternativamente aquí se puede categorizar la característica métrica para luego crear una
tabla bidimensional contra la sobrevivencia, finalmente obtener información de la tabla
condicional y discutir el poder clasificador.
Categorizar las variables métricas para lograr el objetivo de ser analizadas, es decir,
identificar características que clasifiquen si un pasajero sobrevivió o no, es una buena
estrategia de análisis”
Interprete, discuta, realice supuestos si es necesarios para concluir.
Observación:
✓ Para obtener el puntaje completo debe ser detallado y ordenado en sus respuestas,
basado en el objetivo general. El ideal, en algunos casos, de ser posible, es mostrar la
aplicación de más de una herramienta descriptiva para obtener las conclusiones.
✓ Las tablas de frecuencias, tablas de resúmenes de indicadores estadísticos y gráficos
deben tener: (1) Encabezamiento (2) Tabla o gráfico propiamente tal y (3) Fuente