0% encontró este documento útil (0 votos)
116 vistas3 páginas

Tarea Parte 1

Este documento presenta un proyecto de análisis de datos sobre los pasajeros del Titanic. Los estudiantes deben analizar un conjunto de datos sobre los pasajeros para identificar qué características clasifican a un pasajero como sobreviviente o fallecido, y cuáles son las más relevantes estadísticamente. Se describen las variables de los datos y los objetivos específicos de describir cada variable, analizar las relaciones entre variables relevantes, y obtener hallazgos sobre la clasificación de pasajeros. Se piden respuestas detalladas a pregunt

Cargado por

Vero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
116 vistas3 páginas

Tarea Parte 1

Este documento presenta un proyecto de análisis de datos sobre los pasajeros del Titanic. Los estudiantes deben analizar un conjunto de datos sobre los pasajeros para identificar qué características clasifican a un pasajero como sobreviviente o fallecido, y cuáles son las más relevantes estadísticamente. Se describen las variables de los datos y los objetivos específicos de describir cada variable, analizar las relaciones entre variables relevantes, y obtener hallazgos sobre la clasificación de pasajeros. Se piden respuestas detalladas a pregunt

Cargado por

Vero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

RAC

Trabajo. Parte 1
Datos Titanic
Instrucciones generales:
• El trabajo es grupal, de 3 integrantes.
• Anote, en la carátula, los integrantes que desarrollaron esta tarea.
• Entregue un informe word y el script de Google colab correspondiente del
procesamiento.
• El enuncia se entrega el 21 de noviembre del 2022
• La solución debe devolverse el viernes 2 de diciembre del 2022

El RMS Titanic fue un transatlántico británico, el mayor barco de pasajeros del mundo en el
momento de su terminación, que se hundió en la noche a la madrugada del 15 de abril de 1912
durante su viaje inaugural desde Southampton a Nueva York. En el hundimiento del Titanic
murieron 1514 personas de las 2223 que iban a bordo, lo que convierte a esta tragedia en uno
de los mayores naufragios de la historia ocurridos en tiempo de paz. El dataset en donde se
analizarán diferentes interpretaciones estadísticas son basadas en un conjunto de datos que
describen a los pasajeros que estuvieron en ese viaje del transatlántico

Se describen los nombres de las columnas de los datos Titanic


PassengerId: ID del pasajero
Survived: Si sobrevivió (1: sobrevivió, 0 murió)

Pclass: Clase del pasajero (1, 2, 3)


Name: Nombre del pasajero
Sex: Sexo del pasajero (Female, male)
Age: Edad del pasajero

SibSp: Número de parientes (Hermano, hermana, hermanastras, hermanastro, esposa o esposa)

Parch: Número de parientes (Madre, padre, hijo, hija, hijastro, hijastra)

Tickect: Numero de tickect o boleto

Fare: Tarifa del pasaje

Cabin: Número de cabina del pasajero

Embarked: Datos del puerto del embarque (C = Cherbourg, Q = Queenston, S = Southapmtpon)


RAC

La base de datos Titanic se encuentran en los siguientes enlaces:

Excel

https://1drv.ms/x/s!AqeEhfUIuvnvisYCDv1QdTc70BlS3Q?e=Lw3tgZ

Csv

https://1drv.ms/u/s!AqeEhfUIuvnvisYEtkeGm9qHzqoxzw?e=BfVH5V

Objetivo general:

Identificar qué características clasifican a un pasajero que sobrevivió o no sobrevivió al naufragio,


y cual o cuales son las más relevante estadísticamente.

Objetivos específicos

1. Describir el comportamiento de cada una de las variables unidimensionalmente


2. Describir la relación entre características relevantes, de acuerdo al objetivo general
3. Obtener hallazgos que entreguen información sobre la clasificación de pasajeros, es decir,
respecto a si sobrevivió o no.
Así como entender el comportamiento de las características de los pasajeros, con detalle,
y además obtener “hallazgos” para dar respuesta al objetivo general. Puede hacer
supuestos para interpretar, discutir y entregar la conclusión respectiva.

Resuelva las siguientes preguntas:

1. Describa en que escala están cada una de las columnas o características de la base de
datos Titanic3. ¿Cuántos datos hay (filas)?

“Sea detallado en su respuesta, justificando la clasificación que usted entregue”

2. (Sobre objetivo 1) Para cada una de las características de los pasajeros, construya sus
distribuciones de frecuencias, grafique adecuadamente y realice interpretaciones.

“A cada tabla y/o gráfico acompañe el cálculo de medidas de tendencia central,


dispersión, posición, curtosis y asimetrías apropiadamente. Puede hacer supuestos para:
interpretar, discutir y entregar la conclusión sobre esta pregunta respectiva”

3. (Sobre objetivo 2) Analizar convenientemente las características de los pasajeros para


lograr dar respuesta al objetivo general. Interprete, discuta, realice supuestos si es
necesarios para concluir.
RAC

“En esta parte, puede usar tablas bidimensionales, diagramas de dispersión, box plot. Por
ejemplo, para graficar una variable unidimensionalmente y/o también cruzar mediante un
box plot una característica cuantitativa con una categórica (sobrevivir o no).

Alternativamente aquí se puede categorizar la característica métrica para luego crear una
tabla bidimensional contra la sobrevivencia, finalmente obtener información de la tabla
condicional y discutir el poder clasificador.

Categorizar las variables métricas para lograr el objetivo de ser analizadas, es decir,
identificar características que clasifiquen si un pasajero sobrevivió o no, es una buena
estrategia de análisis”

Interprete, discuta, realice supuestos si es necesarios para concluir.

Observación:

✓ Para obtener el puntaje completo debe ser detallado y ordenado en sus respuestas,
basado en el objetivo general. El ideal, en algunos casos, de ser posible, es mostrar la
aplicación de más de una herramienta descriptiva para obtener las conclusiones.

✓ Las tablas de frecuencias, tablas de resúmenes de indicadores estadísticos y gráficos


deben tener: (1) Encabezamiento (2) Tabla o gráfico propiamente tal y (3) Fuente

También podría gustarte