0% encontró este documento útil (0 votos)
152 vistas5 páginas

UChicago Python para Data Science - Guía Del Programa

Este documento presenta un programa de 8 semanas sobre Python para Data Science. El programa enseña conceptos básicos y avanzados de Python para el análisis y manipulación de datos, así como el entrenamiento y evaluación de modelos de machine learning. Los estudiantes aprenderán a analizar y manipular datos con Pandas y NumPy, desarrollar modelos de ML con Scikit-Learn, y paralelizar programas y web scrapers. El programa es totalmente en línea y flexible, con acceso a contenido interactivo, videos, actividades prácticas y foros de discusión
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
152 vistas5 páginas

UChicago Python para Data Science - Guía Del Programa

Este documento presenta un programa de 8 semanas sobre Python para Data Science. El programa enseña conceptos básicos y avanzados de Python para el análisis y manipulación de datos, así como el entrenamiento y evaluación de modelos de machine learning. Los estudiantes aprenderán a analizar y manipular datos con Pandas y NumPy, desarrollar modelos de ML con Scikit-Learn, y paralelizar programas y web scrapers. El programa es totalmente en línea y flexible, con acceso a contenido interactivo, videos, actividades prácticas y foros de discusión
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

GUÍA DEL PROGRAMA

Python para Data Science


Programa en remoto

Inicio del programa: 06/08/2020 - Fin del programa: 30/09/2020

DESCRIPCIÓN DEL PROGRAMA

En un mundo en el que los datos se consideran un producto, es fundamental que los profesionales
de data science posean amplios conocimientos de los aspectos que intervienen en el diseño y la
escritura de código en Python. Además, han de saber emplear este mismo código de manera
creativa y útil a la hora de resolver problemas reales.

Nuestro programa de ocho semanas Python para Data Science es una introducción a los
conceptos básicos del lenguaje de programación Python. Se trata de un programa de elevado
nivel técnico basado en proyectos, que incluye muchos ejemplos prácticos que te serán de
utilidad para, más adelante, tener la oportunidad de crear y ejecutar tus propios proyectos en
Python.

FACULTY

Nuestra comunidad está formada por investigadores de renombre y eruditos en sus respectivos
campos. Alentados por el debate riguroso y la colaboración interdisciplinar, nuestro Faculty es
reconocido internacionalmente.

Brian Craft, BA (Cum Lade), MSc


LECTURER FOR PYTHON OF ANALYTICS, UNIVERSITY OF CHICAGO

Brian Craft es un científico de datos con años de experiencia en la industria. En su papel como
científico de datos en Conagra Brands, se centra en la ampliación de sus capacidades de machine
learning y desarrolla modelos para entender el comportamiento de compra del consumidor e
identificar las nuevas tendencias de ingredientes y sabores.

MENTORES DEL PROGRAMA

El programa contará con mentores; consultores seniors expertos en la materia con una amplia
experiencia en su campo. Responderán preguntas e interactuarán con el objetivo de fomentar
reflexiones más profundas, facilitar la colaboración y asegurarse de que los participantes viven
una experiencia positiva de aprendizaje mediante foros de discusión y sesiones en
directo. También realizarán la corrección de las actividades y foros.

1
¿A QUIÉN VA DIRIGIDO?

Este programa está diseñado para profesionales que:

• Tengan nociones básicas de Python y de machine learning y quieran aumentar sus


conocimientos para ponerlos en práctica.
• Estén ansiosos por aprender sobre data science, pero no hayan dado con el programa de
formación adecuado.
• Sean analistas de inteligencia empresarial y cuenten con una buena base de
conocimientos sobre la teoría del análisis y la manipulación de datos, pero no tengan
mucha experiencia en Python.
• Tengan una mentalidad de trabajo cuantitativa, pero carezcan de herramientas técnicas.
• Sean analistas de datos que trabajen, sobre todo, en Excel.

OBJETIVOS

Los participantes aprenderán a:

• Entender el lenguaje de programación Python.


• Ser un experto en el análisis y la manipulación de datos.
• Escribir código de producción en Python.
• Entrenar y evaluar modelos de machine learning.
• Diseñar y optimizar código de Python para lograr una mejora del rendimiento y un
aumento de la velocidad.
• Escribir código en Python para procesar grandes conjuntos de datos de manera eficiente.
• Preparar modelos de machine learning con el fin de utilizarlos en producción.

DURACIÓN DEL PROGRAMA

Este programa online tiene una duración de 8 semanas y se presentará un módulo en cada una
de ellas. La mayoría de los participantes invertirá una media de entre 8 y 10 horas semanales en
las actividades del programa.

METODOLOGÍA

El programa es completamente online y flexible. El participante puede adaptar la realización de


tareas y el estudio de los módulos a sus horarios y situación individual.

El participante tendrá acceso a todos los contenidos del programa y podrá relacionarse con su
mentor y sus compañeros a través del campus virtual, viviendo una experiencia de formación
completa y satisfactoria. La metodología combina todos estos recursos con el objetivo de que se

2
vayan fijando los conocimientos adquiridos de forma natural mientras se completa el programa.
Estos recursos comprenden:

• Contenidos interactivos
• Vídeos explicativos de los instructores
• Preguntas de repaso
• Autoevaluaciones
• Glosario
• Wiki
• Actividades prácticas
• Foros de discusión
• Material complementario y fuentes recomendadas
• Sesión webinar de bienvenida
• Sesiones Q&A con el mentor
• Sesiones webinar con los Instructores

Este programa se desarrolla en un entorno altamente colaborativo, fomentado a través de foros


de discusión en los módulos y en el Student Lounge (un foro diseñado para que los participantes
interactúen entre ellos). Las clases en directo y los foros de discusión favorecerán el networking y
el aprendizaje conjunto.

Las tareas que se tendrán en cuenta para la evaluación serán las actividades y los foros de
discusión. Es recomendable asistir a las sesiones webinar y de Q&A en vivo, pero no es obligatorio;
todas las sesiones se grabarán y podrán visualizarse más tarde en el campus virtual.

REQUISITOS DE INSCRIPCIÓN PARA EL PROGRAMA

No hay requisitos específicos para cursar el programa.

CONTENIDO DEL PROGRAMA*

El programa consta de los siguientes 8 módulos:

Módulo 1: Las funcionalidades básicas de Python


1. La declaración de variables, las operaciones matemáticas y lógicas, los tipos de datos y
los contenedores
2. Las condicionales (if, elif, else)
3. Las iteraciones (bucles for y while)
4. La comprensión
5. Los errores y las excepciones
Módulo 2: Las clases y las funciones definidas por el usuario
1. Las funciones definidas por el usuario (FDU)

3
2. La mejora de las FDU
3. Introducción a las clases
4. El desarrollo de regresiones lineales
Módulo 3: El análisis y la manipulación básica de datos
1. El uso de pandas para cargar datos externos
2. La manipulación de estructuras de datos y arrays con NumPy
3. Pandas y NumPy en acción
4. La unión y concatenación de estructuras de datos mediante pandas
5. La creación de visualizaciones a través de Seaborn
Módulo 4: El análisis y la manipulación avanzada de datos
1. El uso del broadcasting
2. Las operaciones de matrices y elementos para una manipulación de datos eficiente
3. Conceptos avanzados para la manipulación de estructuras de datos en pandas
4. Las métricas de distancia, las matrices de distancia y las distribuciones con SciPy
Módulo 5: El entrenamiento y la evaluación de modelos de machine learning (ML)
1. La normalización de datos con Sklearn
2. La extracción de atributos con Sklearn
3. El uso de Sklearn para entrenar modelos de predicción, clasificación y de ML no
supervisado
4. La evaluación de modelos de predicción, clasificación y de aprendizaje no supervisado
5. La validación cruzada
Módulo 6: La paralelización del entrenamiento de modelos y programas mediante el
multiprocesamiento
1. Introducción a la paralelización
2. El parámetro n_jobs y los random forests en Sklearn
3. La paralelización de la técnica grid search en Sklearn
4. El multiprocesamiento en Python
5. El desarrollo de random forests a través de los módulos de multiprocesamiento y los
árboles de decisión de Sklearn
Módulo 7: La paralelización de web scrapers mediante la programación multihilo
1. La programación multihilo frente al multiprocesamiento
2. La programación multihilo en Python
3. La extracción de datos a través del módulo request
4. La programación multihilo para la extracción de datos en paralelo
Módulo 8: La implementación de modelos
1. Entrenar y guardar un modelo Sklearn
2. Definición de API y creación de una API de Flask básica
3. El desarrollo de una API de Flask para hacer predicciones a través de un modelo de ML
guardado
4. La puntuación por lotes a través del multiprocesamiento

*Es posible que se produzcan cambios en el índice de contenidos por motivos académicos.

4
Los participantes deben realizar un módulo cada semana. Esto incluye la entrega de actividades
y la participación en foros de discusión.

CERTIFICADO DEL PROGRAMA

Al finalizar el programa, los participantes recibirán un Certificate of Completion por parte de


University of Chicago Professional Education. Este certificado acredita oficialmente que han
completado el programa. Podrá ser compartido en redes sociales, como LinkedIn.

ACCESO AL MATERIAL DEL PROGRAMA

Al finalizar el programa y durante un periodo de trienta días, los participantes tendrán acceso al


campus virtual con todos los contenidos, actividades, foros y material complementario. Podrán
repasar los contenidos que consideren relevantes y consultar de nuevo las actividades y foros
realizados.

SOPORTE ACADÉMICO

Todos los participantes tendrán asistencia para resolver todas sus preguntas o dificultades
relacionadas con el acceso, la utilización del campus virtual y el proceso de aprendizaje.

El plazo de respuesta a las incidencias es de veinticuatro a cuarentiocho horas.

Es posible contactar a través del Buzón del campus virtual o por correo electrónico a
academicsupport@[Link]

También podría gustarte