9 DATA SCIENCE E-BOOKS
Los mejores consejos para
comenzar tu carrera
Contenidos
CÓMO COMENZAR EN CIENCIA DE
DATOS
Rosana Ferrero
¿QUÉ ES LA CIENCIA DE DATOS? www.maximaformacion.es
APLICACIONES PRÁCTICAS DE LA CIENCIA DE DATOS
¿QUÉ PROBLEMAS RESUELVE LA CIENCIA DE DATOS?
¿LA CIENCIA DE DATOS ES PARA MÍ?
7 ETAPAS DE UN PROYECTO DE CIENCIA DE DATOS
ROLES PROFESIONALES DE LA CIENCIA DE DATOS
¿CÓMO TE CONVIERTES EN CIENTÍFICO DE DATOS?
¿QUÉ HERRAMIENTAS/SOFTWARES NECESITO?
ROADMAP DE LA CIENCIA DE DATOS
PÁGINA 1
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
¿Qué vas a obtener con este Ebook?
La ciencia de datos es un campo relativamente
nuevo y junto con sus beneficios viene una gran
dificultad: la confusión. ¿Por dónde empezar? ¿Qué
aprender y cómo aprender? ¿Cómo encontrar los
recursos adecuados para la ciencia de datos?
En este ebook respondemos las preguntas más
frecuentes de los apasionados por los datos.
¡Contestamos tus dudas,
te ayudamos a descubrir
diferentes aspectos de la
carrera en Ciencia de
Datos y las mejores
prácticas!
PÁGINA 2
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
¿Qué es la Ciencia de Datos?
Se trata de convertir los datos en información útil
Por lo tanto lo que distingue a la Ciencia de Datos es el uso que le
damos a los datos, la creación de predicciones e información
impactante para una amplia gama de campos académicos y de la
industria.
Aplicaciones prácticas
Detección de anomalías
Identifica anomalías y valores atípicos (outliers) en un conjunto de
datos; sus usos incluyen la detección de fraudes y la ciberseguridad.
Reconocimiento de patrones
Descubre patrones en los datos; incluye el uso de analítica de
clientes, comercio financiero y manejo de riesgo.
Motores de recomendación
Sugerir productos e elementos a los clientes; sus usos incluye la
venta online y los servicios de medios audiovisuales.
Análisis de sentimiento
Analiza datos para comprender los sentimientos de los
clientes;incluye el marketing y los servicios de clientes.
Modelado predictivo
Modelar el comportamiento y eventos futuros; incluye el marketing
dirigido y el mantenimiento predictivo.
IA Conversacional
Asistentes de chatbot; para servicios a clientes e reclamaciones.
PÁGINA 3
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Los Científicos de datos son diversos,
también lo son sus trabajos.
La Ciencia de Datos es para todos. No importa el background que
tengas, la analítica te servirá tanto para la academia como para la
industria. Combina tu área de conocimiento con la analítica para crear
tu perfil profesional que destaque.
PÁGINA 4
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
¿Cuál de las profesiones de datos se adapta más
a tu personalidad?
¿Quieres saber más? Consulta los perfiles de los Científicos de Datos
más reconocidos del mundo.✨
Fei-Fei Li: A
Cassie Kozyrkov: cie ero del Lady Who
ntífica Andrew Ng: Pion Teaches Co
jefe de decisiones mático y mputers To
de Google aprendizaje auto Understand
línea Pictures
la educación en
er in AI n: Padrino
ig: A Pione
Corinna Corte
s: Pionera Geoffrey Hinto
Peter Norv ie nc e de la je Profundo
rized D ata S c minería de datos y del Aprendiza
Who Popula
is Books SVM
Through H
https://www.scijournal.org/articles/famous-data-scientists
PÁGINA 5
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Los pilares de la Ciencia de Datos
¿Qué habilidades tiene un científico de datos?
Para responder a esto, analicemos el popular
diagrama de Venn Diagrama de Venn de Drew
Conway en el que la ciencia de datos es la
intersección de tres sectores.
Conocimiento del
Negocio y/o Ciencias
(biología, leyes,
económicas)
Bases de datos, Álgebra lineal,
algoritmos, cálculo,
aprendizaje optimización,
automático, estadística
big data, clásica y
programación bayesiana
Drew Conway (2010)
PÁGINA 6
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Qué problemas resuelve la Ciencia de Datos
La Ciencia de datos es un término general que
engloba varios subcampos.
A menudo se intercambian las palabras Análisis de Datos,
Estadística, Machine Learning & Artificial Intelligence, pero cada uno
tiene objetivos diferentes.
Inspírate Decide Crea reglas Actúa
(exploración) (comprensión) (predicción) (acción)
Analítica Inferencia Aprendizaje Inteligencia
descriptiva estadística automático artificial
El objetivo de la inteligencia artificial es realizar tareas de manera
autónoma, y para ello necesita capacidad de aprendizaje. A menudo
puede ser difícil indicarle a la máquina cómo debe aprender, porque
desconocemos las reglas exactas con las que resolver una tarea, otras
veces queremos automatizar el aprendizaje a partir de la experiencia,
en estos casos entra en juego el aprendizaje automático como bloque
de construcción.
Por otra parte, si lo que buscas es tomar decisiones bajo
incertidumbre, querrás utilizar la inferencia estadística y, si buscas
inspiración, necesitas describir, explorar o analizar datos.
PÁGINA 7
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
¿Por qué aprender Ciencia de Datos?
El auge de la Ciencia de Datos es realmente emocionante. Pero
comienza preguntándote por qué querrías ser un profesional del
dato y qué esperas lograr en tu carrera para asegurarte de que te
dirijas a una experiencia que disfrutarás de principio a fin.
10 razones para comenzar tu carrera en Data Science:
1. Oportunidad de generar impacto: innovación
2. Trabaja en la academia, la industria o incluso como freelance.
3. Múltiples industrias/dominios: multidisciplinar
4. Roles diferentes para elegir según tus preferencias.
5. Trabajo en equipo.
6. La necesidad de éstas habilidades nunca ha sido tan grande.
7. Constante aprendizaje de habilidades.
8. Puedes trabajar en diferentes partes del mundo.
9. Oportunidad de crecimiento (e.g. debido a la digitalización)
10. ¡No te vas a aburrir!
PÁGINA 8
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
¿La Ciencia de Datos es para mí?
La ciencia de datos es para ti si:
Disfrutas de trabajar con datos.
Te gusta mucho el análisis.
Eres una persona a la que le gusta resolver problemas y los nuevos
desafíos.
Te gusta explorar, discutir, organizar y analizar datos complejos.
Te gusta la mejora continua de procesos, automatizar y optimizar.
Eres creativo, flexible, eres cuidadoso con los detalles pero también
te interesa la visión global de los problemas.
No importa
No importa qué edad tienes.
No importa qué estudiaste previamente.
No importa de dónde eres.
Ni cuánto conocimiento técnico tienes.
PUEDES COMENZAR DESDE CERO,
ESPECIALIZARTE O
DAR UN GIRO PARA IMPULSAR TU PERFIL PROFESIONAL.
PÁGINA 9
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
7 etapas de un proyecto de Ciencia de Datos
El Ciclo de Vida de la Ciencia de Datos
es un proceso que incluye varias fases.
1 Problema: comprender el objetivo de
investigación o negocio.
2
Datos: recolectar los datos, mantenerlos
y actualizarlos.
3
Preparación: limpiar, ordenar,
transformar y preparar los datos.
Modelado: seleccionar el algoritmo a
4 utilizar, ajustar el modelo, evaluar,
diagnosticar y validar.
5
Implementación: poner en producción
el modelo.
6
Monitoreo: revisar el rendimiento del
modelo para nuevos datos.
7
Reentrenamiento: para garantizar la
rapidez y precisión del modelo.
PÁGINA 10
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Roles profesionales de la Ciencia de Datos
Hay muchos roles involucrados en la ciencia de datos,
pero voy a destacar cuatro de ellos.
Ingeniero de datos: obtiene,
almacena y mantiene los datos.
Analista de datos: procesa,
visualiza y describe los datos.
Ingeniero de Machine Learning:
entrena modelos y los despliega
en producción.
Científico de datos: supervisa todo
el ciclo, obtiene valor de los datos.
CADA UNA DE LAS ESPECIALIZACIONES ENFRENTA DIFERENTES DESAFÍOS EN
DIFERENTES ESCALAS DE ORGANIZACIÓN.
PÁGINA 11
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Cómo te conviertes en un Científico de Datos
Capacitación + Entrenamiento
Aprende los fundamentos y pon énfasis en desarrollar habilidades
relevantes para tu trabajo diario, que te mantengan motivado y con el
foco en el resultado esperado. Practica a diario con proyectos de datos
para lograr dominar. Comparte, pregunta y haz networking, la discusión
aclara las ideas y abre oportunidades para el desarrollo. Busca un
entrenador personal en Ciencia de Datos, una guía diaria que te ayude a
ganar confianza en el camino a seguir y descartar lo matos hábitos.
Saber Saber hacer Hacer
(Conocimiento) (Habilidad) (Actitud)
1 2 3
EL CONOCIMIENTO QUE NO SE TRADUCE EN HABILIDADES, NO PERDURA.
PÁGINA 12
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
1 Comienza por lo básico: los fundamentos
Al final las tecnologías seguirán evolucionado pero lo
fundamentos te servirán como punto de partida para todo
lo que hagas.
¿Necesito saber Estadística?
Sí, “La estadística es la gramática
de la ciencia”. Pero no tengas miedo,
no estás obligado a realizar un
doctorado en estadística, necesitas
un conjunto básico de conocimientos
para ejecutar tu función (como
estadísticas descriptivas,
inferenciales, modelos de regresión).
No te llevará mucho tiempo si
encuentras los recursos adecuados.
Recopilación de datos. Muestreo Estadística inferencial
Ética y privacidad de los datos Métodos multivariados
Diseño experimental Modelado, selección y evaluación
Limpieza y preparación de datos Probabilidad
Ingeniería de datos Álgebra lineal y cálculo
Estadística descriptiva Comunicación de los resultados.
La mejor Ciencia de Datos siempre
comienza con la Ciencia, no con los Datos.
PÁGINA 13
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
1 Comprende el problema a resolver
¿Necesito experiencia en el área?
Sí, debes identificar el problema y los
usuarios objetivo, conocer la
investigación o negocio, definir los
resultados esperados, definir las
medidas de éxito e identificar
limitantes, brechas y factores.
Consejos para responder preguntas de negocio/ciencia:
Ten siempre presente tu objetivo, el problema que quieres resolver,
te mantendrá motivado y orientado.
Ten en cuenta el contexto que está detrás de tu investigación y
evalúa el alcance (la importancia práctica) de tus resultados.
Conocer los antecedentes de los datos nos ayudará a tomar
decisiones más sensatas e interesantes. ¿eres capaz de explicar el
significado real de los resultados de tu investigación?. Debemos
ser claros en la importancia práctica de nuestros hallazgos.
PÁGINA 14
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
2 Luego domina las herramientas
¿Necesito ser bueno programando?
No necesitas ser un ingeniero de software, pero tener claro los
conceptos básicos de programación te ayudará.
Las habilidades son las capacidades para ejecutar la función y eso
incluye la programación.
La programación te permitirá:
Automatizar tareas
Manejar bases de datos grandes
Explorar múltiples funcionalidades de manera sencilla
Experimentar Múltiples formas de comunicar resultados
Registrar tu trabajo para hacerlo reproducible
PÁGINA 15
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
2 Lenguajes de Ciencia de Datos
¿Cuál deberías elegir para tu carrera?
Cada lenguaje tiene sus propias características y capacidades únicas
que lo hacen funcionar para ciertos profesionales de la ciencia de datos.
Administración
Lenguaje de consulta estructurada,
orientado a la manipulación, Investigación
consulta, extracción y preparación Lenguaje estadístico orientado
de datos. al análisis, visualización y
MySQL (gratis) o SQLServer (pago) modelado.
Fácil para usos básicos Open source
Relativamente sencillo,
estadística con poco código.
Producción ¿Entonces que herrami
enta
Lenguaje de programación tengo que aprender?
multifuncional, orientado a la ¿Me recomendas apren
der
primero SQL, R o Pyth
automatización de tareas, on?
ingeniería de datos y puesta en
Piensa QUÉ vas hace
r con
producción de modelos. esas herramientas
Open source
Relativamente sencillo.
Elige una y empieza, lo que importa es la habilidad.
No necesitas utilizar todos los idiomas, pero elige uno y
PÁGINA 16 domínalo con el tiempo.
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
3 Consigue la actitud, mentalidad
y experiencia adecuada
Un principiante ni siquiera sabe lo que no sabe. Repiten a ciegas y
luego modifican las cosas con la esperanza de que funcionen, usan la
jerga de manera incorrecta o hacen preguntas que tienen poco sentido.
Un profesional competente puede hacer cosas rutinarias de manera
confiable, pero es posible que necesiten buscar detalles que no usan
muy a menudo. La mayoría de nosotros nos volvemos competentes en la
mayoría de las cosas que hacemos regularmente y no nos molestamos en
progresar más allá de eso.
Los expertos parecen ser capaces de resolver problemas comunes de
un vistazo, por lo general son mucho mejores para trabajar hacia atrás
desde los efectos hasta las causas, es decir, en el diagnóstico y la
depuración.
Es difícil pasar de principiante a experto en un solo curso o taller, pero sí pasar de
principiante a competente. Para pasar de competente a experto el enfoque más
efectivo es el entrenamiento individual y la experiencia.
PÁGINA 17
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Aprende sin perder el norte
El éxito de toda formación está en el trabajo, la organización y el
compromiso. Ningún contenido gratuito o de pago será suficiente si no
inviertes el tiempo necesario para aprender, y esto es cierto para
cualquier cosa. No hay recetas mágicas, no es cuestión de suerte, ni hay
atajos.
Aprende una herramienta a la vez. No necesitas aprender 10
herramientas, aprende una y domínala. El 80% de las tareas se realizan
con una única herramienta, como R.
Mantente actualizado, pero no dejes que esto te distraiga de tus
objetivos. Las novedades no te vuelven obsoleto, por eso, dosifica tu
esfuerzo, es mejor ir lento pero seguro. Menos es más.
PÁGINA 18
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Aprende "haciendo"
¡La práctica hace al maestro!
Céntrate en las aplicaciones prácticas, no solo en la teoría. Esto te
ayudará a comprender el concepto, y te dará también una idea más
profunda de cómo se aplica en la realidad.
Consejos para aprender con la práctica y compartir experiencias:
Aprende por proyectos, crea tu propio portfolio con soluciones para
problemas de negocio y gana experiencia.
Enseña tus logros en un blog, sitio web, Github, redes sociales y
otros medios como Youtube, medium, Stackoverflow.
Participa de competiciones como Kaggle y Hackatones.
Participa de actividades de voluntariado o como becario, para ganar
experiencia.
Participa activamente en Linkedin, sigue a científicos de datos
renombrados, amplía tu red de contactos y realiza networking.
Asiste a eventos relacionados con la Ciencia de Datos.
Prepárate para entrevistas de trabajo.
PÁGINA 19
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Aprende de los errores
Al igual que cualquier
destreza o habilidad en la vida,
la Ciencia de Datos es algo que
se aprende y se perfecciona
con los años y con la
experiencia.
Cometer errores en Ciencia de Datos es algo muy común. Sentir
ansiedad o temor es natural cuando te enfrentas a algo nuevo, pero no
permitas que esto te paralice. No veas los errores como un fracaso sino
como una oportunidad de aprendizaje, avanza y gana autonomía. Si
quieres crecer más rápido, aprende de los errores.
Consejos para aprovechar las equivocaciones y que estas impulsen tu
aprendizaje para mejorar:
1. Poner los conocimientos en práctica, el dominio debe ser el objetivo.
2. Aceptar los errores como parte del proceso de aprendizaje.
3. Intentar corregir el problema por tu cuenta. Al investigar la solución
adquieres nuevos conocimientos.
4. Pedir luego la opinión de otras personas, para ampliar tu horizonte.
5. Comprender que la formación es un proceso continuo. Lo mejor que
puedes hacer es ser flexible y entender que estarás en constante
aprendizaje.
PÁGINA 20
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Hoja de ruta de Ciencia de Datos
Las hojas de ruta son planes estratégicos que determinan un objetivo
o el resultado deseado y presentan los pasos o hitos importantes
necesarios para alcanzarlo.
Consigue tu empleo
en Ciencia de Datos.
Construye tu perfil y portfolio.
Prepárate para entrevistas.
Machine Learning, Deep Learning, Artificial
Intelligence y despliegue de modelo.
Aprende las herramientas clave
para la Ciencia de Datos
(SQL, R, Python)
Aprende las bases de
Estadística/Matemáticas,
y Conocimiento del área (e.g. negocios)
PÁGINA 21
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Dónde aprender Ciencia de Datos
Resumen:
1. La ruta de aprendizaje anterior variará según el rol que buscas.
2. Pon el foco en las aplicaciones, no solo el enfoque teórico.
3. Obtén experiencia del mundo real (e.g. voluntariado, becario,
proyectos, crea tu portfolio).
4. No quieras resolver un proyecto de datos entero, empieza por
resolver un problema más pequeño.
5. No realices mil cursos a la vez, hazlos de a uno y de manera integral.
6. Busca un mentor, un tutor a quién puedas consultar por más
información y que te dé una evaluación sustantiva y personalizada.
7. Aprende en grupo, te brindará apoyo y motivación.
8. Consulta libros, blogs de profesionales, meetup, Jornadas, etc..
PÁGINA 22
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
Dónde aprender Ciencia de Datos
Hay un montón de recursos disponibles para aprender Ciencia de
Datos, esto es naturalmente algo maravilloso, pero dado que hay tanto
por ahí, ¿Por dónde empezar? ¿Cómo distinguir el material de valor?
¿Qué camino seguir?
Me haría las siguientes preguntas para tomar la decision:
¿Eres una persona que tiene constancia para aprender por su cuenta
y te gusta ir a tu ritmo? En ese caso apuesta por la formación online.
¿Los empleos que buscas requieren un título universitario o Máster?
¿O lo que buscas es realizar una investigación en un doctorado?
¿Prefieres un certificado por una universidad o un bootcamp con
proyectos?
¿En tu trabajo actual tienes alguna oportunidad de moverte hacia un
rol mas analítico? ¿Qué habilidades y herramientas buscan?
PÁGINA 23
MASTER DATA SCIENCE | MASTER MACHINE LEARNING
DATA SCIENCE
Máxima Formación e-books
☎️+34 635 659 391 | +598 94 707 187
[email protected] ¡Síguenos en redes sociales!
PÁGINA 24
Más información
Máster de Estadística Aplicada
para la Ciencia de Datos con R
M con técnicas estadísticas clásicas,
Extrae todo el potencial de tus datos
robustas, avanzadas y multivariantes.
Más información
Toma decisiones inteligentes basadas en la experiencia de los datos