0% encontró este documento útil (0 votos)
386 vistas27 páginas

Ebook CIENCIA DE DATOS CON R

Este documento presenta una introducción a la ciencia de datos, incluyendo definiciones de conceptos clave, aplicaciones prácticas, roles profesionales, habilidades necesarias y razones para aprender ciencia de datos. Explica que la ciencia de datos involucra el análisis de datos para generar información útil a través de técnicas como aprendizaje automático, modelado predictivo y reconocimiento de patrones. También destaca que la ciencia de datos es multidisciplinaria y abierta a personas de diferentes antecedentes.

Cargado por

Vlad Tovar
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
386 vistas27 páginas

Ebook CIENCIA DE DATOS CON R

Este documento presenta una introducción a la ciencia de datos, incluyendo definiciones de conceptos clave, aplicaciones prácticas, roles profesionales, habilidades necesarias y razones para aprender ciencia de datos. Explica que la ciencia de datos involucra el análisis de datos para generar información útil a través de técnicas como aprendizaje automático, modelado predictivo y reconocimiento de patrones. También destaca que la ciencia de datos es multidisciplinaria y abierta a personas de diferentes antecedentes.

Cargado por

Vlad Tovar
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

9 DATA SCIENCE E-BOOKS 

Los mejores consejos para


comenzar tu carrera
Contenidos
CÓMO COMENZAR EN CIENCIA DE
DATOS
Rosana Ferrero
¿QUÉ ES LA CIENCIA DE DATOS? www.maximaformacion.es

APLICACIONES PRÁCTICAS DE LA CIENCIA DE DATOS

¿QUÉ PROBLEMAS RESUELVE LA CIENCIA DE DATOS?

¿LA CIENCIA DE DATOS ES PARA MÍ?

7 ETAPAS DE UN PROYECTO DE CIENCIA DE DATOS

ROLES PROFESIONALES DE LA CIENCIA DE DATOS

¿CÓMO TE CONVIERTES EN CIENTÍFICO DE DATOS?

¿QUÉ HERRAMIENTAS/SOFTWARES NECESITO?

ROADMAP DE LA CIENCIA DE DATOS

PÁGINA 1
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

¿Qué vas a obtener con este Ebook?

La ciencia de datos es un campo relativamente


nuevo y junto con sus beneficios viene una gran
dificultad: la confusión. ¿Por dónde empezar? ¿Qué
aprender y cómo aprender? ¿Cómo encontrar los
recursos adecuados para la ciencia de datos?
En este ebook respondemos las preguntas más
frecuentes de los apasionados por los datos.

¡Contestamos tus dudas,


te ayudamos a descubrir
diferentes aspectos de la
carrera en Ciencia de
Datos y las mejores
prácticas!

PÁGINA 2
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

¿Qué es la Ciencia de Datos?


Se trata de convertir los datos en información útil

Por lo tanto lo que distingue a la Ciencia de Datos es el uso que le


damos a los datos, la creación de predicciones e información
impactante para una amplia gama de campos académicos y de la
industria.

Aplicaciones prácticas
Detección de anomalías
Identifica anomalías y valores atípicos (outliers) en un conjunto de
datos; sus usos incluyen la detección de fraudes y la ciberseguridad.

Reconocimiento de patrones
Descubre patrones en los datos; incluye el uso de analítica de
clientes, comercio financiero y manejo de riesgo.

Motores de recomendación
Sugerir productos e elementos a los clientes; sus usos incluye la
venta online y los servicios de medios audiovisuales.

Análisis de sentimiento
Analiza datos para comprender los sentimientos de los
clientes;incluye el marketing y los servicios de clientes.

Modelado predictivo
Modelar el comportamiento y eventos futuros; incluye el marketing
dirigido y el mantenimiento predictivo.

IA Conversacional
Asistentes de chatbot; para servicios a clientes e reclamaciones.

PÁGINA 3
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Los Científicos de datos son diversos,


también lo son sus trabajos.

La Ciencia de Datos es para todos. No importa el background que


tengas, la analítica te servirá tanto para la academia como para la
industria. Combina tu área de conocimiento con la analítica para crear
tu perfil profesional que destaque.

PÁGINA 4
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

¿Cuál de las profesiones de datos se adapta más


a tu personalidad?

¿Quieres saber más? Consulta los perfiles de los Científicos de Datos


más reconocidos del mundo.✨

Fei-Fei Li: A
Cassie Kozyrkov: cie ero del Lady Who
ntífica Andrew Ng: Pion Teaches Co
jefe de decisiones mático y mputers To
de Google aprendizaje auto Understand
línea Pictures

la educación en

er in AI n: Padrino
ig: A Pione
Corinna Corte
s: Pionera Geoffrey Hinto
Peter Norv ie nc e de la je Profundo
rized D ata S c minería de datos y del Aprendiza
Who Popula

is Books SVM
Through H

https://www.scijournal.org/articles/famous-data-scientists

PÁGINA 5
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Los pilares de la Ciencia de Datos

¿Qué habilidades tiene un científico de datos?

Para responder a esto, analicemos el popular


diagrama de Venn Diagrama de Venn de Drew
Conway en el que la ciencia de datos es la
intersección de tres sectores.

Conocimiento del
Negocio y/o Ciencias
(biología, leyes,
económicas)

Bases de datos, Álgebra lineal,


algoritmos, cálculo,
aprendizaje optimización,
automático, estadística
big data, clásica y
programación bayesiana

Drew Conway (2010)

PÁGINA 6
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Qué problemas resuelve la Ciencia de Datos


La Ciencia de datos es un término general que
engloba varios subcampos.

A menudo se intercambian las palabras Análisis de Datos,


Estadística, Machine Learning & Artificial Intelligence, pero cada uno
tiene objetivos diferentes.

Inspírate Decide Crea reglas Actúa


(exploración) (comprensión) (predicción) (acción)



Analítica Inferencia Aprendizaje Inteligencia


descriptiva estadística automático artificial

El objetivo de la inteligencia artificial es realizar tareas de manera


autónoma, y para ello necesita capacidad de aprendizaje. A menudo
puede ser difícil indicarle a la máquina cómo debe aprender, porque
desconocemos las reglas exactas con las que resolver una tarea, otras
veces queremos automatizar el aprendizaje a partir de la experiencia,
en estos casos entra en juego el aprendizaje automático como bloque
de construcción.
Por otra parte, si lo que buscas es tomar decisiones bajo
incertidumbre, querrás utilizar la inferencia estadística y, si buscas
inspiración, necesitas describir, explorar o analizar datos.

PÁGINA 7
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

¿Por qué aprender Ciencia de Datos?

El auge de la Ciencia de Datos es realmente emocionante. Pero


comienza preguntándote por qué querrías ser un profesional del
dato y qué esperas lograr en tu carrera para asegurarte de que te
dirijas a una experiencia que disfrutarás de principio a fin.

10 razones para comenzar tu carrera en Data Science:

1. Oportunidad de generar impacto: innovación


2. Trabaja en la academia, la industria o incluso como freelance.
3. Múltiples industrias/dominios: multidisciplinar
4. Roles diferentes para elegir según tus preferencias.
5. Trabajo en equipo.
6. La necesidad de éstas habilidades nunca ha sido tan grande.
7. Constante aprendizaje de habilidades.
8. Puedes trabajar en diferentes partes del mundo.
9. Oportunidad de crecimiento (e.g. debido a la digitalización)
10. ¡No te vas a aburrir!

PÁGINA 8
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

¿La Ciencia de Datos es para mí?


La ciencia de datos es para ti si:
Disfrutas de trabajar con datos.
Te gusta mucho el análisis.
Eres una persona a la que le gusta resolver problemas y los nuevos
desafíos.
Te gusta explorar, discutir, organizar y analizar datos complejos.
Te gusta la mejora continua de procesos, automatizar y optimizar.
Eres creativo, flexible, eres cuidadoso con los detalles pero también
te interesa la visión global de los problemas.

No importa
No importa qué edad tienes.
No importa qué estudiaste previamente.
No importa de dónde eres.
Ni cuánto conocimiento técnico tienes.

PUEDES COMENZAR DESDE CERO,


ESPECIALIZARTE O
DAR UN GIRO PARA IMPULSAR TU PERFIL PROFESIONAL.

PÁGINA 9
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

7 etapas de un proyecto de Ciencia de Datos


El Ciclo de Vida de la Ciencia de Datos
es un proceso que incluye varias fases.

1 Problema: comprender el objetivo de


investigación o negocio.

2
Datos: recolectar los datos, mantenerlos
y actualizarlos.

3
Preparación: limpiar, ordenar,
transformar y preparar los datos.

Modelado: seleccionar el algoritmo a


4 utilizar, ajustar el modelo, evaluar,
diagnosticar y validar.

5
Implementación: poner en producción
el modelo.

6
Monitoreo: revisar el rendimiento del
modelo para nuevos datos.

7
Reentrenamiento: para garantizar la
rapidez y precisión del modelo.

PÁGINA 10
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Roles profesionales de la Ciencia de Datos

Hay muchos roles involucrados en la ciencia de datos,


pero voy a destacar cuatro de ellos.

Ingeniero de datos: obtiene,


almacena y mantiene los datos.

Analista de datos: procesa,


visualiza y describe los datos.

Ingeniero de Machine Learning:


entrena modelos y los despliega
en producción.

Científico de datos: supervisa todo


el ciclo, obtiene valor de los datos.

CADA UNA DE LAS ESPECIALIZACIONES ENFRENTA DIFERENTES DESAFÍOS EN


DIFERENTES ESCALAS DE ORGANIZACIÓN.
PÁGINA 11
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Cómo te conviertes en un Científico de Datos


Capacitación + Entrenamiento

Aprende los fundamentos y pon énfasis en desarrollar habilidades


relevantes para tu trabajo diario, que te mantengan motivado y con el
foco en el resultado esperado. Practica a diario con proyectos de datos
para lograr dominar. Comparte, pregunta y haz networking, la discusión
aclara las ideas y abre oportunidades para el desarrollo. Busca un
entrenador personal en Ciencia de Datos, una guía diaria que te ayude a
ganar confianza en el camino a seguir y descartar lo matos hábitos.

Saber Saber hacer Hacer


(Conocimiento) (Habilidad) (Actitud)

1 2 3
EL CONOCIMIENTO QUE NO SE TRADUCE EN HABILIDADES, NO PERDURA.
PÁGINA 12
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

1 Comienza por lo básico: los fundamentos

Al final las tecnologías seguirán evolucionado pero lo


fundamentos te servirán como punto de partida para todo
lo que hagas.

¿Necesito saber Estadística?


Sí, “La estadística es la gramática
de la ciencia”. Pero no tengas miedo,
no estás obligado a realizar un
doctorado en estadística, necesitas
un conjunto básico de conocimientos
para ejecutar tu función (como
estadísticas descriptivas,
inferenciales, modelos de regresión).
No te llevará mucho tiempo si
encuentras los recursos adecuados.

Recopilación de datos. Muestreo Estadística inferencial


Ética y privacidad de los datos Métodos multivariados
Diseño experimental Modelado, selección y evaluación
Limpieza y preparación de datos Probabilidad
Ingeniería de datos Álgebra lineal y cálculo
Estadística descriptiva Comunicación de los resultados.

La mejor Ciencia de Datos siempre


comienza con la Ciencia, no con los Datos.
PÁGINA 13
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

1 Comprende el problema a resolver

¿Necesito experiencia en el área?


Sí, debes identificar el problema y los
usuarios objetivo, conocer la
investigación o negocio, definir los
resultados esperados, definir las
medidas de éxito e identificar
limitantes, brechas y factores.

Consejos para responder preguntas de negocio/ciencia:


Ten siempre presente tu objetivo, el problema que quieres resolver,
te mantendrá motivado y orientado.
Ten en cuenta el contexto que está detrás de tu investigación y
evalúa el alcance (la importancia práctica) de tus resultados.
Conocer los antecedentes de los datos nos ayudará a tomar
decisiones más sensatas e interesantes. ¿eres capaz de explicar el
significado real de los resultados de tu investigación?. Debemos
ser claros en la importancia práctica de nuestros hallazgos.

PÁGINA 14
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

2 Luego domina las herramientas

¿Necesito ser bueno programando?


No necesitas ser un ingeniero de software, pero tener claro los
conceptos básicos de programación te ayudará.
Las habilidades son las capacidades para ejecutar la función y eso
incluye la programación.

La programación te permitirá:
Automatizar tareas
Manejar bases de datos grandes
Explorar múltiples funcionalidades de manera sencilla
Experimentar Múltiples formas de comunicar resultados
Registrar tu trabajo para hacerlo reproducible

PÁGINA 15
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

2 Lenguajes de Ciencia de Datos


¿Cuál deberías elegir para tu carrera?

Cada lenguaje tiene sus propias características y capacidades únicas


que lo hacen funcionar para ciertos profesionales de la ciencia de datos.

Administración

Lenguaje de consulta estructurada,


orientado a la manipulación, Investigación
consulta, extracción y preparación Lenguaje estadístico orientado
de datos. al análisis, visualización y
MySQL (gratis) o SQLServer (pago) modelado.
Fácil para usos básicos Open source

Relativamente sencillo,
estadística con poco código.

Producción ¿Entonces que herrami


enta
Lenguaje de programación tengo que aprender?
multifuncional, orientado a la ¿Me recomendas apren
der
primero SQL, R o Pyth
automatización de tareas, on?
ingeniería de datos y puesta en

Piensa QUÉ vas hace


r con
producción de modelos. esas herramientas
Open source

Relativamente sencillo.

Elige una y empieza, lo que importa es la habilidad.


No necesitas utilizar todos los idiomas, pero elige uno y
PÁGINA 16 domínalo con el tiempo.
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

3 Consigue la actitud, mentalidad


y experiencia adecuada

Un principiante ni siquiera sabe lo que no sabe. Repiten a ciegas y


luego modifican las cosas con la esperanza de que funcionen, usan la
jerga de manera incorrecta o hacen preguntas que tienen poco sentido.

Un profesional competente puede hacer cosas rutinarias de manera


confiable, pero es posible que necesiten buscar detalles que no usan
muy a menudo. La mayoría de nosotros nos volvemos competentes en la
mayoría de las cosas que hacemos regularmente y no nos molestamos en
progresar más allá de eso.

Los expertos parecen ser capaces de resolver problemas comunes de


un vistazo, por lo general son mucho mejores para trabajar hacia atrás
desde los efectos hasta las causas, es decir, en el diagnóstico y la
depuración.

Es difícil pasar de principiante a experto en un solo curso o taller, pero sí pasar de


principiante a competente. Para pasar de competente a experto el enfoque más
efectivo es el entrenamiento individual y la experiencia.
PÁGINA 17
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Aprende sin perder el norte

El éxito de toda formación está en el trabajo, la organización y el


compromiso. Ningún contenido gratuito o de pago será suficiente si no
inviertes el tiempo necesario para aprender, y ​esto es cierto para
cualquier cosa. No hay recetas mágicas, no es cuestión de suerte, ni hay
atajos.

Aprende una herramienta a la vez. No necesitas aprender 10


herramientas, aprende una y domínala. El 80% de las tareas se realizan
con una única herramienta, como R.

Mantente actualizado, pero no dejes que esto te distraiga de tus


objetivos. Las novedades no te vuelven obsoleto, por eso, dosifica tu
esfuerzo, es mejor ir lento pero seguro. Menos es más.

PÁGINA 18
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Aprende "haciendo"
¡La práctica hace al maestro!

Céntrate en las aplicaciones prácticas, no solo en la teoría. Esto te


ayudará a comprender el concepto, y te dará también una idea más
profunda de cómo se aplica en la realidad.

Consejos para aprender con la práctica y compartir experiencias:


Aprende por proyectos, crea tu propio portfolio con soluciones para
problemas de negocio y gana experiencia.
Enseña tus logros en un blog, sitio web, Github, redes sociales y
otros medios como Youtube, medium, Stackoverflow.
Participa de competiciones como Kaggle y Hackatones.
Participa de actividades de voluntariado o como becario, para ganar
experiencia.
Participa activamente en Linkedin, sigue a científicos de datos
renombrados, amplía tu red de contactos y realiza networking.
Asiste a eventos relacionados con la Ciencia de Datos.
Prepárate para entrevistas de trabajo.
PÁGINA 19
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Aprende de los errores

Al igual que cualquier


destreza o habilidad en la vida,
la Ciencia de Datos es algo que
se aprende y se perfecciona
con los años y con la
experiencia.

Cometer errores en Ciencia de Datos es algo muy común. Sentir


ansiedad o temor es natural cuando te enfrentas a algo nuevo, pero no
permitas que esto te paralice. No veas los errores como un fracaso sino
como una oportunidad de aprendizaje, avanza y gana autonomía. Si
quieres crecer más rápido, aprende de los errores.

Consejos para aprovechar las equivocaciones y que estas impulsen tu


aprendizaje para mejorar:
1. Poner los conocimientos en práctica, el dominio debe ser el objetivo.
2. Aceptar los errores como parte del proceso de aprendizaje.
3. Intentar corregir el problema por tu cuenta. Al investigar la solución
adquieres nuevos conocimientos.
4. Pedir luego la opinión de otras personas, para ampliar tu horizonte.
5. Comprender que la formación es un proceso continuo. Lo mejor que
puedes hacer es ser flexible y entender que estarás en constante
aprendizaje.

PÁGINA 20
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Hoja de ruta de Ciencia de Datos


Las hojas de ruta son planes estratégicos que determinan un objetivo
o el resultado deseado y presentan los pasos o hitos importantes
necesarios para alcanzarlo.

Consigue tu empleo
en Ciencia de Datos.

Construye tu perfil y portfolio.


Prepárate para entrevistas.

Machine Learning, Deep Learning, Artificial


Intelligence y despliegue de modelo.

Aprende las herramientas clave


para la Ciencia de Datos
(SQL, R, Python)

Aprende las bases de


Estadística/Matemáticas,
y Conocimiento del área (e.g. negocios)
PÁGINA 21
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Dónde aprender Ciencia de Datos

Resumen:
1. La ruta de aprendizaje anterior variará según el rol que buscas.
2. Pon el foco en las aplicaciones, no solo el enfoque teórico.
3. Obtén experiencia del mundo real (e.g. voluntariado, becario,
proyectos, crea tu portfolio).
4. No quieras resolver un proyecto de datos entero, empieza por
resolver un problema más pequeño.
5. No realices mil cursos a la vez, hazlos de a uno y de manera integral.
6. Busca un mentor, un tutor a quién puedas consultar por más
información y que te dé una evaluación sustantiva y personalizada.
7. Aprende en grupo, te brindará apoyo y motivación.
8. Consulta libros, blogs de profesionales, meetup, Jornadas, etc..

PÁGINA 22
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

Dónde aprender Ciencia de Datos

Hay un montón de recursos disponibles para aprender Ciencia de


Datos, esto es naturalmente algo maravilloso, pero dado que hay tanto
por ahí, ¿Por dónde empezar? ¿Cómo distinguir el material de valor?
¿Qué camino seguir?

Me haría las siguientes preguntas para tomar la decision:


¿Eres una persona que tiene constancia para aprender por su cuenta
y te gusta ir a tu ritmo? En ese caso apuesta por la formación online.
¿Los empleos que buscas requieren un título universitario o Máster?
¿O lo que buscas es realizar una investigación en un doctorado?
¿Prefieres un certificado por una universidad o un bootcamp con
proyectos?
¿En tu trabajo actual tienes alguna oportunidad de moverte hacia un
rol mas analítico? ¿Qué habilidades y herramientas buscan?

PÁGINA 23
MASTER DATA SCIENCE | MASTER MACHINE LEARNING

DATA SCIENCE
Máxima Formación e-books

☎️+34 635 659 391 | +598 94 707 187


[email protected]

¡Síguenos en redes sociales!

PÁGINA 24
Más información

Máster de Estadística Aplicada


para la Ciencia de Datos con R
M con técnicas estadísticas clásicas,
Extrae todo el potencial de tus datos
robustas, avanzadas y multivariantes.
Más información

Toma decisiones inteligentes basadas en la experiencia de los datos

También podría gustarte