Ciencia de Datos
Unidad Didáctica nro. 1
Ciencia de Datos: Definición y conceptos. Gestión y uso de la información.
Modelos tradicionales de gestión de la información. Modelos de gestión
de la información basados en ciencia de datos.
Unidad Didáctica nro. 2
Datos. Tipos y atributos. Ciclo de vida. Captura, pre-procesamiento,
análisis y visualización. Gestión de datos. Preparación, validación y de
datos. Evaluación de resultados.
Unidad Didáctica nro. 3
Metodología para Análisis de datos: Tableros de control Análisis predictivo
e Inteligencia de Negocios. Visualización y transformación de la
información
Unidad Didáctica nro. 4
Ética en ciencia de datos. Calidad, privacidad y seguridad de los datos
Perspectiva de género y los derechos humanos en ciencia de datos.
Ciencia de datos como factor clave para la autonomía tecnológica,
desarrollo económico y competitividad en las industrias.
Técnica y procesamiento del Habla
1-Introducción a NLP:
Definición y alcance de la inteligencia artificial.
Breve historia y evolución de NLP.
Aplicaciones prácticas de NLP en la vida cotidiana y en la industria.
Análisis de texto básico
2-Procesamiento del Lenguaje natural
Tokenización, lematización y stemming.
Análisis sintáctico y semántico.
Uso de bibliotecas populares como spaCy, NLTK,Part of speech
Named Entity
3- Aprendisaje Automático aplicado a NLP
Introducción a técnicas de aprendizaje automático.
CountVectorizer
Logistic Regression
Clasificación de texto: análisis de sentimientos, detección de spam,
4- Topic Modeling
Overview de Topic modeling
LDA (Latent Dirichlet)
NMF (Non Negative Matrix Factorization)
5- Semantic and Sentimental Analysis, Embeddings
Traditional Embedding
Semantic y Word Vectors
Word2vec
6- Recuperación de Información
Base de datos vectoriales (Chroma)
Concepto de Similitud
PageRank.
Hits
7- Dep Learning for NLP
Perceptron
Feed Forwards Neural Networks
Uso de bibliotecas Keras, PyTorch
Recurrent Neural Networks (RNN)
Long Short Term Memomry (LSTM)
Text Generation con LSTM.