0% encontró este documento útil (0 votos)
34 vistas2 páginas

Introducción a Ciencia de Datos y NLP

El documento abarca dos áreas principales: Ciencia de Datos y Procesamiento del Lenguaje Natural (NLP). En Ciencia de Datos, se exploran conceptos fundamentales, gestión de datos, metodologías de análisis y consideraciones éticas. En NLP, se cubren técnicas de procesamiento, aprendizaje automático, modelado de temas y redes neuronales profundas para aplicaciones prácticas.

Cargado por

Noelia Cotignola
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
34 vistas2 páginas

Introducción a Ciencia de Datos y NLP

El documento abarca dos áreas principales: Ciencia de Datos y Procesamiento del Lenguaje Natural (NLP). En Ciencia de Datos, se exploran conceptos fundamentales, gestión de datos, metodologías de análisis y consideraciones éticas. En NLP, se cubren técnicas de procesamiento, aprendizaje automático, modelado de temas y redes neuronales profundas para aplicaciones prácticas.

Cargado por

Noelia Cotignola
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Ciencia de Datos

Unidad Didáctica nro. 1


Ciencia de Datos: Definición y conceptos. Gestión y uso de la información.
Modelos tradicionales de gestión de la información. Modelos de gestión
de la información basados en ciencia de datos.

Unidad Didáctica nro. 2


Datos. Tipos y atributos. Ciclo de vida. Captura, pre-procesamiento,
análisis y visualización. Gestión de datos. Preparación, validación y de
datos. Evaluación de resultados.

Unidad Didáctica nro. 3


Metodología para Análisis de datos: Tableros de control Análisis predictivo
e Inteligencia de Negocios. Visualización y transformación de la
información

Unidad Didáctica nro. 4


Ética en ciencia de datos. Calidad, privacidad y seguridad de los datos
Perspectiva de género y los derechos humanos en ciencia de datos.
Ciencia de datos como factor clave para la autonomía tecnológica,
desarrollo económico y competitividad en las industrias.
Técnica y procesamiento del Habla
1-Introducción a NLP:
Definición y alcance de la inteligencia artificial.
Breve historia y evolución de NLP.
Aplicaciones prácticas de NLP en la vida cotidiana y en la industria.
Análisis de texto básico
2-Procesamiento del Lenguaje natural
Tokenización, lematización y stemming.
Análisis sintáctico y semántico.
Uso de bibliotecas populares como spaCy, NLTK,Part of speech
Named Entity
3- Aprendisaje Automático aplicado a NLP
Introducción a técnicas de aprendizaje automático.
CountVectorizer
Logistic Regression
Clasificación de texto: análisis de sentimientos, detección de spam,
4- Topic Modeling
Overview de Topic modeling
LDA (Latent Dirichlet)
NMF (Non Negative Matrix Factorization)
5- Semantic and Sentimental Analysis, Embeddings
Traditional Embedding
Semantic y Word Vectors
Word2vec
6- Recuperación de Información
Base de datos vectoriales (Chroma)
Concepto de Similitud
PageRank.
Hits
7- Dep Learning for NLP
Perceptron
Feed Forwards Neural Networks
Uso de bibliotecas Keras, PyTorch
Recurrent Neural Networks (RNN)
Long Short Term Memomry (LSTM)
Text Generation con LSTM.

También podría gustarte