0% encontró este documento útil (0 votos)
36 vistas17 páginas

Plantilla Final 999

La propuesta de tesis se centra en la detección de emociones asociadas a la depresión mediante el uso de Redes Neuronales Artificiales, abordando un problema de salud pública en México donde la depresión es comúnmente subdiagnosticada. Se busca desarrollar un modelo computacional que mejore la detección temprana de síntomas depresivos a través de técnicas de inteligencia artificial, utilizando datos de diversas fuentes como texto, imágenes y voz. La investigación tiene como objetivo contribuir a la creación de políticas públicas que fomenten la atención a la salud mental en la población mexicana.

Cargado por

adolfcg
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
36 vistas17 páginas

Plantilla Final 999

La propuesta de tesis se centra en la detección de emociones asociadas a la depresión mediante el uso de Redes Neuronales Artificiales, abordando un problema de salud pública en México donde la depresión es comúnmente subdiagnosticada. Se busca desarrollar un modelo computacional que mejore la detección temprana de síntomas depresivos a través de técnicas de inteligencia artificial, utilizando datos de diversas fuentes como texto, imágenes y voz. La investigación tiene como objetivo contribuir a la creación de políticas públicas que fomenten la atención a la salud mental en la población mexicana.

Cargado por

adolfcg
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE

MONTERREY
Campus Guadalajara

Escuela de Posgrados

Maestría en Ciencias de la Computación

PROPUESTA DE TESIS
“Detección de Emociones asociadas a la Depresión usando Redes Neuronales”

Autor
Adolfo Cabrera García

Asesor
Dr. Luis Eduardo Falcón Morales

Zapopan, Jalisco a 20 de Mayo del 2020


Resumen

La depresión se ha convertido recientemente en un problema de salud pública en México, diferentes


circunstancias permean en el tejido social convirtiendo a esta enfermedad en una de las principales
causas de incapacidad tanto para mujeres como hombres en edad productiva. Aunado a otros
trastornos coexistentes como la ansiedad y el consumo de sustancias, la depresión representa un foco
de atención prioritaria para los sistemas de salud en el mundo y la detección temprana una de las
maneras más eficientes de hacerle frente.
El diagnóstico oportuno beneficia a los pacientes facilitando la adopción de los tratamientos
disminuyendo el tiempo invertido para lograr una evolución satisfactoria. Es aquí donde los
profesionales de la salud mental requieren alternativas que les permitan actuar de manera proactiva
en la detección de individuos con rasgos primarios de la enfermedad.
El siguiente trabajo se enfoca en profundizar sobre técnicas en el campo de la Inteligencia Artificial
que permitan generar modelos de detección autónoma de emociones relacionadas a la depresión. Una
de las técnicas más utilizadas por investigadores y expertos en el análisis de datos es es la Red
Neuronal Artificial. Gracias a su versatilidad y facilidad de implantación, estas redes pueden ser
utilizadas para entrenar modelos que logren una eficaz detección de atributos relacionados a la
depresión sobre distintas fuentes de datos como imágenes, texto y voz.

2
Índice

Capítulo 1: Planteamiento del Problema 4


1.1 Antecedentes 4
1.2 Problemática 4
1.3 Preguntas de Investigación 5
1.4 Justificación 5
Capítulo 2: Entorno y Delimitación del Tema 6
2.1 Mapa Conceptual 6
2.2 Objetivo General 6
2.2.1 Objetivos Específicos 6
2.2 Alcances 7
2.3 Hipótesis 7
2.4 Posibles Restricciones. 7
2.5 Matriz de Soluciones 8
2.6 Contribución Académica 8
Capítulo 3: Investigación Preliminar 9
3.1 Estado del arte 9
3.2 Inteligencia Competitiva 11
3.2.1 Principales Competidores y sustitutos 11
Bibliografía 12

3
Capítulo 1: Planteamiento del Problema

1.1 Antecedentes
En México la depresión como enfermedad mental no ha sido vista con la importancia necesaria,
según el estudio publicado por Morgan State University en conjunto con el Instituto Nacional de
Psiquiatría Ramón de la Fuente [1] , una de cada cinco personas en México enfrenta estos
trastornos que en su gran mayoría nunca son diagnosticados y mucho menos tratados debido a la
falta de políticas públicas que faciliten a los pacientes de dichos trastornos la atención profesional
durante las diversas fases del desarrollo de la enfermedad. Dado que es una problemática que no
solo aqueja a los mexicanos diversos investigadores y científicos de datos alrededor del mundo
trabajan en grupos interdisciplinarios junto con profesionales de la salud mental para desarrollar
estrategias que mejoren los índices de diagnóstico fundamentalmente en grupos vulnerables.
Diversas técnicas son utilizadas hoy en dia con esta finalidad, técnicas de Aprendizaje Automático
como de Minería de datos han resultado útiles gracias a su eficacia en la clasificación de datos con
características asociadas a dichos trastornos.
Desafortunadamente en México hay pocos estudios relacionados con este tema, algunos como el
publicado en el Journal of Medical Internet Research del 2019 [2] ofrecen un acercamiento al
análisis de datos extraídos de la red social Twitter donde usuarios abiertamente expresaron
experimentar sentimientos relacionados a la depresión como angustia, ansiedad o tristeza. El
análisis realizado al texto en las publicaciones de los modelos de prueba ayudó a determinar
patrones de palabras cargadas con un sentido negativo en usuarios con depresión, comparados con
individuos de control se identificó una clara tendencia en el uso de palabras con sentimientos
negativos. Dicho estudio abre la posibilidad de generar nuevos modelos de clasificación con
técnicas más sofisticadas como las Redes Neuronales Artificiales, dichas tecnologías sirven como
apoyo en la clasificación de los datos de prueba permitiendo alcanzar mayores porcentajes de
efectividad comparadas con modelos actuales.

1.2 Problemática
En México se tiene un insignificante porcentaje de personas que son diagnosticadas con depresión,
esto se debe en parte, a que no existe una cultura de salud en la población que le de la importancia
debida a las enfermedades mentales. Aunado a esto, existen pocos datos oficiales que permitan
conocer con exactitud el tamaño del problema ni políticas públicas que fomenten su investigación.
El diagnóstico oportuno según la Sociedad Española a de Psiquiatría [3] es crucial no solo para
evitar el avance de la enfermedad sino para generar una correcta adopción del tratamiento. En
dicho estudio se enumeran las bondades de una intervención precoz dado que la sintomatología
asociada a la depresión comúnmente puede ser confundida o mal interpretada con otras afecciones
emocionales o del sistema nervioso central. Cuando los síntomas se combinan con otras
enfermedades como la diabetes los signos de la depresión son relegados a segundo plano y muchas
veces ignorados pudiendo generar complicaciones o dificultades para la adopción de un futuro
tratamiento.

4
1.3 Preguntas de Investigación
En virtud de lo anterior es que se proponen las siguientes preguntas de investigación:

● ¿Existen técnicas de análisis de datos que permitan una rápida detección de síntomas
asociados a la depresión?
● ¿Pueden las Redes Neuronales Artificiales mejorar los resultados obtenidos en el análisis de
datos de personas con síntomas de depresión en comparación con otras técnicas de
aprendizaje automático?
● ¿Es posible dar un margen de certeza sobre la efectividad de los resultados obtenidos al
analizar datos con algoritmos de aprendizaje automático?
● ¿Pueden sistemas informaticos ser la base de adopción de políticas públicas que fomenten la
cultura de salud sobre enfermedades de salud mental?
● ¿Pueden sistemas informaticos ser un apoyo efectivo en el diagnóstico de enfermedades de
salud mental como la depresión?

1.4 Justificación
El avance tecnológico en el área de análisis de datos ha tenido un despunte en México y en el
mundo, en años recientes, cada vez más investigadores hacen uso de estas tecnologías debido a su
potencial de aplicación en prácticamente cualquier área del conocimiento. Dada su naturaleza
propositiva la ciencia de datos ha tenido una gran adopción en estudios de diversas ramas de la
salud y el área de la salud mental ha encontrado en ella, herramientas que permiten potencializar su
investigación y desarrollo. Las aplicaciones son variadas y como se describe en el artículo del
Nature Human Behaviour [4] , dentro de la clasificación del UK Clinical Research Collaboration,
el área de la detección y diagnóstico es de las más estudiadas.
La investigación sobre la mente y su bienestar involucran a diversas áreas del conocimiento debido
a su complejidad y variabilidad. Tratamientos alternativos junto con el desarrollo de fármacos
compuestos que evitan fomentan dependencia aumentan el abanico de posibilidades de
tratamientos a la vez que dificultan la formulación de modelos de atención generalizada para la
población, como sería si se enfrentara la infección de algún agente patógeno común. A la
complejidad mencionada debemos sumar variables sociales y ambientales que obligan a formular
modelos específicos para la población Mexicana agrupando contextos bastante particulares.
Afortunadamente un acercamiento a esclarecer estas incógnitas puede lograrse al profundizar en la
utilización de técnicas avanzadas de aprendizaje automático, dichas técnicas permiten realizar un
análisis a grandes volúmenes de datos que permitan formar una base de conocimientos sólida sobre
la cual puedan generarse modelos específicos a atacar problemáticas de salud tan presentes como
la depresión. Los recursos tecnológicos de los que ahora contamos más la enorme cantidad de
datos que se genera cada segundo nos abre un oportunidad para darle sentido a la información
generada y poder mejorar las condiciones de salud de la población.

5
Capítulo 2: Entorno y Delimitación del Tema

2.1 Mapa Conceptual


A continuación en la Figura 1. se muestra un diagrama conceptual del estudio e investigación que
realizan las Áreas de la Salud en México apoyadas de tecnologías de Inteligencia Artificial como
el Aprendizaje Automático o el Procesamiento de Lenguaje Natural.

Figura 1. Mapa Conceptual de las Inteligencia Artificial Aplicada

2.2 Objetivo General


El propósito de este estudio es determinar si el uso de Redes Neuronales Artificiales en la
detección de emociones relacionadas con la depresión permite proporcionar un modelo confiable
de detección en comparación con otras técnicas de Aprendizaje Automático.

2.2.1 Objetivos Específicos


● Obtener un muestreo de la población en México que nos permita obtener resultados
que acompañen la directriz de la investigación.
● Dar a conocer un modelo computacional que proporcione buenos porcentajes de
eficacia en la detección de emociones negativas asociadas a la depresión.
● Dar a conocer los resultados de la investigación en depresión para comparar el
análisis de datos obtenido con el de otras técnicas de Aprendizaje Automático.

6
2.2 Alcances
Dado que es un área de estudio poco conocida en México se busca establecer un modelo
computacional base para el análisis de datos de personas que presenten rasgos de una probable
depresión, con el uso de herramientas en el campo del Aprendizaje Automático se busca alcanzar
un buen rango de efectividad para el diagnóstico de los trastornos citados.
Dicha investigación será geolocalizada para obtener información personas en México de habla
hispana, esto se debe a que se desea orientar los resultados a promover políticas públicas
relacionadas con la salud y la promoción de la atención de pacientes con trastornos mentales.

2.3 Hipótesis
De los puntos anteriores se deriva la siguiente formulacion de hipotesis:
“El número de personas en edad productiva con signos de depresión en México no esta aún
determinado ya que no se conoce un método certero de detección temprana que facilite a las
personas recibir un diagnóstico oportuno”

2.4 Posibles Restricciones.


Dentro de las restricciones previstas en el trabajo de investigación se destacan tres presentadas a
continuación:

● La recopilación del conjunto de datos de estudio se realizará mediante la extracción


de texto publicado en redes sociales por lo que no se cuenta con un perfilado de
género ni de edades para facilitar la segmentación de los resultados. Aquí se tienen
que mencionar varios supuestos y es que la información recabada será filtrada del
extracto antes mencionado y a su vez pasará por un proceso de limpieza por lo que el
dato final que será utilizado como dato de entrada puede contener información
indeseada y por consiguiente aumentar la entropía.
● Para el procesamiento de datos se utilizarán recursos de cómputo limitados por lo que
la estructura del modelo está imaginada como una estructura con una mínima
funcionalidad que permita una fácil adopción a un futuro escalamiento.
● El conjunto de datos de datos de entrenamiento y prueba esta siendo acotado a un
perfil de personas con tendencias a la depresión, por lo que otro trastorno asociado,
derivado o coexistente no está siendo considerado este trabajo por lo que los datos de
salida deben de interpretarse tomando esta consideración.

7
2.5 Matriz de Soluciones
A continuación se muestra la matriz de soluciones Figura 2. en donde se contemplan diferentes
técnicas del aprendizaje automático y criterios de implementación, dando

Figura 2 Matriz de Soluciones

2.6 Contribución Académica


Con el siguiente trabajo se busca dejar un modelo computacional eficaz para la detección de
emociones en hispanohablantes mexicanos. El grupo de emociones abarcadas en el estudio es un
grupo de emociones negativas sin embargo un modelo robusto podría ser capaz de ser utilizado
para trabajar diferentes emociones asociadas o coexistentes con la depresión. Adicional a esto se
observa un gran potencial en la detección de respuestas emocionales a estímulos como la reacción
al consumo de fármacos, la reacción al consumo de alimentos, la reacción al consumo de
productos de entretenimiento, entre otros.

Otra contribución esperada es la posibilidad de utilizar el modelo base para trabajar con otras
tecnicas de extraccion de informacion no necesariamente asociadas a la inteligencia artificial , aquí
hablo de la minería de datos combinada con técnicas de aprendizaje automático. Dicha
combinación plantea la idea de manejar enormes volúmenes de datos y realizar pre-procesamientos
para ser posteriormente analizados por los sistemas de clasificación. Generar funciones
complementarias atacando diferentes enfoques supone un resultado con mucho más valor.

8
Capítulo 3: Investigación Preliminar

3.1 Estado del arte


A continuación se muestran una serie de estudios recientes (5 años =< ) relacionados con este
trabajo de investigación, el objetivo es poder establecer un marco de referencia de investigaciones
a nivel global sobre la problemática abordada en esta investigación.

“Giving Voice to Vulnerable Children: Machine Learning Analysis of Speech Detects Anxiety and
Depression in Early Childhood” [5] En dicho estudio los investigadores del Michigan Institute
for Clinical and Health Research, trataron a un grupo de niños con indicadores de depresión y
ansiedad en lo que se denominaron desórdenes de internalización. Colocaron a los niños en grupos
y les pidieron relatar una historia relacionada con la familia, mientras esto ocurria los jovenes eran
grabados para obtener el conjunto de datos de análisis, algo interesante es que mientras los jóvenes
ofrecían su discurso uno de los investigadores los interrumpia para generar una situación de estrés
que pudiera desatar la sintomatología asociada a los trastornos a investigar. Una vez obtenidos los
datos estos pasaron por un proceso de limpieza como es habitual para eliminar lo que llaman
pausas naturales y ruido de diferentes frecuencias para obtener entradas acústicas con la mayor
calidad posible. Ya con las entradas preprocesadas se ingresaron al modelo de Aprendizaje
Automático donde se identificó que el modelo de Regresión Lineal para la clasificación fue el que
arrojó un mayor grado de efectividad en los datos analizados. Como se sabe la ingeniería de
características es fundamental y en este estudio se detectaron porcentajes similares para la
Ansiedad e Internalización por lo que se concluye como una herramienta de potencial valor para la
detección de características asociadas a dichas enfermedades.

“Deep Learning for Emotion Recognition on Small Datasets Using Transfer Learning” [6] El
siguiente estudio describe las técnicas utilizadas por los investigadores del Advanced Digital
Sciences Center from Singapore’s Agency for Science en el concurso 2015 Emotion Recognition
in the Wild. En dicho concurso se propone la participación de investigadores de área para lograr
eficientar el porcentaje de detección de emociones analizando un conjunto de imagenes de
expresión facial. El conjunto base de emociones comúnmente estudiado es el modelo 7 donde se
buscan los prototipos de (neutralidad, felicidad, enojo, tristeza, sorpresa, miedo y molestia). Para el
análisis se utilizaron conjuntos de datos del ImageNet previamente tratadas para poder extraer la
mayor información posible. Por el procesado se refiere a una serie de ajustes de normalización y
recortes a la imagen que permiten eliminar zonas sin información relevante. Una vez con los datos
y la arquitectura de Redes Neuronales Convolucionales definida se utilizó el conjunto de datos
reforzado para mejorar los porcentajes de efectividad realizando microajustes para superar el reto
de aplicar arquitecturas complejas a grupos de datos pequeños del orden de 1000 imágenes y poder
evitar el sobre-entrenamiento.

9
“Automatic speech emotion recognition using recurrent neural networks with local
attention” [7] En el siguiente estudio se plantean una serie de técnicas avanzadas de ingeniería de
características para obtener modelos de valor en la detección de emociones en audios como grupos
de datos de entrada. Del volumen de datos de voz utilizados para el análisis previsto se definieron
dos fases para el análisis donde en la primera se caracteriza por tecnicas de extraccion de
caracteristicas del audio en crudo normalizado y en la segunda fase aplicar una serie de funciones
estadísticas para obtener lo que denominan extracción de características asociadas. Aquí se supone
la utilización de una técnica de clasificación llamada SVM (Support Vector Machine) en donde se
establecen una serie de capas de aplicación para dotar a la red neuronal de mayor complejidad por
cada característica de emoción ubicada. Entonces al combinar las distintas capas se logra la
extracción de las características con mayor peso definido y se obtiene así una depuración que
permite una aproximación más certera. Una característica de la utilización de Redes Neuronales es
la utilización tradicionalmente de una capa final de consolidación para los resultados de las capas
ocultas intermedias donde la suma de los errores considerado como la iner-entropía se procesa en
la capa final, aquí los investigadores de Microsoft plantean la discrecionalidad de agrupaciones de
capas divididas por pesos que proporcionen la salida de análisis de las capas finales logrando unos
mejores porcentajes de eficiencia comparando el modelo tradicional.

“Using YouTube Comments for Text-based Emotion Recognition ” [8] El siguiente estudio
publicado por el Faculty of Science and Technology de Marruecos proporciona datos interesantes
acerca del análisis de texto en redes sociales. Las conversaciones analizadas provienen de
comentarios capturados en Youtube donde lo interesante se refleja en la construcción de un corpus
de frases provenientes de videos con diferentes categorías, al extraer la información de los videos
por categorías se etiqueta el origen de los comentarios de cada video para identificar las tendencias
de valores negativo o positivo. Una vez que se tienen agrupados los comentarios se procede a
realizar su análisis mediante técnicas de Aprendizaje Automático no supervisado. Una vez que se
tiene construido el corpus el análisis pasa por un esquema conocido como Pointwise Mutual
Information o PMI, donde se le otorga un valor a cada palabra para determinar su perfil emocional.
Este tipo de estudios marcan la pauta para que trabajos futuros logran la automatización de las
categorías de los comentarios partiendo del análisis crudo de datos donde no se tiene perfilada
ninguna categoría previamente. Dicho corpus también puede ser utilizado como modelo base para
otras técnicas de aprendizaje automático como modelos de capas convolucionales recurrentes. Ahi
solo bastaría enmarcar el uso de los resultados obtenidos para darle un sentido lúdico más que solo
determinar la empatía de los comentarios basándose en la categorización inicial.

“Speech Emotion Recognition Using Spectrogram and Phoneme Embedding ” [9] A


continuación escribo sobre el artículo publicado en Interspeech 2018 el cual describe un estudio de
reconocimiento de emociones basado en audio recibiendo como entradas electrogramas en lugar de
texto como comúnmente se trabaja este tipo de estudios. El trabajo mencionado menciona haber
obtenido una eficacia mayor en correspondencia con el análisis del mismo grupo de datos basado
en texto. Para dicho estudio se utilizó la base de datos Interactive Emotional Dyadic Motion
Capture (IEMOCAP), donde se extrajeron las entradas de audio crudo sin procesar para evitar la

10
pérdida asociada la transformación multimedia. Normalmente estos estudios comienzan por
transformar los audios a texto aplicando filtros al espectro de frecuencias y realizando una
limpieza de ruidos no deseados. En este trabajo en particular se menciona la importancia de
conservar la mayor información posible para evitar que la intencionalidad en los audios pueda ser
excluida al realizar las normalizaciones clásicas. El modelo utiliza una red neuronal convolucional
para con una técnica conocida como short-Time Fourier transform (STFT) para extraer las
características relevantes directo de los rangos de frecuencia del espectrograma. La combinación
del modelo de análisis de fonema tradicional con el análisis del espectrograma planteado permiten
una mejor interpretación de sonidos no-humanos generando resultados con tasas de mayor eficacia
en la detección de características emocionales.

“Emotion Detection and Recognition from Text using Machine Learning ” [10] La siguiente
investigacion publicada en el International Journal of Computer Sciences and Engineering aborda
el tratamiento de un flujo de texto proveniente de la red social Twitter en donde se preprocesa un
flujo de texto haceindo una traduccion inicial al ingles de cada tweet para llevarlo a encajar en un
vector de 8 emociones propuesto por el estadounidense [11] Robert Plutchik, en este acercamiento
se catalogan frases explicitas que son obenidas a traves de la interfaz que Twitter proporciona. Ya
que se tiene el corpus de trabajo se procesa en sacos por cada emocion descrita en el cluster de
emociones y se claseifica con ayuda de Algoritmos de Aprendizaje Automatico, para este caso en
particular utilizaron Support Vector Machine SVM en el orden de los algoritmos supervisados y
K-Means en el orden de los no supervisados. Dentro de sus conclusiones destacan que el algoritmo
SVM fue el que arrojo un porcentaje de eficiencia mayor pero destacan que el numero de palabras
por saco de emocion puede mejorar para aumentar su eficiencia.

3.2 Inteligencia Competitiva

3.2.1 Principales Competidores y sustitutos


Después de recabar diferentes investigaciones sobre el tema logró identificar a la división
de Microsoft Research como uno de los grupos de investigación más grandes y a la
vanguardia en la investigación de detección de emociones con técnicas avanzadas de
Aprendizaje Automático de la mano de Eric Horvitz (Technical Fellow and Chief
Scientific Officer) lideran unos parte de los proyectos que están más a la vanguardia como
Beyond Accuracy: The Role of Mental Models in Human-AI Team Performance [12]
donde se plantean la idea de trabajar mano a mano entre los expertos del dominio y la
Inteligencia Artificial. Hablando de temas médicos que es lo que nos concierne, trata
escenarios en donde un modelo de Aprendizaje Automático puede direccionar al
profesional de la salud a pacientes con pre condiciones de salud como un índice elevado de
azúcar o mediciones elevadas de temperatura. Dicha discrecionalidad plantea un modelo
de colaboración que permita eficientar la labor de la atención médica con agentes
productivos que coadyuven en los diagnósticos médicos.

11
Capítulo 4. Metodología del Proyecto

4.1 Estrategia de investigación


A continuación se detalla la estrategia a utilizar para la resolucion de la problemática planteada,
dicha estrategia sera dividida en dos fases:
 La fase de extraccion de datos > Para dicha fase se propone la utilizacion del API Tweepy
que nos permite realizar la extraccion post autenticacion de un flujo de datos continuao
geolocalizado.
 La fase del procesamiento de datos > Se proporne la utilizacion de una red neuronal
convoluciaonal para el apoyo en la clasificaion del flujo de datos, dicha red esta dise;ada
para poder manejar flujos de datos bastante grandes ademas de generar buenos porcentajes
de eficacia en la deteccion de elementos comunes que para nuestra finalidad seran de gran
apoyo.

4.2 Poblacion y Muestra


Como poblacion muestra vamos a utilizar usuarios de la red social Twitter para enfocar la
investigacion a la poblacion mexicana. Con la finalidad de realizar la extraccion de datos
solicitamos una cuenta de desarollador de Twitter para utilizar libremente sus API y poder realizar
una extracion de datos requerida.
Una vez que se tiene el conjunto de datos a analisar se efectuo un preprocesamiento como parte de
la primera fase desacrita con anterioridad, en este preprocesamiento se busca realizar una limpieza
de la informacion obtenida de datos no deseados como etiquetas HTML, caracteres basura y
multiples espacios en blanco.

4.3 Instrumentos
A continuacion se enumeran las principales tecnologias utilizadas en el desarollo de este trabajo de
investigacion, dichas tecnologias son abiertas y no de pago ningun licenciamiento para su uso:
 Standard Search API / Tweepy – Twitter
 Python 3 – Python Software Foundation
 Keras and Tesnsorflow API – Keras SIG Google

12
4.4 Estrategia de Analisis
Para efectuar nuestro analisis de datos se opto por un modelo computacional basado en redes
neuronales, como se muestra en la Figura 3. para el procesamiento de lenguaje natural se utilizan
comunmente 2 aproximaciones:

Figura 3 Matriz de Soluciones

EL llamado Bag-Of-Words (CBOW) y el continuous Skip-gram (SG). En el primero se parte de


una conjunto de palabras en el vecindario para detrminar su contexto y en el segundo se parte de
una palabra para determinar su vecindario. Haciendo uso del esquema SG tenemos el siguiente
ejemplo:

“Hoy por la maniana me desperte triste porque estaba nublado” Con un tamanio de ventana 3
teniendo la palabra triste como centro sus vecinos serian (maniana,
desperte,porque,estaba,nublado) donde (triste, nublado) podrian ser catalocados en el
entrenamiento como palabras con una mayor proximidad a sentimientos negativos relacionados
con tristeza, melancolia, angustia, etc. A continuacion en le Figura 4. Se muestra un grafico [14]
del modelo SG que refuerza la aproximacion seleccionada.

Figura 4 Modelo Skip-gram

13
Capítulo 5. Conclusiones y Resultados

5.1 Resultados
A continuacion se exponen los resultados obtenidos en la implantacion del metodo con una red
neuronal CNN, los datos obtenidos de Twitter pasaron como flujo en un orden 80:20 por lo que el
entrenamiento de la red neuronal se efectuo con 400 tweets de datos de entrenamiento por 100
tweets de datos de prueba.

Modelo propuesto

Figura 5 Arquitectura Propuesta

Resultados Obtenidos

Figura 6 Resultaods Obtenidos

Conclusiones
Si comparamos el porcentaje de eficacia del entrenamiento de la CNN vemos que ronda el
91% y el porcentaje de prueba ronda el 81% para la CNN aunque se nota por la curva de las
imágenes mostradas un claro sobrentremaineto por la diferenciacion entre las curvas de
entrenamiento y prueba. Aquí concluimos que es posible llegar a porcentajes aceptables con la
selección de la red neuronal artificial como se propone originalmente y que se requieren
mayores pruebas para pretender aumentar los porcentajes de eficacia alcanzados.

14
En este trabajo queda claro que hay dos puntos que considero reelevantes antes de pensar en
declarar un modelo confiable para el apoyo en la deteccion de rasgos asociados a la depresion.
La primera tiene que ver con la calidad de los datos de entrada, es evidente que no podemos
controlar el ruido proveniente de datos recabados desde las redes sociales por lo que se tendria
que ingresar datos con una mayor depuracion o crear campanias en las mismas redes que
perdmitan a los pacientes autodeclarados tomar encuestras cortas que ayuden a alimentar de
mejor forma los modelos propuestos. Por otra parte ya en la ejecucion de nuestro modelo
identificamos una necesidad de realizar un cluster de pruebas mas exaustivo con un numero de
datos mayor y variantes de parametrizacion muy especificos que permitan reducir el umbral
del sobreentrenamiento para poder generar resultados mas confiables.

5.1 Otras Lineas de Ivestigacion


En el trabajo reciente se identifica dos temas que vendrian a enriquecer el trabajo actual:
 La deteccion de los razgos emocionales en el presente trabajo es es explicito, esto
significa que estamos recopilando informacion de los usuarios que voluntariamente
estan declarando tener sintomas relacionados a la depresion por lo que los razgos
emocionales implicitos no son abordados y seria una gran tema poder ser tratados
para enriquecer la investigacion actual.
 Si bien la finalidad de la investigacion es buscar la precision en la categorizacion de
los textos para darles un sentido emocional asociado a algun trastorno mental, es
evidente que esto solo aborda la superficie y de momento no parece porder generar la
certeza necesaria para determiar si realmente se tratan de signos depresivos o no, falta
precicios para evitar confundir esa intencion con otros trastornos o simplemente con
un grado de subjetividad no detectado.

15
Bibliografía

1. Wagner, Fernando A., González-Forteza, Catalina, Sánchez-García, Sergio, García-Peña,


Carmen, & Gallo, Joseph J.. (2012). Enfocando la depresión como problema de salud pública
en México. Salud mental, 35(1), 3-11. Recuperado en 21 de mayo de 2020, de
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0185-
33252012000100002&lng=es&tlng=es.
2. Leis, A., Ronzano, F., Mayer, M. A., Furlong, L. I., & Sanz, F. (2019). Detecting Signs of
Depression in Tweets in Spanish: Behavioral and Linguistic Analysis. Journal of medical
Internet research, 21(6), e14199. https://doi.org/10.2196/14199
3. Castellón Leal, E., Ibern Regàs, P., Gili Planas, M., Lahera Forteza, G., Sanz González, J., &
Saiz Ruiz, J. (2016). El abordaje de la depresión en el ámbito del trabajo: recomendaciones
clave. Psiquiatría Biológica, 23(3), 112–117. https://doi.org/10.1016/j.psiq.2016.08.003
4. Russ, T. C., Woelbert, E., Davis, K. A. S., Hafferty, J. D., Ibrahim, Z., Inkster, B., … Stewart,
R. (2018). How data science can advance mental health research. Nature Human Behaviour,
3(1), 24–32. https://doi.org/10.1038/s41562-018-0470-9
5. McGinnis, E. W., Anderau, S. P., Hruschak, J., Gurchiek, R. D., Lopez-Duran, N. L.,
Fitzgerald, K., … McGinnis, R. S. (2019). Giving Voice to Vulnerable Children: Machine
Learning Analysis of Speech Detects Anxiety and Depression in Early Childhood. IEEE
Journal of Biomedical and Health Informatics, 23(6), 2294–2301.
https://doi.org/10.1109/jbhi.2019.2913590
6. Ng, H.-W., Nguyen, V. D., Vonikakis, V., & Winkler, S. (2015). Deep Learning for Emotion
Recognition on Small Datasets using Transfer Learning. Proceedings of the 2015 ACM on
International Conference on Multimodal Interaction - ICMI ’15, 443–449.
https://doi.org/10.1145/2818346.2830593
7. Mirsamadi, S., Barsoum, E., & Zhang, C. (2017). Automatic speech emotion recognition
using recurrent neural networks with local attention. 2017 IEEE International Conference on
Acoustics, Speech and Signal Processing (ICASSP), 1–6.
https://doi.org/10.1109/icassp.2017.7952552
8. yasmina, D., Hajar, M., & Hassan, A. M. (2016). Using YouTube Comments for Text-based
Emotion Recognition. Procedia Computer Science, 83, 292–299.
https://doi.org/10.1016/j.procs.2016.04.128
9. Yenigalla, P., Kumar, A., Tripathi, S., Singh, C., Kar, S., & Vepa, J. (2018). Speech Emotion
Recognition Using Spectrogram and Phoneme Embedding. Interspeech 2018, 3688–3692.
https://doi.org/10.21437/interspeech.2018-1811
10. Salam, S. A., & Gupta, R. (2018). Emotion Detection and Recognition from Text using
Machine Learning. International Journal of Computer Sciences and Engineering, 6(6), 341–
345. https://doi.org/10.26438/ijcse/v6i6.341345
11. Imbir, K. K. (2017). Psychoevolutionary Theory of Emotion (Plutchik). Encyclopedia of
Personality and Individual Differences, 1–9. https://doi.org/10.1007/978-3-319-28099-8_547-
1
12. Bansal, G. (2020, February 1). Beyond Accuracy: The Role of Mental Models in Human-AI
Team Performance. Retrieved from https://www.microsoft.com/en-
us/research/publication/beyond-accuracy-the-role-of-mental-models-in-human-ai-team-
performance/

16
13. Word2Vec Tutorial - The Skip-Gram Model · Chris McCormick. (2016, April 19). Retrieved
from http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/

17

También podría gustarte