Papers by Damires Yluska Souza Fernandes
JVVRU YYY TGFFKV EQO ;.8 9.(& * 7*85438&'.1.)&)* 84(.&1 *2 24)*148 57*).9.;48 &79.,4 547 &COKTGU ... more JVVRU YYY TGFFKV EQO ;.8 9.(& * 7*85438&'.1.)&)* 84(.&1 *2 24)*148 57*).9.;48 &79.,4 547 &COKTGU ;NWUMC FG 5QW\C (GTPCPFGU G #NGZ 5CPFTQ FC %WPJC 4șIQ FCOKTGU"KHRD GFW DT CNGZ"KHRD GFW DT

Brazilian Journal of Computers in Education, Jul 2, 2023
Avaliar o desempenho de estudantes em diversos contextos é algo muito complexo. Isso não é difere... more Avaliar o desempenho de estudantes em diversos contextos é algo muito complexo. Isso não é diferente quando se discute fatores associados ao desempenho de estudantes em provas como a do Exame Nacional do Ensino Médio (ENEM). Diversos fatores como, por exemplo, o conhecimento adquirido do estudante ao longo de sua trajetória acadêmica, assim como outros oriundos de suas experiências, situação social ou econômica podem impactar em resultados diferenciados na prova. Dados históricos do ENEM disponibilizados compõem informações diversas sobre os resultados individuais dos estudantes assim como incluem respostas a questionários formulados no momento da inscrição. Diante da dimensionalidade dos dados e da complexidade de análises que podem ser realizadas a partir desses conjuntos de dados, uma questão essencial é identificar quais fatores são realmente mais relevantes para tais análises. Técnicas de mineração de dados, a exemplo de modelos preditivos e seleção de features, têm sido usadas como meio para ajudar na obtenção das análises. Neste cenário, este trabalho apresenta uma revisão sistemática da literatura com o intuito de identificar os principais fatores que podem influenciar no desempenho dos estudantes na prova do ENEM, considerando estudos publicados nos últimos dez anos. Os resultados obtidos mostraram que os fatores mais relevantes estão relacionados às questões socioeconômicas, sendo os atributos em maior evidência os seguintes: renda familiar, idade, sexo e raça. O nível de escolaridade dos pais também ganha destaque. Atributos relacionados às notas nas provas e caracterização das escolas de origem dos estudantes relativos à estrutura física e pedagógica são igualmente destacados. O presente estudo evidencia alguns caminhos que podem ser conduzidos em pesquisas complementares.

Anais II WIDAT
O volume de informações em saúde, em especial no cenário das arboviroses, cresceu juntamente com ... more O volume de informações em saúde, em especial no cenário das arboviroses, cresceu juntamente com os desafios para trabalhar com os dados de forma que análises úteis possam ser feitas e usadas para apoiar a tomada de decisões. Este artigo apresenta a Arbovis, uma aplicação para análise visual de dados sobre arboviroses no estado da Paraíba. A Arbovis disponibiliza visões interativas e customizadas sobre os referidos dados, baseadas em filtros que podem ser aplicados para gerar gráficos. Os dados apresentados foram obtidos através da Secretaria de Saúde do Estado da Paraíba e do IBGE. Como resultados iniciais, foram desenvolvidos gráficos de barras, barras horizontais e de linhas. Através da visão interativa, é possível identificar quais municípios possuem maior incidência de casos das doenças, por meio do cruzamento entre quantidade de habitantes e de casos, e também em quais houve maior quantidade de casos registrados. Dessa maneira, a Arbovis apresenta impacto positivo na gestão e ...
FC )*8&+.48 * 45479:3.)&)*8 3& .39*,7&{4 )4 &2'.*39* (13.(4 * ).,.9&1 5&7& &54.4 &4 ).&,389.(4 )&... more FC )*8&+.48 * 45479:3.)&)*8 3& .39*,7&{4 )4 &2'.*39* (13.(4 * ).,.9&1 5&7& &54.4 &4 ).&,389.(4 )& ,&,:*.7& &79.,4 547
Ciência, tecnologia e inovação: Geração de emprego e democratização de oportunidades
Editora Direitos para esta edição cedidos à Atena Editora pelos autores. Open access publication ... more Editora Direitos para esta edição cedidos à Atena Editora pelos autores. Open access publication by Atena Editora Todo o conteúdo deste livro está licenciado sob uma Licença de Atribuição Creative Commons. Atribuição-Não-Comercial-NãoDerivativos 4.0 Internacional (CC BY-NC-ND 4.0).

Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)
Example-dependent cost-sensitive classification methods are suitable to many real-world classific... more Example-dependent cost-sensitive classification methods are suitable to many real-world classification problems, where the costs, due to misclassification, vary among every example of a dataset. Tax administration applications are included in this segment of problems, since they deal with different values involved in the tax payments. To help matters, this work presents an experimental evaluation which aims to verify whether cost-sensitive learning algorithms are more cost-effective on average than traditional ones. This task is accomplished in a tax administration application domain, what implies the need of a cost-matrix regarding debt values. The obtained results show that cost-sensitive methods avoid situations like erroneously granting a request with a debt involving millions of reals. Considering the savings score, the cost-sensitive classification methods achieved higher results than their traditional method versions.
XV Simp�sio Brasileiro de Banco de Dados, 2-4 Outubro 2000, Jo�o Pessoa, Para�ba, Brasil, Anais
Sbbd, 2000
XV Simpósio Brasileiro de Banco de Dados, 2-4 Outubro 2000, João Pessoa, Paraíba, Brasil, Anais
Brazilian Symposium on Databases, 2000

Lecture Notes in Computer Science, 2009
In Peer Data Management Systems (PDMS), ontology matching can be employed to reconcile peer ontol... more In Peer Data Management Systems (PDMS), ontology matching can be employed to reconcile peer ontologies and find correspondences between their elements. However, traditional approaches to ontology matching mainly rely on linguistic and/or structural techniques. In this paper, we propose a semantic-based ontology matching process which tries to overcome the limitations of traditional approaches by using semantics. To this end, we present a semantic matcher which identifies, besides the common types of correspondences (equivalence), some other ones (e.g., closeness). We also present an approach for determining a global similarity measure between two peer ontologies based on the identified similarity value of each correspondence. To clarify matters, we provide an example illustrating how the proposed approach can be used in a PDMS and some obtained experimental results.
Using Semantics in Peer Data Management Systems
… of Computation: Brazil/ …, 2009
1Universidade Federal de Pernambuco (UFPE), Centro de Informática, Av. Prof. Luiz Freire, S/N 50.... more 1Universidade Federal de Pernambuco (UFPE), Centro de Informática, Av. Prof. Luiz Freire, S/N 50.740-540 Recife, PE, Brazil 2Université de Versailles et Saint-Quentin-en-Yvelines (UVSQ), 45 Avenue des Etats-Unis, 78035 Versailles, France ... {cesp,dysf,acs}@cin. ...
Towards a Context Ontology for Geospatial Data Integration
Lecture Notes in Computer Science, 2006
Recently, Geospatial data and Geographic Information Systems (GIS) have been increasingly used. A... more Recently, Geospatial data and Geographic Information Systems (GIS) have been increasingly used. As a result, the integration of geospatial data has become a crucial task for decision makers. Since GIS and geospatial databases are designed by different organizations using different representation models and there are diverse levels of detail for the spatial features, it is much more complex to achieve
GeoVisual Interface - A Visual Query Interface for Geographic Information Systems
Brazilian Symposium on Databases, 2000
This work presents GeoVisual Interface - an interface for visual queries in Geographic Informatio... more This work presents GeoVisual Interface - an interface for visual queries in Geographic Information Systems (GIS). GeoVisual Interface is the upper level module of a complete visual query system architecture. It allows users to formulate queries using visual elements (i.e. spatial objects from a visualization area, from the database schemas or from a geographic entity metaphor) and spatial operators

Tax management is a complex problem faced by governments around the world. In Brazil, in order to... more Tax management is a complex problem faced by governments around the world. In Brazil, in order to help solving problems in this area, data analytics has been increasingly used to support and enhance tax management processes. In this light, this work proposes an approach which uses supervised learning in order to classify requests of an administrative service. The requests at hand are named as Requests for Revision of Registered Debt (R3Ds). The service underlying such requests is offered by the Brazil’s National Treasury Attorney-General's Office and usually deals with a high volume of registrations. The experimental evaluation accomplished in this work presents some promising results. The obtained classification models present good levels of accuracy, area under ROC curve and recall. Four evaluation scenarios have been experimented, including imbalanced and balanced data. The Random Forest model achieves the best results in all the evaluated scenarios.

Revista Principia - Divulgação Científica e Tecnológica do IFPB
A necessidade de acompanhamento dos estágios de aprendizado discente e suas dificuldades de forma... more A necessidade de acompanhamento dos estágios de aprendizado discente e suas dificuldades de forma precoce tomou uma dimensão ainda maior nesses tempos recentes de pandemia e de ensino online. Nesse panorama, este trabalho apresenta uma abordagem para predição de forma precoce de comportamentos de estudantes que possuem um elevado risco de reprovação em disciplinas que ocorrem em ensino on-line. Para analisar e avaliar a viabilidade da abordagem proposta foi realizado um estudo de caso com dados do ensino técnico integrado do campus Monteiro do IFPB. Foi construído um conjunto de dados com dados reais originados do Google Sala de Aula e do SUAP. Uma vez finalizado o conjunto de dados, foram construídos e avaliados modelos de aprendizado de máquina usando seis diferentes algoritmos de classificação supervisionada. Adicionalmente foi objeto de análise o tratamento do desbalanceamento dos dados e a influência da seleção de atributos no desempenho final dos preditores.

Revista Principia - Divulgação Científica e Tecnológica do IFPB
A Mineração de Dados Educacionais tem sido uma ferramenta muito utilizada para identificar a poss... more A Mineração de Dados Educacionais tem sido uma ferramenta muito utilizada para identificar a possibilidade de evasão de estudantes e suas possíveis causas, buscando auxiliar instituições de ensino no acompanhamento, gerenciamento e solução a esse desafio. Esse artigo apresenta uma abordagem que aplica mineração de dados educacionais para predizer estudantes de cursos subsequentes do IFPB com potencial de evasão. Para isso, foram coletados dados a partir do sistema acadêmico do IFPB, no contexto do Campus Cajazeiras. Os dados passaram por etapas de preparação, e um conjunto de dados específico foi gerado para o propósito da abordagem proposta. Com a assistência de um especialista de domínio, a abordagem provê a geração de modelos de aprendizado de máquina que classificam a possibilidade de evasão de estudantes, a partir de cinco métodos supervisionados. A avaliação dos métodos de classificação utilizados demonstra que todos os algoritmos apresentaram resultados próximos, a partir dos...

Mapeamentos conceituais entre os modelos relacional e NoSQL: Uma abordagem comparativa
Revista Principia - Divulgação Científica e Tecnológica do IFPB, 2015
&... more <p>As atuais perspectivas computacionais, vindas sobretudo da Web, têm gerado novas demandas relacionadas ao gerenciamento de dados, principalmente em termos de volume, heterogeneidade e dinamismo. Uma tendência atual para facilitar o gerenciamento de dados na Web é a utilização dos denominados Sistemas NoSQL, que se diferenciam dos sistemas que seguem o Modelo Relacional por possibilitarem a implementação de estruturas mais flexíveis. Contudo, a maioria dos bancos de dados de aplicações existentes encontra-se em estruturas relacionais, e a migração de uma base que segue o Modelo Relacional para uma NoSQL requer grande esforço dos projetistas diante das diferenças existentes. Nesse panorama, este artigo descreve os modelos citados, em termos de conceitos e estruturas, e apresenta um estudo comparativo apontando possíveis mapeamentos conceituais entre eles. Aborda também, de forma comparativa, trabalhos de conversão de dados existentes, e indica desafios e possibilidades para novas pesquisas sobre o…

Proceedings of the 17th International Conference on Enterprise Information Systems, 2015
The huge volume of datasets available on the Web has motivated the development of a new class of ... more The huge volume of datasets available on the Web has motivated the development of a new class of Web applications, which allow users to perform complex queries on top of a set of predefined linked datasets. However, given the large number of available datasets and the lack of information about their quality, the selection of datasets for a particular application may become a very complex and time consuming task. In this work, we argue that one possible way of helping the selection of datasets for a given application consists of evaluating the completeness of the dataset with respect to the data considered as important by the application users. With this in mind, we propose an approach to assess the completeness of a linked dataset, which considers a set of specific data requirements and allows saving large amounts of query processing. To provide a more detailed evaluation, we propose three distinct types of completeness: schema, literal and instance completeness. We present the definitions underlying our approach and some results obtained with the accomplished evaluation.

Proceedings of the 17th International Conference on Enterprise Information Systems, 2015
When users access data-oriented applications, they aim to obtain useful information. Sometimes, h... more When users access data-oriented applications, they aim to obtain useful information. Sometimes, however, the user needs to reformulate the submitted queries several times and go through many answers until a satisfactory set of answers is achieved. In this scenario, the user may be in different contexts, and these contexts may change frequently. For instance, the place where the user submits a given query may be taken into account and thereby may change the query itself and its results. In this work, we address the issue of personalizing query answers in data-oriented applications considering the context acquired at query submission time. To this end, we propose a query rewriting approach, which makes use of context-based rules to produce new related expanded or relaxed queries. In this paper, we present our approach and some experimental results we have accomplished. These results show that, by considering the acquired user context, it really enhances the precision and recall of the obtained answers.

A Domain-based Approach to Publish Data on the Web
Proceedings of International Conference on Information Integration and Web-based Applications & Services - IIWAS '13, 2013
ABSTRACT The Linked Data project defines a set of practices for publishing structured data on the... more ABSTRACT The Linked Data project defines a set of practices for publishing structured data on the Web. In order to apply the recommended practices and achieve this Web of Data vision, existing data provided in diverse formats should be converted to a standard model. Since these data are in nature heterogeneous, it is usually unfeasible to convert them without considering the knowledge domain in which they exist. In this light, we propose an approach, named SenseRDF, which makes use of a domain reference, made available by vocabularies and domain ontologies, to provide the semantics during the conversion of a dataset from one format to a standard RDF model. Also, we adopt a semi-automated technique, where a domain expert is required to assist the conversion process, which is incrementally enriched. We present the principles underlying our approach, some usage examples and the obtained experimental results.
Capítulo 4 Linked Data: da Web de Documentos para a Web de Dados
The term Linked Data refers to a set of best practices for publishing and connecting structured d... more The term Linked Data refers to a set of best practices for publishing and connecting structured data on the Web with the purpose of creating a Web of Data. Recently, a significant number of datasets have been published adhering to the Linked Data principles and numerous efforts are underway to build applications for exploit this Web of Data. In this context, during this course, we present the fundamental concepts of Linked Data, as well as the theoretical basis of how to publish and to consume data available on the Web of Data. We also present some applications for visualization and consume of Linked Data and we discuss the main difficulties and challenges in this research area.
Uploads
Papers by Damires Yluska Souza Fernandes