Defesa de mestrado do discente Isaias Januario, dia 12/12/2019, as 13:00, sala multimídia do ICEB

Defesa de mestrado do discente Isaias Januario, dia 12/12/2019, as 13:00, sala multimídia do ICEB.

Título: Uma Metodologia para Desambiguação Lexical de Sentido e Substituição Lexical baseada em Dicionários e embeddings

Resumo: A ideia de reescrever sentenças lexicograficamente preservando o significado original permeia diferentes tarefas inerentes às áreas de Recuperação de Informação e Processamento de Linguagem Natural. Como é o caso do uso em ferramentas de aprendizagem de um segundo idioma através de exercícios de substituição de palavras, ferramentas de simplificação de texto, indexação semântica, desambiguação lexical de sentido, entre outras tarefas. Nestes casos, a elaboração de métodos para recomendar e mensurar a aplicabilidade de possíveis sinônimos dentro de uma sentença faz-se necessária, já sendo explorada amplamente na literatura e com constante evolução, principalmente no que tange às fontes de dados utilizadas para a geração de sinônimos que alimentam os métodos de substituição. Naturalmente, dicionários e thesauri (listas de sinônimos e definições) têm sido amplamente utilizados por agruparem conjuntos de sinônimos em sua estrutura, mas o caráter polissêmico das palavras inviabilizam uma mera troca de palavras sem a observância do contexto. De mesmo modo, modelos de espaço vetorial, tais como os embeddings, são amplamente utilizados para representar os contextos de aplicação das palavras. No entanto, a representação de palavras considerando fatores meramente contextuais, em muitos casos, dão margem à representação aproximada de termos que não são, necessariamente, sinônimos. Tais deficiências elencadas sugerem a junção de dicionários e embeddings, como alternativa para o processo de substituição. Assim, apresentamos uma metodologia voltada à tarefa de substituição lexical, para a qual utilizamos de informações contidas em dicionários e thesauri e relações linguísticas expressas na forma de ontologias para realizar o processo de substituição. Almejando ganho de acurácia, combinamos fontes distintas de bases anotadas. Avaliando a aplicação dos potenciais sinônimos ponderando sua aplicabilidade em pequenos contextos, além de todo o contexto para realizar a tarefa inerente de desambiguação, que se apóia sobre os modelos vetoriais utilizados. Nossos resultados atestam a eficácia da abordagem, superando o estado-da-arte na predição de um melhor substituto em determinados cenários avaliados para uma consolidada base de experimentação na literatura.

Banca: Profa. Dra. Andréa Bianchi (UFOP); Profa. Dra. Lucelene Lopes (PUC-RS); Prof. Dr. Álvaro Rodrigues Pereira Jr. (UFOP)

Departamento de Computação  |  ICEB  |  Universidade Federal de Ouro Preto
Campus Universitário Morro do Cruzeiro  |  CEP 35400-000  |  Ouro Preto - MG, Brasil
Telefone: +55 31 3559-1692  |  decom@ufop.edu.br