Defesa de Dissertação de Leandro Figueiredo, dia 15/05/15, as 10:00, no CEAD.Defesa de Dissertação de Leandro Neiva Lopes Figueiredo, dia 15/05/15, as 10:00, no CEAD. Banca: Prof. Dr. Anderson Almeida Ferreira; Prof. Dr. Álvaro Rodrigues Pereira Junior; Prof. Dr. Guilherme Tavares de Assis; Prof. Dr. Altigran Soares da Silva. Título: Um Metodo Baseado em Informações de Renderização para Extração de Dados de Páginas Web. Resumo: A extração de dados de páginas web e uma importante tarefa para várias aplicações, como comparadores de preçcos, bibliotecas digitais e mineradores de dados. Grande parte dos dados necessários para essas aplicações e disponibilizada através de páginas de resultado de busca, onde cada resultado, chamado de search result record, representa um registro de um banco de dados. Um dos passos mais importantes para extrair esses registros é identicar, dentro as diferentes regiões de dados de uma página, aquela que contém os registros a serem extrados, ou seja, a principal região de dados. Uma identicação errada dessa região pode resultar em uma extração incorreta dos search |
Departamento de Computação | ICEB | Universidade Federal de Ouro Preto
Campus Universitário Morro do Cruzeiro | CEP 35400-000 | Ouro Preto - MG, Brasil
Telefone: +55 31 3559-1692 | decom@ufop.edu.br