Notícias‎ > ‎

Defesa de T.C.C. por João dos Santos Gonçalves

postado em 3 de mar de 2015 03:42 por Silvio Santos




Na última sexta-feira, dia 27/02/2015, o aluno João dos Santos Gonçalves defendeu seu T.C.C. no Laboratório de Ensino de Ciência da Computação (LECC), com o título "Construindo um web crawler para recuperação de informações financeiras usando o framework scrapy", sob orientação do Prof. Rodolfo Carneiro Cavalcante. Teve em sua banca examinadora os professores Thiago Bruno e Alexandre Paes.

Abaixo, apresenta-se uma síntese de sua monografia:


"Hoje, a Web destaca-se como uma das maiores fontes de informações devido ao seu enorme conteúdo disponível. No entanto, existem diversos fatores que dificultam o resgate de informações relevantes a um tema de interesse do usuário na Web. Dentre estes fatores, estão o dinamismo e o crescimento exponencial da Web, que leva a uma explosão informacional e torna impossível catalogar manualmente a maioria das páginas disponíveis. Além disso, os dados e informações não se encontram estruturados, e as informações são dispersas entre diversas fontes. Estes fatores criam uma demanda por sistemas automatizados de recuperação da informação, que se fazem fundamentais para avanços na recuperação de informações para os mais diversos fins. Este trabalho estuda o processo de construção de web crawlers, sistemas que se apresentam como uma forma de resolver boa parte destes problemas de recuperação na Web. Investigamos como construir uma aplicação de web crawler baseada no Scrapy, um framework escrito na linguagem Python que facilita a construção de aplicações desta natureza. Ao final, realizamos um estudo de caso de aplicação do crawler desenvolvido aplicado ao problema de recuperação de informações de notícias financeiras na Web."

Palavras-chave: Recuperação de Informações. Web crawler. Scrapy. Sistemas de Recuperação de Informações.

A monografia defendida pelo aluno pode ser baixada aqui no formato PDF.









Comments