Investigação Do Processo De Stemming Na Lngua Portuguesa – Reinaldo Viana Alvares

Teses e dissertações PDF
Acessar

Resumo:

O processo de busca e recuperação de informação é uma tarefa rotineira do ser humano, no entanto, de complexa automatização. Isto ocorre pois a qualidade dos resultados é muitas vezes relacionada com o grau de satisfação do usuário, um parâmetro de difícil mensuração. Em geral esta qualidade é avaliada levando-se em consideração um conjunto de consultas realizadas em uma coleção de textos, e as respostas relevantes obtidas. Comumente, duas medidas de avaliação são utilizadas neste processo: precision, que representa a proporção de itens relevantes recuperados do total de itens recuperados, e recall, que representa a proporção de itens relevantes recuperados do total de itens relevantes da coleção. Para isso, um dos desa#os é encontrar formas e#cientes para representar os documentos, de maneira a evitar ambigüidade. Uma alternativa para resolver este problema consiste em obter uma representação única para palavras que apontem para um mesmo conceito. Esta tarefa pode ser de#nida como stemming. O processo de stemming muitas vezes é atrelado à estrutura morfológica do idioma onde é utilizado. Em se tratando da língua portuguesa, foram encontradas poucas soluções para atender a demanda por esses tipos de algoritmos. A complexidade morfológica da língua portuguesa e as poucas soluções de stemming encontradas para este idioma, serviram como motivação para o desenvolvimento desta dissertação. Este trabalho apresenta um modelo para algoritmos de stemming, aplicável à língua portuguesa, baseado num estudo estatístico realizado em uma coleção de palavras extraídas da Web brasileira. Com objetivo de avaliar o modelo, um stemmer é implementado e comparado com uma solução encontrada na literatura, especialmente desenvolvida para este idioma. As principais contribuições deste trabalho são o modelo sistemático para o processo de stemming, além do stemmer concebido e implementado especialmente para a língua portuguesa.

Detalhes:

  • Categoria: Teses e dissertações
  • Instituição: UFF/COMPUTAÇÃO
  • Área de Conhecimento: CIÊNCIA DA COMPUTAÇÃO
  • Nível: Mestrado
  • Ano da Tese: 2005
  • Tamanho: 462.57 KB
  • Fonte: Portal Domínio Público

Faça download do ebook em PDF:

Recomendamos para você

Abaixo você vai encontrar uma lista de livros que na nossa opinião podem ser interessantes para você.

São itens relacionados a esta oferta que você provavelmente vai gostar. Dá uma olhada! 👌

Termos relacionados

  • livro Investigação Do Processo De Stemming Na pdf
  • livro Investigação Do Processo De Stemming Na baixar
  • livro Investigação Do Processo De Stemming Na epub
  • livro Investigação Do Processo De Stemming Na comprar
  • livro Investigação Do Processo De Stemming Na online
  • livro Investigação Do Processo De Stemming Na mobi
  • livro Investigação Do Processo De Stemming Na download