tcc-latex/tcc_resumo_por.tex

Profissionais de diversos ramos de atuação dependem do uso de termos específicos de sua área, alguns desses em língua estrangeira, para uma comunicação eficaz e eficiente. Para tanto, é necessária a exposição do indivíduo com casos de uso para formação de um repertório na língua. No entanto, a formação de tal repertório é geralmente feita lentamente e manualmente, ou através de ferramentas não-gratuitas quando o método de ensino faz o uso de \textit{corpora}. Neste trabalho, desenvolvemos uma aplicação de internet de código aberto para ampliar funcionalidades, tendo em vista aplicações similares existentes, enquanto se mantém amigável ao usuário.
%
O sistema tem como entrada um corpus fornecido pelo usuário. O sistema, utilizando-se de algoritmos de segmentação, etiquetagem e busca, processa o corpus, tendo como saídas a lista de sentenças, a frequência de palavras, a lista de palavras, o autômato de cada sentença, o autômato do corpus como um todo e o texto etiquetado. Opcionalmente, uma expressão de busca pode ser fornecida para a entrada e à saída é adicionada a colocação no texto dos termos encontrados.
%
Nosso sistema é modular e extensível através de \textit{plug-ins}, diferentemente das principais soluções disponíveis no mercado; a contrapartida é que é um sistema novo, logo, nem todas as funcionalidades presentes em outras aplicações estarão disponíveis nesta.
%
O sistema desenvolvido possui custo significativamente menor que os competidores pagos e pode ser utilizado para auxiliar o estudo da língua por linguistas enquanto ferramenta em futuras pesquisas.

Palavras-chave: Processamento Automático da Linguagem Natural. Sistema \textit{Web}. Corpus. \textit{Plug-in}.