# Yet Another Simple POS Tagger Este é um etiquetador de partes do discurso (POS tagger) que foi escrito para ter os mesmos formatos de entrada e saída que do Unitex/GramLab, sem fazer uso do algoritmo de Viterbi, mas sim um simples casamento de padrões. Devido aos resultados obtidos (46% das etiquetas foram atribuidas corretamente), este provavelmente não é o etiquetador que você busca. ## Licença do código MIT. ## Licença do corpus embarcado ("downloaded/corpus100.txt") Serei direto: não sei. É exatamente o arquivo mesmo que você acha para baixar [numa página dum subdomínio da USP](http://www.nilc.icmc.usp.br/nilc/tools/nilctaggers.html) ([link direto](http://www.nilc.icmc.usp.br/nilc/download/corpus100.txt) | [manual de etiquetas](http://www.nilc.icmc.usp.br/nilc/download/tagsetcompleto.doc)), mas não achei nenhuma menção de licença por lá. Se quiser trocar por um corpus etiquetado licenceado em Creative Commons Attribution 4.0 International License, uma solução “drop-in” que funcione imediatamente após descompactado na pasta adequada é o [Mac-Morpho](http://nilc.icmc.usp.br/macmorpho/) ([link direto](http://nilc.icmc.usp.br/macmorpho/macmorpho-v3.tgz) | [manual de etiquetas](http://nilc.icmc.usp.br/macmorpho/macmorpho-manual.pdf)).