17 lines
1.3 KiB
Markdown
17 lines
1.3 KiB
Markdown
|
# Yet Another Simple POS Tagger
|
||
|
|
||
|
Este é um etiquetador de partes do discurso (POS tagger) que foi escrito para ter os mesmos formatos de entrada e saída que do Unitex/GramLab, sem fazer uso do algoritmo de Viterbi, mas sim um simples casamento de padrões.
|
||
|
|
||
|
Devido aos resultados obtidos (46% das etiquetas foram atribuidas corretamente), este provavelmente não é o etiquetador que você busca.
|
||
|
|
||
|
## Licença do código
|
||
|
|
||
|
MIT.
|
||
|
|
||
|
## Licença do corpus embarcado ("downloaded/corpus100.txt")
|
||
|
|
||
|
Serei direto: não sei. É exatamente o arquivo mesmo que você acha para baixar [numa página dum subdomínio da USP](http://www.nilc.icmc.usp.br/nilc/tools/nilctaggers.html) ([link direto](http://www.nilc.icmc.usp.br/nilc/download/corpus100.txt) | [manual de etiquetas](http://www.nilc.icmc.usp.br/nilc/download/tagsetcompleto.doc)), mas não achei nenhuma menção de licença por lá.
|
||
|
|
||
|
Se quiser trocar por um corpus etiquetado licenceado em Creative Commons Attribution 4.0 International License, uma solução “drop-in” que funcione imediatamente após descompactado na pasta adequada é o [Mac-Morpho](http://nilc.icmc.usp.br/macmorpho/) ([link direto](http://nilc.icmc.usp.br/macmorpho/macmorpho-v3.tgz) | [manual de etiquetas](http://nilc.icmc.usp.br/macmorpho/macmorpho-manual.pdf)).
|
||
|
|