**/*_train/** **/*_test/** tagged.json text.tfst tokens.txt