Skip to content

Latest commit

 

History

History
9 lines (7 loc) · 810 Bytes

README.md

File metadata and controls

9 lines (7 loc) · 810 Bytes

MystemParser

Парсер для Mystem - https://tech.yandex.ru/mystem/ Этот замечательный парсер умеет читать файлы в формате xml, которые создаёт mystem. По некоторым причинам, он рассчитан только на английские граммемы, поэтому используйте опцию --eng-gr. Занимается простым подсчётом встреченных слов.

Пример: mystem -cgin --eng-gr --format xml input.txt output.xml

У парсера нет возможности вводить аргументы через командную строку, поэтому нужно просто запустить одну из версий исполняемого файла.