Skip to content

Элементарное квазиреферирование текста

License

Notifications You must be signed in to change notification settings

FireEagle25/QuasiAbstracting

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

QuasiAbstracting

Элементарное квазиреферирование текста

Если кратко, то квазиреферирование - это вычленение главных предложений из текста и формирование из них выходного текста. Типа краткого содержания.

Запуск

  1. Проверяем, что установлен питон / ставим его. (я сижу на 3.5, что будет под 2м - хз)
  2. Ставим либу pymystem3
  3. Запускаем файл main.py

Пример запуска из консоли: python3 main.py text.txt 0.2

Структура

StringSlicing

Разбивает входной текст на слова или предложения с помощью регулярок

WordStorage

Хранит и определяет вес слов

Перед тем как определять, какое слово нужно добавить, входное слово нормализируется(т.е. находится его базовая форма), нормализацией занимается pymystem3

Доки для питона к либе лежат тут

Abstractor

С помощью WordStorage'а определяет вес предложения

Авторы

FireEagle25

WinPooh32

About

Элементарное квазиреферирование текста

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages