Skip to content

Исследование в рамках курса «Моя первая научная статья», тесно связанное с NLP. Yet another NLP research at M1P Course.

License

Notifications You must be signed in to change notification settings

intsystems/2023-Project-131

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Название исследуемой задачи:Итеративное улучшение тематической модели с обратной связью от пользователя
Тип научной работы:M1P
Автор:Алексей Ильич Горбулев
Научный руководитель:д. ф.-м. н., Воронцов Константин Вячеславович
Научный консультант(при наличии):Алексеев Василий Антонович

Abstract

(RUS) В работе представлен метод тематического моделирования с использованием обратной связи от пользователя. Обратная связь заключается в определении принадлежности темы, полученной при тематическом моделировании, к одной из трёх категорий: релевантная, нерелевантная, <<мусорная>>. Основная задача состоит в улучшении базовой модели, которое заключается в выделении новых релевантных тем при сохранении выделенных тем и уменьшении числа <<мусорных>> тем. В работе предлагается решение с использованием библиотек тематического моделирования и регуляризаторов сглаживания и декоррелирования. Вычислительный эксперимент проводится на текстовой коллекции, основанной на новостях сайта Lenta.ru.

(ENG) We introduce the method of topic modeling using user feedback. The user marks a topic as relevant, irrelevant, or "garbage". The main problem is to improve the base model preserving relevant topics. The number of "garbage" topics should decrease. We provide the solution using topic modeling algorithms and regularizers for sparsing and decorrelation. We run the experiment on Lenta.ru news dataset.

Research publications

Presentations at conferences on the topic of research

  1. Отчетная конференция научного трека инновационного практикума ФПМИ 2023 (Russian) <https://indico-workshop.samcs.ru/event/3/>

Software modules developed as part of the study

  1. A code with all experiment visualisation here.

About

Исследование в рамках курса «Моя первая научная статья», тесно связанное с NLP. Yet another NLP research at M1P Course.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published