Skip to content

Проект для курса «Моя первая научная статья», задача 130: Автоматическое выделение терминов для тематического моделирования. Project for M1P, task 130: Automatic selection of terms for thematic modeling

License

Notifications You must be signed in to change notification settings

intsystems/2023-Project-130

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

58 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Test status Test coverage Docs status

Название исследуемой задачи:Автоматическое выделение терминов для тематического моделирования
Тип научной работы:M1P
Автор:Никитина Мария Александровна
Научный руководитель:Доктор физико-математических наук, Воронцов Константин Вячеславович
Научный консультант:Аспирант, Потапова Полина Сергеевна

Abstract

Nowadays, new scientific terms appear every day. It is necessary to learn how to extract them in the collection of documents. Doing it manually is long and expensive, because you need to attract highly specialized specialists. This article discusses the problem of automatic term extraction. To solve it the collocation allocation method (TopMine) in combination with the modular technology of thematic modeling (using the BigARTM library) and modern methods based on neural network models of the language are used. These two methods have not been compared before.

About

Проект для курса «Моя первая научная статья», задача 130: Автоматическое выделение терминов для тематического моделирования. Project for M1P, task 130: Automatic selection of terms for thematic modeling

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published