한국데이터정보과학회지 게재 논문

Sequence-to-text 기법을 활용한
언어 모델의 분류 성능 비교

Comparison of Classification Performance of
Language Models using Sequence-to-Text Techniques

First Author

김민경	김유미	민지현	성현수

Abstract

최근 들어 활발한 언어 모형의 개발과 함께 많은 분야의 연구자들이 이에 관심을 갖게 되었다. 언어 모형의 사용처는 매우 다양하여 많은 분야에 사용될 수 있다. 전통적인 통계학이나 머신러닝의 분야에서는 기존에 이진 분류에 대한 연구가 활발하게 진행되어왔고, 언어 모형들 역시 동일한 과제를 수행할 수 있다. 언어 모형의 특징으로 인해 입력 데이터는 테이블 형식의 숫자로 이루어진 데이터가 아니라 문자형 식의 변수를 요구한다. 이 논문에서는 열 가지의 최신 언어 모형들의 목적과 특징들을 소개한다. 한편, 언어 모형의 데이터 입력을 위해 시퀀스 데이터를 텍스트로 변환하는 sequence-to-text 방법의 여러 가지 예시를 구체적으로 제시한다. 이를 통해 언어 모형 구현에 경험이 없는 독자들에게는 도움이 될 것으로 기대한다. 마지막으로, 제시한 여러 가지 sequence-to-text 방법을 실제 데이터를 이용한 모의 실험을 통하여 이 논문에서 소개하는 최신 언어 모형들의 성능을 비교하고 머신러닝 모형들의 결과도 함께 제공하여 언어 모형들의 우수한 분류 성능을 확인한다.

Background

활발한 언어 모형의 개발이 진행되고 있으며 다양한 분야에 사용될 수 있습니다. 전통적인 통계학이나 머신러닝 분야에서는 이진 분류에 대한 연구가 활발하게 진행되어왔고, 언어 모형들 역시 동일한 과제를 수행 가능합니다.

Objective

이 논문에서의 주요 목표는 시계열 데이터의 패턴을 언어 모델로 학습하고 분류 예측에 사용하는 것입니다.

Key Ideas

연속된 시계열 데이터를 시퀀스 형태로 나열한 후 언어 모델이 이해할 수 있는 텍스트 형태로 변환합니다.
단순히 순차적 행동을 텍스트로 나열하는 것이 아니라, 요약 정보를 문장 초두에 함께 제시합니다.
사전 학습된 언어 모델을 HuggingFace로부터 불러와 분류 과제를 학습하여 예측을 수행합니다.
동일한 정보량이 주어졌을 때, 언어 모델과 머신러닝 모델의 예측 성능을 비교합니다.

*Figure 1: Data preprocessing from sequence to text. Source: [논문링크](link).*

Table: Comparison of Language models and Machine learning models

Language models	Machine learning models
a	b
a	b
a	b

내용

Significance

내용

Citation

@article{?,
  title={Comparison of Classification Performance of Language Models using Sequence-to-Text Techniques},
  author={Kim, M., Kim, Y., Min, J., Seong, H., and Jung, Y.},
  journal={Journal of the Korean Data & Information Science Society.},
  volume={??},
  number={???-???},
  pages={?},
  year={2024}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

한국데이터정보과학회지 게재 논문

Sequence-to-text 기법을 활용한
언어 모델의 분류 성능 비교

Comparison of Classification Performance of
Language Models using Sequence-to-Text Techniques

Abstract

Background

Objective

Key Ideas

Table: Comparison of Language models and Machine learning models

Significance

Citation

Files

README.md

Latest commit

History

README.md

File metadata and controls

한국데이터정보과학회지 게재 논문

Sequence-to-text 기법을 활용한 언어 모델의 분류 성능 비교

Comparison of Classification Performance of Language Models using Sequence-to-Text Techniques

Abstract

Background

Objective

Key Ideas

Table: Comparison of Language models and Machine learning models

Significance

Citation

Sequence-to-text 기법을 활용한
언어 모델의 분류 성능 비교

Comparison of Classification Performance of
Language Models using Sequence-to-Text Techniques