Skip to content

PlaydataAI22/DACON_2022_text_classification

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 
 
 

Repository files navigation

문장 유형 분류 AI 경진대회

[주제]

문장 유형 분류 AI 모델 개발

[설명]

언어가 사용되는 모든 영역에서 폭넓게 활용될 수 있는 문장 유형 분류 AI 모델을 개발해 주세요.
문장을 입력으로 받아 문장의 '유형', '시제', '극성', '확실성'을 AI 분류 모델 생성

[주최 / 주관]

주최: 성균관대학교
주관: 데이콘

[참가 자격]

일반인, 학생 등 누구나
https://dacon.io/competitions/official/236037/overview/description

최종 성적(51/333)

평가방법: Weighted F1 Score
최종 점수: 0.74317 (대회 1위 점수 0.75854)

데이터 특성

데이터는 문어체 형태로, 비표준어나 비문이 거의 없는 형태였음

예시문장: 이에 항공사들은 살아남기 위해 운항, 객실, 정비, 지원 등의 업무를 하고 있는 임직원들도 무급 및 유급 휴가와 임금 삭감 등의 회사 방침에 묵묵히 따르고 있으며, 정부 부처와 유관 기관들도 심각성을 깨닫고 실제 체감이 되는 방향으로 방안을 마련 중이나 역부족인 상황이다.

데이터 증식

MLM(https://github.com/seoyeon9646/MLM-data-augmentation)과 Back Translation을 통해 데이터를 증식하였음

사용 모델

KpfBert, KoElectra, KoBert 모델을 학습시켰고 KpfBert 5-Folds 모델이 가장 좋은 성능을 보였음

About

DACON 문장 유형 분류 AI 경진대회

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published