Skip to content

zidane100e/news_clustering_dataset

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 

Repository files navigation

뉴스 기사 군집화 분석 사용 기사 링크

저작권 문제로 기사 링크와 일부 타이틀만 올립니다.

contents

뉴스 본문 링크
check_train_test_same_v2.ipynb : contents 내 기사가 testset 에 있으면 제거
Unsupervised 학습만 하여 레이블 없음

testset

테스트 기사 링크와 타이틀 및 라벨링

데이터셋1

데이터셋1 : 디렉토리 명으로 구분(finance, general, global, industry, stock)

데이터셋2

데이터셋2 : label.md 에 있는 라벨 구분 활용
실제 사용 시 중복 데이터 등 제거하여 사용

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published