Skip to content

v2.2.1

Compare
Choose a tag to compare
@YugwonWon YugwonWon released this 20 Sep 06:25
48f18d4

2.2.1 (Sep 21, 2023)

결함

  • postag: 원문보다 더 큰 형태 크기가 발견되면 복합명사 처리 제외
  • manual: 관리자 웹 및 도움말 사이트 주소 오타 수정
  • manual: 106개 분절 규칙을 모두 107개 분절규칙으로 변경
  • train: Token map DB 저장 경로 수정

개선

  • postag: 축약_되_돼_오류 레이블 개선
    • '되어'의 준말인 '돼'의 오류 표기에 대해서 '되어'로 올바르게 분석하기 위한 레이블
    • 예를 들어, '되서' 형태에 대해서 기존에는 '서'를 기준으로 '어'를 복원했지만, 새로운 레이블 규칙에서는 '되'를 기준으로 '어'를 복원한다.
    • 되_돼 오류 복원시 받침이 있는 종결어미가 있는 경우에도 처리할 수 있도록 수정
      • ex) 여드름이 아주 깨끗하게 제거되엽 -> 제거되/VV+어엽/EF
  • runenv: logger를 slog로 변경
    • 기존의 log 대신에 slog를 사용하여 로그를 변경하였고, 기존의 log.Printf 스타일 대신에 Info, Warn, Debug, Error 형식으로 기록
    • runenv: log 레벨을 debug로 지정

학습데이터 세부 수정 사항

  • 학습데이터 증강
    • 축약_되_돼 오류 레이블 관련 자체 말뭉치 학습 데이터 증강
      • ex) 배송완료라 표시되서(되어서) 기뻤어요.
      • ex) 충전도 엄청 잘되영(되어영)
    • 축약_뵈_봬 오류 레이블 관련 자체 말뭉치 학습 데이터 증강
      • ex) 오늘 은사님을 뵈서(뵈어서) 기뻤어요.
      • ex) 아빠가 아파서 병원에 찾아뵈융(뵈어융)
  • 학습데이터 수정
    • 파/VV+얾/EC -> 팔/VV+ㅁ/ETN
    • 원문과 분석 형태가 맞지 않는 경우 수정
      • 비자/NNG+이/VCP+루/SS -> 비자루/NNG
      • 성공적인의과대학 -> 성공적의과학대학
      • 자룐가요 -> 자룐가요?
      • 자동측정기이라든지 -> 자동측정기라든지