-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
write test cases as detailed in here #51
Comments
1 -> 2, 3 왜? 예를 들면 이런 예시를 일일히 수작업으로 고쳐야 한다:
위가 무엇을 보여주는 것인가? 다음은 가능하다:
하지만
왜? 습니다의 경우 1, 2의 경우가 전부 어차피 반말부터 공부하는 외국인들은 숫자가 커지는 경우를 더 필요로 할것이기 때문에, politeness를 줄이는 알고리즘은 data augmentation의 용도가 아닌이상.. 굳이 필요없다. 그래서 우리는... 더이상 3 -> 1, 2는 지원하지 않겠다...! 그래야 개발에 속도가 붙을 것 같다. |
문제점
줍 + 어요 -> 주워요는 오케이. 왜?아.. if-else문의 반복이기에, 두개 이상의 케이스에 해당돼도 한 케이스만 적용하고 끝나버리기 때문인 것으로 보인다. 그렇다면 어떻게 해결할까?if-else의 연속을 여러개의 if문의 나열로 바꿔야한다. 음.. 그게 말이 쉽지..ㅠㅠ 일단 방법을 한번 생각해보자. soynlp에서는 어떻게 하고 있지? 어떻게 여러개의 규칙을 적용하고 있을까?
soynlp는 여러개가 순차적으로 적용되는 건 고려하지 않는다. 이렇게 두가지가 존재한다고 보는듯. 오늘 뭐했음? - 정리뭘했는지 쉽게 설명어간의 활용 알고리즘을 수정하고 있다. |
음... 일단 알고리즘 구현은 나중으로 미뤄보고.지금은 애초에 계획했던 테스트만 쓰고 끝내자. TDD라고 생각하면 된다. |
오늘 뭐했지? 쉽게 설명다음과 같이, soynlp에서 소개한 용언의 활용 케이스를 Lines 247 to 336 in 6165ef1
하나만 예를 들며 설명해보자면 이런걸 테스트하고 있다: 입력 = "하늘이 파랗다." 인 경우.
저 테스트를 돌려보면 아직 완벽하지 않기 때문에 20개 중 8개는 패스하지 못한다. 하지만 개발을 시작하기전, 분명한 목표를 설정해둔다는 것에 오늘의 활동에 의의를 둔다. ... 그런데 이렇게 복잡한 한국어를 난 도대체 어떻게 하고 있는거지? 체득된 문법이란 참 신기한 것 같다. |
No description provided.
The text was updated successfully, but these errors were encountered: