You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
현재 namuwikitext는 \n =를 기준으로 문서를 나누고 있는데, 본문 중에 \n =로 행이 시작하지만 =로 끝나지 않는 행이 존재하는 것을 확인했습니다. Korpora.utils::load_wikitext의 주석을 확인해볼 때 heading을 기준으로 split하는 것이 의도된 동작으로 보여 이슈를 남깁니다.
현재 namuwikitext는
\n =
를 기준으로 문서를 나누고 있는데, 본문 중에\n =
로 행이 시작하지만=
로 끝나지 않는 행이 존재하는 것을 확인했습니다.Korpora.utils::load_wikitext
의 주석을 확인해볼 때 heading을 기준으로 split하는 것이 의도된 동작으로 보여 이슈를 남깁니다.정규식
^ =.*[^=]$
으로 검색해보시면 알 수 있고, 자세한 내용은 jeongukjae/tfds-korean#12 (comment) 에 적어놓았습니다.Korpora/Korpora/utils.py
Lines 64 to 91 in a2c1ba8
관련 이슈: lovit/namuwikitext#10, jeongukjae/tfds-korean#12
The text was updated successfully, but these errors were encountered: