Skip to content

[c] ngram function

Myungchul Shin edited this page Jan 9, 2017 · 11 revisions
  • generate ngrams(minsize=3, maxsize=6) from a given word(utf-8)

  • code snippet from fasttext

$ g++ -g ngram.cc -std=c++0x -o ngram
$ ./ngram
<카카	1387097
<카카오	1620067
<카카오1	1032470
<카카오12	1407148
카카오	1151521
카카오1	815408
카카오12	1371046
카카오12검	1181318
카오1	449865
카오12	1959841
...
Clone this wiki locally