JanomeとMeCabで日本語のテキストを単語に分ける

テキストの類似度を求める機械学習をするには単語に分ける必要があります。 英語などであればスペースで簡単に分けることができますが、日本語だとそういうわけにはいきません。 そこでjanomeまたはmecabを使って日本語の分 … 続きを読む JanomeとMeCabで日本語のテキストを単語に分ける