地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

Anaconda windows でMeCab

 日本語の処理には必須の分かち書きMeCabを使ってやるのが定番の様だ。Juman++というのもあるようだけれども、今日のところはMeCabのインストールにチャレンジ・・・。

 と言っても下記のサイトの通りでばっちりでした。

qiita.com

 

  ところが、UTF-8の文字列を取り扱うとエラー連発。困ったなぁ・・・。と思っていたら、デフォルトがCP932らしい。いちいち明示的にファイル取り扱うのが無難かなぁ。どこかで一発で宣言できれば便利なんだけれども。

qiita.com