地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

2021-01-01から1年間の記事一覧

文書を俯瞰 #3

自然言語処理。文書を適当に俯瞰できるといいなと始めてみた。 前処理は見えてきたので、どうやって特徴量を出すのか。調べてみると、Doc2VecやTF-IDFあたりが割と枯れた技術のようなので、どちらかにする。情報が沢山あったほうが勉強しやすい。あまり古い…

文書を俯瞰 #2

自然言語処理。さてと、特許の分類に興味があったけれども、日本の特許庁は不便なんで、手に入るもので挑戦しようと調査中。 今回は、形態素解析。日本語を分解して単語に分ける。単語を単位とすれば処理ができるようになる。よく見かけるのはMeCabやJanome…

文書を俯瞰 #1

自然言語処理。文書が俯瞰できる仕組み作りに挑戦。 類似文書分類が、お手軽にできるのは、VEC2DOCかSklearnでTFIDFを利用。高度なプログラムは出来ないので、枯れたところを活用するのが幸せ。と、思って探していると、Kaggleのサイトにシンプルで綺麗なコ…

文書を俯瞰 #0

自然言語処理を調べている。人工知能搭載ボット・・・となるといきなり壁が高すぎる気がする。そこで、大量の文章をざっと眺める方法から取り掛かる。 特許で何やら、地図っぽい絵を描かせてどこが特許のポイントかを図示する方法があるらしい。パテント・ラ…

ゲーム&ウオッチ スーパーマリオブラザーズ

楽しい。 時計も見飽きない。ゲームもできる。 がっつりゲームするには・・・小さい。 ぱっと手にとって、スーパーマリオで遊ぶ。 当初、転売で高くなってたが、通常値段で購入できるようになった。 コレクション的アイテム。和む。 ゲーム&ウオッチ スーパ…