地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

2021-01-01から1ヶ月間の記事一覧

在宅勤務で腰に負担?

実際、車で通勤だったら、さほど座っている時間は変わらないんじゃないかと思う、在宅勤務。ひと目を気にせず、背伸びしたり、音楽聞いたり、ウロウロしながら考え事したりできるのは在宅勤務のいいところ。 その上、クッションも自由に選べる、ということで…

文書を俯瞰 #6

自然言語解析。科研費データから説明文を形態素解析を実施して、俯瞰データをプロット。ドットと密度をカーネル密度マップで描画。なんか、それらしくなった。 ・ついでにそれぞれの年の重心位置もプロット。 ・科研費の番号は適当に間引いて表示。 ・インタ…

文書を俯瞰 #5

自然言語解析。あとはグラフを書く。 そんなに悩むことなく。seabornを使ってカーネル密度マップを書いてみる。 fig = plt.figure(figsize=(10, 10)) sns.kdeplot(x=data[x], y=data[y], fill=True, cmap='CMRmap', thresh=0, levels=100, bw_method=0.1 ) s…

文書を俯瞰 #4

自然言語処理。とりあえず、ベクトル化まで終わったので、作図。 ベクトルの可視化に着手。調べると、pca, t-sna, umapあと、少し経路が違うけれどもmdsも入れていいのかな。 cpp-learning.com mdsは、きれいな特許マップを見せてくれるValuenex社が採用して…

文書を俯瞰 #3

自然言語処理。文書を適当に俯瞰できるといいなと始めてみた。 前処理は見えてきたので、どうやって特徴量を出すのか。調べてみると、Doc2VecやTF-IDFあたりが割と枯れた技術のようなので、どちらかにする。情報が沢山あったほうが勉強しやすい。あまり古い…

文書を俯瞰 #2

自然言語処理。さてと、特許の分類に興味があったけれども、日本の特許庁は不便なんで、手に入るもので挑戦しようと調査中。 今回は、形態素解析。日本語を分解して単語に分ける。単語を単位とすれば処理ができるようになる。よく見かけるのはMeCabやJanome…

文書を俯瞰 #1

自然言語処理。文書が俯瞰できる仕組み作りに挑戦。 類似文書分類が、お手軽にできるのは、VEC2DOCかSklearnでTFIDFを利用。高度なプログラムは出来ないので、枯れたところを活用するのが幸せ。と、思って探していると、Kaggleのサイトにシンプルで綺麗なコ…

文書を俯瞰 #0

自然言語処理を調べている。人工知能搭載ボット・・・となるといきなり壁が高すぎる気がする。そこで、大量の文章をざっと眺める方法から取り掛かる。 特許で何やら、地図っぽい絵を描かせてどこが特許のポイントかを図示する方法があるらしい。パテント・ラ…

ゲーム&ウオッチ スーパーマリオブラザーズ

楽しい。 時計も見飽きない。ゲームもできる。 がっつりゲームするには・・・小さい。 ぱっと手にとって、スーパーマリオで遊ぶ。 当初、転売で高くなってたが、通常値段で購入できるようになった。 コレクション的アイテム。和む。 ゲーム&ウオッチ スーパ…