地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

お勉強

PDFを使ってQ&Aをさせてみたい。(gpt-3.5-turbo+LangChain)

Chat GPTで、おしゃべりも楽しいけれども、実用的に考えれば根拠のある回答ができるようが良い。そこで、PDFドキュメントを使った対話が可能だというのでお試しした。 qiita.com こちらを参考にさせていただきつつ、colabで動かしてみた。題材は、題材は産総…

BabyAGIで少子化対策を・・・。

自立エージェントのBabyAGIをお試し。コストの都合上、GPT-3.5-Turboで進めます。 note.com いつも、拝見しています。 ※Googleさんに翻訳してもらっています。 *****目的***** 日本の少子化問題を解決するための政策を提案してください。 初期タスク: タスク…

dolly-japanese-gpt-1bを試してみる。

rinna社の「japanese-gpt-1b」を、日本語データセット「databricks-dolly-15k-ja」を使用して学習させたDolly-Japanese-GPT-1Bモデルを試してみる。今はすっかりGPT-3が話題ですが、GPT-2相当のモデルでどこまでできるのだろうとcolaboratoryで動作させてみ…

ChatGPTとGPT4、Claude-instant、Claude、Sageでアムロとシャアに会話させてみた。

OpenAIのChatGPTばかり話題になるが、他の会社も頑張っている。Poeサービスを使って、3つのモデルでアムロとシャアに降臨して頂き会話をしていただいた。 プロンプトを作成し、以下のセリフからの続きを生成してもらった。参考にさせていただいたサイトは文…

ColaboratoryでCerebras-GPTをとりあえず動かしてみる

毎日何かしらトピックが尽きないし大規模言語モデル。今度は、Cerebras-GPTが発表された。ColaboratoryでCerebras-GPT-1.3Bを動かしてみた。無料版だとRAMがギリギリだったが、動かせた。 Generative AI is a very powerful tool for the creation of new AI…

ChatGPTで降臨。跡部景吾様

引き続き、ChatGPTの醍醐味であるプロンプトに挑戦した。 挑戦したキャラクターは、テニスの王子様に出てくる跡部景吾。イケメンで凄腕プレイヤーで御曹司と非の打ち所がない中学生。「なるほどsundayじゃねーの」と言った名台詞も多数。少年ジャンプで連載…

ColaboratoryでchatGPT(+Whisper+VOICEVOX)で遊ぶ

すっかり話題の巨大言語モデル。OpenAIのchatGPTなら個人が使える価格帯だし、ぼちぼち使ってみたい。そこで、colabでトライしてみた。 whipserで音声認識。chatGPTで返答を作成したらVOICEVOXで音声とする。色んな人が同じような手順でやっているので参考に…

自然言語処理 spaCyでelectraのファインチューニング

超大規模モデルが世間を圧倒させている。それをAPIで使うってのも面白そう。しかし、お手軽に使うとなると・・・。悔しいので、colabでできる自然言語処理のお勉強を進めることにする。今回は、固有表現抽出用にelectraのファインチューニングをお手軽にでき…

FuguMTで翻訳してみる。

フリーのニューラル機械翻訳モデル(日本語・英語)FuguMTをお試ししてみた。 staka.jp といっても簡単。ほぼモデルを呼び出すだけ。 github.com これくらいのベースが出来ているのであれば、分野や文書ごとに追加で学習させて使うやりかたが気軽にできそう…

Google Colabにpre-installされたspaCyをテスト

自然言語処理ライブラリspaCy。Colabで使う時には、なんとなく惰性でpipでインストールしていたが、実はpre-installされていた。今更気が付いた。 Google Colab now comes with spaCy v3.3 pre-installed as the default Run spaCy 3.3 workflows in Google …

AI対話:会話データSODAで鍛えたCOSMOモデルを試す。

自然な会話ができるChatGPTが話題ですが、SODA*1という、データセットで学習させたCOSMOというモデルがなかな優秀だというのをtwitterで見かけたので試してみる。 github.com 会話の状況は「最後の一葉」を参考にして投入した。 instructionは不要らしいが、…

Metaが公開したNLLBモデルを試してみる。

No Language Left Behind: NLLBでのモデルが公開された。どんな言語でもWeb上の情報を母国語でコミュニケーションできるようにという翻訳AIプロジェクト。 No Language Left Behind: A model from NLLB is released. A translation AI project that allows a…

続:ラズパイでPoetryを「Failed to create the collection:」エラー

ラズパイにPoetryを導入して無事に動いたものの、別のラズパイにも入れたが、いざ環境構築しようとすると・・・ Failed to create the collection: Prompt dismissed.. と、いうエラー。 調べると・・ Keyring errors during non-publishing operations · Is…

Stable Diffusion2.0お試し。

本家を見てColabで動かそうとしたら、さくっと先人がいらっしゃったので、参考にした。プロンプト(呪文)も先人の知恵を参考にした。 note.com お手軽に結構なクオリティで描ける。すっかり民主化された道具になったので、驚かなくなった。凄い瞬間に立ち会…

自然言語処理:spaCyとBERT(transformers) #1

簡単に自然言語処理にトライできるspaCy。産業的な製品向けのための自然言語処理らしい。だが、初心者がこだわらずに挑戦するのにも向いていると思う。 spacy.io しかも、spaCy3ではtransformersのモデルも使える様になったので、ちょっくら使ってみようとし…

文章要約に挑戦

文章要約にチャレンジ。 Pysummarizationを使うと簡単にできそうなので、採用。 pypi.org 基本的には、こちらのページを見ながら試していけば、よいのだが、要約モデルをいくつか試せるのが楽しい。 github.com 普通にやっても面白くないので、長文を無理や…

メモ:Python, Pandas, apply.

Pandasを使っていて、applyは便利。 引数が複数ある関数を使う場合の一例のメモ。 import pandas as pd df = pd.DataFrame({'A': ['A1', 'A2', 'A3'], 'B': ['B1', 'B2', 'B3'], 'C': ['C1', 'C2', 'C3']}) def func(x,y,z): return x+y+z df.apply(lambda x…

流行りの画像生成をやってみる #04

DiscoDiffusion v5.6で動画生成トライ。 #DiscoDiffusion 先週は画像生成動画。今週は次にチャレンジしようと思ったら、状況が変わっていた。 pic.twitter.com/8CieyjR3AB — BW/GIFT (更新通知・実験BOT・中の人) (@bwgift20th) August 27, 2022 簡単に夢に…

流行りの画像生成をやってみる #03

引き続きDisco Diffusion v5.6で画像生成。プロンプトって結構難しい。色んな情報が飛び交うのも分かる気が・・・。試行錯誤してみたら、基本的な要領がわずかにつかめた(かもしれない(笑)) サイバーパンク風街並み。 遠景。雲の下に雪の街並み。 プロン…

流行りの画像生成をやってみる #01

「Midjourney」、「DALL·E」といったテキストからの画像生成が話題です。好みの画像を生成するキーワードとかテクニックの記事も出てきて楽しい今日この頃。 キーワードテクニックは、モデルが変われば変わってくる。だが、こうした色んな人の試行錯誤が集ま…

AIマリオチャレンジ #4

Stage 8-1をようやくクリア! 最後はハイパーパラメータを調整してなんとか達成。継続学習でエラーが出て、解決に手間取っていたところ、先にクリアした方のNotebookを参考に解決。その後、初めから学習をやり直したところ、ゴール。 競争ではないけれども、…

りんなにシャーロックホームズを教える

青空文庫からデータをダウンロードして加工できた。さっそく、コナンドイル作品から「」内の会話文を抽出して学習用データをしました。具体的な手法は、過去記事参照。 bwgift.hatenadiary.jp 使ったりんなモデルはスモールモデル。例によってColabを使いま…

青空文庫から自然言語処理用データをダウンロード その2

以前、青空文庫から自然言語処理用データをGoogle Colabでダウンロードして整形するようにしたが、挿絵がzipに同梱してあるとエラーになるのに(いまさら)気が付いた。bugfixして、ついでに、セリフだけを取り出すことにした。 これで、〇〇風にrinnaをfine…

青空文庫から自然言語処理用データをダウンロード

青空文庫の中から自然言語処理用データを入手する。青空文庫は、定番の題材のようだ。意外と読んだことのない本が多いことに気が付きつつ、青空文庫に感謝しつつ、題材とさせていただきました。注意点は、掲載しているすべてのデータが著作権が切れたもので…

りんな、日本語GPT-2モデルとガンダムで遊んでみた#02

「Colaboratoryを使ってRinnaで遊んでみた」のコード。 以下のサイトを参考にさせていただきました。 note.com ファインチューニング編 rinna_de_asobu/Rinna_fineTuring_G_try.ipynb at main · chottokun/rinna_de_asobu · GitHub ※学習データは別途準備要…

りんな、日本語GPT-2モデルとガンダムで遊んでみた#01

rinna社が公開したGPT言語モデル。なんだか楽しそうなので、ファインチューニングにチャレンジした。お勉強なので、お手軽にできる範囲。モデルをサイズの小さいsmallを選択し、実行環境は参考にしたサイトを見ながらColabで構築。題材は「逆襲のシャア」の…

#AIマリオチャレンジ リブート

AIマリオチャレンジ。world 8-1が未だにゴールできない。 このステージは長い。土管入って・・なんてやるとルールを与えないと難しいだろうし・・・。ハイパーパラメータを弄って、大ジャンプまでは頑張ってくれたが、3連土管をクリアする確率が上がらない…

AIマリオチャレンジ その後

AIマリオチャレンジを継続中。world 8-1がどうしてもクリアできない。 基礎知識がそもそもないので、強化学習の勉強をしてみたり。一般常識を頭に入れつつ遊び続けている。NNは弄ると泥沼に入りそうだったので、ハイパーパラメータと報酬で何とかならぬかと…

AIマリオチャレンジってば

機械学習で遊ぼう、という、からあげ先生の楽しいチャレンジ。 karaage.hatenadiary.jp ゼロから作るスキルもないし、強化学習は初めてトライ。報酬とちょっとしたハイパーパラメータの調整程度でとりあえずは楽しめる。 楽しむ手順1 強化学習時の報酬を調…

Colaboratory で local 接続を

Google Colaboratoryは、Notebook形式のPythonが動く環境が提供されていて、お勉強したり、お試ししたり、に便利に使える。環境構築で悩むことが少ない。万事解決するわけでもないが、お手軽であるのには間違いがない。 時間がかかる計算をさせる場合は、 ・…