地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

Colaboratory

Langchain, plan and executeを試す。

LangchainのPlan and executeを試してみた。 BabyAGI からヒントを得て実装した、タスク立案→実行の流れで自律的に動作をする。題材として、トヨタ自動車のSWOT分析をさせてみる。 検索エンジンはSerpでなくDuckDuckGoにした。試行錯誤するとあっという間にS…

LLaMa2をllma2_13b_chat_ggmlv3で試してみる。

Metaが発表したLLaMa2。LLaMaの性能も高かったし、発表後の評判も高い。とは言え、貧弱なPCでは70Bは動かすのは厳しい。そこで、Google Colabで量子化モデルを浮かしてみる。無料プランの範囲で動作可能だ。 huggingface.co llama_cppをGPUで動かそうとした…

spaCyからLLMを使えるようになりつつあり

spaCyからLLMを使えるように実装が始まっている。どんどんお気軽に使える様になってきてうれしい。 github.com とりあえず、簡単なテスト。 github.com FewShot学習も対応しているけれども、日本語はこれからの模様。こういう動きになると益々プロンプトエン…

PDFを使ってQ&Aをさせてみたい。(gpt-3.5-turbo+LangChain)

Chat GPTで、おしゃべりも楽しいけれども、実用的に考えれば根拠のある回答ができるようが良い。そこで、PDFドキュメントを使った対話が可能だというのでお試しした。 qiita.com こちらを参考にさせていただきつつ、colabで動かしてみた。題材は、題材は産総…

BabyAGIで少子化対策を・・・。

自立エージェントのBabyAGIをお試し。コストの都合上、GPT-3.5-Turboで進めます。 note.com いつも、拝見しています。 ※Googleさんに翻訳してもらっています。 *****目的***** 日本の少子化問題を解決するための政策を提案してください。 初期タスク: タスク…

dolly-japanese-gpt-1bを試してみる。

rinna社の「japanese-gpt-1b」を、日本語データセット「databricks-dolly-15k-ja」を使用して学習させたDolly-Japanese-GPT-1Bモデルを試してみる。今はすっかりGPT-3が話題ですが、GPT-2相当のモデルでどこまでできるのだろうとcolaboratoryで動作させてみ…

ColaboratoryでCerebras-GPTをとりあえず動かしてみる

毎日何かしらトピックが尽きないし大規模言語モデル。今度は、Cerebras-GPTが発表された。ColaboratoryでCerebras-GPT-1.3Bを動かしてみた。無料版だとRAMがギリギリだったが、動かせた。 Generative AI is a very powerful tool for the creation of new AI…

ChatGPTで降臨。跡部景吾様

引き続き、ChatGPTの醍醐味であるプロンプトに挑戦した。 挑戦したキャラクターは、テニスの王子様に出てくる跡部景吾。イケメンで凄腕プレイヤーで御曹司と非の打ち所がない中学生。「なるほどsundayじゃねーの」と言った名台詞も多数。少年ジャンプで連載…

ColaboratoryでchatGPT(+Whisper+VOICEVOX)で遊ぶ

すっかり話題の巨大言語モデル。OpenAIのchatGPTなら個人が使える価格帯だし、ぼちぼち使ってみたい。そこで、colabでトライしてみた。 whipserで音声認識。chatGPTで返答を作成したらVOICEVOXで音声とする。色んな人が同じような手順でやっているので参考に…

言語モデル、Flan_UI2をcolaboratoryで試してみる。

例に従って簡単に動かせました。 github.com 質問 Answer the following question step by step in the detail. Give the rationale before answeringWhat should be implemented to eliminate war from the world? 答え War is a state of armed conflict b…

Stable Diffusionで画像生成2023年3月版

何やらさらに進化しているらしいということで・・・StableDiffusionで画像生成をチェックしてみました。使ったcolabのコードです。 github.com waifu-diffusion/wd-1-5-beta2 · Hugging Face Defpoint/Defmix-v2.0 · Hugging Face 用途に応じでアイデア次第…

自然言語処理 spaCyでelectraのファインチューニング

超大規模モデルが世間を圧倒させている。それをAPIで使うってのも面白そう。しかし、お手軽に使うとなると・・・。悔しいので、colabでできる自然言語処理のお勉強を進めることにする。今回は、固有表現抽出用にelectraのファインチューニングをお手軽にでき…

FuguMTで翻訳してみる。

フリーのニューラル機械翻訳モデル(日本語・英語)FuguMTをお試ししてみた。 staka.jp といっても簡単。ほぼモデルを呼び出すだけ。 github.com これくらいのベースが出来ているのであれば、分野や文書ごとに追加で学習させて使うやりかたが気軽にできそう…

Google Colabにpre-installされたspaCyをテスト

自然言語処理ライブラリspaCy。Colabで使う時には、なんとなく惰性でpipでインストールしていたが、実はpre-installされていた。今更気が付いた。 Google Colab now comes with spaCy v3.3 pre-installed as the default Run spaCy 3.3 workflows in Google …

AI対話:会話データSODAで鍛えたCOSMOモデルを試す。

自然な会話ができるChatGPTが話題ですが、SODA*1という、データセットで学習させたCOSMOというモデルがなかな優秀だというのをtwitterで見かけたので試してみる。 github.com 会話の状況は「最後の一葉」を参考にして投入した。 instructionは不要らしいが、…

Metaが公開したNLLBモデルを試してみる。

No Language Left Behind: NLLBでのモデルが公開された。どんな言語でもWeb上の情報を母国語でコミュニケーションできるようにという翻訳AIプロジェクト。 No Language Left Behind: A model from NLLB is released. A translation AI project that allows a…

Stable Diffusion2.0お試し。

本家を見てColabで動かそうとしたら、さくっと先人がいらっしゃったので、参考にした。プロンプト(呪文)も先人の知恵を参考にした。 note.com お手軽に結構なクオリティで描ける。すっかり民主化された道具になったので、驚かなくなった。凄い瞬間に立ち会…

文章要約に挑戦

文章要約にチャレンジ。 Pysummarizationを使うと簡単にできそうなので、採用。 pypi.org 基本的には、こちらのページを見ながら試していけば、よいのだが、要約モデルをいくつか試せるのが楽しい。 github.com 普通にやっても面白くないので、長文を無理や…

流行りの画像生成をやってみる #05

Stable Diffusionを使って画像生成。プロンプトの呪文は難しい。でも、なんか、呪文ばかりを考えて粘るのも嫌だなと思う。それにも負けず、トライしてみた。とりあえず、まとめて生成させて、使えそうなキーワードを見つけつつ、10回ずつ試行。 たまに良い…

流行りの画像生成をやってみる #04

DiscoDiffusion v5.6で動画生成トライ。 #DiscoDiffusion 先週は画像生成動画。今週は次にチャレンジしようと思ったら、状況が変わっていた。 pic.twitter.com/8CieyjR3AB — BW/GIFT (更新通知・実験BOT・中の人) (@bwgift20th) August 27, 2022 簡単に夢に…

流行りの画像生成をやってみる #03

引き続きDisco Diffusion v5.6で画像生成。プロンプトって結構難しい。色んな情報が飛び交うのも分かる気が・・・。試行錯誤してみたら、基本的な要領がわずかにつかめた(かもしれない(笑)) サイバーパンク風街並み。 遠景。雲の下に雪の街並み。 プロン…

流行りの画像生成をやってみる #02

Disco-Diffusionを使っての静止画生成にチャレンジ中。Midjouneyだとお手軽だと思いつつ、お勉強している雰囲気も欲しいのでDDで遊んでみている。 定番のブレードランナー的SF風の絵。都市部の雨模様の風景。やってみると、テキストの選択が難しい。教師デー…

流行りの画像生成をやってみる #01

「Midjourney」、「DALL·E」といったテキストからの画像生成が話題です。好みの画像を生成するキーワードとかテクニックの記事も出てきて楽しい今日この頃。 キーワードテクニックは、モデルが変われば変わってくる。だが、こうした色んな人の試行錯誤が集ま…

AIマリオチャレンジ #4

Stage 8-1をようやくクリア! 最後はハイパーパラメータを調整してなんとか達成。継続学習でエラーが出て、解決に手間取っていたところ、先にクリアした方のNotebookを参考に解決。その後、初めから学習をやり直したところ、ゴール。 競争ではないけれども、…

勝手に三国志。GPT2で遊ぶ。

GPT2を使って、文章の生成にチャレンジをしています。 bwgift.hatenadiary.jp なんか、いまいちだった。そこで、試行錯誤して、rinnaのmiddleサイズの学習データをベースに、吉川英治の三国志を学習してみた。 github.com その結果できた文章。読める文章が…

りんなで会話を構成してみる

引き続き遊んでみた。 bwgift.hatenadiary.jp りんなのsmallモデルからmediumモデルを使ってファインチューニング。プロンプトテキストは生成テキストを加えて行き、行数が増えてきたら、直近の適当な行数をベースとした。(この例だと、最初に20行まで生成…

りんなにシャーロックホームズを教える

青空文庫からデータをダウンロードして加工できた。さっそく、コナンドイル作品から「」内の会話文を抽出して学習用データをしました。具体的な手法は、過去記事参照。 bwgift.hatenadiary.jp 使ったりんなモデルはスモールモデル。例によってColabを使いま…

青空文庫から自然言語処理用データをダウンロード その2

以前、青空文庫から自然言語処理用データをGoogle Colabでダウンロードして整形するようにしたが、挿絵がzipに同梱してあるとエラーになるのに(いまさら)気が付いた。bugfixして、ついでに、セリフだけを取り出すことにした。 これで、〇〇風にrinnaをfine…

青空文庫から自然言語処理用データをダウンロード

青空文庫の中から自然言語処理用データを入手する。青空文庫は、定番の題材のようだ。意外と読んだことのない本が多いことに気が付きつつ、青空文庫に感謝しつつ、題材とさせていただきました。注意点は、掲載しているすべてのデータが著作権が切れたもので…

りんな、日本語GPT-2モデルとガンダムで遊んでみた#02

「Colaboratoryを使ってRinnaで遊んでみた」のコード。 以下のサイトを参考にさせていただきました。 note.com ファインチューニング編 rinna_de_asobu/Rinna_fineTuring_G_try.ipynb at main · chottokun/rinna_de_asobu · GitHub ※学習データは別途準備要…