地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

Colaboratory

Langchain, plan and executeを試す。

Colaboratory IT お勉強自然言語処理

LangchainのPlan and executeを試してみた。 BabyAGI からヒントを得て実装した、タスク立案→実行の流れで自律的に動作をする。題材として、トヨタ自動車のSWOT分析をさせてみる。検索エンジンはSerpでなくDuckDuckGoにした。試行錯誤するとあっという間にS…

#自然言語処理

LLaMa2をllma2_13b_chat_ggmlv3で試してみる。

Colaboratory LLM Python お勉強自然言語処理

Metaが発表したLLaMa2。LLaMaの性能も高かったし、発表後の評判も高い。とは言え、貧弱なPCでは70Bは動かすのは厳しい。そこで、Google Colabで量子化モデルを浮かしてみる。無料プランの範囲で動作可能だ。 huggingface.co llama_cppをGPUで動かそうとした…

#自然言語処理

spaCyからLLMを使えるようになりつつあり

Colaboratory IT Python 機械学習自然言語処理

spaCyからLLMを使えるように実装が始まっている。どんどんお気軽に使える様になってきてうれしい。 github.com とりあえず、簡単なテスト。 github.com FewShot学習も対応しているけれども、日本語はこれからの模様。こういう動きになると益々プロンプトエン…

#自然言語処理

PDFを使ってQ&Aをさせてみたい。(gpt-3.5-turbo+LangChain)

AI Colaboratory IT お勉強機械学習自然言語処理

Chat GPTで、おしゃべりも楽しいけれども、実用的に考えれば根拠のある回答ができるようが良い。そこで、PDFドキュメントを使った対話が可能だというのでお試しした。 qiita.com こちらを参考にさせていただきつつ、colabで動かしてみた。題材は、題材は産総…

#自然言語処理

BabyAGIで少子化対策を・・・。

AI Colaboratory お勉強なにこれ機械学習自然言語処理

自立エージェントのBabyAGIをお試し。コストの都合上、GPT-3.5-Turboで進めます。 note.com いつも、拝見しています。 ※Googleさんに翻訳してもらっています。 *****目的***** 日本の少子化問題を解決するための政策を提案してください。初期タスク: タスク…

#自然言語処理

dolly-japanese-gpt-1bを試してみる。

Colaboratory AI IT お勉強自然言語処理機械学習

rinna社の「japanese-gpt-1b」を、日本語データセット「databricks-dolly-15k-ja」を使用して学習させたDolly-Japanese-GPT-1Bモデルを試してみる。今はすっかりGPT-3が話題ですが、GPT-2相当のモデルでどこまでできるのだろうとcolaboratoryで動作させてみ…

#自然言語処理

ColaboratoryでCerebras-GPTをとりあえず動かしてみる

Colaboratory IT お勉強なんとなく自然言語処理

毎日何かしらトピックが尽きないし大規模言語モデル。今度は、Cerebras-GPTが発表された。ColaboratoryでCerebras-GPT-1.3Bを動かしてみた。無料版だとRAMがギリギリだったが、動かせた。 Generative AI is a very powerful tool for the creation of new AI…

#自然言語処理

ChatGPTで降臨。跡部景吾様

Colaboratory IT お勉強なんとなく自然言語処理

引き続き、ChatGPTの醍醐味であるプロンプトに挑戦した。挑戦したキャラクターは、テニスの王子様に出てくる跡部景吾。イケメンで凄腕プレイヤーで御曹司と非の打ち所がない中学生。「なるほどsundayじゃねーの」と言った名台詞も多数。少年ジャンプで連載…

ColaboratoryでchatGPT(+Whisper+VOICEVOX)で遊ぶ

Colaboratory Python お勉強機械学習自然言語処理

すっかり話題の巨大言語モデル。OpenAIのchatGPTなら個人が使える価格帯だし、ぼちぼち使ってみたい。そこで、colabでトライしてみた。 whipserで音声認識。chatGPTで返答を作成したらVOICEVOXで音声とする。色んな人が同じような手順でやっているので参考に…

#自然言語処理

言語モデル、Flan_UI2をcolaboratoryで試してみる。

AI Colaboratory IT Python なにこれ自然言語処理

例に従って簡単に動かせました。 github.com 質問 Answer the following question step by step in the detail. Give the rationale before answeringWhat should be implemented to eliminate war from the world? 答え War is a state of armed conflict b…

#自然言語処理

Stable Diffusionで画像生成２０２３年３月版

IT Colaboratory Python なんとなく画像生成

何やらさらに進化しているらしいということで・・・StableDiffusionで画像生成をチェックしてみました。使ったcolabのコードです。 github.com waifu-diffusion/wd-1-5-beta2 · Hugging Face Defpoint/Defmix-v2.0 · Hugging Face 用途に応じでアイデア次第…

自然言語処理 spaCyでelectraのファインチューニング

Colaboratory IT お勉強自然言語処理機械学習

超大規模モデルが世間を圧倒させている。それをAPIで使うってのも面白そう。しかし、お手軽に使うとなると・・・。悔しいので、colabでできる自然言語処理のお勉強を進めることにする。今回は、固有表現抽出用にelectraのファインチューニングをお手軽にでき…

#自然言語処理

FuguMTで翻訳してみる。

Colaboratory IT Python お勉強自然言語処理

フリーのニューラル機械翻訳モデル（日本語・英語）FuguMTをお試ししてみた。 staka.jp といっても簡単。ほぼモデルを呼び出すだけ。 github.com これくらいのベースが出来ているのであれば、分野や文書ごとに追加で学習させて使うやりかたが気軽にできそう…

#自然言語処理

Google Colabにpre-installされたspaCyをテスト

Colaboratory IT お勉強自然言語処理

自然言語処理ライブラリspaCy。Colabで使う時には、なんとなく惰性でpipでインストールしていたが、実はpre-installされていた。今更気が付いた。 Google Colab now comes with spaCy v3.3 pre-installed as the default Run spaCy 3.3 workflows in Google …

#自然言語処理

AI対話：会話データSODAで鍛えたCOSMOモデルを試す。

AI Colaboratory IT お勉強機械学習自然言語処理

自然な会話ができるChatGPTが話題ですが、SODA*1という、データセットで学習させたCOSMOというモデルがなかな優秀だというのをtwitterで見かけたので試してみる。 github.com 会話の状況は「最後の一葉」を参考にして投入した。 instructionは不要らしいが、…

#自然言語処理

Metaが公開したNLLBモデルを試してみる。

Colaboratory IT お勉強機械学習自然言語処理

No Language Left Behind: NLLBでのモデルが公開された。どんな言語でもWeb上の情報を母国語でコミュニケーションできるようにという翻訳AIプロジェクト。 No Language Left Behind: A model from NLLB is released. A translation AI project that allows a…

#NLLB #自然言語処理

Stable Diffusion2.0お試し。

Colaboratory IT お勉強画像生成

本家を見てColabで動かそうとしたら、さくっと先人がいらっしゃったので、参考にした。プロンプト（呪文）も先人の知恵を参考にした。 note.com お手軽に結構なクオリティで描ける。すっかり民主化された道具になったので、驚かなくなった。凄い瞬間に立ち会…

#Stable Diffusion

文章要約に挑戦

Colaboratory お勉強自然言語処理

文章要約にチャレンジ。 Pysummarizationを使うと簡単にできそうなので、採用。 pypi.org 基本的には、こちらのページを見ながら試していけば、よいのだが、要約モデルをいくつか試せるのが楽しい。 github.com 普通にやっても面白くないので、長文を無理や…

#自然言語処理

流行りの画像生成をやってみる #05

AI Colaboratory Python 機械学習画像生成

Stable Diffusionを使って画像生成。プロンプトの呪文は難しい。でも、なんか、呪文ばかりを考えて粘るのも嫌だなと思う。それにも負けず、トライしてみた。とりあえず、まとめて生成させて、使えそうなキーワードを見つけつつ、１０回ずつ試行。たまに良い…

流行りの画像生成をやってみる #04

Colaboratory Python お勉強画像生成機械学習

DiscoDiffusion v5.6で動画生成トライ。 #DiscoDiffusion 先週は画像生成動画。今週は次にチャレンジしようと思ったら、状況が変わっていた。 pic.twitter.com/8CieyjR3AB — BW/GIFT (更新通知・実験BOT・中の人) (@bwgift20th) August 27, 2022 簡単に夢に…

流行りの画像生成をやってみる #03

Colaboratory Python お勉強機械学習画像生成

引き続きDisco Diffusion v5.6で画像生成。プロンプトって結構難しい。色んな情報が飛び交うのも分かる気が・・・。試行錯誤してみたら、基本的な要領がわずかにつかめた（かもしれない（笑））サイバーパンク風街並み。遠景。雲の下に雪の街並み。プロン…

流行りの画像生成をやってみる #02

Python 画像生成 Colaboratory お出かけ

Disco-Diffusionを使っての静止画生成にチャレンジ中。Midjouneyだとお手軽だと思いつつ、お勉強している雰囲気も欲しいのでDDで遊んでみている。定番のブレードランナー的SF風の絵。都市部の雨模様の風景。やってみると、テキストの選択が難しい。教師デー…

流行りの画像生成をやってみる #01

Colaboratory Python お勉強画像生成機械学習 AI

「Midjourney」、「DALL·E」といったテキストからの画像生成が話題です。好みの画像を生成するキーワードとかテクニックの記事も出てきて楽しい今日この頃。キーワードテクニックは、モデルが変われば変わってくる。だが、こうした色んな人の試行錯誤が集ま…

AIマリオチャレンジ #4

Colaboratory Python お勉強

Stage 8-1をようやくクリア！最後はハイパーパラメータを調整してなんとか達成。継続学習でエラーが出て、解決に手間取っていたところ、先にクリアした方のNotebookを参考に解決。その後、初めから学習をやり直したところ、ゴール。競争ではないけれども、…

勝手に三国志。GPT2で遊ぶ。

Colaboratory Python なんとなく自然言語処理

GPT2を使って、文章の生成にチャレンジをしています。 bwgift.hatenadiary.jp なんか、いまいちだった。そこで、試行錯誤して、rinnaのmiddleサイズの学習データをベースに、吉川英治の三国志を学習してみた。 github.com その結果できた文章。読める文章が…

りんなで会話を構成してみる

Colaboratory Python なんとなく自然言語処理

引き続き遊んでみた。 bwgift.hatenadiary.jp りんなのsmallモデルからmediumモデルを使ってファインチューニング。プロンプトテキストは生成テキストを加えて行き、行数が増えてきたら、直近の適当な行数をベースとした。（この例だと、最初に20行まで生成…

#自然言語処理

りんなにシャーロックホームズを教える

Colaboratory PC お勉強自然言語処理 Python

青空文庫からデータをダウンロードして加工できた。さっそく、コナンドイル作品から「」内の会話文を抽出して学習用データをしました。具体的な手法は、過去記事参照。 bwgift.hatenadiary.jp 使ったりんなモデルはスモールモデル。例によってColabを使いま…

#自然言語処理

青空文庫から自然言語処理用データをダウンロード　その２

Colaboratory Python お勉強自然言語処理

以前、青空文庫から自然言語処理用データをGoogle Colabでダウンロードして整形するようにしたが、挿絵がzipに同梱してあるとエラーになるのに（いまさら）気が付いた。bugfixして、ついでに、セリフだけを取り出すことにした。これで、〇〇風にrinnaをfine…

#自然言語処理

青空文庫から自然言語処理用データをダウンロード

Colaboratory IT Python お勉強データ自然言語処理

青空文庫の中から自然言語処理用データを入手する。青空文庫は、定番の題材のようだ。意外と読んだことのない本が多いことに気が付きつつ、青空文庫に感謝しつつ、題材とさせていただきました。注意点は、掲載しているすべてのデータが著作権が切れたもので…

#自然言語処理

りんな、日本語GPT-2モデルとガンダムで遊んでみた#02

Colaboratory Python お勉強自然言語処理

「Colaboratoryを使ってRinnaで遊んでみた」のコード。以下のサイトを参考にさせていただきました。 note.com ファインチューニング編 rinna_de_asobu/Rinna_fineTuring_G_try.ipynb at main · chottokun/rinna_de_asobu · GitHub ※学習データは別途準備要…

#Python #自然言語処理