地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

2024-02-01から1ヶ月間の記事一覧

GemmaをLORAと日本語データでファインチューニング

alfred さんのコードを参考にcolabで動かして見ました。折角なので「OpenMathInstruct-1 を日本語に自動翻訳した商用利用可能な180万件の指示チューニングデータセット」を使ってみます。 github.com 参考: Gemma初心者ファインチューニングコードです。HF…

Fine_tune_Gemma_models_in_Keras_using_LoRAを試す

Googleが発表したGemma。2Bモデルをファインチューニングをサンプルコードを使ってやってみました。せっかくなので、データセットを日本語databricks-dolly-15k-jaを使ってみます。Kaggleからモデルをダウンロードするので、対応する部分を整備して実行。 gi…

Pipenvでhashエラー

Pipenv installでhash値のエラーが生じて困っていた。ライブラリーの依存性が解消されないだけだと思って試行錯誤していたが、どうも様子がおかしい。調べてみると、同じようなところで悩んでいる方が・・・。 github.com 参考にして $ pipenv --rm$ sudo ap…

Qwen1.5を試す。

Qwenは優秀なモデルということらしいので、早速試して見た。 Qwen1.5-7B-Chat-GPTQ-Int8" Qwen1.5-7B-Chat-AWQ" Qwen/Qwen1.5-14B-Chat-AWQ" の順で試して見て・・・7Bだといまいちだったので、14Bまでcolab(無料)でお試し。 Qwen1.5-14B-Chat-AWQ 質問:日…

NextCloudの設定メモ

NextCloudは、クラウドストレージを構築する便利なOSS。クラウドストレージだけでなく、メールクライアントやチャットなど一通りの環境をクラウドに構築できる。便利に使ってきたが、警告や不具合の解消を実用上問題ない程度解消したのでメモ。 PHPはほとん…