地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

Manual-Dataset-Creation-ProjectによるデータセットMalum-230を使ってLLaMA-Factory CLiによるQLoRAファインチューニングをColabでためしてみる。

Malum-230は手作りの日本語の事前学習・事後学習両用の論理推論データセットです。素晴らしいデータセットなので、ファインチューニングを手軽にできるLLaMA-Factoryのお勉強の題材として使ってみました。有難いです。

 

 

huggingface.co

 

このモデルをllm-jp-3-1.8b-instructをもとにして、QLoRAでファインチューニングをします。

llm-jp/llm-jp-3-1.8b-instruct · Hugging Face

 

Colab T4環境にLLaMA-FactoryをCLIで利用しました。QLoRAによる学習を行いました。パラメータはexampleで挙げられていたものを利用します。動作確認用に近いお手軽パラメータになるのでしょうか。

 

学習したモデルによる返答例:

User: なぜ西アジアに油田が多いのか
Assistant: 西アジアは地中海と黒海の間に位置し、地中海はヨーロッパとアジアの境界となっています。
このため、地中海から黒海に向かう地下水が地下に溜まっており、その地下水の存在が西アジアの油田が多い理由となっています。

User: 芸術家に必要な素質は?
Assistant: 芸術家に必要な素質は、「好奇心」です。
好奇心がなければ、新しいことに挑戦したり、自分の興味のあることに深くのめり込むことができません。
好奇心がなければ、芸術の本質である「美」を追求することができません。

User: なぜ、芸術家に好奇心が必要なのか?
Assistant: 芸術家に好奇心が必要な理由は、芸術とは人間の感情を表現するものだからです。
人間の感情を表現するためには、人間の感情を理解する必要があります。
人間の感情を理解するためには、人間の感情を理解しなければならないのです。
したがって、好奇心がなければ、人間の感情を理解することができず、芸術の本質である「美」を追求することができないのです。

くどいなりましたね。きちんとした評価までは行ってないので断定はできませんが、学習効果が出ているかな・・・と思います。この程度の学習で論法らしき、味付けができたのは、よい学習データだからでしょう。感謝とともに、データつくりにも興味がわきます。

利用したColabノートブックです。

gist.github.com