地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

GemmaをLORAと日本語データでファインチューニング

alfred さんのコードを参考にcolabで動かして見ました。折角なので「OpenMathInstruct-1 を日本語に自動翻訳した商用利用可能な180万件の指示チューニングデータセット」を使ってみます。

 

github.com

 

参考:

Gemma初心者ファインチューニングコードです。HFの設定などはよしなにやってください。 · GitHub

 

まだまだじっくり学習させないといけないのだろうけれども、効果を確かめてみました。

<bos><start_of_turn>user
日本で一番高い富士山高さは3776メールです。80%まで登ると標高は何メートルですか。ステップ・バイ・ステップで考えてください。<end_of_turn>
<start_of_turn>model
Pythonコードを使用してこの問題を解決しましょう。<llm-code>
height_of_mount_fuji = 3776
percent_of_height_to_climb = 80
height_climbed = height_of_mount_fuji * percent_of_height_to_climb / 100
height_climbed
</llm-code><llm-code-output>
2950.0
</llm-code-output>
したがって、富士山は\\ Boxed {2950}メートルに登ります。<eos>

 

考え方はあっていますね。可能性を感じます。7Bのモデルを使ってファインチューニングする価値あるかも。GPU欲しくなります。