phi4はコーディング能力も高そうです。clineで使えたら良いですよね。そこで試してみます。
ollamaを使えばすぐに試せます。が、素のままだとループが始まったりしていまいちです。Qwen2.5でも同じ傾向があったので、先人のトライを参考にします。modelfileをcline向きに変えてしまえば改善するかもという期待です。
ollamaの恩恵もあってGeForce RTX 3060(12G)でもなんとか動きました。ClineとRoo Clineで試してみましたが、実用レベルの回答が得られていると思います。しかしながら、この環境での動作速度は重くて、ごりごりコーディングするには辛いかもしれません。phi4の能力は高さはSYSTEMやTEMPLATEの内容を調整するのは、この速度だと試行錯誤が辛いので断念。速度はGPUが解決してくれそうですが。
とりあえず、動いたのでメモです。
手順
こちらのテンプレートを参考にしてModelfileを作成し、それを利用します。
Modelfileのファイル名:phi4-tools-cline.modelfile
FROM phi4:latest
PARAMETER num_ctx 16384
SYSTEM """
{{ここに先ほどのサイトのSYSTEMを入れる}}""
TEMPLATE """"
{{ここに先ほどのサイトのtemplateを入れる}}"""
設置とollamaに反映
1. dockerでollamaコンテナを起動\
2. dockerにモデルファイルを転送します。
docker cp phi4-tools-cline.modelfile ollama:/root/.ollama/
3. 新しいモデル名で定義します。
docker exec ollama ollama create phi4-tool-cline:latest -f /root/.ollama/phi4-tools-cline.modelfile
あとは、Clineの設定画面から選択肢としてphi4-tool-clineが現れます。