引き続きLLMマリオを挑戦します。
MobileVLMを使ってLLMマリオを動作するColab notebookを早速Kazuhito00さんが追加されたので、試して見ました。MobileVLM版では動作を極力シンプルにするため['right'], ['right', 'A']の2種の動作に限っていた点を「SIMPLE MOVEMENT」に近い組み合わせとしてプロンプトを弄って実施してみました。加えて、生成する動作を指示するための数字がある範囲を超えたら、再生成するように仕込んでみました。ですが、仕込んだら間違えてくれなくなったので、Bugあるかも・・・。
いや、MobileVLM速い。サクサク結果がでるので、楽しい・・・。
結果です。
確かにGPT-4oに比べたらおバカです。でも、このゲームのプレイヤーとしてはGPT-4oもそもそも大したことありません。軽量モデルによる高速な生成速度で、ここまでさくっとできるのかと楽しくなりました。追加学習をさせるとスコア向上するのか、興味津々です。
改良したコードはこちら・・・。