地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

#02 LLMでマリオをプレイ「Large Language Mario」に挑戦

引き続きLLMマリオを挑戦します。

bwgift.hatenadiary.jp

 

MobileVLMを使ってLLMマリオを動作するColab notebookを早速Kazuhito00さんが追加されたので、試して見ました。MobileVLM版では動作を極力シンプルにするため['right'], ['right', 'A']の2種の動作に限っていた点を「SIMPLE MOVEMENT」に近い組み合わせとしてプロンプトを弄って実施してみました。加えて、生成する動作を指示するための数字がある範囲を超えたら、再生成するように仕込んでみました。ですが、仕込んだら間違えてくれなくなったので、Bugあるかも・・・。

 

いや、MobileVLM速い。サクサク結果がでるので、楽しい・・・。

 

結果です。

mobilevlm版AIマリオ

確かにGPT-4oに比べたらおバカです。でも、このゲームのプレイヤーとしてはGPT-4oもそもそも大したことありません。軽量モデルによる高速な生成速度で、ここまでさくっとできるのかと楽しくなりました。追加学習をさせるとスコア向上するのか、興味津々です。

 

改良したコードはこちら・・・。

github.com