地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

AIマリオチャレンジ その後

AIマリオチャレンジを継続中。world 8-1がどうしてもクリアできない。

 

基礎知識がそもそもないので、強化学習の勉強をしてみたり。一般常識を頭に入れつつ遊び続けている。NNは弄ると泥沼に入りそうだったので、ハイパーパラメータと報酬で何とかならぬかと悩んでいる。

 

何度か試行錯誤が続いて、やり直しを繰り返す。すると、安定的に学習するパラメータは存在していて、全然賢くならないダメパラメータもあった。報酬の与え方が肝といっても、基本は抑えないとそりゃダメなのだ。とりあえず、学習をしばし回して、報酬獲得が順調に伸びていっているか、を確認してから放置プレイを繰り返した。

 

Colab Proは契約せずにローカルで計算を続けている。CPUだけなので、1晩とか2晩くらい回しておかないと、結果が見えてこない。電気代が怖いなぁ・・・。

 

チャレンジ終わったら、百万のマリオを供養せねばならぬ、と独り言ちつつ。

 

bwgift.hatenadiary.jp

 

 

bwgift.hatenadiary.jp