東京から帰ってきました。(‘◇’)ゞ
さて、今回は研究のほうにいろんな新しい話があり、
参加したシンポジウムもかなり面白かったので、
ぉぅぇぃ的に、結構実りの有る出張でした。(*゜ー゜)b
前日のSOARSの話で、
自律的な学習型人工知能の話が出ましたが、
その人工知能のパフォーマンスを測定するために、
いくつかの定番があります。
その中でもっとも有名のは「迷路探索問題」じゃないかと思います。
KCGが結構強い「マイクロマウス」はまさにこんな感じに、
マウスに迷路の出口を探索してもらっていますね。Ψ(`∇´)Ψ
で、一応簡単な強化学習エージェントを作っていますので、
これも非常に簡単なバージョンでテストしないと気まずいわけですね。
で、とりあえずテストケースとして、5x5の迷路を描いて、
エージェントを迷路の中に放り込んで、出口を勝手に探索してもらいます。
で、今回作ったものは、まあ、ほどほどいい感じに
スタートポイントかゴールまでの経路を学習してくれました。
十分な学習を行ったら、ほとんど一直線「スタート→ゴール」のような感じに飛ばして点数を稼ぎまくります。ъ(`ー゜)
まあ、非常に簡単なテストなので、これから色々ロバストの検証をしないといけないのですが、
まあ、それはこれからの話。(*゜ー゜)
最後に、オマケとして、今回作った迷路をお見せいたします。(‘◇’)ゞ
↓こんな感じですね。
スタートポイントは1、ゴールは25。b
色付いているところはご褒美が用意されている場所です。
ゴールにたどり着くと、スタートポイントに飛ばされ、
もう一回チャレンジしてもらうようになっています。