強化学習の機能オブジェクトъ(`ー゜)

東京から帰ってきました。(‘◇’)ゞ

さて、今回は研究のほうにいろんな新しい話があり、

参加したシンポジウムもかなり面白かったので、

ぉぅぇぃ的に、結構実りの有る出張でした。(*゜ー゜)b

前日のSOARSの話で、

自律的な学習型人工知能の話が出ましたが、

その人工知能のパフォーマンスを測定するために、

いくつかの定番があります。

その中でもっとも有名のは「迷路探索問題」じゃないかと思います。

KCGが結構強い「マイクロマウス」はまさにこんな感じに、

マウスに迷路の出口を探索してもらっていますね。Ψ(`∇´)Ψ

で、一応簡単な強化学習エージェントを作っていますので、

これも非常に簡単なバージョンでテストしないと気まずいわけですね。

で、とりあえずテストケースとして、5x5の迷路を描いて、

エージェントを迷路の中に放り込んで、出口を勝手に探索してもらいます。

で、今回作ったものは、まあ、ほどほどいい感じに

スタートポイントかゴールまでの経路を学習してくれました。

十分な学習を行ったら、ほとんど一直線「スタート→ゴール」のような感じに飛ばして点数を稼ぎまくります。ъ(`ー゜)

まあ、非常に簡単なテストなので、これから色々ロバストの検証をしないといけないのですが、

まあ、それはこれからの話。(*゜ー゜)

最後に、オマケとして、今回作った迷路をお見せいたします。(‘◇’)ゞ

↓こんな感じですね。

迷路探索問題

スタートポイントは1、ゴールは25。b

色付いているところはご褒美が用意されている場所です。

ゴールにたどり着くと、スタートポイントに飛ばされ、

もう一回チャレンジしてもらうようになっています。

comments

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*