アンケートhttp://bit.ly/chug-10#chug_jp
#chug_jp
今日の発表はこれで終わり#chug_jp
強化学習は現状研究が進んでいる段階#chug_jp
質疑強化学習の案件などで紹介できるものはあるかビジネスで案件になったものはないゲームで相談を受けたことはある#chug_jp
質疑「本当の意味で弱い」AIプレイヤーの思いどおりに動くもの?多くの人がプレイしてくれるもの、等#chug_jp
質疑接待オセロの定義序盤全力で殺しにいって最後は負けるようなAIこれはこれで盛り上がった僅差で負けるようなことを目指すのはおそらく難しい#chug_jp
オセロのコツ* 序盤、中盤は少なくとる* 角を取る#chug_jp
CNNを使っていない特徴量をナイーブに入力する全層結合#chug_jp
8x8のオセロはまだ完全解析されていない#chug_jp
価値関数ベースのイメージ盤面の価値を予測一歩先のすべての盤面を列挙し、最も価値の高い盤面を選択AI同士で対戦した結果から盤面価値を学習探索による先読みと組み合わせることで性能の高い方策を実現できる#chug_jp
負けられる人募集#chug_jp
中盤から一気に悪手を取ってくる角は取らない相手に角を取らせるような選択をする#chug_jp
序盤の動きは強いAIとほとんど同じオセロの本質は相手の選択肢を削ること#chug_jp
単純にルールのとらえ方を変えればよい負けたら報酬を上げるように変更ランダム手と対戦しても勝たない#chug_jp
最悪手を常に打てばよいのか?相手が最善を打つという前提相手も悪手を打ってきた場合に成立しない#chug_jp
とことん弱いAIを考えるルール上自殺ができない同じような考え方をしている人はいた#chug_jp
2段の知人曰く4段程度の強さあまりNNが向いている感じはない先読みの数の方が重要#chug_jp
3カ月で強いAIができたオセロ2段の友人を5:0で圧勝#chug_jp
DNNで盤面価値を予測アルファベータ探索で6-14手先までの盤面を読むランダム性を持って良い手を選ぶ自己対戦で学習#chug_jp
ルールの簡単なオセロを対象速度優先でC++を使用NNも含めてフルスクラッチで書く#chug_jp