読者です 読者をやめる 読者になる 読者になる

AlphaGoの弱点

セドルが勝ちました!

AlphaGoが勝利した時よりもこれは驚きです

policyネットワークの手の読みを外してモンテカルロ探索の特徴が強く出てくるような状況に追い込まれると悪手を連発してしまう様な事を

ニコ生のソフトウェア側の解説者の方が仰っていましたが

その点が今のところ弱点と言えそうです。

 

Policyネットワークに劣勢の状態から勝ちへ繋がる手を学習させると改善されそうですがどうでしょう?

アルちゃんもう一回お勉強の調整のし直しですかね

しかし凄まじく豪華なデバッグ作業とでもいいますか