読者です 読者をやめる 読者になる 読者になる

AlphaGo vs セドル AI DeepLearningの応用技術がもたらす今後の事

GoogleのAlphaGoという囲碁AIが人間の世界チャンピオンのリ・セドル

破り、その技術に使用されたニューラルネットの技術に注目が集まる機会が増えています。

せめてその理解の一助にでもなりAIが人々に受け入れられるよう働きかけるため

AI関連の情報を書いていきたいと思います。

 

※shi3zさんという私の尊敬するエンジニアの方の一人が努めてAIという用語は使用せずにニューラルネットという用語を使用されているので

強いAI等の用語となっている場合を除き

私も努めて今後その用語を使用したいと思います。

 

  • AlphaGoについて

1.何が新しいのか?

AlphaGoがこれまでの乱数でプレイアウトした結果、期待値の高い戦略をとる

モンテカルロ法による探索と違う点は

Value NetworkとPolicy NetworkというDeepLearningを応用した有望手の絞り込みと評価を行っているという点の様です。

つまりPolicyネットワークは囲碁の手順で勝ちに繋がった手と負けに繋がった手を単純に膨大に学習させ、盤面を観たときに勝ちそうな手に絞り込む機能を持ち

その精度が人間と比べて桁外れに高い事がここまでのブレイクスルーを引き起こした主要因と言って良いでしょう。

 

Nature 上の論文(有料)

http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html

 

論文をざっくり解説頂いたサイト

AlphaGo の論文をざっくり紹介 - technocrat

 

 開発者による解説

Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning

  • One neural network, the “policy network”, predicts the next move, and is used to narrow the search to consider only the moves most likely to lead to a win.
  • The other neural network, the “value network”, is then used to reduce the depth of the search tree -- estimating the winner in each position in place of searching all the way to the end of the game.

参照元(ちなみにこちらのサイトのTwitterログに僕とM澤君の会話ログがありましたw)

d.hatena.ne.jp

 

 

 

 

2.ディープラーニングってどういう技術?

ディープラーニングと呼ばれるニューラルネットの原型は

hinton氏が2006年に発表したニューラルネットの一種であると思われます(ネオコグニトロンとか制限つきボルツマンマシンまではさかのぼらない)

僕も勉強中なので細かい所は立ち入らないようにしますが

基本的には畳み込みと呼ばれる手法で、与えられたデータの部分的な情報を重みの値と活性化関数を使って変形し

(画像データの場合は与えられた画像のピクセル集合を細かい四角形で分割して

スライドさせていき、その情報をまとめてしまうというイメージです。)

Pooling層という変形されたデータを更にまとめ上げる構造をしています。

ぶっちゃけ自分で観ていじった方が実感しやすいので下記のページで

JavaScriptで動くDeepLearningのデモがあるので自分のPCで動かしてみて下さい。

分かりやすいのは一般画像分類のデモと手書き文字認識のデモでしょう。

 

手書き文字認識デモ

ConvNetJS MNIST demo

一般画像分類のデモ

ConvNetJS CIFAR-10 demo

 

日本のエンジニア向けに取り扱われているものについてはshi3zさんが公開されている情報を読んで頂くのが分かりやすいでしょう。

d.hatena.ne.jp

shi3z さんのブログはディープラーニング関連のページを読み進めれば

松尾先生の本や論文のまとめを読むより取っ付きやすく

エンジニアの方には数式よりgithubに公開頂いているコードを読んで手を動かした方が分かりやすく実際の挙動を感じられるのではないかと思います。

厳密に数理的な定義やニューラルネットの歴史も含め知りたいという方は

深層学習という本を購入しましょう、僕も購入しました。

深層学習 Deep Learning (監修:人工知能学会) : 麻生 英樹, 安田 宗樹, 前田 新一, 岡野原 大輔, 岡谷 貴之, 久保 陽太郎, ボレガラ ダヌシカ, 人工知能学会, 神嶌 敏弘 : 本 : Amazon.co.jp

 

無料で公開されているブログの中でもかなり濃い内容を記載頂いている素晴らしい方もいます

aidiary.hatenablog.com

 

3.この技術で世の中はどう変化するのか?

Google Reserch Blogでは気象予測や重病の解析に使いたいとの事でしたが

セドルが3連敗した事を踏まえると

もはやそれは開発者側が社会の受容度合いを考慮した

過小評価した申告であるように思います。

データが一定量以上収集された業務全てに応用が可能な革新的な技術と言ってしまって良いでしょう。

データが既に存在するものであれば学習用のデータセットとしてデータを再構成しDeepLearning型のニューラルネットに読み込ませる事が出来るでしょう。

学習の試行を続けるとニューラルネットの各ノード間の結合重みが更新されていきます。最終的には与えられたテスト用のデータから特徴的な情報を抽出するフィルターとして機能するようになります。

既にyahoo の音声認識では使用されていますが

【GTCJ2015】ヤフーの音声認識サービス「YJVOICE」におけるディープラーニングの活用事例 - Car Watch

例えば

  1. 自動運転車の操縦に必要な画像認識
  2. ドローンの安全な運用に対する飛行履歴からの操作
  3. 翻訳データから学習したもっとも解釈しやすい翻訳
  4. 今後指定期間内に価値が上昇する株式銘柄への投資
  5. 経営課題に対する有力戦略の決定
  6. シミュレーター上のロボットの課題に対する行動戦略の決定
  7. 現実のロボットへの7のフィードバックによる複雑な労働課題の解決(単純労働のみではない)

など

現代のあらゆる技術に対して応用が効く汎用的な分類機と考えられます

 

僕が考えた上記の課題は囲碁の解析木より小さい探索空間を持つゲーム木にまとめられるか近似が出来てしまう様に思うのです。

上記の各分野において疲れもせず、休みもせず19 ×19の戦略の中から世界最高の訓練を受けたプロより正しい手筋を選択し続けられる人間が存在するでしょうか?

 

この技術の導入に必要なのは下記の2つだけです

  1. 今回ハサビスが使用したディープラーニングのアーキテクチャを上記の事例に(ゲーム上の解析木として解釈して適用させ、従来の手法と組み合わせる)応用出来るソフトウェアエンジニア
  2. 人間のプロを凌駕するまで学習させられる十分な量のデータセット

 

この2つだけが揃った分野は戦略的な判断をする意味では人間が存在する価値がなくなるか少なくともこれまでより減少する可能性が高いと考えられます。

逆に人間にとって未知の分野や量子デバイスのような現代のデータ保存基盤より小さいスケールを対象とした研究はこのシステムで学習対象とする事は難しいのではないのでしょうか?(短期間的には)

 

長期的にはいわゆる強いAIが登場する事が期待されますが

そのAIは現代ではデータ化する事が難しい分野にも進出していく事が予想されます。

Googleのカーツワイルは2029年に強いAIが登場し

機械が自己改変を繰り返し、性能を向上させる事が可能になる技術的特異点が2045年に到来する事を提唱していますが

強いAIはこのDeepLearningと学習用データセットの収集方法が上手く組み合わされたシステムを取り込んだものであると予想されます。

 

技術的特異点はその強いAIが更に自己改変を可能にする必要がある為

僕はそれを可能にするキーテクノロジーは強いAIが大規模シミュレーションを行う為の現実の物理法則をモデル化しプログラミングが出来るようになる事が条件だと現段階で考えているのです。

 

著者:

数年前まで計算論的神経科学という分野を勉強していました。

はてな名は万次郎という者です。