Deep Learningの力はまだ解放されていない

Deep Learningが最近話題になっている為
私もリファレンスモデルを使って画像分類と自分で用意したデータを加えたデータセットで学習をしてみようかと思いました。
GPUがそもそもうちのPCには増設されていなかったのでまず
そちらからする事にしました。

参考にしたのはこちらの方のページ
https://timdettmers.wordpress.com/2014/08/14/which-gpu-for-deep-learning/

で今回購入したのは
この種の問題を解かせるためのものとしては初心者レベルのGPU Gefroce GTX 960
VRAMは4GB搭載のもの

http://kakaku.com/item/K0000774775/


当然まともに学習させるつもりなら欲しいのはTitanや 980 Ti
というハイエンドの高価なボードなのですが
GPUの増設初めてでいきなりそこに行くのもリスクがあって嫌だったのと
複数の計算を複数GPUで実行しても問題ない訳で
Gefroceの環境に慣れてからもう一枚ハイエンドモデル購入しても良いかと思ったのでこの選択となりました。
最も大きな理由は2016年にGeforceGPUアーキテクチャーをpascal変更するという情報があり
これはGefroceの予測ではDeep Learningを用いた学習に対して
従来のGPU(Titanとか980 Tiとか?)の10倍程の実行速度が出せるとの事。
なら高いのはどーんとアーキテクチャ変更時に購入した方が良いであるまいか
それまで分散処理の方面へ投資していく事にしよう


DeepLearningに関しては
多くの先人達が画像認識に関しては研究しており
最近ビジネス関連の記事によく登場するようになったのは
有名なgoogleの猫の論文のインパクトが特にビジネスマンや投資家に対して大きかったのでしょう。
日本ではAIの話題が出ると必ず登場する東大の松尾先生の本も読みましたが

http://www.amazon.co.jp/人工知能は人間を超えるか-ディープラーニングの先にあるもの-角川EPUB選書-松尾-豊/dp/4040800206

Deep Learningの本質的な変質は特徴量の抽出が自動で可能になった事なんでしょう
これまでの画像認識では読み込んだ猫の写真の画像データに猫が移っていると判定する為の
基準は人間側が基本的には手作業で作っていた訳で
横から、縦、色々な角度からとった猫を猫という共通の概念として判定するには
超単純化して考えると

単純にひげがある
OR
毛が生えている
OR
しっぽが生えている

目の形が細長い
AND
耳の形が三角
AND
顔の輪郭が丸い


みたいにじょじょに細分化された画像部位の判定に落し込んで
最終的な答えを出す、というような技が必要だった様です。
実際は上のような抽象概念じゃなくてベクトルや固有値の条件から
輪郭を判定してそこから形状を認識させたり
やっぱり職人の領域だった訳ですね
Deep Learning はこの人間が手作業で設定してきた特徴量の定義を自分で学習してくれます。
で便利なんで画像認識やSiriの音声認識に使われてるというのがここまでのお話

この動きが動作の学習まで進めば
Deep Learningはもっと強大なインパクトを社会にもたらす可能性があるでしょう
ニコニコ動画に登場したむにむにさんの動作学習は遺伝的アルゴリズムを使って
解となる動作を学習していましたが
結局のところ彼も歩く動作を学習させる為に環境を手作業で設定する必要がありました。

例えばロボットの歩行動作学習の為に
kinnectで取って来た3次元の点群の環境モデルとモーションキャプチャーで取ってきた人間の歩行動作を上手く3次元のオブジェクトとしてシミュレーターの中にぶちこんで
その中でロボットに動作を学習させ続ければ自動で歩行を学習するかも知れません。
歩行動作もデータ化されている訳でその中から歩行という動作に必要な動作のデータ列の特徴量を認識出来れば
シミュレーター内でロボットは自動で歩行動作を学習していくのではないでしょうか?
歩いている人間の3Gオブジェクトはモーションキャプチャー等ゲーム業界の方が詳しい技術を使えば実現出来そうに思えますし
kinnectで環境データが取得出来れば簡単な実在する環境のモデルでシミュレーションが実行出来るしミューレーターが出来るという訳です。

ラジコンロボットに動作を強化学習させてる方のブログなんか面白いですが
ここにDeepLearningが絡むとロボットに動作をプログラミングする作業が自動化され、格段に楽になる可能性があります。
で、そんな事考えていたらどうやら一時期有名になったGoogle が買収したDeep Mindが
Q-LearningとDeepLearningを組み合わせたDQN(ギャグではない)というAIを作成していたらしい
目の付けどころがシャープなgoogleです、googleメガネです。
DQN(Deep Q Network)はアタリのゲームを解かせる様子がyoutube動画で出回ってますが
強化学習というとやはり動作の学習というイメージが強いです
こんな方とか
http://research.preferred.jp/2015/06/distributed-deep-reinforcement-learning/

こういうのはペッパーみたいなヒューマノイドに適用したらどうなるのか
実に興味深いですよね










P.S

あとバケモノの子見ました
細田守作品の面白さは僕個人としては下記のようなものです。

サマーウォーズ時をかける少女>バケモノの子>おおかみこどもの雨と雪

バケモノの子は千と千尋の神隠しの様な構造かと思ったら
途中からデスノート夜神月くん(一郎彦)が絶叫しながら人間の闇をぶちまける
かわいいヒロインと男の子が立ち向かうという
スペクタクルバトルになりました

映像面では夜神月くんが作り出した幻のクジラが美しいCGで
映画館では一見の価値があります。