Deep Learning のトレンドについて喋ってきた 2 18, 2016

Convolutional Neural NetworksのトレンドについてCasualじゃない話をしてきました.

全脳アーキテクチャ若手の会カジュアルトーク

全脳アーキテクチャ若手の会カジュアルトーク というところでお話をしてきました.
ちょっと層がわからなかったのですが,IT系のエンジニアの方が多かったみたいです.
(学生は4人くらい…?しかもほぼ身内)

僕のスライドはSlide Shareの方にアップロードされています.

しかも,映像もアップロードされていた…

発表後記

実際はConvolutional Neural Networks(CNN)系論文128本ノックにするつもりだったとはいえない空気でしたね…

個人的には画像生成やキャプション生成系の研究速度はとても速く進んでいると感じています.
Visual Turing Test の話はもう少し掘り下げたかったですね.

Deep Mind が DQNで3D一人称視点ゲームを遊ぶ話がちょうど発表直前に出ていて,alphaGoの話題とともに紹介しましたが,あの領域は完全にGoogleの独壇場かなと思います.

本当にここ最近はすごいペースで研究が進んでいくので,どこかで一回整理しないといけないなっていう危機感があり,自分なりにまとめました.
サーベイってけっこう上手くやらないと労力使うし,大事な研究を見落とすこともあるので,こういう資料がだれかのサーベイの種なればいいなあ,なんて.
(各々,独自にまとめていって,こういう資料がどんどん増えることを願う)

紹介文献一覧

CNNアーキテクチャの変遷 / 最適化手法

CNNアーキテクチャ

確率的勾配降下法における学習率調整法

特徴量の解析 / 可視化

物体検出・領域分割

画像生成・超解像

3Dタスクへ

映像への挑戦

  • スポーツ映像分類
    • A. Karpathy, G. Toderici, S. Shetty, T. Leung, R. Sukthankar, F. Li. Large-scale Video Classification with Convolutional Neural Networks. CVPR, 2014.

より “人間らしい” 機械知覚へ

  • MemNet: CNN for Memorability
    • LaMem
    • A. Khosla, A. S. Raju, A. Torralba and A. Oliva. Understanding and Predicting Image Memorability at a Large Scale. ICCV, 2015.

マルチモーダル・アプリケーション

CNNと強化学習

What’s Next ?