機械学習で読んだ本

機械学習関係で読んだ本とその内容について紹介します. 全部を熟読した本はないのと,私は数学系の人間なので,理論系に厳しいのはご了承ください.

理論系

Understanding Machine Learning:From Theory to Algorithms

Understanding Machine Learning: From Theory to Algorithms

Understanding Machine Learning: From Theory to Algorithms

いくつか見た機械学習の本で一番数学科向けの本です. 比較的定義もしっかりしている.真面目に勉強するならこの本しかないかもしれない.

ただ400ページ以上あるので,適切にトピックを選んだほうがよい気がしているのと, VCDimension等使う際はそこまでという部分はとばしてもいいかもしれません.

パターン認識と機械学習

パターン認識と機械学習 上

パターン認識と機械学習 上

  • 作者: C.M.ビショップ,元田浩,栗田多喜夫,樋口知之,松本裕治,村田昇
  • 出版社/メーカー: 丸善出版
  • 発売日: 2012/04/05
  • メディア: 単行本(ソフトカバー)
  • 購入: 6人 クリック: 33回
  • この商品を含むブログ (20件) を見る

とても有名な本ですが,私は最初の一章を読んで,やめました. 最初に読む気がなくなったのは過学習の説明です. 過学習は訓練誤差が徐々に落ちるが,評価誤差がどんどんあがる現象という理解です.

これは次数を増やすに連れ,評価誤差がどんどんあがるから過学習だと言っているように読めました.

ここは不満が二つあります. 1つはモデルのとれる場所を途中で変えていること. 機械学習はある関数のなす集合から,訓練データに対する誤差を小さくする関数をもとめています. なので,訓練データの点だけに特化しすぎた関数になるのはわかるのですが, 上の説明は関数のなす集合を変更しています.

また,10個の点を通る10時多項式は一意に定まりますが,10個の点を通る100次多項式は 一意に定まらないし,なかには評価データに対しても誤差が低いものがあるかもしれません.(私は計算していないので実際はわかりません)

ですが,そうした状況を何1つ考慮せずに断定している状況をみて,この本を読んでも, 客観的にそれが正しいか確認できる状態にならず,勉強にならないと思いやめました. 細かくはいろいろ不満がありますが,この本で勉強するのをやめた理由はそこです.

Deep Learning

Deep Learning (Adaptive Computation and Machine Learning series)

Deep Learning (Adaptive Computation and Machine Learning series)

2章,3章は私かるすとお気持ちが並んでいるだけに見えたので, 理論的な理解をしたい人は,この本を読む理由はないのかなと思っています. 後ろの方は実用的な話かもしれません.

グラフィカルモデル

グラフィカルモデル (機械学習プロフェッショナルシリーズ)

グラフィカルモデル (機械学習プロフェッショナルシリーズ)

Amazonの書評で数学書みたいと書いてあったのをきっかけに前半を読みました. きっちり書いてくれている部分も多いですが, 数学書だと思うと言いたいことは多数あります. 特につらいのは証明が汚いことです.作者は証明を理解しているんだろうかという気持ちになったものも多数あります. (僕がTAで採点しているなら☓にしようかなと思うものが…)

ある程度わかりましたが,今ひとつ消化しきれていないです.

ゼロから作るディープラーニング

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

理論系にならべていいのかわかりませんが,いい本です. 私は実装経験が薄いのでこの本を読んで直接実装したくなりました.

フレームワーク系

詳解ディープラーニング: TensorFlow・Kerasによる時系列データ処理

詳解 ディープラーニング TensorFlow・Kerasによる時系列データ処理

詳解 ディープラーニング TensorFlow・Kerasによる時系列データ処理

当時RNNをメインにしっかり扱った本がなかったので とてもよかったのではないかと思います. とはいえ,私の感覚とコードの命名規則が噛み合っていなかったのでその辺は相性があるかもしれません Tensorflow含めフレームワークはどんどんあたらしくなので,今勧められるかきわどい本です.

TensorFlow機械学習クックブック Pythonベースの活用レシピ60+

TensorFlow機械学習クックブック Pythonベースの活用レシピ60+ (impress top gear)

TensorFlow機械学習クックブック Pythonベースの活用レシピ60+ (impress top gear)

Tensorflowの写経用の本として便利. プログラミングに慣れていない人の場合は,これを写経しながら実際書いてみて 挙動を理解する方がよいかもしれません.

将棋AIで学ぶディープラーニング

将棋AIで学ぶディープラーニング

将棋AIで学ぶディープラーニング

Chainerと強化学習が知りたくて購入しました. とても面白そうな気配がするのですが,現状ほとんとChainerも強化学習も使っていないということで 後回しになっています.時間を作って読みたいものです.

ビジネス系

仕事で始める機械学習

仕事ではじめる機械学習

仕事ではじめる機械学習

とりあえず,一読しておくべき本. 実際にデータを集めて,モデリングする時と うまくいかなくておとしどころを考えるべき時に効果を発揮します.

応用系

深層学習による自然言語処理

深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)

深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)

Word2VecからメモリネットワークまでDeepLearningで行われている基本的な部分は網羅されています. 自然言語で一番しっかり書いてくれている本だと思いますが,数学の扱いはまだまだ不十分だなと思うことも多いです.

トピックモデル

トピックモデル (機械学習プロフェッショナルシリーズ)

トピックモデル (機械学習プロフェッショナルシリーズ)

トピックモデルを中心にベイズ推定や変分近似について丁寧に書いてある本 ベイズ推定のいい勉強になると思います.

生命情報処理における機械学習 多重検定と推定量設計

生命情報処理における機械学習 多重検定と推定量設計 (機械学習プロフェッショナルシリーズ)

生命情報処理における機械学習 多重検定と推定量設計 (機械学習プロフェッショナルシリーズ)

生命情報をベースに統計(仮説検定)を紹介した本. あまりちゃんと読めていませんが,丁寧にまとまっている印象です. 生物系をやろうと思っているならよい本です.

// コードブロック