本記事では、
「PythoやRで実験計画法を実践するためのおすすめ本を紹介して欲しい」
という要望にお答え致します。
EXCELで実験計画法をする場合は以下の記事を参考にしてみてください。Pythonでは難易度が高い!という人にはこちらをおすすめいたします。Pythonは情報が少ないですからね。
実験計画法の初学者向け
実験計画法を初めて勉強するという人は「実験計画と分散分析のはなし」を読むことをおすすめいたします。
大村さんの「実験計画と分散分析のはなし」は、実験計画法を非常にわかりやすく解説している本です。
こちらの本はPythonやRとは関係ないのですが、「一度も実験計画法を勉強したことがない!」、「実験計画法を勉強したことはあるけど、なぜそうなるのかわからない」という人におすすめできます。
わかりやすいので、文系の方に特におすすめできます。文系の方にもおすすめできる理由は、計算を非常に容易に解説しているからです。
足し算、引き算、割り算などで難しい計算を使用しません。
わかりやすく説明しすぎているせいで、若干くどいと感じることもあります。一度、勉強した人でも「なぜそうなるの?」と疑問に思っていることも解決できます。
二元配置、三元配置、直交表まで解説しており、「なぜそうなるのか?」ということが原理からわかります。
Amazonで試し読みできます。
Pythonで実験計画法
Pythonで実験計画法をする方法もあります。最近出てきた本で、Pythonなので今後も応用が効く技術かと思います。
「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」
Pythonで実験計画法を実践するための限られた本の一つです。
作者のホームページで第三章まで無料公開しています。
第1章 データ解析や機械学習を活用した分子設計・材料設計・プロセス設計・プロセス管理
1.1 ケモ・マテリアルズ・プロセスインフォマティクス
1.2 分子設計
1.3 材料設計
1.4 なぜベイズ最適化が必要か
1.5 プロセス設計
1.6 プロセス管理
1.7 データ解析・人工知能(モデル)の本質第2章 実験計画法
2.1 なぜ実験計画法か
2.2 実験計画法とは
2.3 適応的実験計画法
2.4 必要となる手法・技術第3章 データ解析や回帰分析の手法
3.1 データセットの表現
3.2 ヒストグラム・散布図の確認
3.3 統計量の確認
3.4 特徴量の標準化
3.5 最小二乗法による線形重回帰分析
3.6 回帰モデルの推定性能の評価
3.7 非線形重回帰分析
3.8 決定木
3.9 ランダムフォレスト
3.10 サポートベクター回帰
3.11 ガウス過程回帰第4章 モデルの適用範囲
4.1 モデルの適用範囲とは
4.2 データ密度
4.3 アンサンブル学習第5章 実験計画法・適応的実験計画法の実践
5.1 実験候補の生成
5.2 実験候補の選択
5.3 次の実験候補の選択
5.4 ベイズ最適化
5.5 化学構造を扱うときはどうするか第6章 応用事例
6.1 複雑な非線形関数を用いた実験計画法・適応的実験計画法の実践
6.2 分子設計
6.3 材料設計
6.4 プロセス設計第7章 さらなる深みを目指すために
7.1 Gaussian Mixture Regression(GMR)
7.2 GMR-Based Optimization(GMRBO)(GMRに基づく適応的実験計画法)
7.3 複雑な非線形関数を用いたGMRBOの検証第8章 数学の基礎・Anaconda・Spyder
8.1 行列やベクトルの表現・転置行列・逆行列・固有値分解
8.2 最尤推定法・正規分布
8.3 確率・同時確率・条件付き確率・確率の乗法定理
8.4 AnacondaとRDKitのインストール・Spyderの使い方https://www.kspub.co.jp/book/detail/5235300.html
「Pythonで気軽に化学・化学工学」
Amazonで中身をチラ見できます。
一部実験計画法を紹介しています。作者のホームページで第三章まで無料公開しています。
1章 必要なソフトウェアをインストールして,Jupyter Notebook やPython に慣れる
1.1 Anaconda のインストール
1.2 Jupyter Notebook の使い方
1.3 Jupyter Notebook の起動
1.4 セルおよびセルのタイプとモード
1.5 セルの実行
1.6 おもな操作方法
1.7 キーボードショートカット
1.8 Jupyter Notebook の終了2章 Python プログラミングの基礎を学ぶ
2.1 数値や文字などの扱い
2.2 数値や文字の集合の扱い
2.3 組み込み関数による効率的な処理3章 データセットの読み込み・確認・変換・保存ができるようになる
3.1 データセットの読み込み
3.2 データセットの中身の確認
3.3 データセットの保存4章 データセットの特徴を把握する
4.1 行列形式によるデータセットの表現
4.2 ヒストグラムによるデータの分布の確認
4.3 おもな基礎統計量を計算することによる特徴量間の比較
4.4 散布図による特徴量間の関係の確認
4.5 相関係数による特徴量間の関係の強さの確認5章 データセットを前処理して扱いやすくする
5.1 特徴量のスケールの統一化
5.2 ばらつきの小さい特徴量の削除
5.3 類似した特徴量の組における一方の特徴量の削除6章 データセットの見える化(可視化)をする
6.1 主成分分析 37
6.2 t-distributed Stochastic Neighbor Embedding (t-SNE) 437章 データセットを類似するサンプルごとにグループ化する 49
7.1 クラスタリング 49
7.2 階層的クラスタリングの基礎 50
7.3 階層的クラスタリングの実行 53
7.4 化学・化学工学での応用 568章 モデルy=f (x) を構築して,新たなサンプルのyを推定する
8.1 クラス分類(クラス分類とクラスタリングとの違い,教師あり学習と教師なし学習)
8.2 k-NN によるクラス分類とクラス分類モデルの推定性能の評価
8.3 回帰分析
8.4 k-NN や最小二乗法による回帰分析と回帰モデルの推定性能の評価
8.5 モデルの推定性能を低下させる要因とその解決手法(PLS)
8.6 さまざまな解析の自動化・効率化
8.7 非線形の回帰分析手法やクラス分類手法
8.8 ダブルクロスバリデーション
8.9 化学・化学工学での応用9章 モデルの推定結果の信頼性を議論する
9.1 目的変数の推定に用いる最終的なモデル
9.2 モデルの適用範囲
9.3 One-Class Support Vector Machine (OCSVM)10章 モデルを用いてy からx を推定する
10.1 仮想サンプルの生成
10.2 仮想サンプルの予測および候補の選択11章 目標達成に向けて実験条件・製造条件を提案する
11.1 実験計画法
11.2 応答曲面法
11.3 適応的実験計画法12章 化学構造を扱う
12.1 RDKit のインストール
12.2 化学構造の表現方法
12.3 化合物群の扱い
12.4 化学構造の数値化
12.5 化学構造のデータセットを扱うときの注意点およびデータセットの前処理https://www.maruzen-publishing.co.jp/item/?book_no=304108
Amazonで中身をチラ見できます。
Rで実験計画法
Rでこれから学んで行きたい人には以下の本がおすすめできます。
「Rで学ぶ実験計画法」
Amazonで中身をチラ見できます。
二元配置から直交表まで詳細に説明されています。計算式が詳しく説明されています。初学者には少しむずかしいかもしれません。
目次
1 実験計画法への導入
2 分散分析
3 直交表による方法
4 乱塊法
5 分割法
A R入門https://www.asakura.co.jp/G_12.php?isbn=ISBN978-4-254-12216-9
Amazonで中身をチラ見できます。
「RとRコマンダーではじめる実験計画法」
RコマンダーというGUIを使用しているため、プログラミングは不要であり難易度は低いです。
目次
第1章 検定と推定
第2章 分散分析入門―一元配置法
第3章 回帰分析
第4章 二元配置法・多元配置法
第5章 直交表による実験
第6章 混合モデル
第7章 応答曲面法
第8章 パラメータ設計
付録A Rの基本
付録B 記号・関数表https://www.kinokuniya.co.jp/f/dsg-01-9784817193711
実験計画法と合わせて勉強したい統計学入門
実験計画法は統計学に基づいて、有意差検定を行っていきます。その検定はエクセル分析ツールで勝手にできてしまいます。(エクセルが自動計算してくれる)
本当は統計学を学んでから実験計画法を学ぶことが正しい順序なのですが、会社の研修ではサラッと説明して、いきなり実験計画法にいく場合があります。
(ちなみに、私は実験計画法の研修をそれぞれ別の会社で2回受けていますが、過去2回ともそうでした。)
統計学をしっかり学びたいかたは、エクセル「完全独習 統計学入門」をおすすめします。統計を学ぶ人の間では、非常に有名な本です。
私も実験計画法を含めたQCを勉強した時に、講師におすすめされて、購入しました。
この本は早い人なら4~5時間くらいで終わる内容で、中学生でもわかるんじゃないか?というくらいのレベルからスタートします。
カイ二乗分布やt検定の内容まで理解できるようになります。
私は前半の標準偏差の意味の説明が非常にわかりやすいと思いました。同時に、普段なんとなく使用している標準偏差にこういう意味があったなんて!と感銘を受けました。
途中、ガウスの難しい式がでてくるのですが、「おぞましい式がでてきて、発疹ができるといけないので、無視して先に進みましょう。」という、読者の気持ちを察して話を進めてくれます。
Amazonで中身を確認できます。