ケモインフォマティクスにおけるデータ収集の最適化と解析手法

～組成予測や化学構造の生成、合成経路探索や反応条件最適化、毒性評価～

2節分子記述子の種類と活用法

1.記述子と機械学習
2.ケモインフォマティクス研究の代表的なタスク
3.分子記述子の位置付け
4.現在の利用されている分子記述子の分類
- 4.1 記述対象による分類
- 4.2 次元による分類
- 4.3 局所性に基づく分類
5.記述子をどのように数値的に評価するか?
- 5.1 ソースコードの利用
- 5.2 データベースの利用
- 5.3 計算ソフトの利用
  - 5.3.1 記述子計算ソフトウエアの利用
  - 5.3.2 量子化学計算ソフトウエアの利用
6.電子状態インフォマティクス (ESI) 記述子
7.記述子の活用法
- 7.1 標準化
- 7.2 記述子間の相関を調べる
- 7.3 次元削減

第2章データ収集・データベース構築での留意点

1節精度向上のためのデータ収集で考えなければいけないこと

1データ収集とは
- 1.1 データの生成と蓄積
- 1.2 研究データの構造
- 1.3. データ構造モデル
2.データ収集時に考えなければいけないこと
- 2.1 活用可能なデータ
- 2.2 データ取得コスト
- 2.3 説明変数の制御可能性
3.課題設定の重要性

2節データ取得コストに留意したデータ収集での留意点

1.逆解析による分子設計
- 1.1 逆解析による分子設計・化学構造設計の流れ
- 1.2 入力用の化合物DBの作成
- 1.3 候補化合物DBの作成
- 1.4 化合物の類似度指標
- 1.5 適用領域 (Applicability Domain)
2.AIを活用した分子設計
- 2.1 AIを用いた生成モデルタイプ
- 2.2 強化学習を用いた分子生成モデル
- 2.3 化合物の生成モデルの課題
3.合成に関わるDB
- 3.1 Molecular Transformationに関わるDB
- 3.2 合成研究に関わるDB
- 3.3 AIによる化合物生成モデルの研究で用いられる合成反応DB
- 3.4 合成反応DBのプラットフォーム整備
- 3.5 合成可能性の指標

3節 R&D部門におけるデータ共有システムの構築とその活用方法

1.R&D部門におけるデータ共有・利活用の実情
2.属人的なデータ共有、形骸化したデータ共有状況から生まれる問題点
3.属人的なデータ共有、形骸化したデータ共有状況が生み出される原因
4.属人的データ共有状況を脱するための事前準備の前に行うべきこと
5.R&D部門におけるデータベース、システムは、魔法の箱ではない!
6.データベース、システムの最大の利点とは!
7.属人的データ共有状況を脱するための事前準備 (手順書作成編)
8.属人的データ共有状況を脱するための事前準備 (システム化対象特定編)
9.属人的データ共有状況を脱するためのデータ共有システム導入に必要な要件
10.データ共有システムにおける項目名の決定の方法と注意点
11.データ共有システムを使ったデータ分析の方法と注意点
12.データ共有システム導入時の落とし穴とそれを防ぐ方策
13.データ共有システム運用後陥りがちな落とし穴とそれを防ぐ方策
14.効果的なデータ共有・利活用手法と運用体制の作り方

4節ハイスループット実験による効率的で生産性の高いデータ収集法

1.計測・分析実験の最適化
- 1.1 適応型実験計画法によるハイスループット実験の最適化
- 1.2 情報科学・統計技術を用いた高精度・高速・高効率計測
2.計測データ解析の自動化
- 2.1 計測実験データの定性解析
- 2.2 計測実験データの定量的解析

第3章データセットの作成と各種解析手法の活用事例

1節データ解析をスムーズに行うためのデータセット作成の留意点

1.データ解析の目的を明確にする
2.どのような実験データを採用するか
3.化学構造を含むデータセット作成の留意点
- 3.1 化学構造データの取り扱い
- 3.2 化学構造のデータ形式
- 3.3 化学構造データの前処理 (クリーニング)
- 3.4 構造データに対するその他の前処理
4 測定値 (活性値など) の収集における留意点
- 4.1 一般的な留意点
- 4.2公共のデータベースから活性値を収集する際の留意点
- 4.3 その他の留意点

2節計算化学研究におけるスパースモデリングの応用

1.金属クラスターモデルを用いた一酸化窒素の解離反応触媒活性の解析
2.金属吸着分子の励起状態解析

3節次元削減によるデータセットの可視化と主成分分析

1.ワインのデータセット
2.データの可視化
3.主成分分析 (PCA)
4.独立成分分析 (ICA)
5.非負値行列因子分解 (NMF)
6.線形判別分析 (LDA)
7.次元削減の応用

4節データセットの構築法とデータの関係性の視覚化法

1.ケモインフォマティクスにおけるデータ解析の進め方
2.R言語
- 2.1 R言語とは
- 2.2 R言語でのデータ処理
- 2.3 Rプログラミングを学習するために
3.ケモインフォマティクスで活用できるR パッケージの例
- 3.1 説明変数と目的変数の行列作成 reshape; サンプル-変数名-値から正規化テーブルをつくる
- 3.2欠落値補完 mice; 多重代入法による欠損値補完
- 3.3説明変数行列によるサンプルおよび変数間の関係性 a散布図による変数間の関係性を視覚化する
- 3.4 多変量回帰モデルの構築
- 3.5予測精度の評価
- 3.6 その他
4.説明変数と目的変数の行列作成
- 4.1正規化テーブルを作る
- 4.2複数の表をマージする
  - 4.2.1 merge関数の活用
5.データの関係性の視覚化法
- 5.1散布図による変数間の関係性を視覚化する
- 5.2写像法
6.R言語の楽しみ方

5節「線形回帰モデル」と「非線形回帰モデル」によるデータ解析での留意点

1.回帰分析
- 1.1 線形回帰モデル
- 1.2 非線形回帰モデル
2.データの前処理
- 2.1 観測値の前処理
- 2.2 記述子の前処理
3.変数の選択
- 3.1 回帰モデルの推定に基づいた変数選択
- 3.2 決定木に基づいた変数選択
- 3.3 遺伝的アルゴリズムに基づいた変数選択
4.モデルの評価

6節非線形データ解析・モデリングと外挿性改善

- Random Forestに外挿性を付与する –

1.はじめに _{内挿と外挿}
2.ランダムフォレスト (RF)
3.提案手法
- 3.1 提案手法の概要
- 3.2 提案手法の詳細
- 3.3 パラメータ
4.人工データ
- 4.1 データセット
  - 4.1.1 1次元データ
  - 4.1.2 2次元データ
- 4.2 検証内容
- 4.3 解析結果
  - 4.3.1 1次元データ
  - 4.3.2 2次元データ

7節ベイズ最適化による効率的実験計画とデータ解析

1.能動学習による実験計画
- 1.1 機械学習によるデータ駆動型アプローチ
- 1.2 ガウス過程によるブラックボックス関数の統計的モデリング
- 1.3 ガウス過程回帰に基づく能動学習
- 1.4 まとめ
2.ベイズ最適化
- 2.1 ベイズ最適化のアルゴリズム
- 2.2 獲得関数の設計
  - 2.2.1 下側信頼限界に基づく探索
  - 2.2.2 改善確率に基づく探索
  - 2.2.3 期待改善度に基づく探索
- 2.3 まとめ
3.応用事例紹介:イオン伝導性物質の伝導度推定

8節ハイパーパラメータの最適化の事例

1.ハイパーパラメータの最適化の概要
- 1.1 ハイパーパラメータの組み合わせの探索アルゴリズム
- 1.2 MLモデルの学習と評価
- 1.3 MLモデルの選択
- 1.4 ハイパーパラメータの種類
  - (1) MLモデル構造のハイパーパラメータ
  - (2) 学習制御のハイパーパラメータ
  - (3) 最適化技法のハイパーパラメータ
2.研究事例におけるハイパーパラメータの調整
- 2.1 分子活性予測
- 2.2 量子化学計算の運動エネルギー予測
3.ハイパーパラメータの自動最適化

9節 Rでのケモインフォマティクスの実践事例

1.活用するデータの説明
- 1.1 薄膜デバイス構造とポストトリートメント処理の数値表現法
- 1.2 デバイス構造とSMILES
2.dplyrパッケージ活用による有機薄膜太陽電池の構造と構築プロセスにおける4つのパフォーマンス比較
3.薄膜太陽電池データの欠損値の取り扱い
4.欠損値を含むデータ行列をいかに解析するべきか
5.回帰モデルの構築
6.まとめと今後の展望

第4章機械学習の具体的活用とその事例

1節ケモインフォマティクスにおける機械学習モデルの種類と具体的活用法

1.機械学習の計算方法
- 1.1 分子軌道計算
- 1.2 RとCaretパッケージ
- 1.3 計算モデル
2.Caretを用いた計算例
- 2.1 回帰法と説明変数の選択
- 2.2 過学習の問題
- 2.3 回帰法による違い

2節 Pythonのケモインフォマティクスでの活用

1.RDKitを用いたPythonでの化合物情報の扱い
- 1.1 RDKitのインストール
- 1.2 RDKitでの分子の扱い
2.分子フィンガープリント・分子記述子の生成
- 2.1 RDKitを用いた分子フィンガープリントの生成
- 2.2 Morganフィンガープリントの可視化
- 2.3 分子記述子計算ソフトウェアmordredを用いた特徴ベクトルの作成
3.PyCaretを用いたPythonでの機械学習の実践
- 3.1 機械学習用データセットの準備
- 3.2 PyCaretを用いた分類モデルの作成
- 3.3 機械学習結果の可視化

3節 KNIMEを活用したデータ処理・ケモインフォマティクスの事例紹介

1.KNIMEの導入方法
2.KNIMEを使ったデータ前処理
- 2.1 データの読み込み・結合
- 2.2 阻害率の計算
- 2.3 QCデータの計算と出力
- 2.4 阻害率データの出力,用量反応曲線の表示
3.KNIMEを用いたケモインフォマティクス事例
- 3.1 ドラッグライクフィルターの実装
- 3.2 クラスタリングの実行
- 3.3 次元削減によるケミカルスペースの可視化
- 3.4 類縁化合物の検索
  - 3.4.1 類似性検索
  - 3.4.2 部分構造検索
- 3.5 構造発生とフィルタリングのパイプライン

4節量子コンピュータのケモインフォマティクスへの応用

1.量子計算とゲート方式量子コンピュータの研究開発動向
2.量子機械学習の研究開発動向
3.量子コンピュータのハードウェア・ソフトウェア・クラウドサービス
4.量子回路学習のアルゴリズムと実装例
5.量子機械学習のケモインフォマティクス実課題への応用例

5節機械学習のためのデータの前処理での留意点

1.イシューからはじめよ
2.イシューを決めることとは、テストデータと学習データを適切に準備すること
3.記述子・特徴量への変換と前処理
4.共線性の分析と前処理
5.外挿データの分析と前処理

6節過学習に留意した最適な機械学習モデルの構築

1.検証データに基づく機械学習モデルの検証方法
- 1.1 ホールドアウト法
- 1.2 交差検証
2.実データを用いた機械学習モデルの構築例
- 2.1 ELMモデル
- 2.2 データセット
- 2.3 ホールドアウト法を適用したELMモデルの精度検証
- 2.4 交差検証を適用したELMモデルの精度検証

7節少ない実験回数で予測精度の高い機械学習モデルの開発

1.機械学習を活用した最適化手法
- 1.1 条件探索における機械学習の応用
- 1.2 薄膜試料作製における機械学習応用による最適化
- 1.3 ネオジム磁石の磁気特性の機械学習応用による向上
2.実験計画法の機械学習モデルへの応用
- 2.1 実験計画法による実験の効率化
- 2.2 パラメータチューニングにおける一部実施計画の適用
3.機械学習における効率の良いハイパーパラメータ探索
- 3.1 ハイパーパラメータ探索
- 3.2 ベイズ最適化

8節転移学習を用いたデータ解析のポイント

1.転移学習とは
2.転移学習の種類
- 2.1 帰納転移学習 (マルチタスク学習・ファインチューニング)
- 2.2 トランスダクティブ転移学習
- 2.3 自己教師あり学習
- 2.4 教師無し転移学習

9節「説明可能なAI」による複雑分子系の状態間遷移における遷移状態の解明

1.手法
- 1.1 MDシミュレーション
- 1.2 線形回帰と深層学習
- 1.3 LIME?Local Interpretable Model-agnostic Explanation
- 1.4 SHAP?Shapley Additive exPlanations
2.結果
- 2.1 コミッターの学習と予測
- 2.2 予測に対する集団変数の寄与度

第5章化学物質の合成経路探索・反応条件最適化への活用事例用

1節反応条件最適化へのケモインフォマティクスの応用

1.反応機構の精査
2.溶媒効果
3.熱力学的制御と速度論的制御
4.反応器形状の概念的最適化

2節機械学習や深層学習を用いた合成容易性予測モデルの開発動向

1.研究者の定義に基づいた合成容易性予測手法
- 1.1 化学構造の複雑さに基づいた手法
- 1.2 合成経路に基づいた手法
2.機械学習や深層学習を用いた最近の合成容易性予測手法
- 2.1 合成容易性の学習と検証の難しさ
- 2.2 合成容易性予測モデルの紹介
  - 2.2.1 SYBA
  - 2.2.2 SCScore
  - 2.2.3 RAscore
3.新規な合成容易性予測モデルの構築に向けた研究の紹介
- 3.1 SAscoreを加えた4つの予測モデルの問題点
- 3.2 新規な合成容易性予測モデルの作成と検証
  - 3.2.1 新規予測モデルの作成
  - 3.2.2 検証セット
  - 3.2.3 合成困難な化合物に対する予測結果
  - 3.2.4 不安定な化合物に対する予測結果

3節 AIによる合成条件推薦システムの構築

1.並列合成実験と実験条件推薦システムを活用した合成条件の定量化
2.実験条件推薦システムによる新物質探索

4節触媒選択へのケモインフォマティクスの応用

1.不均一系触媒反応における触媒選択・設計のためのインフォマティクス
2.均一系触媒反応における触媒選択・設計のためのインフォマティクス
3.ベイズ最適化を活用した触媒選択の効率化

5節量子化学計算により収集した触媒活性を用いた機械学習

1.オレフィンメタセシス反応の解析
- 1.1 オレフィンメタセシスにおける計算機上で収集したデータを用いた構造物性相関
- 1.2 構造ジェネレータと進化的アルゴリズムを用いた構造最適化
2.Vaska錯体による水素開裂
3.Cr触媒によるエチレンオリゴメリゼーション反応の解析
4.不斉有機触媒
5.分子場解析に基づくデータ駆動型不斉触媒設計

6節 AIによる逆合成解析の経路探索の手法と活用

1.CAOS (Computer Aided Organic Synthesis) のはじまり
2.Synthia??-Grzybowskiの示した解決策
3.逆合成から順合成へ
4.分子は作れるのか?
5.これから

7節 AIによるフロー合成の反応条件最適化

1.機械学習による反応条件最適化と変数制御
- 1.1 2変数制御の組合せによる多変数制御
- 1.2 電解フロー反応における3変数制御系
- 1.3 電解フローにおける多変数制御
2.機械学習によるフロー反応条件最適化を用いたバッチでは困難な反応の制御
3.フロー反応の条件最適化による生産性向上
4.機械学習による反応最適化プロセスの自動化
- 4.1 インライン分析とデータ解析の自動化による多段階フロー反応のリアルタイムプロセス解析
- 4.2 フロー型モジュール有機合成装置のロボットによる自動化と,逆合成解析および実験計画,フロー反応を全自動化したシステムの開発

8節フロー合成の反応条件最適化への機械学習の活用

1.反応条件最適化手法について
2.反応条件最適化におけるフロー合成法の利点
3.フロー合成法における連続型変数に対する反応条件最適化:定常状態9+4+1法
4.フロー合成法における連続型変数に対する反応条件最適化:擬定常状態グラジエント法
5.フロー合成法における離散型変数に対する反応条件最適化

9節機械学習による意思決定とデータ解釈:物質合成パラメータの最適化とin situ測定結果の自動解析

1.機械学習による意思決定:物質合成パラメータ最適化プロセスでの機械学習の活用
2.データの解釈:in situ測定結果の機械学習による自動解析

第6章化学物質・材料設計への活用事例

1節インフォマティクスによる材料組成の予測・最適化

1.材料インフォマティクスにおける組成設計の位置づけ
- 1.1 組成設計は材料インフォマティクスの「必修科目」
- 1.2 組成設計で学べる「勘所」
- 1.3 組成設計MIにおける注意点・心構え
2.樹脂組成物の設計事例
- 2.1 目標
- 2.2 物性予測モデルの構築方法
- 2.3 データ準備
- 2.4 スパースなデータへの対応
- 2.5 予測モデルの学習
- 2.6 逆設計
- 2.7 その他の逆設計手法
- 2.8 実試作結果
- 2.8 最後に

2節マテリアルズインフォマティクスにおけるスパースモデリングを用いた特徴量エンジニアリングの展開

1.マテリアルズインフォマティクスとスパースモデリング
2.スパースモデリングの基礎
3.スパースモデリングによる物質・材料設計への展開
4.少数データに対するスパースモデリングの展開

3節社会実装を目指した強誘電体・誘電体材料のマテリアルズインフォマティクス

1.誘電体・強誘電体材料の第一原理計算の活用例
2.マテリアルズ・インフォマティクス適用対象の選択
3.常誘電体高誘電率材料
4.誘電率の第一原理計算
5.常誘電体高誘電率材料マテリアルズ・インフォマティクス
6.新規強誘電体材料マテリアルズ・インフォマティクス

4節ケモインフォマティクスを用いた3次元的立体構造と電子的な特性

- 単分子磁石サレン希土類錯体の探索研究に取り組むまでに –

1.はじめに~SMM概略~
2.SMM研究における機械学習 (モデル作成編)
3.SMM研究における機械学習 (データセット作成編)
4.情報技術を扱う上で必要な知識
- 4.1 コンピュータの概論
- 4.2 機械学習
- 4.3 化学での機械学習

5節材料の物性予測へむけた非晶質物質の量子ビーム構造解析

1.非晶質物質の回折の理論
2.典型的な酸化物ガラスの構造
3.非晶質物質の回折ピークの起源
4.特異な構造を持つ酸化物ガラス

6節機械学習と離散最適化に基づく新規物質設計

1.機械学習による予測関数の構築法
- 1.1 機械学習
- 1.2 化合物の化学グラフによるモデル化
- 1.3 二層モデルに基づく特徴関数
- 1.4 構造仕様
2.所望の物性値・分子構造を算出する逆解析法
- 2.1 混合整数線形計画Mf,η,σの定式化
- 2.2 組み換え解の生成
- 2.3 近傍解の生成
3.提案法の計算実験結果
- 3.1 予測関数構築に対する実験結果
- 3.2 逆解析:化学グラフ構築の実験結果
- 3.3 組み換え解生成の実験結果
- 3.4 近傍解生成の実験結果

7節自律材料探索AIを用いた材料設計の事例

1.高飽和磁化合金
2.シミュレーション型の自律材料探索AI
3.提案された高飽和磁化合金の合成と計測
4.ハイスループット第一原理計算による考察

8節ベイズ最適化によるポリマーの効率的設計

1.背景
- 1.1 企業におけるデータ科学の普及
- 1.2 データ科学による機能性材料が抱える課題
- 1.3 少数データにおける機械学習
2.ベイズ最適化を用いた熱可塑ポリマー設計
- 2.1 データセット構築
- 2.2 説明変数の生成
- 2.3 機械学習による回帰モデル構築
- 2.4 ベイズ最適化によるポリマーの繰返し単位の設計
3.まとめ

9節実証実験でのコンビナトリアル手法の活用とハイスループット材料合成

1.コンビナトリアル薄膜合成手法
2.コンビナトリアル薄膜評価法
3.コンビナトリアル手法を用いた薄膜材料開発
4.コンビナトリアル手法とデータ蓄積

10節ケモインフォマティクスを用いた層状物質の剥離挙動の制御

1.はじめに
- 1.1 小規模データに対応可能な実験科学者によるMIの必要性
- 1.2 2次元材料としてのナノシートとMIによるプロセス制御
2.実験主導MIによる収率予測モデル構築と検証17,19,22
- 2.1 小規模データセットの作成と学習
- 2.2 予測モデルを用いた未知な系の収率予測と実験的な最適化
3.実験主導MIによるサイズおよびサイズ分布予測モデル構築と検証20,21
- 3.1 サイズ予測モデルの構築と検証
- 3.2 サイズ分布予測モデルの構築と検証

第7章化学物質の毒性評価手法とその事例

1節ケモインフォマティクスを用いた化合物毒性予測での記述子設計とデータ解析

1.ケモメトリックス研究に用いる化合物の吟味
- 1.1 サンプル化合物及びサンプル母集団の吟味
- 1.2 サンプル母集団のクラスポピュレーションでの留意点
2.化合物より創出された記述子の調整と記述子選択
- 2.1 創出された記述子の吟味とウオッシング (洗浄) :簡易的な記述子選択
- 2.2 高度な記述子選択とノイズサンプル化合物の取り出し
- 2.3 最終選択記述子の種類と適用パターン
3.芳香族アミン化合物の発がん性に関する解析
- 3.1 ケモメトリックスによる解析に用いたサンプルデータと要因解析実施目的
- 3.2 記述子創出から記述子洗浄および簡易な記述子選択実施
- 3.3 ケモメトリックス解析に重要な役割を果たす記述子の選択
- 3.4 重要記述子選択の実施手順
- 3.5 重要記述子選択の実施結果
- 3.6 重要記述子による要因解析の実施
- 3.7 ニクラス分類/予測結果
4.まとめ
- 4.1 化学分野のデータサイエンスの (ケモメトリックス) 適用時の留意点
- 4.2 毒性関連研究分野のメカニズム追及への展開
- 4.3 メカニズム解析におけるケモメトリックス研究の役割と留意点
- 4.4 今後から近未来への展開:データサイエンスの自動化から自律化への進歩

2節安全性評価に活用できるオープンデータベースとその活用

1.医薬品・化学品の毒性評価に関するオープンデータベースとその活用
- 1.1 QSAR Toolbox
- 1.2 QSAT Toolboxの活用
2.医薬品の安全性評価に用いられるリアルワールドデータとその活用
- 2.1 国内外の有害事象自発報告データベース
- 2.2 有害事象自発報告データベースを活用したシグナルの検出

3節 QSAR解析による毒性評価

1.規制目的のための (Q) SARモデル検証のOECD原則
- 1.1 原則1: a defined endpoint (定義されたエンドポイント)
- 1.2 原則2: an unambiguous algorithm (曖昧さのないアルゴリズム)
- 1.3 原則3: a defined domain of applicability (定義された適用範囲)
- 1.4 原則4: appropriate measures of goodness-of-fit, robustness and predictivity (適合度,頑健性及び予測性の適切な評価)
- 1.5 原則5: a mechanistic interpretation, if possible (可能な場合,メカニズムに関する説明)
- 1.6 QSAR Model Reporting Format (QMRF)
- 1.7 QSAR Prediction Reporting Format (QPRF)
2.ICH M7ガイドラインにおける (Q) SARを用いた変異原性評価

4節インビボ毒性試験データベースを用いた反復投与毒性のインシリコ予測

1.準備・予備知識
- 1.1 反復投与毒性
- 1.2 インシリコ手法
- 1.3 HESSデータの概要
2. (Q) SARによる反復投与毒性予測
- 2.1 予測対象の反復投与毒性
- 2.2 予測モデルの説明変数
- 2.3 用いた統計的手法
- 2.4 内部検証の結果
3.リードアクロスによる反復投与毒性予測
- 3.1 予測対象の反復投与毒性
- 3.2 予測の説明変数
- 3.3 用いた統計的手法
- 3.4 内部検証と外部検証
4.まとめと考察
- 4.1 SMOTEアルゴリズムの利用
- 4.2 組合せ最適化理論の利用
- 4.3 予測モデルの適用領域
- 4.4 インシリコ予測研究における課題

5節毒性発現機構を考慮した一般化学品の毒性予測システムの開発~AI-SHIPS~

1.AI -SHIPSプロジェクトの意義 _{開発背景、設計思想、および今後の展開について}
- 1.1 AI-SHIPSプロジェクトスタートの背景
- 1.2 毒性予測の仕組み (3層モデル)
- 1.3 毒性予測システムの構成
- 1.4 データ駆動型化学の全体像の中での毒性予測システムの位置づけと今後への期待

第8章医薬品開発への活用事例

1節創薬リード探索へのケモインフォマティクスの活用

1.医薬品の起源と疾病
2.抗体薬物複合体 (ADC) 開発における天然物のポテンシャル
3.希少放線菌Saccharothrix sp. A1506株が生産する新規抗がん剤シースsaccharothriolide類

2節ケモインフォマティクスとAIによる化学構造の生成

1.Matched Molecular Pair解析
- 1.1 Matched Molecular Pair (MMP)
- 1.2 Matched Molecular Pairの検出法
- 1.3 Matched Molecular Pair解析による生物学的等価体の検索
- 1.4 Matched Molecular Series (MMS)
2.SAR Matrixによる新規化合物の生成と活性予測
- 2.1 SAR Matrixの構築方法
- 2.2 SAR Matrixにおける新規化合物の活性予測
- 2.3 SAR Matrixを用いたMatrix Metalloproteinase 1 (MMP-1) 阻害剤の設計
3.DeepSARMによるSAR Matrixの拡張
- 3.1 DeepSARMの概要
- 3.2 DeepSARMの学習手順
- 3.3 DeepSARMによるSARMの拡張

3節少ない実験データとベイズ最適化による機能タンパク質の配列設計

1.変異体ライブラリーからの機能タンパク質探索の課題
2.配列空間の設計と探索課題
3.機械学習による配列空間探索
4.ベイズ最適化に基づく蛍光タンパク質の機能改変

4節質量分析インフォマティクスとケモインフォマティクスによる代謝物構造推定

1.代謝物のアノテーション
- 1.1 ケモインフォマティクスを用いた保持時間予測
- 1.2 in-silicoフラグメンテーションによるMS/MSスペクトルの予測
- 1.3 リピドミクスにおける脂質のin-silicoフラグメンテーション
- 1.4 MS/MSスペクトルデータベース
2.ケモインフォマティクスを用いた構造推定法
- 2.1 代表的な構造推定法CSI:Finger ID
- 2.2 化合物クラスを予測する方法
- 2.3 MS/MSスペクトルネットワーク
- 2.4 酵素反応の情報を利用した構造推定法
3.代謝物アノテーションと構造推定の実例

5節創薬研究に有用なデータベースとその活用のポイント

1.化合物を中心とするデータベース
- 1.1 世界最大級の化合物データベース:PubChem
- 1.2 手動でキュレーションされた生物活性を収録する化合物データベース:ChEMBL
- 1.3 その他,化合物を中心とする有用なデータベース
2.タンパク質を中心とするデータベース
- 2.1 タンパク質の配列データベース:UniProt
- 2.2 タンパク質の配列データベース:PDB, PDBbind
- 2.3 タンパク質の予測立体構造データベース:AlphaFold
3.遺伝子発現データベース
- 3.1 大規模な遺伝子発現データベース:GEO, Expression Atlas
- 3.2 毒性や疾患の理解のための遺伝子発現データベース構築プロジェクト:Open TG-GATEs, DrugMatrix, Tox21, CMap, L1000, GTEx
4.統合データベース
- 4.1 創薬ターゲットの発見を支援するデータベース:Open Targets, TargetMine
- 4.2 化合物の選択,最適化を支援するデータベース:Binding DB, CTD
5.文献データベース
- 5.1 生物医学分野の文献情報データベース:MEDLINE,PubMed
- 5.2 MeSH用語を用いた論文検索の実例
- 5.3 生命科学分野のプレプリントサーバー:bioRxiv,medRxiv

6節医薬品安全性情報DBのインフォマティクスへの活用

1.Chemotargets CLARITY
- 1.1 CLARITYのデータベース
- 1.2 CLARITYによる毒性・安全性予測モデル
- 1.3 CLARITYによる毒性・安全性予測
2.CLARITY PV
- 2.1 CLARITY PVのデータベース
- 2.2 医薬品の安全性シグナルの検出
- 2.3 医薬品の安全性問題のトランスレーショナル解析
- 2.4 医薬品の安全性問題の比較解析

7節化合物ライブラリーの情報検索におけるポイント

1.ライブラリーの検索における留意点
- 1.1 化合物ライブラリーの大きさ
- 1.2 化合物構造の正規化
2.ライブラリーの検索方法
- 2.1 文字列検索
- 2.2 類似性検索
- 2.3 ファーマコフォア検索
- 2.4 部分構造・骨格構造検索
- 2.5 創薬分野における応用 (分子プロパティ・忌避構造検索)
- 2.6 大規模ライブラリーの高速検索技術
3.機械学習モデルを用いたライブラリー検索、事例紹介

8節化合物同定のためのメタボロームデータベースの活用

1.LC-MSによるノンターゲット・メタボローム解析
2.LC-MSメタボローム解析で得られる基本情報
- 2.1 LCの保持時間
- 2.2 m/z値
- 2.3 マススペクトル
- 2.4 付加イオン (アダクトイオン) とインソースフラグメンテーション
3.同定までの流れとデータベース
- 3.1 LC-MS分析
- 3.2 多変量解析等による選抜
- 3.3 既知化合物データベースに対する検索
- 3.4 マススペクトルによる選抜
- 3.5 試料特異性データベースによる選抜
- 3.6 同定

9節第一原理計算と分子動力学計算による膜透過性の評価・推定

1.水-オクタノール分配係数の第一原理計算とQSAR法の融合
- 1.1 電子状態計算に基づくLogPo/wの簡易予測法
- 1.2 計算の詳細
- 1.3 計算結果
2.バイアス型拡張サンプリング法による膜透過係数の算出法¹⁰
- 2.1 自由エネルギー反応経路探索法
- 2.2 計算対象と計算の詳細
- 2.3 計算結果
3.非バイアス型拡張サンプリング法による膜透過係数の算出法¹¹
- 3.1 並列カスケード選択型分子動力学法
- 3.2 計算対象と計算の詳細
- 3.3 計算結果

第9章分析インフォマティクスとの連携・活用事例

1節機械学習によるスペクトルデータ解析

1.X線分光スペクトル解析へのベイズ推定の導入の意義
- 1.1 X線吸収分光・X線光電子分光スペクトル解析
- 1.2 従来の解析法の問題点
2.ハミルトニアンパラメータのベイズ推定・ベイズ統合
- 2.1 ベイズ推定
- 2.2 交換モンテカルロ法
- 2.3 ベイズ統合
3.ベイズ統合のデータ解析結

2節内殻電子励起スペクトル (ELNES/XANES) の理論計算と機械学習を用いた解析

1.ELNES/XANES理論計算の基礎と応用
- 1.1 ELNES/XANES理論計算の基礎
2.機械学習を利用したELNES/XANES予測と解析
- 2.1 機械学習を利用したELNES/XANESの予測
- 2.2 ELNES/XANESから動径分布関数 (RDF) の予測
- 2.3 スペクトルからの物性予測
3.スペクトルデータベース

3節 AIによるHPLC分析メソッド開発の事例

1.HPLCメソッド開発を効率良く行うための手順
- 1.1 HPLCの分離度に関する関係式
- 1.2 HPLCのメソッド開発を効率良く行うためのスキーム
- 1.3 最適なカラム選択の為のソフトウェア (New ColumnViewer)
- 1.4 AIを利用したHPLC用自動メソッド開発ソフトウェア (ChromSword Auto5.1)
- 1.5 化学構造式からクロマトグラムをシミュレーションする
- 1.6 頑健性試験

4節 AIによるNMR化学シフト予測の高精度化

1.はじめに:循環型社会とバイオプロセス評価
2.機械学習を併用した量子理論化学シフト・スピン結合定数の予測精度向上
3.高分子材料の物性・構造記述子と固体NMR因子の統合解析
4.ベイズ最適化を利用した高分子材料の分解予測モデルの構築
5.魚肉のNMR緩和学習による物性、NMR情報転移による組成評価の試み

5節機械学習によるTOF-SIMS スペクトル解析

1.教師なし機械学習法の応用
- 1.1 非負値行列因子分解 (non-negativity matrix factorization: NMF)
- 1.2 自己符号化器 (autoencoder)
- 1.3 シャノンエントロピー
2.教師あり機械学習法の応用
- 2.1 ランダムフォレスト (Random Forest) によるスペクトル予測
- 2.2 人工ニューラルネットワーク (ANN) による定量分析

ページのトップヘ

執筆者

奈良先端科学技術大学院大学宮尾知幸
熊本大学杉本学
国立研究開発法人産業技術総合研究所安藤康伸
三井化学株式会社向田志保
株式会社キャトルアイ・サイエンス上島豊
大阪大学小野寛太
摂南大学河合健太郎
北海道大学岩佐豪
北海道大学小林正人
北海道大学武次徹也
大阪電気通信大学森田成昭
奈良先端科学技術大学院大学金谷重彦
滋賀大学江崎剛史
奈良先端科学技術大学院大学船津公人
名古屋大学大学院松井孝太
豊橋技術科学大学後藤仁志
豊橋技術科学大学五十幡康弘
豊橋技術科学大学加藤凱生
豊橋技術科学大学立花尚登
奈良先端科学技術大学院大学井上泰彰
城西大学寺前裕之
ケモインフォ株式会社藤秀義
旭化成ファーマ株式会社下田嵩央
旭化成ファーマ株式会社山口貴也
一般財団法人高度情報科学技術研究機構河東田道夫
国立研究開発法人産業技術総合研究所椿真史
岡山県立大学野田祐輔
株式会社メドインフォ嵜山陽二郎
国立研究開発法人理化学研究所佐藤朋広
大阪大学金鋼
株式会社 Transition State Technology 山口徹
株式会社 Transition State Technology 堀憲次
北里大学若杉昌輝
京都大学林博之
国立研究開発法人産業技術総合研究所矢田陽
国立研究開発法人理化学研究所山口滋
京都大学竹邊日和
京都大学松原誠二郎
京都大学竹邊日和
北海道大学永木愛一郎
北海道大学岡本和紘
静岡大学間瀬暢之
国立研究開発法人物質・材料研究機構大久保勇男
東京大学 Mikk Lippmaa
東レ株式会社山本海
筑波大学五十嵐康彦
一般財団法人ファインセラミックスセンター森分博紀
東京理科大学秋津貴城
東京理科大学滝口裕司
東京理科大学中根大輔
国立研究開発法人物質・材料研究機構小原真司
京都大学小野寺陽平
京都大学永持仁
国立研究開発法人物質・材料研究機構岩崎悠真
株式会社レゾナック南拓也
株式会社レゾナック中陳巧勤
国立研究開発法人物質・材料研究機構長田貴弘
慶應義塾大学緒明佑哉
筑波大学五十嵐康彦
株式会社インシリコデータ湯田浩太郎
日本たばこ産業株式会社植沢芳広
明治薬科大学黒﨑宏太
一般財団法人化学物質評価研究機構赤堀有美
一般財団法人化学物質評価研究機構林多恵
国立研究開発法人産業技術総合研究所竹下潤一
静岡県立大学吉成浩一
京都大学掛谷秀昭
株式会社理論創薬研究所吉森篤史
東北大学梅津光央
国立研究開発法人産業技術総合研究所齋藤裕
国立研究開発法人産業技術総合研究所亀田倫史
東京大学津田宏治
ヒューマン・メタボローム・テクノロジーズ株式会社山本博之
東京情報大学村上洋一
大阪大学長尾知生子
大阪大学水口賢司
株式会社モルシス東田欣也
慶應義塾大学池田和由
慶應義塾大学米澤朋起
国立遺伝学研究所櫻井望
筑波大学重田育照
筑波大学高橋輝行
大阪公立大学満田祐樹
筑波大学原田隆平
公益財団法人高輝度光科学研究センター水牧仁一朗
東京大学溝口照康
東京大学柴田基洋
クロムソードジャパン株式会社鈴木政明
国立研究開発法人理化学研究所菊地淳
成蹊大学青柳里果

ページのトップヘ

出版社

株式会社技術情報協会

お支払い方法、返品の可否は、必ず注文前にご確認をお願いいたします。

お問い合わせ

本出版物に関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(出版社への直接のお問い合わせはご遠慮くださいませ。)

体裁・ページ数

A4判 657ページ

ISBNコード

978-4-86104-944-6

発行年月

2023年4月

販売元

tech-seminar.jp

価格

80,000円 (税別) / 88,000円 (税込)

出版物を購入する

ページのトップヘ

開始日時		開催方法
2026/5/14	計算科学シミュレーション技術の基礎と材料設計への応用	オンライン
2026/5/19	ロボットを活用した実験の自動化	オンライン
2026/5/21	マテリアルズ・インフォマティクスと第一原理計算による材料研究の実践	オンライン
2026/5/21	マテリアルズインフォマティクスのための実験データ統合、データベース構築と活用例	オンライン
2026/5/21	最新動向を俯瞰的に学び、データサイエンティスト/材料開発者が知っておくべき基礎	オンライン
2026/5/21	機械学習を用いたスペクトルデータ解析と材料開発への適用	オンライン
2026/5/25	化学プロセスのコスト計算とコスト削減のポイント	オンライン
2026/5/25	機械学習を用いたスペクトルデータ解析と材料開発への適用	オンライン
2026/5/26	化学プロセスのコスト計算とコスト削減のポイント	オンライン
2026/5/27	反応工学の基礎から学ぶ各種反応器の合理的な設計と工業化・スケールアップにおけるポイント	オンライン
2026/5/28	材料・分析データに活かすためのケモメトリクスの基礎と実践	オンライン
2026/5/28	AIによる物性推算	オンライン
2026/6/4	電子実験ノートの導入とR&Dデータ共有・利活用ノウハウ	オンライン
2026/6/5	最新動向を俯瞰的に学び、データサイエンティスト/材料開発者が知っておくべき基礎	オンライン
2026/6/8	AIによる物性推算	オンライン
2026/6/10	安定性・凝集抑制を目指したタンパク質溶液製剤の合理的設計・添加剤選定と構造安定性の評価	オンライン
2026/6/12	ニューラルネットワーク分子動力学法の基礎と応用	オンライン
2026/6/15	化学工場で働く技術者に伝えたい使える化学工学知識	オンライン
2026/6/16	反応工学の基礎から学ぶ各種反応器の合理的な設計と工業化・スケールアップにおけるポイント	オンライン
2026/6/16	二次元NMRによる構造解析の基礎からトラブル事例と対策まで	オンライン

発行年月
2025/4/14	化学業界30社〔2025年版〕技術開発実態分析調査報告書 (CD-ROM版)
2025/4/14	化学業界30社〔2025年版〕技術開発実態分析調査報告書 (書籍版)
2025/3/31	ベイズ最適化の活用事例
2025/2/28	マイクロ波の工業応用事例集
2024/11/29	ファインケミカル、医薬品の連続生産プロセス
2024/10/31	自然言語処理の導入と活用事例
2024/1/12	世界のマテリアルズ・インフォマティクス最新業界レポート
2023/12/27	実験の自動化・自律化によるR&Dの効率化と運用方法
2022/8/2	カーボンニュートラルのためのグリーン燃料と化学品
2021/7/30	マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/6/28	AI・MI・計算科学を活用した蓄電池研究開発動向
2020/12/30	実践Rケモ・マテリアル・データサイエンス
2020/12/25	フロー合成、連続生産のプロセス設計、条件設定と応用事例
2020/8/11	化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/8/1	材料およびプロセス開発のためのインフォマティクスの基礎と研究開発最前線
2019/1/31	マテリアルズ・インフォマティクスによる材料開発と活用集
2016/3/25	初心者のためのPHREEQCによる反応解析入門
2014/2/15	3M〔米国特許版〕技術開発実態分析調査報告書 (CD-ROM版)
2014/2/15	3M〔米国特許版〕技術開発実態分析調査報告書
2011/9/20	三菱化学技術開発実態分析調査報告書

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ

ケモインフォマティクスにおけるデータ収集の最適化と解析手法

ケモインフォマティクスにおけるデータ収集の最適化と解析手法

目次

第1章 化学構造の表現・数値化と記述子の設計・活用

1節 説明変数選定と記述子の設計法

2節 分子記述子の種類と活用法

第2章 データ収集・データベース構築での留意点

1節 精度向上のためのデータ収集で考えなければいけないこと

2節 データ取得コストに留意したデータ収集での留意点

3節 R&D部門におけるデータ共有システムの構築とその活用方法

4節 ハイスループット実験による効率的で生産性の高いデータ収集法

第3章 データセットの作成と各種解析手法の活用事例

1節 データ解析をスムーズに行うためのデータセット作成の留意点

2節 計算化学研究におけるスパースモデリングの応用

3節 次元削減によるデータセットの可視化と主成分分析

4節 データセットの構築法とデータの関係性の視覚化法

5節 「線形回帰モデル」と「非線形回帰モデル」によるデータ解析での留意点

6節 非線形データ解析・モデリングと外挿性改善

7節 ベイズ最適化による効率的実験計画とデータ解析

8節 ハイパーパラメータの最適化の事例

9節 Rでのケモインフォマティクスの実践事例

第4章 機械学習の具体的活用とその事例

1節 ケモインフォマティクスにおける機械学習モデルの種類と具体的活用法

2節 Pythonのケモインフォマティクスでの活用

3節 KNIMEを活用したデータ処理・ケモインフォマティクスの事例紹介

4節 量子コンピュータのケモインフォマティクスへの応用

5節 機械学習のためのデータの前処理での留意点

6節 過学習に留意した最適な機械学習モデルの構築

7節 少ない実験回数で予測精度の高い機械学習モデルの開発

8節 転移学習を用いたデータ解析のポイント

9節 「説明可能なAI」による複雑分子系の状態間遷移における遷移状態の解明

第5章 化学物質の合成経路探索・反応条件最適化への活用事例用

1節 反応条件最適化へのケモインフォマティクスの応用

2節 機械学習や深層学習を用いた合成容易性予測モデルの開発動向

3節 AIによる合成条件推薦システムの構築

4節 触媒選択へのケモインフォマティクスの応用

5節 量子化学計算により収集した触媒活性を用いた機械学習

6節 AIによる逆合成解析の経路探索の手法と活用

7節 AIによるフロー合成の反応条件最適化

8節 フロー合成の反応条件最適化への機械学習の活用

9節 機械学習による意思決定とデータ解釈:物質合成パラメータの最適化とin situ測定結果の自動解析

第6章 化学物質・材料設計への活用事例

1節 インフォマティクスによる材料組成の予測・最適化

2節 マテリアルズインフォマティクスにおけるスパースモデリングを用いた特徴量エンジニアリングの展開

3節 社会実装を目指した強誘電体・誘電体材料のマテリアルズインフォマティクス

4節 ケモインフォマティクスを用いた3次元的立体構造と電子的な特性

5節 材料の物性予測へむけた非晶質物質の量子ビーム構造解析

6節 機械学習と離散最適化に基づく新規物質設計

7節 自律材料探索AIを用いた材料設計の事例

8節 ベイズ最適化によるポリマーの効率的設計

9節 実証実験でのコンビナトリアル手法の活用とハイスループット材料合成

10節 ケモインフォマティクスを用いた層状物質の剥離挙動の制御

第7章 化学物質の毒性評価手法とその事例

1節 ケモインフォマティクスを用いた化合物毒性予測での記述子設計とデータ解析

2節 安全性評価に活用できるオープンデータベースとその活用

3節 QSAR解析による毒性評価

4節 インビボ毒性試験データベースを用いた反復投与毒性のインシリコ予測

5節 毒性発現機構を考慮した一般化学品の毒性予測システムの開発~AI-SHIPS~

第8章 医薬品開発への活用事例

1節 創薬リード探索へのケモインフォマティクスの活用

2節 ケモインフォマティクスとAIによる化学構造の生成

3節 少ない実験データとベイズ最適化による機能タンパク質の配列設計

4節 質量分析インフォマティクスとケモインフォマティクスによる代謝物構造推定

5節 創薬研究に有用なデータベースとその活用のポイント

6節 医薬品安全性情報DBのインフォマティクスへの活用

7節 化合物ライブラリーの情報検索におけるポイント

8節 化合物同定のためのメタボロームデータベースの活用

9節 第一原理計算と分子動力学計算による膜透過性の評価・推定

第9章 分析インフォマティクスとの連携・活用事例

1節 機械学習によるスペクトルデータ解析

2節 内殻電子励起スペクトル (ELNES/XANES) の理論計算と機械学習を用いた解析

3節 AIによるHPLC分析メソッド開発の事例

4節 AIによるNMR化学シフト予測の高精度化

5節 機械学習によるTOF-SIMS スペクトル解析

第1章化学構造の表現・数値化と記述子の設計・活用

1節説明変数選定と記述子の設計法

2節分子記述子の種類と活用法

第2章データ収集・データベース構築での留意点

1節精度向上のためのデータ収集で考えなければいけないこと

2節データ取得コストに留意したデータ収集での留意点

4節ハイスループット実験による効率的で生産性の高いデータ収集法

第3章データセットの作成と各種解析手法の活用事例

1節データ解析をスムーズに行うためのデータセット作成の留意点

2節計算化学研究におけるスパースモデリングの応用

3節次元削減によるデータセットの可視化と主成分分析

4節データセットの構築法とデータの関係性の視覚化法

5節「線形回帰モデル」と「非線形回帰モデル」によるデータ解析での留意点

6節非線形データ解析・モデリングと外挿性改善

7節ベイズ最適化による効率的実験計画とデータ解析

8節ハイパーパラメータの最適化の事例

第4章機械学習の具体的活用とその事例

1節ケモインフォマティクスにおける機械学習モデルの種類と具体的活用法

4節量子コンピュータのケモインフォマティクスへの応用

5節機械学習のためのデータの前処理での留意点

6節過学習に留意した最適な機械学習モデルの構築

7節少ない実験回数で予測精度の高い機械学習モデルの開発

8節転移学習を用いたデータ解析のポイント

9節「説明可能なAI」による複雑分子系の状態間遷移における遷移状態の解明

第5章化学物質の合成経路探索・反応条件最適化への活用事例用

1節反応条件最適化へのケモインフォマティクスの応用

2節機械学習や深層学習を用いた合成容易性予測モデルの開発動向

4節触媒選択へのケモインフォマティクスの応用

5節量子化学計算により収集した触媒活性を用いた機械学習

8節フロー合成の反応条件最適化への機械学習の活用

9節機械学習による意思決定とデータ解釈:物質合成パラメータの最適化とin situ測定結果の自動解析

第6章化学物質・材料設計への活用事例

1節インフォマティクスによる材料組成の予測・最適化

2節マテリアルズインフォマティクスにおけるスパースモデリングを用いた特徴量エンジニアリングの展開

3節社会実装を目指した強誘電体・誘電体材料のマテリアルズインフォマティクス

4節ケモインフォマティクスを用いた3次元的立体構造と電子的な特性

5節材料の物性予測へむけた非晶質物質の量子ビーム構造解析

6節機械学習と離散最適化に基づく新規物質設計

7節自律材料探索AIを用いた材料設計の事例

8節ベイズ最適化によるポリマーの効率的設計

9節実証実験でのコンビナトリアル手法の活用とハイスループット材料合成

10節ケモインフォマティクスを用いた層状物質の剥離挙動の制御

第7章化学物質の毒性評価手法とその事例

1節ケモインフォマティクスを用いた化合物毒性予測での記述子設計とデータ解析

2節安全性評価に活用できるオープンデータベースとその活用

4節インビボ毒性試験データベースを用いた反復投与毒性のインシリコ予測

5節毒性発現機構を考慮した一般化学品の毒性予測システムの開発~AI-SHIPS~

第8章医薬品開発への活用事例

1節創薬リード探索へのケモインフォマティクスの活用

2節ケモインフォマティクスとAIによる化学構造の生成

3節少ない実験データとベイズ最適化による機能タンパク質の配列設計

4節質量分析インフォマティクスとケモインフォマティクスによる代謝物構造推定

5節創薬研究に有用なデータベースとその活用のポイント

6節医薬品安全性情報DBのインフォマティクスへの活用

7節化合物ライブラリーの情報検索におけるポイント

8節化合物同定のためのメタボロームデータベースの活用

9節第一原理計算と分子動力学計算による膜透過性の評価・推定

第9章分析インフォマティクスとの連携・活用事例

1節機械学習によるスペクトルデータ解析

2節内殻電子励起スペクトル (ELNES/XANES) の理論計算と機械学習を用いた解析

5節機械学習によるTOF-SIMS スペクトル解析