技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

ケモインフォマティクスにおけるデータ解析手法とそのコツ・応用事例

データ解析の基本プロセスが学べる

ケモインフォマティクスにおけるデータ解析手法とそのコツ・応用事例

~データセット作成や、ハイパーパラメータ最適化など、解析をスムーズに行うためのコツ、事例~
オンライン 開催

概要

本セミナーでは、ケモインフォマティクスについて基礎から解説し、データセット作成や、ハイパーパラメータ最適化など、解析をスムーズに行うためのコツ、事例を詳解いたします。

開催日

  • 2023年3月7日(火) 9時45分 17時15分

プログラム

第1部 記述子の種類と各手法の活用法

(2023年3月7日 9:45〜11:15)

 ケモインフォマティクスの重要なタスクの一つは、化合物を分類するモデルを構築したり、その性能を予測する機械学習モデルを作成することである。これらによってこれまで合成されていなかった新規化合物あるいは既知化合物の中から有望な化合物を計算機上で探索する (=バーチャルスクリーニングを行う) ことが可能となる。分類モデルや定量的な性能予測モデル (回帰モデルと呼ばれる) を構築するためには、目的とする性能に関する参照データのみならず、一つ一つの物質を数値的に記述する「記述子」を準備する必要がある。
 本講ではケモインフォマティクス研究で用いられている記述子を紹介するとともに、その特徴や用途について解説する。また、目的に応じて記述子を作成ないしは考案するための戦略について議論する。その一例として、演者が考案した電子状態インフォマティクス記述子について紹介する。また、記述子の実際の応用例を紹介し、記述子の用途・特徴などを紹介する。最後に今後の展望について議論したい。

  1. 記述子とは何か?
  2. 記述子とデータ数の関係
  3. 代表的な記述子とその特徴
  4. 記述子を作る・考案する
  5. 電子状態インフォマティクス記述子
  6. 記述子の応用事例
  7. 今後の展望
    • 質疑応答

第2部 データ解析をスムーズに行うためのデータセット作成の留意点

(2023年3月7日 11:30〜13:00)

 データセットはデータ解析の基盤となるものである。当然のことであるが、いくら優れた解析方法があったとしても、データセットが無ければ何も出来ない。また、解析の目的に適合したデータが豊富にあったとしても、そのデータに不備がないことが必要となる。データに不備がなくても、化学構造式のように取り扱いに注意が必要なデータの場合、最大のパフォーマンスを得るためには適切な化学構造情報の処理が必要となる。
 そこで本稿では、化学構造情報の前処理を含めた「データ解析をスムーズに行うためのデータセット作成」における留意点について述べたい。

  1. データ解析の目的を明確にする
  2. どのような実験データを採用するか
  3. 化学構造を含むデータセット作成の留意点
    1. 化学構造データの取り扱い
    2. 化学構造のデータ形式
    3. 化学構造データの前処理 (クリーニング)
    4. 構造データに対するその他の前処理
  4. 測定値 (活性値など) の収集における留意点
    1. 一般的な留意点
    2. 公共のデータベースから活性値を収集する際の留意点
    3. その他の留意点
    • 質疑応答

第3部 ケモインフォマティクスにおけるデータ解析手法と活用事例

(2023年3月7日 14:00〜15:30)

 研究開発の効率化を目指し、ケモインフォマティクスの手法を使って化合物の特性を予測するモデルが注目されており、機械学習をはじめとした人工知能の貢献が期待されている。ライブラリに保管している化合物の構造データだけから、化合物の材料、もしくは薬としての特性を予測することができれば、実験規模を縮小しつつ有効な化合物を選び出すことができるため、研究開発にかかる費用や時間の短縮が見込まれる。
 本講演では、機械学習を用いて化合物特性を予測する先端研究とともに、特性の予測を行うための注意点について紹介したい。

  1. ケモインフォマティクスの概要
  2. 特性を予測するとは
  3. 課題の設定
  4. データの前処理
  5. モデルの選択
  6. 精度の評価
  7. 活用事例
  8. インフォマティクスを専門とする研究者の役割
    • 質疑応答

第4部 ハイパーパラメータの最適化の事例

(2023年3月7日 15:45〜17:15)

  1. ハイパーパラメータの最適化の概要
    1. ハイパーパラメータの組み合わせの探索アルゴリズム
    2. MLモデルの学習と評価
    3. MLモデルの選択
    4. ハイパーパラメータの種類
      1. MLモデル構造のハイパーパラメータ
      2. 学習制御のハイパーパラメータ
      3. 最適化技法のハイパーパラメータ
  2. 研究事例におけるハイパーパラメータの調整
    1. 分子活性予測
    2. 量子化学計算の運動エネルギー予測
  3. ハイパーパラメータの自動最適化
    • 質疑応答

講師

  • 杉本 学
    熊本大学 大学院 先端科学研究部
    准教授
  • 河合 健太郎
    摂南大学 薬学部
    准教授
  • 江崎 剛史
    滋賀大学 データサイエンス・AIイノベーション研究推進センター
    准教授
  • 後藤 仁志
    豊橋技術科学大学 情報メディア基盤センター 計算科学研究室
    教授

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 60,000円 (税別) / 66,000円 (税込)
複数名
: 55,000円 (税別) / 60,500円 (税込)

複数名同時受講割引について

  • 2名様以上でお申込みの場合、1名あたり 55,000円(税別) / 60,500円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 60,000円(税別) / 66,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 110,000円(税別) / 121,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 165,000円(税別) / 181,500円(税込)
  • 同一法人内による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 他の割引は併用できません。

アカデミック割引

  • 1名様あたり 30,000円(税別) / 33,000円(税込)

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

  • 学校教育法にて規定された国、地方公共団体、および学校法人格を有する大学、大学院、短期大学、附属病院、高等専門学校および各種学校の教員、生徒
  • 病院などの医療機関・医療関連機関に勤務する医療従事者
  • 文部科学省、経済産業省が設置した独立行政法人に勤務する研究者。理化学研究所、産業技術総合研究所など
  • 公設試験研究機関。地方公共団体に置かれる試験所、研究センター、技術センターなどの機関で、試験研究および企業支援に関する業務に従事する方
  • 支払名義が企業の場合は対象外とさせていただきます。
  • 企業に属し、大学、公的機関に派遣または出向されている方は対象外とさせていただきます。

ライブ配信セミナーについて

  • 本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
  • お申し込み前に、 視聴環境テストミーティングへの参加手順 をご確認いただき、 テストミーティング にて動作確認をお願いいたします。
  • 開催日前に、接続先URL、ミーティングID​、パスワードを別途ご連絡いたします。
  • セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
  • ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
  • タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
  • ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
  • 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
  • Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
    万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2024/4/4 多変量解析・データ処理 超入門 オンライン
2024/4/10 Pythonによる時系列データ分析とその活用 オンライン
2024/4/11 材料開発効率化への生成AI・ChatGPT導入と活用 オンライン
2024/4/12 機械学習/Deep Learningの画像データ前処理に活用できる画像フィルタリングの基本と最新動向 オンライン
2024/4/15 ディープラーニングの基礎と実践 オンライン
2024/4/15 少ないデータに対する機械学習、深層学習の適用 オンライン
2024/4/17 ルールベースと機械学習ベースの画像認識技術 オンライン
2024/4/18 生成AIをめぐる著作権問題の最前線 東京都 会場・オンライン
2024/4/19 ディープラーニングの基礎と実践 オンライン
2024/4/19 ラボでの電子実験ノート管理・運用における経験からわかった電子情報管理の問題点・解決とDXの進め方 オンライン
2024/4/19 自然言語処理の基礎と生成AI・大規模言語モデルの研究開発への活用 オンライン
2024/4/22 高分子インフォマティクスの応用事例 オンライン
2024/4/24 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/4/25 カルマンフィルタの実践 オンライン
2024/4/26 少ないデータに対する機械学習、深層学習の適用 オンライン
2024/4/26 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/4/26 R&D部門での生成AI活用およびDXによる材料設計の加速化 オンライン
2024/5/1 ラボでの電子実験ノート管理・運用における経験からわかった電子情報管理の問題点・解決とDXの進め方 オンライン
2024/5/2 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/5/2 自然言語処理の基礎と生成AI・大規模言語モデルの研究開発への活用 オンライン

関連する出版物

発行年月
2024/1/12 世界のマテリアルズ・インフォマティクス 最新業界レポート
2023/12/27 実験の自動化・自律化によるR&Dの効率化と運用方法
2023/6/30 生産プロセスにおけるIoT、ローカル5Gの活用
2023/4/28 ケモインフォマティクスにおけるデータ収集の最適化と解析手法
2022/12/31 機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2022/4/28 研究開発部門へのDX導入によるR&Dの効率化、実験の短縮化
2021/10/25 AIプロセッサー
2021/10/25 AIプロセッサー (CD-ROM版)
2021/7/30 マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14 AIビジネスのブレークスルーと規制強化
2021/6/30 人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28 AI・MI・計算科学を活用した蓄電池研究開発動向
2020/12/30 実践Rケモ・マテリアル・データサイエンス
2020/8/11 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/8/1 材料およびプロセス開発のためのインフォマティクスの基礎と研究開発最前線
2020/7/31 生体情報センシングと人の状態推定への応用
2020/4/30 生体情報計測による感情の可視化技術
2020/3/26 ビッグデータ・AIの利活用に伴う法的留意点
2020/3/24 リアルワールドデータの使用目的に応じた解析手法 - 各データベースの選択と組み合わせ -
2019/1/31 センサフュージョン技術の開発と応用事例