技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー
技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー
第1のパラダイムでは「仮説検定」の発想で経験科学が進展した。そして、ニュートンの法則に代表される第2のパラダイムでは、定量性を考慮した理論科学、計算機の発明により第3のパラダイムとして複雑な現象をシミュレーションに再現する科学へ、そして、現在、第4のパラダイム、として豊富なデータを活用したビッグ・データ・サイエンスが生まれた。ここでは、さらに社会実装も考慮されるようになった。一方、2012年、ハーバード・ビジネス・レビュー誌がデータサイエンスを「21世紀で最もカッコいい仕事」と位置づけたことから、注目を集めるようになった。では、これを具体的に化学・マテリアル科学の領域で進めるにはどうしたいいだろうか。実践として必要とされることは、ターゲットとする分野の知識、プログラミングとして必要とされるデータ解析技術としては、データの収集、機械学習と解析結果の評価法 (統計学) である。いままで、これらは地道に情報科学の各分野が基盤技術を確立してきた。しかし、オープンサイエンスの時代になり、これらのプログラムおよびデータについてもデータベースとして公開されるようになってきた。ではユーザーとしてこれらのプログラムとデータを活用し、新たな知見を獲得し、さらに社会実装することを目指すことになる。社会実装というと大げさに聞こえるが、企業であれば新たな製品を開発するということへつなげることであり、結局のところ、いま世の中に定着し始めたSustainable Development Goals (SDGs) に向けた取り組みということへ帰着する。
本書では、このような背景を考慮しながらも、まず「機械学習、統計学をいかに実践的に習得するか?」に焦点を当て、化学・マテリアル科学の具体的データを取り入れ、R言語におけるプログラム例 (約75スクリプト) をもとに解説した。R言語にはさまざま解析用途に応じたパッケージが公開されている。そこで、本書では、<1.データの入力>、ファイルからのデータを入力、<2.データの整形>、目的に応じて入力データから必要な項目の抽出、<3.データ解析>、抽出されたデータを目的にあった関数・パッケージ (統計、多変量解析、機械学習などの関数) に入力し、解析結果を得る。<4.解析結果の表示・出力>解析結果をもとにグラフに表示する、あるいは、ファイルへ出力する。という4つのステップに沿って、Rスクリプトを作成することを説明した。特に、データの整形について本書全体を通して説明を加えた。また、さまざまなパッケージの活用法も習得できるように配慮した。エディタRStudio、Rのインストール、プログラミングの基礎、化学構造からの特徴表現 (分子記述子) による多変量データ解析 (機械学習により回帰モデル、分類モデル) 、妥当性・汎化性能評価という一連の流れを、ひとりでも学べるように本テキスト「 (ひとりで学べる) 実践Rケモ・マテリアル・データサイエンス~付録Rスクリプト付き~」を作成した。また、 株式会社 シーエムシー・リサーチでは、講習会も企画しているそうであるので、これもご活用いただくと、さらに理解が深まり実践的活用への自信もつくと思う。
金谷 重彦
付録CDには、書籍内容のPDFと金谷研で開発したRスクリプトのフォルダが入っています。
Rスクリプトは著作権フリーですが、書籍のPDFは著作権で保護されておりますので、ご購入いただきました研究室や部署・部門の範囲でのご利用に限定させていただきます。
無断転載・シェアは固くお断りいたします。
シーエムシーリサーチからの案内をご希望の方は、割引特典を受けられます。
開始日時 | 会場 | 開催方法 | |
---|---|---|---|
2024/11/15 | マテリアルズ・インフォマティクス入門 | オンライン | |
2024/11/27 | AI・ロボットを活用した自律駆動型材料開発の最新動向と課題・展望 | オンライン | |
2024/11/27 | 医薬品開発に使えるタンパク質の理論的デザイン法とタンパク質のフォールディング予測法 | オンライン | |
2024/12/6 | AI/機械学習と従来型実験データの実用的な組み合わせ方法 | オンライン | |
2024/12/13 | マテリアルズ・インフォマティクスの基礎と応用展開および研究事例 | オンライン | |
2024/12/18 | 新規用途探索、アイデア発掘への生成AI活用の仕方 | オンライン | |
2024/12/25 | マテリアルズ・インフォマティクスの基礎と応用展開および研究事例 | オンライン | |
2025/1/14 | プラントのDX化による異常予兆検知、予知保全とその運用 | オンライン | |
2025/1/14 | 自然言語処理を活用した研究開発、材料分野への適応事例 | オンライン | |
2025/1/20 | ベイズ最適化を活用した実験の効率化と開発期間短縮 | オンライン | |
2025/1/24 | マテリアルズインフォマティクスの基盤となる「計算科学シミュレーション技術」 | オンライン | |
2025/2/27 | 計算科学シミュレーション技術の基礎と材料設計への応用 | オンライン |
発行年月 | |
---|---|
2024/1/12 | 世界のマテリアルズ・インフォマティクス 最新業界レポート |
2023/12/27 | 実験の自動化・自律化によるR&Dの効率化と運用方法 |
2023/4/28 | ケモインフォマティクスにおけるデータ収集の最適化と解析手法 |
2021/7/30 | マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例 |
2021/6/28 | AI・MI・計算科学を活用した蓄電池研究開発動向 |
2020/8/11 | 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート |
2020/8/1 | 材料およびプロセス開発のためのインフォマティクスの基礎と研究開発最前線 |
2019/1/31 | マテリアルズ・インフォマティクスによる材料開発と活用集 |