技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー
技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー
第1のパラダイムでは「仮説検定」の発想で経験科学が進展した。そして、ニュートンの法則に代表される第2のパラダイムでは、定量性を考慮した理論科学、計算機の発明により第3のパラダイムとして複雑な現象をシミュレーションに再現する科学へ、そして、現在、第4のパラダイム、として豊富なデータを活用したビッグ・データ・サイエンスが生まれた。ここでは、さらに社会実装も考慮されるようになった。一方、2012年、ハーバード・ビジネス・レビュー誌がデータサイエンスを「21世紀で最もカッコいい仕事」と位置づけたことから、注目を集めるようになった。では、これを具体的に化学・マテリアル科学の領域で進めるにはどうしたいいだろうか。実践として必要とされることは、ターゲットとする分野の知識、プログラミングとして必要とされるデータ解析技術としては、データの収集、機械学習と解析結果の評価法 (統計学) である。いままで、これらは地道に情報科学の各分野が基盤技術を確立してきた。しかし、オープンサイエンスの時代になり、これらのプログラムおよびデータについてもデータベースとして公開されるようになってきた。ではユーザーとしてこれらのプログラムとデータを活用し、新たな知見を獲得し、さらに社会実装することを目指すことになる。社会実装というと大げさに聞こえるが、企業であれば新たな製品を開発するということへつなげることであり、結局のところ、いま世の中に定着し始めたSustainable Development Goals (SDGs) に向けた取り組みということへ帰着する。
本書では、このような背景を考慮しながらも、まず「機械学習、統計学をいかに実践的に習得するか?」に焦点を当て、化学・マテリアル科学の具体的データを取り入れ、R言語におけるプログラム例 (約75スクリプト) をもとに解説した。R言語にはさまざま解析用途に応じたパッケージが公開されている。そこで、本書では、<1.データの入力>、ファイルからのデータを入力、<2.データの整形>、目的に応じて入力データから必要な項目の抽出、<3.データ解析>、抽出されたデータを目的にあった関数・パッケージ (統計、多変量解析、機械学習などの関数) に入力し、解析結果を得る。<4.解析結果の表示・出力>解析結果をもとにグラフに表示する、あるいは、ファイルへ出力する。という4つのステップに沿って、Rスクリプトを作成することを説明した。特に、データの整形について本書全体を通して説明を加えた。また、さまざまなパッケージの活用法も習得できるように配慮した。エディタRStudio、Rのインストール、プログラミングの基礎、化学構造からの特徴表現 (分子記述子) による多変量データ解析 (機械学習により回帰モデル、分類モデル) 、妥当性・汎化性能評価という一連の流れを、ひとりでも学べるように本テキスト「 (ひとりで学べる) 実践Rケモ・マテリアル・データサイエンス~付録Rスクリプト付き~」を作成した。また、 株式会社 シーエムシー・リサーチでは、講習会も企画しているそうであるので、これもご活用いただくと、さらに理解が深まり実践的活用への自信もつくと思う。
金谷 重彦
付録CDには、書籍内容のPDFと金谷研で開発したRスクリプトのフォルダが入っています。
Rスクリプトは著作権フリーですが、書籍のPDFは著作権で保護されておりますので、ご購入いただきました研究室や部署・部門の範囲でのご利用に限定させていただきます。
無断転載・シェアは固くお断りいたします。
シーエムシーリサーチからの案内をご希望の方は、割引特典を受けられます。
| 開始日時 | 会場 | 開催方法 | |
|---|---|---|---|
| 2025/10/28 | ケモメトリックスの基礎とスペクトル解析への応用 | オンライン | |
| 2025/10/28 | はじめての研究開発での機械学習活用と社内推進のポイント | オンライン | |
| 2025/10/29 | はじめての研究開発での機械学習活用と社内推進のポイント | オンライン | |
| 2025/10/30 | マテリアルズ・インフォマティクス入門 | オンライン | |
| 2025/11/4 | R&D部門における研究・実験データのExcelでの効果的な蓄積・分析方法 | オンライン | |
| 2025/11/5 | 高分子材料の開発・設計における計算科学やAI・MI活用の最新動向 | オンライン | |
| 2025/11/6 | 高分子材料の開発・設計における計算科学やAI・MI活用の最新動向 | オンライン | |
| 2025/11/7 | 原子団寄与法の考え方と利用事例 | オンライン | |
| 2025/11/12 | ラボオートメーションの導入、設計に向けた機器、装置の選定と制御のポイント | オンライン | |
| 2025/11/14 | 研究開発部門における実験データの収集 超入門 | オンライン | |
| 2025/11/17 | マテリアルズ・インフォマティクス入門 | オンライン | |
| 2025/11/18 | 原子団寄与法の考え方と利用事例 | オンライン | |
| 2025/11/20 | AI, 機械学習と従来型研究開発の現実的な組み合わせ方法 | オンライン | |
| 2025/11/26 | 研究開発部門における実験データの収集 超入門 | オンライン | |
| 2025/12/2 | AI, 機械学習と従来型研究開発の現実的な組み合わせ方法 | オンライン | |
| 2025/12/12 | マテリアルズ・インフォマティクスのための実験データ統合、一元化とデータベースの構築、効果的な活用法 | オンライン | |
| 2025/12/18 | 研究開発部門における実験データとCAE、AI、機械学習の導入、活用のポイント | オンライン | |
| 2025/12/24 | アンケート・官能評価の多変量解析 統計解析の応用編 | オンライン | |
| 2026/1/6 | 研究開発部門における実験データとCAE、AI、機械学習の導入、活用のポイント | オンライン | |
| 2026/2/20 | マテリアルズインフォマティクスの基盤となる「計算科学シミュレーション技術」 | オンライン |
| 発行年月 | |
|---|---|
| 2025/3/31 | ベイズ最適化の活用事例 |
| 2024/10/31 | 自然言語処理の導入と活用事例 |
| 2024/1/12 | 世界のマテリアルズ・インフォマティクス 最新業界レポート |
| 2023/12/27 | 実験の自動化・自律化によるR&Dの効率化と運用方法 |
| 2023/4/28 | ケモインフォマティクスにおけるデータ収集の最適化と解析手法 |
| 2021/7/30 | マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例 |
| 2021/6/28 | AI・MI・計算科学を活用した蓄電池研究開発動向 |
| 2020/8/11 | 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート |
| 2020/8/1 | 材料およびプロセス開発のためのインフォマティクスの基礎と研究開発最前線 |
| 2019/1/31 | マテリアルズ・インフォマティクスによる材料開発と活用集 |