技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

実務に使えるスモールデータ解析

実務に使えるスモールデータ解析

~特徴選択・不均衡データ解析・異常検知~
東京都 開催 オンライン 開催

概要

本セミナーでは、スモールデータ解析について基礎から解説し、スモールデータの解析の実態と、その方法論、データ収集の考え方を事例を交えて詳解いたします。

開催日

  • 2020年5月18日(月) 10時30分 16時30分

受講対象者

  • 現実のデータの解析に興味のある技術者・研究者

修得知識

  • スモールデータ解析に必要な技術
  • 変数選択法
  • 不均衡データの解析手法
  • スモールデータ解析を活用した異常検知

プログラム

 生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。
 本セミナーでは、実例を通じ、スモールデータの解析の実態と、その方法論、データ収集の考え方を講義する。

  1. スモールデータとは
    1. スモールデータの特徴
    2. スモールデータ解析の現状
  2. スモールデータ解析の方法論:次元削減と回帰分析
    1. 主成分分析 (PCA)
      1. PCAとは
      2. 直交展開
      3. PCAの導出
      4. PCAと特異値分解
    2. 最小二乗法
      1. 回帰分析とは
      2. 相関係数の意味
      3. 最小二乗法の導出
      4. 最小二乗法の幾何学的意味
      5. 多重共線性の問題
    3. 部分的最小二乗法 (PLS)
      1. PLSとは
      2. 潜在変数モデル
      3. PLSモデルの導出
      4. NIPALSアルゴリズム
      5. PLSから重回帰モデルへの変換
      6. クロスバリデーションによるパラメータチューニング
  3. スモールデータ解析の方法論:入力変数選択
    1. 入力変数選択とは
    2. スパースモデリング
      1. スパースとは
      2. リッジ回帰
      3. Lasso回帰
      4. エラスティックネットモデル
      5. Group Lasso
    3. 変数クラスタリングによる入力変数選択
      1. スペクトラルクラスタリング
      2. NC法のコンセプト
      3. NCSCアルゴリズムの導出
      4. NCSCを用いた変数クラスタリングと入力変数選択
      5. 製薬プロセスへの応用例
  4. スモールデータ解析の方法論:不均衡データ解析
    1. サンプリング手法
      1. サンプリング手法とは
      2. アンダーサンプリングとオーバーサンプリング
    2. ブースティング
      1. ブースティングとは
      2. AdaBoost
      3. RandomForest
    3. ブースティングとサンプリング手法を組み合わせた不均衡データ解析
      1. 何故,ブースティングとサンプリング手法を組み合わせるか
      2. RUSBoost
      3. HUSDOS – Boost
    4. 不均衡データ解析の大規模検診データへの適用例
  5. スモールデータ解析の方法論:異常検出
    1. 異常検出とは
    2. 多変量統計的プロセス管理 (MSPC)
      1. MPSCとは
      2. T2統計量とQ統計量の幾何学的意味
    3. 自己符号化器 (オートエンコーダー)
    4. 異常検出問題の医療データ解析への応用例
  6. スモールデータの収集・解析の考え方
    1. 必要となるデータの質の問題
    2. データ収集の際の留意点
    3. スモールデータ解析の手法選択
    • 質疑応答

講師

  • 藤原 幸一
    名古屋大学 工学研究科 物質プロセス工学専攻
    准教授

会場

大田区産業プラザ PiO

6階 D会議室

東京都 大田区 南蒲田1-20-20
大田区産業プラザ PiOの地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 42,700円 (税別) / 46,970円 (税込)
複数名
: 22,500円 (税別) / 24,750円 (税込)

複数名同時受講の割引特典について

  • 2名様以上でお申込みの場合、
    1名あたり 22,500円(税別) / 24,750円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 42,700円(税別) / 46,970円(税込)
    • 2名様でお申し込みの場合 : 2名で 45,000円(税別) / 49,500円(税込)
    • 3名様でお申し込みの場合 : 3名で 67,500円(税別) / 74,250円(税込)
  • 同一法人内 (グループ会社でも可) による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 請求書および領収書は1名様ごとに発行可能です。
    申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。
  • 他の割引は併用できません。

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

  • 1名様あたり 10,000円(税別) / 11,000円(税込)
  • 企業に属している方(出向または派遣の方も含む)は、対象外です。
  • お申込み者が大学所属名でも企業名義でお支払いの場合、対象外です。
本セミナーは終了いたしました。
講演順序・プログラムは変更となる場合がございます。予めご了承ください。
掲載している受講料は会員価格でございます。
お申し込み後はサイエンス&テクノロジーの会員登録をさせていただき、セミナー等のサービスのご案内を差し上げます。

これから開催される関連セミナー

開始日時
2020/7/14 機械学習を用いた分析スペクトルデータ解析の進め方 東京都
2020/7/15 画像データ前処理に活かす画像フィルタリングの基本と最新動向 オンライン
2020/7/16 機械学習、ディープラーニングにおけるデータ前処理と予測精度向上のポイント 東京都
2020/7/17 PythonとExcelで理解するデータ分析入門 東京都
2020/7/17 逆強化学習入門 東京都
2020/7/20 Pythonを使った時系列データ分析 東京都
2020/7/20 はじめてのPythonと教師あり学習・教師なし学習 オンライン
2020/7/21 時系列データ分析の基礎・モデル化と異常検知・機械学習への応用 東京都
2020/7/21 自動運転・運転支援における環境認識技術 東京都
2020/7/21 スマート工場のためのIoT活用術 東京都
2020/7/22 ロボット、IoTを活用した工場の設備自動化ライン構築の進め方 東京都
2020/7/22 音を利用した設備・機械の故障検知、故障予知 オンライン
2020/7/22 外観検査・目視検査自動化のための画像処理・AI技術の活用 オンライン
2020/7/27 自動車の自動運転におけるLiDARを用いた移動物体認識技術とその応用 オンライン
2020/7/28 機械学習を用いた異常判別・検知手法 オンライン
2020/7/29 QbD (Quality by Design) のための実験計画法入門 2日間講座 東京都
2020/7/30 製造業における人工知能の基礎と自動設計・仮想検査・未知の異常検知への応用入門 オンライン
2020/7/30 スパースモデリング入門 オンライン
2020/7/31 ベイズ最適化の基礎と応用およびPythonによる実装 オンライン
2020/8/3 機械学習における前処理の基礎とそのポイント オンライン