技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

機械学習のためのデータ前処理の基本と実践法

機械学習のためのデータ前処理の基本と実践法

~演習を通して実データを上手く前処理する術を学ぶ実践的セミナー / 基礎から、数値・テキスト・画像・音声データの前処理法、最新技術の調べ方まで~
オンライン 開催

概要

本セミナーでは、機械学習の成果を左右する「データ前処理」について取り上げ、その基本から、高度な前処理、自然言語・画像・音声におけるすぐに使える前処理技術、うまく対処できない時のための最新技術の調べ方のコツなどについて、PCを用いた演習を含めて実践的な内容を解説いたします。

開催日

  • 2022年3月10日(木) 10時30分 16時30分

修得知識

  • Google Colabを用いたデータ分析
  • Pythonを用いたデータの前処理
  • 数値、テキスト、画像、音声データの前処理

プログラム

 本セミナーでは、人工知能やデータサイエンスによるデータ分析において欠かせない機械学習のためのデータの前処理技術についてレクチャー、実演し、自らGoogle Colab環境上でサンプルコードを実行することで、実践に応用可能な前処理技術を習得してもらうことを目的としている。 Google Colab上では一般的な数値計算および機械学習ライブラリに加え、GPUにより高速化できる深層学習フレームワークがあらかじめ導入されている。Google Drive上に学習データやモデルを保存でき、無料ではじめることができるため、機械学習用に計算機を準備するのが難しい初学者にはうってつけのツールである。
 前半では数値データの前処理について扱うが、そのほとんどは、Kaggleで公開されているデータセットを使用する。Kaggleのデータは、教科書向けのきれいな (機械学習で扱いやすい) データではないため、多くの場合、前処理技術を駆使しなければ思うような結果を導き出すことができない。つまり、このセミナーを通して実データを機械学習で扱いやすいようにうまく前処理する技術を身につけることができれば、実際に収集した扱いにくいデータに対しても適切に対応できるようになるはずである。実用の際には、紹介した前処理技法だけではうまく対処できないデータにも出くわすであろう。その際は、複数の前処理技術を組み合わせたり、最新の前処理技法を導入する必要も出てくるが、そんなときに役立つ最新技術の調べ方のコツなども一部紹介する。さらに、自然言語処理、画像処理、音声処理における前処理についても、すぐに使える技術を中心に解説する。

  1. はじめに「AI・機械学習における前処理」
  2. 準備
    1. Google Colabによる実行環境
    2. NumPy,pandas
    3. scikit-learn
    4. matplotlib
    5. Tensorflow,Keras
  3. 基本的な前処理
    1. 標準化と正規化
    2. ビニング
    3. 外れ値・欠損値の扱い
  4. 特徴選択・次元削減と可視化
    1. フィルタ法,ラッパ法,正則化
    2. 線形次元削減,非線形次元削減
  5. 高度な前処理
    1. カテゴリカルデータから数値データへの変換
    2. 不均衡データの扱い
    3. 時系列データの扱い
  6. テキストデータの前処理
    1. 分かち書きと形態素解析
    2. ニューラルネットワークによる文書分類
  7. 画像データ,音声・音楽データにおける前処理
    1. 畳み込みニューラルネットワーク
    2. データ拡張
    3. ファインチューニング
    4. 音声・音楽データの前処理
    • 質疑応答

講師

  • 松本 和幸
    徳島大学 大学院 社会産業理工学研究部
    准教授

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 30,400円 (税別) / 33,440円 (税込)
複数名
: 22,500円 (税別) / 24,750円 (税込)

複数名受講割引

  • 2名様以上でお申込みの場合、1名あたり 22,500円(税別) / 24,750円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 30,400円(税別) / 33,440円(税込)
    • 2名様でお申し込みの場合 : 2名で 45,000円(税別) / 49,500円(税込)
    • 3名様でお申し込みの場合 : 3名で 67,500円(税別) / 74,250円(税込)
  • 同一法人内 (グループ会社でも可) による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 請求書および領収書は1名様ごとに発行可能です。
    申込みフォームの通信欄に「請求書1名ごと発行」とご記入ください。
  • 他の割引は併用できません。
  • サイエンス&テクノロジー社の「2名同時申込みで1名分無料」価格を適用しています。

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

  • 1名様あたり 10,000円(税別) / 11,000円(税込)
  • 企業に属している方(出向または派遣の方も含む)は、対象外です。
  • お申込み者が大学所属名でも企業名義でお支払いの場合、対象外です。

ライブ配信セミナーについて

  • 本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
  • お申し込み前に、 視聴環境テストミーティングへの参加手順 をご確認いただき、 テストミーティング にて動作確認をお願いいたします。
  • 開催日前に、接続先URL、ミーティングID​、パスワードを別途ご連絡いたします。
  • セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
  • セミナー資料は、PDFファイルをダウンロードいただきます。
  • ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
  • タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
  • ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
  • 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
  • Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
    万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2024/5/2 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/5/7 安全性定期報告書等の作成にむけた安全性集積データの見方・評価と文章作成のコツ オンライン
2024/5/8 実験計画法・ベイズ最適化を用いた効率的な実験デザイン オンライン
2024/5/8 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/5/15 ソフトウェア開発への生成AI・ChatGPT導入と活用 オンライン
2024/5/17 スパース推定の本質の理解と実装応用技術への展開 オンライン
2024/5/20 3Dセンサの測距原理とその応用 (2) 東京都 会場
2024/5/21 基礎からわかる生体信号の計測と情報解析・データマイニングのコツ オンライン
2024/5/23 ベイズ統計学の基礎と演習 オンライン
2024/5/23 ベイズ統計から学ぶ統計的機械学習 オンライン
2024/5/23 3次元モデリング/自由視点画像生成のための「NeRF」の基礎 オンライン
2024/5/24 マテリアルインフォマティクスの材料開発への適用と活用事例 オンライン
2024/5/24 画像認識のためのディープラーニングとモデルの軽量化 オンライン
2024/5/27 機械学習による適応的実験計画 オンライン
2024/5/27 外観検査へのAI導入と生成AIによるトレーニングデータ不足への対応 オンライン
2024/5/28 分子シミュレーションの基礎と高分子材料の研究・開発の効率化への展開 オンライン
2024/5/31 ベイズ統計学の基礎と演習 オンライン
2024/5/31 マテリアルズインフォマティクスのためのデータ解析 オンライン
2024/6/10 機械学習 (ディープラーニング) の基礎・活用・実践 (全3回) オンライン
2024/6/10 Python基礎と機械学習 基礎 オンライン