技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

Pythonによるデータサイエンス・AIのためのデータ前処理

Pythonによるデータサイエンス・AIのためのデータ前処理

~Google Colaboratoryで動作するサンプルコードによる演習~
オンライン 開催

概要

本セミナーでは、機械学習の成果を左右する「データ前処理」について取り上げ、その基本から、高度な前処理、自然言語・画像・音声におけるすぐに使える前処理技術、うまく対処できない時のための最新技術の調べ方のコツなどについて、PCを用いた演習を含めて実践的な内容を解説いたします。

開催日

  • 2023年5月29日(月) 10時30分 16時30分

修得知識

  • Google Colaboratoryを用いたデータ分析
  • Pythonを用いたデータの前処理
  • 数値、テキスト、画像、音声データの前処理

プログラム

 本セミナーでは、データサイエンスや人工知能のためのデータ分析において欠かせないデータの前処理技術についてレクチャー、実演をメインに行います。自らGoogle Colaboratory環境上でサンプルコードを動かすことで実践的な前処理技術を習得することが目標です。
 Google Colaboratory上にはじめからインストールされている数値計算、機械学習ライブラリ、深層学習フレームワークは、大変便利で実用的です。しかし、市販の参考書を片手に整理整頓された教科書的なデータを分析するだけでデータサイエンスやAIを理解した気になっていると、実際の業務において、一筋縄ではいかないデータに直面した時、何をどうしてよいのかわからずに思考停止に陥るのではないでしょうか。データサイエンスやAIを一から学びたい人、仕事で使用するためにとにかく手っ取り早く手を動かしながらコツをつかみたい人、ご心配はご無用です。
 このセミナーでは、困ったときに参考になる実用的な前処理用のサンプルコードを豊富に準備しています。また、講師の研究経験から、データ前処理だけでなく有用なデータ収集の困難さやその極意、上手くいかないときのチューニングのノウハウなども伝授したいと思います。

  1. はじめに「AI・機械学習における前処理」
  2. 準備
    1. Google ColaboratoryによるPython実行環境と便利な使い方
    2. NumPy, pandas による数値データの処理
    3. scikit-learnを用いた簡単な機械学習
    4. matplotlibによる可視化の基本
    5. Tensorflow, Keras を用いた深層学習の基本
  3. 基本的な前処理
    1. 標準化と正規化、ビニング
    2. 外れ値や欠損値にどのように対処するか
  4. 特徴選択・次元削減と可視化
    1. 機械学習を使わない統計的な方法 … フィルタ法
    2. 機械学習による効果的な方法 … ラッパ法
    3. 機械学習アルゴリズムに組み込んで利用する … 正則化
    4. 線形次元削減と非線形次元削減
  5. 高度な前処理
    1. カテゴリカルデータから数値データへの変換
    2. バランスの悪いデータにいかに対処するか
    3. 時系列データ処理の基本
  6. テキストデータの前処理
    1. テキスト抽出、分かち書きと形態素解析
    2. 単語分散表現、トピックモデリング
    3. ニューラルネットワークによる文書分類
    4. 最新の言語モデル動向
  7. 画像データ、音声・音楽データにおける前処理
    1. 畳み込みニューラルネットワークの基本
    2. データ不足をデータ拡張で補う
    3. ファインチューニングによる画像分類モデルの構築
    4. 音声・音楽データの基本と前処理手法
    • 質疑応答

講師

  • 松本 和幸
    徳島大学 大学院 社会産業理工学研究部
    准教授

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 50,000円 (税別) / 55,000円 (税込)
複数名
: 25,000円 (税別) / 27,500円 (税込)

案内割引・複数名同時申込割引について

R&D支援センターからの案内登録をご希望の方は、割引特典を受けられます。
案内および割引をご希望される方は、お申込みの際、「案内の希望 (割引適用)」の欄から案内方法をご選択ください。

「案内の希望」をご選択いただいた場合、1名様 40,000円(税別) / 44,000円(税込) で受講いただけます。
複数名で同時に申込いただいた場合、1名様につき 25,000円(税別) / 27,500円(税込) で受講いただけます。

  • R&D支援センターからの案内を希望する方
    • 1名様でお申し込みの場合 : 1名で 40,000円(税別) / 44,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 50,000円(税別) / 55,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 75,000円(税別) / 82,500円(税込)
  • R&D支援センターからの案内を希望しない方
    • 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 100,000円(税別) / 110,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 150,000円(税別) / 165,000円(税込)

ライブ配信セミナーについて

  • 本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
  • お申し込み前に、 視聴環境テストミーティングへの参加手順 をご確認いただき、 テストミーティング にて動作確認をお願いいたします。
  • 開催日前に、接続先URL、ミーティングID​、パスワードを別途ご連絡いたします。
  • セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
  • ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
  • タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
  • ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
  • 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
  • Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
    万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2024/5/23 ベイズ統計から学ぶ統計的機械学習 オンライン
2024/5/24 マテリアルインフォマティクスの材料開発への適用と活用事例 オンライン
2024/5/27 機械学習による適応的実験計画 オンライン
2024/5/27 外観検査へのAI導入と生成AIによるトレーニングデータ不足への対応 オンライン
2024/5/28 分子シミュレーションの基礎と高分子材料の研究・開発の効率化への展開 オンライン
2024/5/31 マテリアルズインフォマティクスのためのデータ解析 オンライン
2024/6/4 最適化技術の本命 : 進化計算法 (EC:Evolutionary Computation) の基礎と応用 オンライン
2024/6/10 機械学習 (ディープラーニング) の基礎・活用・実践 (全3回) オンライン
2024/6/10 Python基礎と機械学習 基礎 オンライン
2024/6/11 分子シミュレーションの基礎と高分子材料の研究・開発の効率化への展開 オンライン
2024/6/12 デジタル時代のヘルスケアビジネスの立ち上げ方 東京都 会場・オンライン
2024/6/13 エンジニアのための実験計画法とExcel上で構築可能な人工知能を併用する非線形実験計画法 オンライン
2024/6/14 機械学習による異常検知入門 東京都 会場
2024/6/14 卑金属のみを用いた固体高分子型水電解用酸素発生電極の開発 オンライン
2024/6/18 機械学習/AIによる特許調査の高度化で実践するスマート特許戦略 オンライン
2024/6/18 Pythonではじめる機械学習入門講座 オンライン
2024/6/19 実験自動化によるR&Dの高速化と再現性向上 オンライン
2024/6/19 機械学習を用いた画像認識技術の基礎とその応用 オンライン
2024/6/19 外観検査自動化に向けた画像処理・AI技術活用の課題と導入のポイント オンライン
2024/6/20 ISO 13485:2016対応に必須の医療機器プロセスバリデーション (進め方、統計的手法とそのサンプルサイズ) オンライン

関連する出版物