技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

時系列データ、言語データ、画像データに対する機械学習のための前処理

時系列データ、言語データ、画像データに対する機械学習のための前処理

~各手法・ツールの特徴・使い方とその実践~
オンライン 開催

開催日

  • 2020年6月29日(月) 13時00分 16時30分

受講対象者

  • 機械学習の応用分野に関連する技術者、研究者
    • 画像処理
    • 信号処理
    • 医療福祉
    • スポーツ分野
    • セキュリティ (監視カメラ、警備、防犯)
    • ロボット
    • コンピュータビジョン
    • 異常行動検出、異常領域検出
    • 統計
    • 経済学 など
  • 機械学習、パターン認識分野の技術者、研究者
  • これから機械学習、パターン認識に携わる技術者、開発者

修得知識

  • 時系列データ分析に対する前処理技術
  • 自然言語データに対する前処理技術
  • 画像データに対する前処理技術

プログラム

 前処理とは何らかの解析処理を行う前に行う処理のことです。前処理の効果は大きく、以降に続く解析処理の成否を決めているのが、実は、前処理とも言われています。ただ前処理は言葉的には明確ですが、具体的にどういう処理を行うかははっきりしていません。それは前処理自体の入出力が様々だからです。まず前処理の入力は、通常、最初に得られた形でのデータですが、どこから得られたデータなのかでその形態は様々です。また前処理の出力は、その後に続く解析処理への入力になるのですが、その解析処理が多様なので、結果的に前処理の出力も様々です。
 本セミナーでは上記の点を踏まえ、解析処理としては機械学習の処理を念頭におき、扱うデータとしては時系列データ、言語データ及び画像データを対象とします。データに対する前処理とは何か、標準的にはどういった処理があるのかを解説します。

  1. 時系列データ
    • 最初に時系列データ分析の前処理について解説します。時系列データは扱いが難しく、分析対象によってどのような
      前処理が必要なのかは様々です。ここでは一般的に時系列データ分析の前処理として扱われるWindowサイズの調整、データの正規化、変数変換、スムージングについて解説します。また周期性に関する注意も行います。更に時系列データから外れ値 (異常値) を検出・削除する処理は前処理とも捉えられますが、外れ値を検出すること自体が独自のタスクである場合もあります。ここでは時系列データから外れ値検出についても代表的手法を紹介します。
      1. Windows サイズの調整
      2. データの正規化
      3. 変数変換
      4. 周期性に関する注意
      5. 外れ値検出
  2. 言語データ
    • 次に自然言語の機械学習処理のための前処理について解説します。扱う言語は日本語と英語に限定します。日本語の場合、まず問題となるコードの問題について解説します。次に自然言語処理の場合、原始データは通常プレーンな文書ではありません。ここでは原始データがhtml 文書の場合に対象を絞って、それをプレーンな文書に変換する方法について解説します。プレーンな文書が得られた後は句読点の統一や無駄な空白の除去などといった俗に言うクリーニング処理が必要であり、どのような処理があるのか、どうすれば簡単に処理できるかを紹介します。その後に行うべき処理では単語分割です。単語分割についてはほぼできあがった技術ですが、単語数を予め定めるニューラルネットワーク翻訳などではSubword の技術が必要なので、この点について解説します。言語が英語の場合、日本語の場合には生じなかった、大文字と小文字の問題や、語尾変化の問題などがあります。このように英語特有の前処理について解説します。最後に単語列から文書に対する特徴ベクトルを作成する手法について解説します。基本はBag of words モデルと TF – IDF の組み合わせです。また文の埋め込み表現についても解説します。
      1. 日本語コード
      2. 構造化文書から plain テキストへ
      3. クリーニング処理
      4. 英語固有の前処理
      5. Bag of words と TF – IDF
      6. 文や文書の埋め込み表現
  3. 画像データ
    • 最後に画像の機械学習処理のための前処理について解説します。まず画像は様々なフォーマットで保存されていますので、それらファーマットの違いと変換処理について解説します。次に画像のノイズ除去の手法を紹介します。また実際に記録されている画像から物体検出を行いたい場合、閾値処理とフィルター処理を前処理として行うことが重要です。これらの処理について解説します。またディープラーニングで画像を扱うためには、実は、入力画像のサイズの問題が深刻です。これについて解説した後に、サイズの変更方法を述べます。最後に画像の機械学習の精度を改善する Data Augmentation の個々の手法について解説します。
      1. 画像のフォーマット変換
      2. 画像からのノイズ除去
      3. 閾値処理
      4. フィルター処理
      5. 画像サイズの変換
      6. Data Augumentation
    • 質疑応答

講師

  • 新納 浩幸
    茨城大学 工学部 情報工学科
    教授

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 38,000円 (税別) / 41,800円 (税込)
複数名
: 20,000円 (税別) / 22,000円 (税込)

複数名同時受講の割引特典について

  • 2名様以上でお申込みの場合、
    1名あたり 20,000円(税別) / 22,000円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 38,000円(税別) / 41,800円(税込)
    • 2名様でお申し込みの場合 : 2名で 40,000円(税別) / 44,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 60,000円(税別) / 66,000円(税込)
  • 同一法人内 (グループ会社でも可) による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 請求書および領収書は1名様ごとに発行可能です。
    申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。
  • 他の割引は併用できません。

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

  • 1名様あたり 10,000円(税別) / 11,000円(税込)
  • 企業に属している方(出向または派遣の方も含む)は、対象外です。
  • お申込み者が大学所属名でも企業名義でお支払いの場合、対象外です。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2024/4/24 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/4/25 カルマンフィルタの実践 オンライン
2024/4/26 ExcelとPythonによる多変量解析 超入門 オンライン
2024/4/26 少ないデータに対する機械学習、深層学習の適用 オンライン
2024/4/26 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/5/2 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/5/8 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/5/17 スパース推定の本質の理解と実装応用技術への展開 オンライン
2024/5/20 3Dセンサの測距原理とその応用 (2) 東京都 会場
2024/5/21 基礎からわかる生体信号の計測と情報解析・データマイニングのコツ オンライン
2024/5/23 ベイズ統計から学ぶ統計的機械学習 オンライン
2024/5/23 3次元モデリング/自由視点画像生成のための「NeRF」の基礎 オンライン
2024/5/24 マテリアルインフォマティクスの材料開発への適用と活用事例 オンライン
2024/5/24 画像認識のためのディープラーニングとモデルの軽量化 オンライン
2024/5/27 機械学習による適応的実験計画 オンライン
2024/5/27 外観検査へのAI導入と生成AIによるトレーニングデータ不足への対応 オンライン
2024/5/31 マテリアルズインフォマティクスのためのデータ解析 オンライン
2024/6/12 デジタル時代のヘルスケアビジネスの立ち上げ方 東京都 会場・オンライン
2024/6/13 エンジニアのための実験計画法とExcel上で構築可能な人工知能を併用する非線形実験計画法 オンライン
2024/6/14 機械学習による異常検知入門 東京都 会場

関連する出版物

発行年月
2024/4/8 画像認識技術・システム 技術開発実態分析調査報告書
2024/4/8 画像認識技術・システム 技術開発実態分析調査報告書 (CD-ROM版)
2023/6/30 生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31 機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25 AIプロセッサー (CD-ROM版)
2021/10/25 AIプロセッサー
2021/7/30 マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14 AIビジネスのブレークスルーと規制強化
2021/6/30 人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28 AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31 生体情報センシングと人の状態推定への応用
2020/4/30 生体情報計測による感情の可視化技術
2020/3/26 ビッグデータ・AIの利活用に伴う法的留意点
2020/3/24 リアルワールドデータの使用目的に応じた解析手法 - 各データベースの選択と組み合わせ -
2019/1/31 センサフュージョン技術の開発と応用事例
2018/5/31 “人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2016/1/20 画像ワーピング技術とその応用
2015/8/17 防犯・監視カメラ〔2015年版〕 技術開発実態分析調査報告書 (CD-ROM版)
2015/8/17 防犯・監視カメラ〔2015年版〕 技術開発実態分析調査報告書