技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

Vision Transformerの仕組み

Vision Transformerの仕組み

~コンピュータビジョン応用を中心とした最前線~
オンライン 開催

開催日

  • 2024年7月18日(木) 10時00分16時00分

受講対象者

  • 画像処理・物体認識に関連する技術者
    • デジタルカメラ、デジタルビデオカメラ
    • 印刷、カラーコピー機
    • テレビ・ディスプレイ
    • レーザ計測、位置決め
    • 医用画像処理、医療機器制御
    • 衛星画像処理
    • 超解像技術
    • ロボットのカメラ、制御
    • 外観検査装置
    • 非破壊検査装置
    • 車載カメラ
    • 防犯カメラ など

プログラム

 自己注意機構を活用したニューラルネットワークであるTransformerは、機械翻訳タスクでSoTAを達成し実用化を加速させている。このTransformerをコンピュータビジョンタスクに適用したモデルがVision Transformerであり、2019年以降、急速に応用と改良が加えられている。Vision Transformerは、CNNとは異なる新たな特徴表現獲得が可能となり、テクスチャノイズに対してロバストな認識が可能となっている。
 本セミナーではVision Transformerについて従来の手法と対比しながらその仕組みと特長について解説し、コンピュータビジョン応用として物体検出、セマンティックセグメンテーション、自己教師あり学習について紹介する。また、自動運転技術に欠かせないTransformerベースのBEV Perceptionの最前線についても紹介する。

  1. 再帰型ニューラルネットワークの仕組み
    1. 再帰型ニューラルネットワーク (RNN)
    2. LSTM
    3. Seq2seq、Attention Seq2seq
  2. Transformerの仕組み
    1. Transformer
    2. 大規模言語モデル
  3. Vision Transformerの仕組み
    1. 特徴表現獲得の変遷
    2. VIsion Transformer (ViT)
    3. ViTによる画像認識
    4. ViTによる特徴表現獲得
    5. ViTベースの物体検出、セマンティックセグメンテーション
    6. ViTの自己教師あり学習
  4. ViTの最新動向
    1. ViTの派生手法
      • Swin Transformer
      • ConvNeXtなど
    2. ViTの派生手法の傾向
  5. TransformerによるBEV Perception
    1. Bird’s-Eye-View (BEV) 空間
    2. BEVベースの3D物体検出
      • BEVFormer
      • BeVerse
    3. BEVベースの自動運転
      • UniAD

講師

  • 藤吉 弘亘
    中部大学 工学部 ロボット理工学科
    教授

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 49,000円 (税別) / 53,900円 (税込)
1口
: 60,000円 (税別) / 66,000円 (税込) (3名まで受講可)

ライブ配信セミナーについて

  • 本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
  • お申し込み前に、 視聴環境テストミーティングへの参加手順 をご確認いただき、 テストミーティング にて動作確認をお願いいたします。
  • 開催日前に、接続先URL、ミーティングID​、パスワードを別途ご連絡いたします。
  • セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
  • ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
  • タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
  • ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
  • 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
  • Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
    万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2025/9/8 ベイズ統計と機械学習の実践と応用 オンライン
2025/9/9 ベイズ統計と機械学習の実践と応用 オンライン
2025/9/10 CMOSセンサ技術の全体像 オンライン
2025/9/12 要素技術者による人工知能応用開発入門 オンライン
2025/9/16 要素技術者による人工知能応用開発入門 オンライン
2025/9/16 自動運転・運転支援のためのミリ波レーダの基礎と車載応用、走行環境認識技術 オンライン
2025/9/16 特許調査への生成AIの活用 オンライン
2025/9/16 三次元点群の基礎と基本プログラミング技法 オンライン
2025/9/16 ケモインフォマティクスと機械学習による化学データ解析 オンライン
2025/9/17 ディジタル信号処理による雑音・ノイズの低減/除去技術とその応用 オンライン
2025/9/17 自動運転・運転支援のためのミリ波レーダの基礎と車載応用、走行環境認識技術 オンライン
2025/9/17 ケモインフォマティクスと機械学習による化学データ解析 オンライン
2025/9/19 説明可能AI (XAI) から人と共に進化・発展するAIへ オンライン
2025/9/22 ラボオートメーション (実験自動化) による研究開発効率向上の実践的アプローチ オンライン
2025/9/24 FT-IRの基礎と機械学習によるスペクトルデータ解析 オンライン
2025/9/26 プロセスインフォマティクスの基礎と製造プロセスへの効果的な活かし方 オンライン
2025/9/28 Vision Transformerの仕組みとBEV Perception オンライン
2025/9/29 生成AIの著作権侵害問題とトラブル対策 オンライン
2025/9/29 プロセスインフォマティクスの基礎と製造プロセスへの効果的な活かし方 オンライン
2025/9/30 人工知能による異常検知入門 オンライン

関連する出版物

発行年月
2025/6/30 皮膚の測定評価と可視化、イメージング技術
2025/6/23 防犯・監視カメラ〔2025年版〕 技術開発実態分析調査報告書 (書籍版)
2025/6/23 防犯・監視カメラ〔2025年版〕 技術開発実態分析調査報告書 (CD-ROM版)
2024/10/31 少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2024/10/31 自然言語処理の導入と活用事例
2024/4/8 画像認識技術・システム 技術開発実態分析調査報告書 (CD-ROM版)
2024/4/8 画像認識技術・システム 技術開発実態分析調査報告書
2023/6/30 生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31 機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25 AIプロセッサー
2021/10/25 AIプロセッサー (CD-ROM版)
2021/7/30 マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14 AIビジネスのブレークスルーと規制強化
2021/6/30 人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28 AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31 生体情報センシングと人の状態推定への応用
2020/4/30 生体情報計測による感情の可視化技術
2020/3/26 ビッグデータ・AIの利活用に伴う法的留意点
2019/1/31 センサフュージョン技術の開発と応用事例