技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

技術者のための視覚基盤モデル入門

技術者のための視覚基盤モデル入門

~2015年からの進化と未来~
オンライン 開催

開催日

  • 2025年9月9日(火) 13時00分17時00分

プログラム

 本セミナーでは、視覚基盤モデル (Vision Foundation Model) を技術者向けに解説します。この技術は視覚言語モデル (VLM) 、視覚言語行動モデル (VLA) へと発展し、実世界との接点としてPhysical AI (Embodied AI) への適用が注目されています。そこで視覚基盤モデルの技術を解説し、工学分野・製造業に与える影響を考察します。

  1. 視覚基盤モデルの重要性
    1. 外界を認識し、行動する上で「見る」ことの重要性
    2. 深層学習の深化:物体検出、領域分割など視覚タスクの広がり
    3. タスクごとのモデルから基盤モデルへの進化
    4. 自動運転、ロボット、製造業における応用
  2. 自己教師あり学習
    1. 自己教師あり学習 (Self-supervised Learning) の意義
    2. 自己教師あり学習手法 (対比学習: Contrastive Learning)
    3. マスク画像モデリング (Masked Auto-encoder)
    4. 自然言語処理分野での成功 (BERT、GPT) の波及
  3. Transformerのインパクトとマルチモーダル学習
    1. 画像分野におけるTransformer のインパクト
    2. マルチモーダル学習:画像とテキストの融合 (CLIP)
    3. 視覚言語モデル (Vision Language Model) における言語の役割
    4. 外観検査への視覚言語モデルの応用:汎用外観検査
    5. 集約型視覚基盤モデル
      • AM-RADIO [CVPR2024]
      • RADIO-v2 [CVPR2025]
  4. 三次元 (3D) 世界への拡張:3D表現学習
    1. 二次元 (2D) 視覚からの発展:なぜ3D理解が重要なのか?
    2. 三次元表現手法 (その1) :Neural Radiance Fields (NeRFs)
    3. 三次元表現手法 (その2) :3D Gaussian Splatting
    4. スチューデントt分布の適用:3D Student Splatting and Scooping [CVPR2025]
    5. VGGT:Visual Geometry Grounded Transformer [CVPR2025]
    6. CADとの連携:CADTalk [CVPR2024]、CADDreamer[CVPR2025]
  5. 行動理解とロボティクスへの視覚基盤モデルの応用
    1. 動画像からの人間動作理解:視覚の役割深化
    2. マークと軌跡の利用
      • Set-of-Mark:SoM
      • Trace-of-Mark:ToM
    3. Magma: A Foundation Model for Multimodal AI Agents [CVPR 2025]
    4. ロボットシミュレーションにおけるVLA (Vision-Language-Action) モデル
    5. 言語による汎化性+推論による行動計画・実行の進化
    6. UI ナビゲーションから点検作業支援/安全管理への発展の可能性

講師

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 47,000円 (税別) / 51,700円 (税込)
1口
: 60,000円 (税別) / 66,000円 (税込) (3名まで受講可)

ライブ配信セミナーについて

  • 本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
  • お申し込み前に、 視聴環境テストミーティングへの参加手順 をご確認いただき、 テストミーティング にて動作確認をお願いいたします。
  • 開催日前に、接続先URL、ミーティングID​、パスワードを別途ご連絡いたします。
  • セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
  • ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
  • タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
  • ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
  • 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
  • Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
    万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2025/11/14 深層学習を用いた少ないデータへの対処と精度向上のポイント オンライン
2025/11/17 マテリアルズ・インフォマティクス入門 オンライン
2025/11/17 リザバーコンピューティングの基礎と研究動向、社会実装に向けた技術課題と応用展開 オンライン
2025/11/18 スモールデータ解析の方法と実問題解決への応用 オンライン
2025/11/18 ベイズモデリングによる機械学習の理解と実践 オンライン
2025/11/19 不具合対応未然防止に繋がる設計品質向上とお手軽フロントローディング導入について オンライン
2025/11/20 強化学習の基礎・発展と機械・ロボット制御への応用 オンライン
2025/11/25 AIモデルのコンパクト化技術とその動向 オンライン
2025/11/25 外観検査を自動化する知識と技術 オンライン
2025/11/26 0からのAIエージェントとデータ分析 オンライン
2025/11/27 機械学習・強化学習によるロボットの運動制御と運動・動作計画・認識・学習への応用とそのポイント オンライン
2025/11/27 0からのAIエージェントとデータ分析 オンライン
2025/11/27 Creo Parametric 3DA オンライン
2025/11/28 Pythonと生成AIによるデータ分析入門 オンライン
2025/11/28 ベイズモデリングによる機械学習の理解と実践 オンライン
2025/12/3 点群レジストレーションとオブジェクト認識 オンライン
2025/12/4 自動運転を支えるセンサフュージョンの最前線 : LiDARが拓く未来 オンライン
2025/12/4 AIモデルのコンパクト化技術とその動向 オンライン
2025/12/5 スモールデータ解析の方法と実問題解決への応用 オンライン
2025/12/5 少ないデータでも使える機械学習・異常検知の基礎とインフラ・製造分野への応用 オンライン

関連する出版物

発行年月
2025/6/30 皮膚の測定評価と可視化、イメージング技術
2025/6/23 防犯・監視カメラ〔2025年版〕 技術開発実態分析調査報告書 (CD-ROM版)
2025/6/23 防犯・監視カメラ〔2025年版〕 技術開発実態分析調査報告書 (書籍版)
2024/10/31 少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2024/10/31 自然言語処理の導入と活用事例
2024/4/8 画像認識技術・システム 技術開発実態分析調査報告書
2024/4/8 画像認識技術・システム 技術開発実態分析調査報告書 (CD-ROM版)
2023/6/30 生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31 機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25 AIプロセッサー (CD-ROM版)
2021/10/25 AIプロセッサー
2021/7/30 マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14 AIビジネスのブレークスルーと規制強化
2021/6/30 人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28 AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31 生体情報センシングと人の状態推定への応用
2020/4/30 生体情報計測による感情の可視化技術
2020/3/26 ビッグデータ・AIの利活用に伴う法的留意点
2019/1/31 センサフュージョン技術の開発と応用事例