技術者のための視覚基盤モデル入門 (2025年9月9日開催) - セミナー・研修

技術者のための視覚基盤モデル入門

～2015年からの進化と未来～

オンライン開催

開催日

2025年9月9日(火) 13時00分～ 17時00分

プログラム

　本セミナーでは、視覚基盤モデル (Vision Foundation Model) を技術者向けに解説します。この技術は視覚言語モデル (VLM) 、視覚言語行動モデル (VLA) へと発展し、実世界との接点としてPhysical AI (Embodied AI) への適用が注目されています。そこで視覚基盤モデルの技術を解説し、工学分野・製造業に与える影響を考察します。

視覚基盤モデルの重要性
1. 外界を認識し、行動する上で「見る」ことの重要性
2. 深層学習の深化:物体検出、領域分割など視覚タスクの広がり
3. タスクごとのモデルから基盤モデルへの進化
4. 自動運転、ロボット、製造業における応用
自己教師あり学習
1. 自己教師あり学習 (Self-supervised Learning) の意義
2. 自己教師あり学習手法 (対比学習: Contrastive Learning)
3. マスク画像モデリング (Masked Auto-encoder)
4. 自然言語処理分野での成功 (BERT、GPT) の波及
Transformerのインパクトとマルチモーダル学習
1. 画像分野におけるTransformer のインパクト
2. マルチモーダル学習:画像とテキストの融合 (CLIP)
3. 視覚言語モデル (Vision Language Model) における言語の役割
4. 外観検査への視覚言語モデルの応用:汎用外観検査
5. 集約型視覚基盤モデル
  - AM-RADIO [CVPR2024]
  - RADIO-v2 [CVPR2025]
三次元 (3D) 世界への拡張:3D表現学習
1. 二次元 (2D) 視覚からの発展:なぜ3D理解が重要なのか?
2. 三次元表現手法 (その1) :Neural Radiance Fields (NeRFs)
3. 三次元表現手法 (その2) :3D Gaussian Splatting
4. スチューデントt分布の適用:3D Student Splatting and Scooping [CVPR2025]
5. VGGT:Visual Geometry Grounded Transformer [CVPR2025]
6. CADとの連携:CADTalk [CVPR2024]、CADDreamer[CVPR2025]
行動理解とロボティクスへの視覚基盤モデルの応用
1. 動画像からの人間動作理解:視覚の役割深化
2. マークと軌跡の利用
  - Set-of-Mark:SoM
  - Trace-of-Mark:ToM
3. Magma: A Foundation Model for Multimodal AI Agents [CVPR 2025]
4. ロボットシミュレーションにおけるVLA (Vision-Language-Action) モデル
5. 言語による汎化性+推論による行動計画・実行の進化
6. UI ナビゲーションから点検作業支援/安全管理への発展の可能性

ページのトップヘ

講師

速水悟氏
早稲田大学研究院

教授

ページのトップヘ

主催

株式会社トリケップス

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様

: 47,000円 (税別) / 51,700円 (税込)

1口

: 60,000円 (税別) / 66,000円 (税込) (3名まで受講可)

ライブ配信セミナーについて

本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
お申し込み前に、視聴環境とテストミーティングへの参加手順をご確認いただき、テストミーティングにて動作確認をお願いいたします。
開催日前に、接続先URL、ミーティングID、パスワードを別途ご連絡いたします。
セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。

本セミナーは終了いたしました。

セミナーの再開催を依頼する

ページのトップヘ

ページ内で移動

これから開催される関連セミナー

開始日時		開催方法
2025/11/18	スモールデータ解析の方法と実問題解決への応用	オンライン
2025/11/19	不具合対応未然防止に繋がる設計品質向上とお手軽フロントローディング導入について	オンライン
2025/11/20	強化学習の基礎・発展と機械・ロボット制御への応用	オンライン
2025/11/25	AIモデルのコンパクト化技術とその動向	オンライン
2025/11/25	外観検査を自動化する知識と技術	オンライン
2025/11/26	0からのAIエージェントとデータ分析	オンライン
2025/11/27	機械学習・強化学習によるロボットの運動制御と運動・動作計画・認識・学習への応用とそのポイント	オンライン
2025/11/27	0からのAIエージェントとデータ分析	オンライン
2025/11/27	Creo Parametric 3DA	オンライン
2025/11/28	Pythonと生成AIによるデータ分析入門	オンライン
2025/12/3	点群レジストレーションとオブジェクト認識	オンライン
2025/12/4	自動運転を支えるセンサフュージョンの最前線 : LiDARが拓く未来	オンライン
2025/12/4	AIモデルのコンパクト化技術とその動向	オンライン
2025/12/5	スモールデータ解析の方法と実問題解決への応用	オンライン
2025/12/5	少ないデータでも使える機械学習・異常検知の基礎とインフラ・製造分野への応用	オンライン
2025/12/8	少ないデータでも使える機械学習・異常検知の基礎とインフラ・製造分野への応用	オンライン
2025/12/9	カルマンフィルタの実践	オンライン
2025/12/10	「設計標準化」で効率的に業務改善を進める	オンライン
2025/12/10	AI特許調査ツールの選定基準と導入、運用のポイント	オンライン
2025/12/11	AI特許調査ツールの選定基準と導入、運用のポイント	オンライン

発行年月
2018/5/31	“人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2016/1/20	画像ワーピング技術とその応用
2015/8/17	防犯・監視カメラ〔2015年版〕技術開発実態分析調査報告書
2015/8/17	防犯・監視カメラ〔2015年版〕技術開発実態分析調査報告書 (CD-ROM版)
2014/3/7	画像処理・画像符号化・画像評価法
2013/10/29	高効率動画像符号化方式:H.265/HEVC (High Efficiency Video Coding)
2013/8/2	HLAC特徴を用いた学習型汎用認識
2013/6/21	機械学習によるパターン識別と画像認識への応用
2013/6/1	画像診断機器(磁気共鳴) 技術開発実態分析調査報告書 (CD-ROM版)
2013/6/1	画像診断機器(磁気共鳴) 技術開発実態分析調査報告書
2013/3/29	3次元物体認識手法とその応用 (カラー版)
2012/10/25	電子写真装置の定着技術技術開発実態分析調査報告書 (CD-ROM版)
2012/10/25	電子写真装置の定着技術技術開発実態分析調査報告書
2012/6/20	画像復元・超解像技術の基礎と応用
2012/4/20	デジカメ主要8社の静止画信号処理技術技術開発実態分析調査報告書 (CD-ROM版)
2012/4/20	デジカメ主要8社の静止画信号処理技術技術開発実態分析調査報告書
2011/2/4	入門画質改善・画像復元・超解像技術
2010/11/15	防犯・監視カメラ技術開発実態分析調査報告書
2010/11/10	高ダイナミックレンジ画像処理技術とMATLABシミュレーション
2010/9/24	JPEG XR画像符号化方式と性能評価

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ

技術者のための視覚基盤モデル入門

技術者のための視覚基盤モデル入門

開催日

プログラム

講師

主催

お問い合わせ

受講料

ライブ配信セミナーについて

ページ内で移動

これから開催される関連セミナー

関連する出版物