技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

HLAC特徴を用いた学習型汎用認識

画像認識の基礎と応用

HLAC特徴を用いた学習型汎用認識

ご案内

 本書は、画像認識の基礎と応用、特にHLAC特徴を用いた学習型汎用認識方式とその応用を纏めたものである。 認識(一般に情報)システムの構成法においては、特に理論的なアプローチと数理的な手法が重要かつ有効である。その基礎となるのが、画像などの多変量データを解析するための手法である多変量解析手法であり、また確率統計的手法である。そして、それらの更に基礎となるが、線形代数である。この観点から、著者はこれまでパターン認識の理論、特に特徴抽出理論の研究を行なってきた。そして、その実践的な応用として、多変量解析手法の画像処理及び認識への応用、更にHLAC 特徴と多変量解析手法を組み合わせた学習型汎用認識方式を提案し、画像認識や動画像認識などへの多様な応用展開を行なってきた。
 これらの研究成果を纏めて、併任先の東京大学機械情報工学科および同大学院知能機械情報学専攻において「パターン情報学」と「知能情報学」の講義を行なってきた。また、それらを1 日ないし2 日のチュートリアル形式に短縮して、トリケプスのセミナー講演等を行なってきた。本書は、それらの内容に加筆補充して本の形に纏めたものである。その意味で、本書は画像認識に関する種々の手法を広く紹介したいわゆる教科書ではない。基礎から応用まで、言わば根から幹、枝葉まで、著者のこれまでの研究を通しての思想を一本の木として筋を通し、特に画像認識の側面を概説したものである。これによって、読者は、画像認識の基本的な枠組や基礎、及び一般的で汎用的な手法を習得して、それぞれの応用課題に展開応用していただきたい。
 HLAC 特徴を用いた学習型汎用認識方式の提案自体は、約35 年前(1978 年)と古く、注目特許や学会の賞も受賞していたが、1980 年代後半から世の中はニューラルネットワークのブームとなり、また著者も国のRWCプロジェクトで忙しく、その後注目されずにいた。近年になって、併任先の大学での学生指導テーマとして再展開し、成果発表が学会の多くの賞に繋がったこともあって、再認識されるようになった。
 画像認識(視覚システム) への期待は、近年、益々大きくなっている。防犯分野での監視カメラ、生産分野での製品の外観検査、医療分野での各種の画像解析や組織検査など、多岐の分野にわたっている。これらのニーズに呼応して、画像認識の研究が国際的にも
盛んに行われていて、様々な手法が提案されている。本書が、これらの基礎からの理解として、画像処理や画像認識分野で研究及び開発に活躍される読者、またその分野を志す若い学生の読者にとって参考になれば幸いである。
 本書全体の構成は、大きくは基礎編と応用編から成っていて、以下の通りである。
 序論(1 章)では、画像認識の諸側面と、ニーズ(応用分野)及びシーズ(方法論)について概観する。
 基礎編では、まず、画像処理及び画像認識の一般的な枠組と基礎的な事項について述べ(2 章)、基礎としての多変量解析手法(3 章)、更に画像認識を含むパターン認識の一般的な枠組と特徴抽出の理論について概説する(4 章)。特に幾何学側面としての不変特徴抽出と統計的側面としての判別特徴抽出の2 段階からなる特徴抽出が重要であることを示して、それぞれの理論と手法を解説する。そして最後に、これらの理論の実践として提案した、高次局所自己相関(HLAC/CHLAC) 特徴と多変量解析手法を組み合わせた「適応学習型汎用認識システム(ARGUS)」の構成方式について説明する(5 章)。
 応用編では、まず、画像処理・認識への多変量解析手法の直接的な応用事例について紹介し(6 章)、続いて、適応学習型汎用認識システム(ARGUS) の具体的な応用として、HLAC 特徴を用いた画像認識(7 章)、CHLAC 特徴を用いた動画像認識(8 章)、更に、対応関係の学習と検索(9 章)、時系列データの解析と認識(10 章)への応用事例をできるだけ数多く紹介する。
 画像認識の基礎としての多変量解析やパターン認識の、更に基礎となる線形代数や確率統計については、必要最小限の知識を簡潔に纏め付録とした。参考にしていただきたい。
 なお、本書での手法の多くは、(独立行政法人)産業技術総合研究所の知財(特許やソフトウェア)となっている。利用については知財部に照会されたい。

目次

第1章 序論:画像認識

  • 1.1 画像認識とは
  • 1.2 応用分野の概観(ニーズ)
  • 1.3 従来手法の概観(シーズ)

第I部 基礎編

第2章 画像処理・画像認識の基礎

  • 2.1 一般的枠組
    • 2.1.1 表現方式
    • 2.1.2 処理方式
  • 2.2 具体的な基礎
    • 2.2.1 画像の表現
    • 2.2.2 前処理
    • 2.2.3 特徴抽出
  • 2.3 数理的な基礎

第3章 基礎としての多変量解析手法

  • 3.1 多変量データの種類
  • 3.2 基礎としての線形代数
  • 3.3 確率統計の初歩的な基礎
  • 3.4 各種手法
    • 3.4.1 主成分分析(PCA)
    • 3.4.2 因子分析(FA)
    • 3.4.3 重回帰分析(MRA)
    • 3.4.4 自己回帰分析(ARA)
    • 3.4.5 判別分析(DA)
    • 3.4.6 正準相関分析(CCA)
    • 3.4.7 数量化手法(I~IV類)

第4章 基礎としてのパターン認識

  • 4.1 一般的枠組
  • 4.2 特徴抽出(幾何学的側面と統計的側面)
    • 4.2.1 不変特徴抽出(幾何学的側面)
    • 4.2.2 判別特徴抽出(統計的側面)
  • 4.3 不変特徴抽出の理論
    • 4.3.1 定式化
    • 4.3.2 不変線形特徴抽出
    • 4.3.3 絶対不変非線形特徴の構成
    • 4.3.4 変換の認識
  • 4.4 不変特徴抽出理論の応用例
    • 4.4.1 ボケ不変特徴の輪郭抽出への応用
    • 4.4.2 動き不変特徴による移動物体認識
    • 4.4.3 3D加速度センサ信号からの回転不変な動きの特徴抽出
  • 4.5 類別・識別・判別の統計的理論と手法
    • 4.5.1 情報圧縮手法(U&N)
    • 4.5.2 類別の理論と手法(U)
    • 4.5.3 識別の理論と手法(S)
    • 4.5.4 判別の理論と手法(S)

第5章 高次局所自己相関を用いた学習型汎用認識方式

  • 5.1 画像の幾何学的特徴としての高次局所自己相関HLAC
    • 5.1.2 多重スケール
    • 5.1.2 多重解像度
  • 5.2 HLACの拡張としての立体高次局所自己相関CHLAC
  • 5.3 ノイズに対する頑健性
  • 5.4 統計的特徴抽出としての多変量解析
    • 5.4.1 通常からの逸脱としての異常検出
  • 5.5 本方式(ARGUS)の特長と汎用性
    • 5.5.1 多様な入力データ(パターン)
    • 5.5.2 従来方式との比較

第II部 応用編

第6章 多変量解析手法の応用

  • 6.1 画像圧縮(SVD)
    • 6.1.1 定式化
    • 6.1.2 多変量解析的な意味づけ
    • 6.1.3 画像圧縮への応用
  • 6.2 自動閾値選定(DA)
    • 6.2.1 判別基準に基づく画像の2値化
    • 6.2.2 最小二乗基準
    • 6.2.3 同値性
    • 6.2.4 実験結果
    • 6.2.5 その他の解析
    • 6.2.6 最適閾値の性質
    • 6.2.7 多値化への拡張
    • 6.2.8 多値化の応用
    • 6.2.9 クラス数の推定
  • 6.3 直線の当てはめ(PCA)
    • 6.3.1 K-L Line Fitting
    • 6.3.2 直線度
  • 6.4 学習型画像処理(MRA)
    • 6.4.1 画像処理の学習
    • 6.4.2 画像修復(逆フィルタ)の学習
  • 6.5 形(輪郭)の認識(CARM)
    • 6.5.1 複素自己回帰モデル(CARM)
    • 6.5.2 相似変換不変な形の分類

第7章 HLAC特徴を用いた画像認識

  • 7.1 複数対象の同時認識と計数
    • 7.1.1 既知対象に基づく計数
    • 7.1.2 大小2種類の粒子の同時計数
    • 7.1.3 背景のある環境下での計数
  • 7.2 位相的特徴の認識と計数
  • 7.3 顔認識と表情認識
    • 7.3.1 顔認識
    • 7.3.2 表情認識
    • 7.3.3 照明変化に頑健な物体認識
  • 7.4 テクスチャ認識
  • 7.5 異常検出の応用:外観検査、癌細胞検出
    • 7.5.1 外観検査
    • 7.5.2 癌細胞検出
  • 7.6 移動体追跡
  • 7.7 距離画像からの物体認識

第8章 CHLAC特徴を用いた動画像認識

  • 8.1 ジェスチャ認識
  • 8.2 動作及び人の認識
    • 8.2.1 CHLAC特徴を用いた動作と人の認識
    • 8.2.2 Gait(歩容)認識
    • 8.2.3 PCクラスタを用いた高精度化
  • 8.3 異常検出の応用
    • 8.3.1 撮像監視(監視カメラ)への応用
    • 8.3.2 牛の発情検知への応用
    • 8.3.3 動画図の適応的圧縮
    • 8.3.4 外科手術撮像への応用
  • 8.4 複数移動物体の同時認識と計数
  • 8.5 スポーツ撮像解析
    • 8.5.1 特定動作の検出
    • 8.5.2 児童の体育評価への応用
  • 8.6 牛肉等級(BMS)の自動判定
  • 8.7 細胞動画像の認識

第9章 対応関係の学習と検索

  • 9.1 感性情報処理への応用
    • 9.1.1 絵画の印象検索
    • 9.1.2 家紋の印象検索
  • 9.2 画像検索とアノテーション
  • 9.3 インターモーダル学習
  • 9.4 類似対応部分の検出

第10章 時系列データ解析・認識への応用

  • 10.1 心電図からの異常検出
  • 10.2 ロボット多指ハンドの解析
  • 10.3 因果関係の解析

付録A 数学的基礎 A.1 線形代数の基礎 A.2 確率統計の基礎 参考文献

執筆者

大津 展之

独立行政法人 産業技術総合研究所

フェロー

出版社

お支払い方法、返品の可否は、必ず注文前にご確認をお願いいたします。

お問い合わせ

本出版物に関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(出版社への直接のお問い合わせはご遠慮くださいませ。)

体裁・ページ数

B5判 並製本 178ページ

発行年月

2013年8月

販売元

tech-seminar.jp

価格

49,800円 (税別) / 54,780円 (税込)

関連する出版物

発行年月
2020/7/31 生体情報センシングと人の状態推定への応用
2020/4/30 生体情報計測による感情の可視化技術
2019/1/31 センサフュージョン技術の開発と応用事例
2016/1/20 画像ワーピング技術とその応用
2015/8/17 防犯・監視カメラ〔2015年版〕 技術開発実態分析調査報告書
2015/8/17 防犯・監視カメラ〔2015年版〕 技術開発実態分析調査報告書 (CD-ROM版)
2014/3/7 画像処理・画像符号化・画像評価法
2013/10/29 高効率動画像符号化方式:H.265/HEVC (High Efficiency Video Coding)
2013/6/21 機械学習によるパターン識別と画像認識への応用
2013/6/1 画像診断機器(磁気共鳴) 技術開発実態分析調査報告書 (CD-ROM版)
2013/6/1 画像診断機器(磁気共鳴) 技術開発実態分析調査報告書
2013/3/29 3次元物体認識手法とその応用 (カラー版)
2012/10/25 電子写真装置の定着技術 技術開発実態分析調査報告書 (CD-ROM版)
2012/10/25 電子写真装置の定着技術 技術開発実態分析調査報告書
2012/6/20 画像復元・超解像技術の基礎と応用
2012/4/20 デジカメ主要8社の静止画信号処理技術 技術開発実態分析調査報告書 (CD-ROM版)
2012/4/20 デジカメ主要8社の静止画信号処理技術 技術開発実態分析調査報告書
2011/2/4 入門 画質改善・画像復元・超解像技術
2010/11/15 防犯・監視カメラ 技術開発実態分析調査報告書
2010/11/10 高ダイナミックレンジ画像処理技術とMATLABシミュレーション