画像の構造情報を用いた系統的符号化と処理生成に関する研究研究
氏名 堀田 裕弘
学位の種類 博士(工学)
学位記番号 博乙第31号
学位授与の日付 平成5年9月22日
学位論文の題目 画像の構造情報を用いた系統的符号化と処理生成に関する研究
論文審査委員
主査 教授 荻原 春生
副査 教授 袖山 忠一
副査 教授 神林 紀嘉
副査 教授 吉川 敏則
副査 法政大学 教授 大竹 孝平
副査 北陸先端科学技術大学院大学 教授 宮原 誠
[平成5(1993)年度博士論文題名一覧] [博士論文題名一覧]に戻る.
目次
第1章 序論
1.1 研究の背景 p.1
1.2 研究の目的と概要 p.4
第2章 画像の構造解析・記述
2.1 まえがき p.7
2.2 構造解析・記述の必要性 p.8
2.3 構造解析・記述の手順 p.10
2.4 構造解析・記述の利用形態 p.12
2.4.1 画像処理
2.4.2 画像生成
2.4.3 画像符号化
2.4.4 画像検索
2.5 画像符号化との関連性 p.15
2.5.1 系統的画像符号化との関連性
2.5.2 画像モデルとの関係
2.5.3 各種冗長度との関連
第3章 系統的な波形符号化とその品質評価
3.1 まえがき p.21
3.2 系統的な波形符号化 p.22
3.2.1 ゾーン直交変換符号化
3.2.2 人間の視覚特性を考慮した直交変換符号化
3.2.3 輪郭適応型直交変換符号化
3.2.4 符号化方式の評価結果
3.3 画質評価 p.41
3.3.1 客観的画質評価尺度(PQS)
3.3.2 PQSによる評価結果
3.4 画質評価尺度に基づく系統的波形符号化 p.44
3.4.1 符号化アルゴリズム
3.4.2 PQSに基づく量子化特性
3.4.3 PQS-伝送レート特性
3.5 むすび p.48
第4章 画像の領域分割
4.1 まえがき p.50
4.2 領域分割の種類 p.51
4.2.1 実空間における領域分割
4.2.2 特徴空間における領域分割
4.3 マンセル表色系(色空間)の特徴 p.53
4.3.1 混色系と顕色系
4.3.2 マンセル知覚色空間
4.3.3 色差
4.3.4 色名
4.4 領域分割処理 p.61
4.4.1 雑音除去フィルタ処理
4.4.2 K平均クラスタリング法
4.5 領域統合処理組 p.65
4.5.1 モードフィルタ
4.5.2 ラベリング処理
4.5.3 グローバルな特徴に基づく領域統合
4.5.4 ローカルな特徴に基づく領域統合
4.5.5 領域の色相差を用いた領域統合
4.6 結果 p.71
4.6.1 領域分割処理の結果
4.6.2 領域統合処理の結果
4.7 むすび p.80
第5章 構造情報を用いた系統的な領域分割符号化
5.1 まえがき p.82
5.2 系統的な領域分割符号化の考え方 p.83
5.2.1 系統的画像符号化の立場
5.2.2 カラーの色再現の立場
5.3 色彩情報の局所的特徴の解析 p.86
5.3.1 マンセル色空間の統計的性質
5.3.2 HVCデータの領域内特徴
5.4 領域分割符号化 p.95
5.4.1 記憶色を用いた色相情報の粗量子化
5.4.2 彩度情報の近似性能評価
5.4.3 明度情報が彩度情報の符号化効率に与える影響
5.4.4 領域の形状情報の符号化
5.5 符号化結果 p.108
5.6 画質評価 p.115
5.6.1 "好ましい"色再現の主観評価実験
5.6.2 評価実験結果の検討
5.7 画質評価尺度に基づく系統的な領域分割符号化 p.120
5.8 むすび p.122
付録A 記憶色
付録B 再生画像
第6章 領域分割の画像処理への応用
6.1 まえがき p.128
6.2 特定領域の色彩変更 p.129
6.2.1 線形変換を用いた色彩変更
6.2.2 許容色差を用いた色彩調整
6.2.3 透過率を用いたエッジ調整
6.3 結果 p.134
6.4 むすび p.137
第7章 領域分割の応用における新しい展望
7.1 まえがき p.138
7.2 今後期待される領域分割の新しい展望 p.139
7.2.1 高度な画像検索への応用
7.2.2 3次元物体認識
7.2.3 画像処理・生成
7.2.4 動画像処理
7.2.5 感性情報処理
7.3 むすび p.147
第8章 結言 p.148
謝辞
参考文献 p.154
筆者発表論文一覧
社会の革新的変化をもたらすと考えられているマルチメディア時代の中心的役割である画像通信、コンピュータビジョンやCGは相乗効果により革新的発展が期待できるが、そのためには画像を構造的に記述する技術が必要である。
本論文は、従来の波形符号化や画像を構成する対象物より得られる構造情報に基づく特徴抽出(領域分割)符号化を情報理論的な情報圧縮とパターン認識・理解的な構造情報の記述表現の両方向から捉え、人間に取って代わる画像品質評価尺度に基づいた系統的な符号化方式を開発する事や、領域分割処理により得られた構造情報を画像処理・生成に応用する事について論じている。本論文は8章から構成されている。
まず、第2章では、画像情報の柔軟で高度な処理・通信・生成を実現するために必要である、構造解析・記述の必要性、手順、利用形態について論じている。さらに、画像情報の構造解析・記述と系統的な画像符号化との関連性について述べている。
第3章では、画像情報の構造記述の基礎である波形符化に於いて、人間の画質評価を代用する客観的画質評価尺度に基づいた系統的画像符号化について論じている。まず、直交変換(波形)符号化を基本として、統計量だけでなく人間の視覚系や直交変換特有の非定常性を考慮した符号化の一例を示している。人間の視覚系の情報処理過程や直交変換特有の特徴を積極的に符号化に応用することにより、従来の統計量のみで構成された符号化法と比較して、再生画像品質がかなり改善できることを主観評価実験で確認している。次に、人間の視覚特性を考慮した客観的画質評価尺度(PQS)について説明し、これを用いた系統的波形符号化の成功例として直交変換符号化の構成例を示している。
第4章では、画像情報から構造情報を抽出するための基本となる修正マンセル表色系(色空間)の特徴、さらには、この空間で定義されている色差や人間が理解しやすい色名との対応関係について説明している。さらに、画像情報から特徴量を抽出して構造情報を解析・記述するための基盤技術であるカラー画像の領域分割法について詳細に論じている。修正マンセル表色系の特徴を利用して、色空間クラスタリング+色差に基づく3段階領域統合処理による新しい領域分割法を提案している。この領域分割法を数枚の標準画像(人間の上半身サイズが異なる画像)に適用して、背景や人物像等の主要な対象物を完全に分離できること、さらには、顔の特徴部分である目、口やまゆ等の人間の表情を表す部位が精度良く抽出できることを述べている。
第5章では、前4章で得られた領域分割結果の系統的な画像符号化への応用として、前3章で述べた従来の波形符号化よりも高度な領域分割(特徴抽出)符号化について論じている。この領域分割符号化は、波形符号化の様に画像信号を波形として捉え、これを受信側で忠実に再現する符号化ではなく、画像を構成する対象物体の領域毎に最適な符号化を行い、人間にとって"好ましい"色再現を行うことを目的とした次世代の符号化である。領域分割された物体内部の色相情報はほぼ一定値であるという新しい見知を利用して、領域内部は人間の肌色記憶色を量子化代表点とする粗量子化を行い、領域の形状情報は差分チェイン符号化を行っている。また、明度情報は、領域分割結果を用いず従来の波形符号化を用いている。誤った領域分割の結果を符号化に用いることは、明度情報の符号化効率を著しく低下させ、かつ、再生画像品質に著しく影響するためである。さらに、領域内の明度情報と彩度情報には強い相関性や高い近似能力があることにより、彩度情報は局部復号化された明度情報の2次多項式近似で表現し、その係数のみを符号化伝送する方式を考案している。この符号化は、伝送レートが1.0[bit/pixel]程度で満足のいく再生画像が得られている。また、伝送レートがほぼ等しい場合、従来の波形符号化(JPEG方式)よりも、より"好ましい"色再現が行なえることを主観評価実験により実証している。
第6章では、前5章後半の結論を受けて、領域分割の画像処理/生成の応用として、抽出された対象物体の色彩情報を自由に調整・変更できる色彩変更法について論じている。調整変更したい特定領域の新しい色を、色名で指定することにより、周囲との整合性のよい違和感のない色調整が可能となることを示している。
第7章では、前2章でまとめた画像情報を構造解析・記述した場合の他方面の応用についての将来展望について述べている。本論文で示した領域分割の基盤技術をベースとして、画像の本来持つ構造情報を積極的に利用することにより、高度な画像検索、物体認識、画像処理生成や動画像処理への応用が可能であることを述べている。
第8章では、本論文で得られた成果と今後の課題について述べている。