本文ここから

複数マイクロホンを用いた自動話者追従収音に関する研究

氏名 小林 和則
学位の種類 博士(工学)
学位記番号 博乙第202号
学位授与の日付 平成15年6月18日
学位論文題目 複数マイクロホンを用いた自動話者追従収音に関する研究
論文審査委員
 主査 教授 島田 正治
 副査 教授 神林 紀嘉
 副査 教授 荻原 春生
 副査 教授 吉川 敏則
 副査 東京電機大学 工学部 教授 金田 豊

平成15(2003)年度博士論文題名一覧] [博士論文題名一覧]に戻る.

目次
第一章 序論 p.1
1.1 序言 p.1
1.2 研究の背景 p.3
 1.2.1 現状の収音システム p.3
 1.2.2 マイクロホンアレイ技術を適用した収音システム p.4
1.3 従来技術 p.5
 1.3.1 従来の話者位置推定技術 p.6
 1.3.2 従来の指向性形成技術 p.9
 1.3.3 従来のハウリング防止技術 p.12
1.4 本研究の考え方 p.14
 1.4.1 研究の目的と着眼点 p.14
 1.4.2 研究方針と本論文の構成 p.16

第2章 同期乗算法による話者位置推定 p.19
2.1 まえがき p.19
2.2 提案する同期乗算法による話者位置推定 p.20
 2.2.1 話者位置推定前の準備 p.22
 2.2.2 出力Ypq(n)特性 p.23
 2.2.3 出力Ypq(n)のピーク検出 p.26
 2.2.4 選択マイク数が4である理由 p.27
 2.2.5 マイクロホン選択をサンプルごとに変化させる効果 p.27
2.3 話者の外側にマイクロホンを配置した場合 p.29
 2.3.1 計算機シミュレーション p.30
 2.3.2 条件 p.30
 2.3.3 計算機シミュレーション結果 p.30
 2.3.4 実音場実験 p.34
 2.3.5 実験システム p.34
 2.3.6 実験条件 p.36
 2.3.7 実験結果 p.36
 2.3.8 遅延和法による話者位置推定との比較 p.47
 2.3.9 話者の外側にマイクロホンを配置した場合のまとめ p.48
2.4 話者の内側にマイクロホンを配置した場合 p.50
 2.4.1 問題点 p.50
 2.4.2 新たなマイクロホン選択方法 p.50
 2.4.3 選択マイクロホン広がり度Λによるマイクロホン選択 p.52
 2.4.4 選択マイクロホン広がり度Λの求め方 p.52
 2.4.5 実験 p.55
 2.4.6 実験条件 p.56
 2.4.7 実験結果 p.56
 2.4.8 話者の内側にマイクロホンを配置した場合のまとめ p.61
2.5 まとめ p.64

第3章 マイクロホン位置と音源意図が未知な場合の位置推定 p.65
3.1 まえがき p.65
3.2 従来の話者位置推定方法 p.65
3.3 提案する話者位置推定方法 p.67
 3.3.1 マイクロホン間到来時間差推定 p.68
 3.3.2 推定条件判定 p.68
 3.3.3 マイクロホン位置・話者位置推定アルゴリズム p.70
3.4 計算機シミュレーション p.71
 3.4.1 計算機シミュレーション方法 p.72
 3.4.2 マイクロホン数と話者数に対する話者位置推定誤差 p.72
 3.4.3 マイクロホン間到来時間差の誤差の影響 p.72
3.5 実音場実験 p.77
 3.5.1 実験方法 p.78
 3.5.2 話者位置とマイクロホン位置の推定性能 p.78
3.6 まとめ p.81

第4章 近接音場型Filter-and-Sumマイクロホンアレイによる指向性形成 p.82
4.1 まえがき p.82
4.2 従来方法(近接音場型遅延和アレイ) p.83
 4.2.1 近接音場型遅延和アレイ出力のSN比 p.83
 4.2.2 近接音場型遅延和アレイ出力の劣化 p.85
4.3 提案する近接音場型Filter-and-Sumアレイ p.85
 4.3.1 評価関数の導出 p.86
 4.3.2 評価関数を最小化するフィルタの求め方 p.87
4.4 計算機シミュレーション p.89
 4.4.1 計算機シミュレーション方法 p.89
 4.4.2 計算機シミュレーション結果 p.90
4.5 実音場実験 p.94
 4.5.1 実験方法 p.94
 4.5.2 実験結果 p.94
4.6 まとめ p.96

第5章 複数仮想音源を用いた適応型マイクロホンアレイによる指向性形成 p.98
5.1 まえがき p.98
5.2 従来の適応型アレイ p.99
5.3 複数仮想音源を用いた適応型アレイ p.100
 5.3.1 仮想目的音生成部 p.102
 5.3.2 フィルタ更新部 p.102
 5.3.3 出力フィルタ部 p.104
5.4 複数仮想音源を用いた適応型アレイの理論解析 p.106
 5.4.1 インパルス応答より求められる理論的最適解 p.106
 5.4.2 適応フィルタの収束解 p.107
 5.4.3 適応フィルタの収束特性 p.108
5.5 計算機シミュレーション p.111
 5.5.1 シミュレーション条件 p.111
 5.5.2 収束特性 p.112
 5.5.3 仮想目的音源間隔の影響 p.114
 5.5.4 提案法AMA-MFSと従来法の比較 p.117
5.6 まとめ p.119

第6章 ハウリング抑圧マイクロホンアレイによる指向性形成 p.121
6.1 まえがき p.121
6.2 従来のハウリング抑圧方法 p.122
6.3 ハウリング抑圧マイクロホンアレイ p.122
 6.3.1 目的音除去 p.123
 6.3.2 仮想目的音生成 p.126
 6.3.3 適応フィルタ p.127
 6.3.4 出力フィルタ p.128
6.4 理論解析 p.128
 6.4.1 理論的最適解 p.128
 6.4.2 提案法の適応フィルタの収束解 p.130
6.5 計算機シミュレーション p.132
 6.5.1 シミュレーション条件 p.132
 6.5.2 残響がなく,目的音源が白色雑音の場合 p.132
 6.5.3 残響があり,目的音源が音声の場合 p.138
6.6 まとめ p.138

第7章 結論 p.139
付録A 話者位置検出率Pcorの求め方 p.142
付録B スピーカ,人,マイクロホンの指向特性 p.144
付録C 複数仮想音源を用いた適応型マイクロホンアレイの理論解析 p.146
 C.1 行列,ベクトルの定義 p.146
 C.1.1 畳み込み行列の定義 p.146
 C.1.2 ベクトルC1およびC0の定義 p.146
 C.1.3 行列Aおよびcの定義 p.147
 C.2 適応フィルタの収束解の導出 p.147
 C.2.1 式(5.18)から式(5.19)の導出 p.147
 C.2.2 適応フィルタの収束解がインパルス応答から求めた理論的最適解と等しくなることの証明 p.147
謝辞 p.149
参考文献 p.151

 多人数が参加する遠隔講義やテレビ会議の収音には、受け渡しで使用するハンドマイクや、各話者の前に設置された卓上マイクが主に使用されている。受け渡しで使用するハンドマイクでは、マイクを持ち運ぶ人手が必要であったり、自由に発言できないという欠点があり、各話者の前に卓上マイクを設置する場合では、人数分のマイクロホンを設置する必要があり、
そのような設備がない部屋では設置が困難である。
 このような問題を解決する方法として、話者から離れた位置にある複数マイクロホン(マイクロホンアレイ)を用いた自動話者追従収音がある。この収音技術は、まず複数マイクロホンで収音した信号から話者位置を推定し、その話者位置に対して、鋭い指向性を形成することで、室内雑音を抑圧した高品質な収音を実現する。これにより、マイクロホンを気にすることなく、自由な位置で、自由に発言することが可能となる。
 本論文では、自動話者追従マイクロホンアレイに必要な話者位置推定と収音のための指向性形成方法について研究を行った。話者位置推定方法に関しては、(1)マイクロホン位置が既知である場合に適用する同期乗算法を用いた話者位置推定方法と、(2)マイクロホン位置が未知である場合にも適用可能なマイクロホン位置と話者位置の同時推定方法の二種類を提案した。収音のための指向性形成方法に関しては、(1)拡散性雑音を想定した近接音場型Filter-and-Sum マイクロホンアレイと、(2)方向性雑音を想定した複数仮想音源を用いた適応型マイクロホンアレイと、(3)場内拡声時に生じるハウリングを抑圧することを目的としたハウリング抑圧マイクロホンアレイの三種類を提案した。
 以下、本論文の構成について説明をする。
 第1章では、研究の背景や問題点、本研究の考え方について述べている。
 第2章では、同期乗算法を用いた話者位置推定方法について述べている。従来の遅延和法を用いた話者位置推定では、残響や複数同時話者の影響により十分な位置推定性能が得られないという問題があった。提案する同期乗算法を用いた話者位置推定方法では、同期乗算と時間的に使用するマイクロホンを切り替えるマイクロホン選択により、残響下での複数同時話者に対しても高精度での位置推定を実現する。計算機シミュレーションおよび実音場実験において、従来法の遅延和法を用いた話者位置推定に比べ、提案法の話者位置検出性能が高いことを示し、有効性を示した。
 第3章では、マイクロホン位置と話者位置の同時推定方法について述べている。従来の話者位置推定方法ではマイクロホン位置が既知である必要があり、あらかじめマイクロホン位置を計測し、固定しておくことが必要で、設置面で不便である。提案するマイクロホン位置と話者位置の同時推定方法では、マイクロホンが自由に配置され位置が未知である場合でも、マイクロホンで受音した信号のみを用いてマイクロホン位置と音源位置の両方を推定することが可能で、設置の不便さを解消できる。計算機シミュレーションおよび実音場実験において、提案法がマイクロホン位置と話者位置を同時推定可能であることを確認した。
 第4章では、拡散性雑音を想定して、雑音を抑圧する指向性を形成する近接音場型Filter-and-Sum マイクロホンアレイについて述べている。従来法である遅延和アレイでは、話者位置の推定誤差等により、鋭い指向性と話者にずれが生じると、収音音声の高周波成分に劣化が生じるという問題がある。この問題は、遅延和アレイの指向性幅が高周波数になるほど狭くなるという特性を持っていることに起因する。提案する近接音場型Filter-and-Sum アレイは、遅延和アレイの遅延の後段にフィルタを設け、ずれによる収音音声の劣化を考慮してフィルタを設計することで、収音音声の劣化を改善する。計算機シミュレーションおよび実音場実験において、提案法が収音音声の劣化を改善可能であることを確認した。
第5章では、方向性雑音に対して遅延和アレイより雑音抑圧性能が高い複数仮想音源を用いた適応型マイクロホンアレイについて述べている。従来の適応型アレイでは、音源移動時に音質劣化と雑音レベルの増加が生じるという問題がある。この問題は、音源移動時に一時的に適応が間に合わなくなるために生じる。提案する複数仮想音源を用いた適応型アレイでは、複数仮想音源を用いて範囲に対する感度を拘束することで、この問題を解決する。計算機シミュレーションおよび実音場実験において、音源移動時でも提案法は安定した収音と雑音抑圧ができることを確認した。
第6章では、ハウリング抑圧マイクロホンアレイについて述べている。このマイクロホンアレイは、収音音声を同一空間内のスピーカから出力する場内拡声システムにおいて、スピーカに対するマイクロホンアレイの感度を低くし、ハウリングを防止するものである。従来の遅延和アレイでは、方向性雑音に対し抑圧性能が低いために、スピーカ音に対する抑圧性能が低く、ハウリング防止効果が低い。また、従来の適応型アレイでは、場内拡声システムのように収音したい音と抑圧したい音が常に同時に出力され、それらの相互相関が高い場合には適用でないという問題がある。提案するハウリング抑圧マイクロホンアレイは、Null Beamformerを用いて抑圧したいスピーカ音だけを抽出し、この信号を抑圧するように適応動作することで、場内拡声システムに対して高いハウリング抑圧性能を実現する。計算機シミュレーションおよび実音場実験において、提案法の高いハウリング抑圧性能を示した。
 第7章では、本論文の総括と今後の展望について述べている。

非公開論文

お気に入り

マイメニューの機能は、JavaScriptが無効なため使用できません。ご利用になるには、JavaScriptを有効にしてください。

ページの先頭へ戻る