本文ここから

音声のカオス・フラクタル性とその生成モデルに関する研究

氏名 古賀 博之
学位の種類 博士(工学)
学位記番号 博甲第261号
学位授与の日付 平成15年3月25日
学位論文題目 音声のカオス・フラクタル性とその生成モデルに関する研究
論文審査委員
 主査 教授 中川 匡弘
 副査 教授 松田 甚一
 副査 教授 神林 紀嘉
 副査 助教授 和田 安弘
 副査 助教授 北谷 英嗣

平成14(2002)年度博士論文題名一覧] [博士論文題名一覧]に戻る.

目次

第1章 序論 p.1
1.1 本研究の背景 p.1
 1.1.1 音声信号のフラクタル性 p.1
 1.1.2 音声信号のカオス性 p.4
 1.1.3 音帯の振動モデル p.7
 1.1.4 揺らぎを有する音声生成 p.10
1.2 本研究の目的 p.12
1.3 論文の構成 p.13

第2章 最尤推定法による自己アフィンフラクタル次元の推定 p.15
2.1 緒言 p.15
2.2 自己アフィン性を有する時系列データとその特性 p.18
 2.2.1 自己アフィン性と自己相似性 p.18
 2.2.2 自己アフィン性を有する時系列 p.19
 2.2.3 フラクショナル微積分演算 p.20
 2.2.4 フラクタル信号の共分散特性 p.22
2.3 自己アフィンフラクタル次元の推定法 p.26
 2.3.1 一般モーメントによる次元推定法 p.26
 2.3.2 臨界指数法(CEM) 〔9〕 p.27
 2.3.3 最尤推定法(MLEM) 〔52〕 p.28
 2.3.4 フラクショナル微積分演算によるフラクタル次元の推定法(FIDM) p.31
2.4 自己アフィンフラクタル次元の推定結果 p.35
 2.4.1 fBmの関数に基くフラクタルデータ p.35
 2.4.2 コッホ曲線 p.46
 2.4.3 変形Bernoulli写像 p.51
2.5 考察 p.54
2.6 緒言 p.60

第3章 音声のカオス・フラクタル性の解析 p.63
3.1 緒言 p.63
3.2 解析データ p.65
 3.2.1 音声信号の測定 p.65
 3.2.2 力学系のよるカオス時系列生成 p.67
3.3 アトラクタの自己相似性の定量評価 p.68
 3.3.1 埋め込みアトラクタの自己相似性 p.68
 3.3.2 相関積分法による音声の相関次元の解析 p.71
 3.3.3 音声のマルチフラクタル次元の推定 p.76
3.4 音声のカオス性の解析 p.79
 3.4.1 ヤコビ行列の推定によるリアプノフ解析手法 〔15〕 p.79
 3.4.2 埋め込み次元の決定法 〔67〕 p.82
 3.4.3 リアプノフ解析の結果 p.86
 3.4.4 サロゲーション p.90
3.5 母音の揺らぎと成分のカオス・フラクタル性の解析 p.99
3.6 緒言 p.105

第4章 カオスの揺らぎを生じる音声生成モデル p.107
4.1 緒言 p.107
4.2 理論 p.108
 4.2.1 音声器官の構造 p.108
 4.2.2 声門内部(声帯)の構造 p.115
 4.2.3 2質量モデル〔36〕(NCSM)における声帯振動の特性関数 p.118
 4.2.4 提案モデル(CSM)における声帯振動の特性関数 p.112
 4.2.5 音声器官の電気的等価回路 p.130
4.3 音声生成シュミレーション p.133
 4.3.1 声帯モデルの運動方程式と音声器官モデルの回路方程式 p.133
 4.3.2 シュミレーション条件 p.134
 4.3.3 生成音声データの波形,及び,PSD p.136
 4.3.4 生成音声データのアトラクタ p.142
4.4 生成音声データのカオス・フラクタル性の解析 p.145
 4.4.1 生成音声データのマルチフラクタル解析 p.145
 4.4.2 生成音声データのリアプノフ解析 p.147
 4.4.3 サロゲーション p.152
 4.4.4 非線形パラメータの制御による生成音声データのカオス性の変化 p.159
4.5 音声生成モデルのリアプノフ解析 p.161
 4.5.1 音声生成モデルのヤコビ行列 p.161
 4.5.2 音声生成モデルのリアプノフ解析の結果 p.166
4.6 考察 p.169
4.7 緒言 p.174

第5章 総括 p.177
 謝辞 p.181
 参考文献 p.183
 本研究に関する論文発表及び学会発表 p.193

付録A フラクショナル微積分演算 p.195

付録B アトラクタの構造解析に基く揺らぐ成分の抽出法 p.199
 B.1 揺らぎ積分の定義 p.199
 B.2 重心軌道の抽出法 p.202
 B.3 重心軌道,及び,揺らぎ成分の抽出結果 p.205

付録C 略称一覧 p.215

 最近,音声信号に含まれる揺らぎのフラクタル性が注目されており,そのフラクタル次元の定量化手法の確立,さらには,そのような揺らぎを発生し得る力学的な音声生成モデルの構築が重要であると考えられている.しかしながら,音声のカオス・フラクタル性に関しては,高精度な解析手法が十分に確立されておらず,とりわけ,音声信号におけるカオスの存在の有無に関しては,これまで殆ど明らかにされていないのが現状である.
上記の観点から,本論文では,音声のカオス・フラクタル性を定量化するため,フラクショナル演算を用いた新規なフラクタル解析手法を提案し,音声のフラクタル次元を高精度に評価し得ることを示した.また,リアプノフ解析手法により,音声にカオス性が存在し,そのダイナミクスは決定論的であることを明らかにした.さらに,このようなカオス・フラクタル性を有する音声を生成するモデルとして,声帯の力学モデルに指数関数型の非線形性を導入し,その生成音声と実際の音声をカオス・フラクタル性の観点から比較・検討した結果,日本語の母音に対して,フラクタル次元やリアプノフ指数に関して定量的な一致を得た.
 本論文は5章から構成されており,各章の要旨は以下の通りである.
 先ず,第1章では,音声信号のカオス・フラクタル性,及び,発声器官の力学モデルに関する研究背景について述べ,また,音声信号の決定論的なカオスダイナミクスの存在を検証することが,音声の揺らぎの発生メカニズムを解明するために重要であることを示した.
次いで,第2章では,時系列データの自己アフィン性を評価するため,フラクショナル演算を併用した最尤推定法を提案した.具体的には,リファレンスデータをガウス白色雑音とし,評価対象であるデータにフラクショナル演算を施し最尤推定を行った.その結果,データ点数が比較的少なく従来の相関次元解析等では次元推定が困難な場合でも,十分に高い精度でフラクタル次元が推定され得ることを示した.
また,第3章では,日本語の母音(/a/,/i/,/u/,/e/,/o/)のカオス・フラクタル性を定量的に評価するため,各母音の音声信号に対してカオス・フラクタル解析を行った.その結果,音声信号から再構成されたアトラクタの次元は,1.8~2.4次元の範囲の非整数値をとり,母音がフラクタル性を有することを示した.また,マルチフラクタル解析の結果,母音のアトラクタは一様なフラクタルノフ指数の値が,約150~400 (bits/s) の範囲で正の値をとることから,カオスの特徴の1つである,アトラクタ軌道の不安定性の存在が実証された.また,サロゲーション手法によって,音声信号の揺らぎは,確率論的ではなく,決定論的ダイナミクスによって生成されることを確認した.
さらに,第4章では,指数関数型の非線形性を力学モデルに導入し,声帯の非線形振動によって音声信号の音声信号と同様に,カオス性,及び,マルチフラクタル性を有することを見出した.
最後に,第5章では,各章で得られた研究成果を総括し,本研究で得られた知見を記述した.
上記のように,本論文では,音声(母音)にはフラクタル性だけではなく,カオス性も潜在しており,さらに,声帯部の非線形性を考慮したカオス力学モデルを構築することにより,その生成音声も実際の音声と同様にカオス性とフラクタル性の両方の性質を併せ持つことを結論した.

非公開論文

お気に入り

マイメニューの機能は、JavaScriptが無効なため使用できません。ご利用になるには、JavaScriptを有効にしてください。

ページの先頭へ戻る