2013年度 学士論文
近年、デジタル処理技術の発展により、3次元の情報を提示するシステムが多く実現されている。私たちが普段生活しているなかで感じる知覚はアナログの情報を3次元の情報として知覚しているため、同じ情報をデジタル処理で作る際には、様々な付加的な情報を付け加える必要がある。3次元の情報をデジタル処理で作成する方法の中で、音に距離感や方向などの情報を与える技術として、立体音響技術がある。しかし立体音響の技術では聞こえ方に個人差があるという問題がある、立体音響技術を今より発展させるためには、この問題を解決する必要がある。解決の手法として個人の頭部伝達関数を用いることがあげられるが、測定に手間と時間がかかるという問題を抱えている。本論文では、測定にかかる手間と時間を減らすために、少ない計測点から頭部伝達関数を推定することを目的とし、輻輳角モデルと逆2乗の法則、音の遅延特性を用いて、2点の計測された頭部伝達関数から間の点からの頭部伝達関数を推定する手法を提案し、提案手法の有用性について検証を行っている。検証の結果より、提案手法を用いて推定される頭部伝達関数は実測値と比較すると別の値となっているが、実測値の代わりとして使用することができると考えられる。
医療機器のデジタル化に伴い、録音可能な電子聴診器が用いられるようになっている。電子聴診器は従来の聴診器と異なり周囲の雑音を低減する機能や、周波数帯域を強調することで呼吸音や心音を聞き取りやすくする機能がある。しかし、聴診器と肌が擦れたときに発生する摩擦音については考えられていない。そのため、摩擦音が録音された聴診音は摩擦音か呼吸音の異常音であるのか判断が難しくなる問題がある。従って、聴診音から摩擦音を除去する必要がある。そこで本研究では、パターン認識の単純パーセプトロンを用い摩擦音の発生箇所を推定するシステムを提案する。まず、摩擦音を含む聴診音と摩擦音を含まない聴診音の周波数スペクトラムから線形識別関数の重みベクトルを求める。次に、電子聴診器で録音した聴診音の周波数スペクトラムと重みベクトルから単純パーセプトロンを用い、周波数スペクトラムに摩擦音を含むか判定を行う。そして、摩擦音の発生箇所の推定を行う。その結果、実際に摩擦音が発生している箇所を推定できることを確認している。また本システムを用い、訪問看護の現場で録音された呼吸異常音が含まれる聴診音に対し摩擦音の発生箇所を推定した。さらに本システムを応用し、呼吸異常音が含まれる聴診音に対し呼吸異常音の発生箇所を推定した。しかし、呼吸異常音を含む聴診音に対しては、摩擦音と呼吸異常音の発生箇所を正しく求めることができないという結果であった。
近年, スマートホンを含む携帯端末には全地球測位システム(GPS: Global PositioningSystemg) が標準的に搭載され, 屋外における位置情報の取得は容易にできるようになっている. そのため, 人間や物の位置情報を用いて, その場所特有のサービスを受けることのできる位置情報サービス(LBS: Local Based Services) が発展してきている. 特に大規模集客施設における携帯端末によるナビゲーションシステムの需要は高まっている. しかしながら屋内や地下街ではGPS の電波を適切に受信することができず, 有効な精度を持った位置推定を行うことができない. そのため, 屋内や地下街における位置情報の取得について多くの研究がなされている. 屋内における既存の位置推定方式としてはRFID や無線LAN の電波受信強度, 電波の到達時間や到来方向を用いた位置推定方式が提案されている. ただし, これらの位置推定方式では専用デバイスの設置コストや有効な位置推定精度が確保できない等の問題点が残っている.そこで本研究では, 屋内や地下街において専用デバイスが必要とならない位置推定方式を提案する. 提案方式では, 屋内には音響設備が既に設置されており, 利用者が所持しているスマートホンでの利用を想定し, スピーカーと単一のマイクロホンを用いる. 各スピーカーからチャープ信号を出力し, マイクロホンに入力される音からそれぞれのチャープ信号の到達時間差を推定する. それぞれのチャープ信号の到達時間差からマイクロホンの位置を推定する. 実際に提案方式による位置推定実験を行った結果, 多少の誤差は生じるが位置推定は可能であることを確認した. また, 反射音の影響により誤差が生じたことを確認した.
近年,音声認識技術が向上しているが,複数話者の音声に対しては高精度な認識が困難である.複数の音声から1 人ずつの音声を抽出できれば,抽出したそれぞれの音声を認識させることで会議の議事録の自動生成等ができるようになる.複数の音声を分離する技術として音源分離技術がある.音源分離技術の従来手法には独立成分分析やDUET といった手法がある.これらの手法は音源数が未知の場合は適用できない,または,複数のマイクを離して設置できない等の問題点がある.しかし,これらの問題点は単一マイクを用いて録音することで解決できる.そこで本研究では,単一マイクを用いて録音した複数話者音声からウェーブレット係数を特徴量として所望の音声を抽出するシステムの提案を行う.また,提案したシステムの有効性を確認するためにシミュレーションを行い,男性と女性の混合音声から所望の音声を抽出できること確認している.しかし,男性2 人や3 人以上の混合音声に対しては所望の音声を抽出できていない.
プロジェクト研究
音響の分野において, コンピュータが一度混ざりあった複数の楽器の混合音を分離することは非常に困難とされている. 楽器の混合音に対して分離を行う際の問題の一つとして, 楽器音の区別がつけられず, どの楽器であるかを判断できないという問題がある. また, 不確定である事象を判断する方法の一つとして, ベイジアンネットワークという方法がある. ベイジアンネットワークとはグラフィカルモデルであり確率推論技術の一つである. この技術を用いることで先ほど述べた問題を解決することができると考えられる.本研究では2 種類の弦楽器の混合音に対してそれぞれの楽器を区別して認識することを目的とし, ベイジアンネットワークを用いることで音同士を区別することができるのかということを検証している. 弦楽器の混合音に対して3 つの前提条件を設け, その条件下で周波数特徴, 事前確率を求め, ベイジアンネットのモデル化を行っている.その結果, 周波数帯域が重ならない範囲では楽器音の区別が可能となり, 周波数帯域が重なる範囲の場合は確率を元にした推論によりどちらの楽器である判断可能であることがわかった.