弥紀のblog(仮)

アイドル、特にでんぱ組に関する妄想を語ります。twitter(@yaki2019)で記事の正式リリース告知および近況を呟いています。

えいたそボイスの秘密 第5回「スペクトル包絡分析~シンガーズ・フォルマントの存在~」

まとめ
  • えいたそのスペクトル包絡を観察した結果、3~5kHzの間に、「シンガーズ・フォルマント」らしき、複数のフォルマントで構成される幅の広いピークがあることがわかった。
  • このピークがえいたその歌声がバックの演奏に埋もれずよく通る理由と考えられる。

その他のえいたそ(成瀬瑛美)関連の記事はこちら

目次 

 

今回はスペクトル包絡を観察する。スペクトル包絡とは、前回取り上げた周波数スペクトルの大まかな形状であり、特にそのピークのある周波数やピークの幅に着目する。

スペクトル包絡は、声帯から口唇までの形状によって定まる音響フィルタの特性を表している。この音響フィルタの共鳴はフォルマントと呼ばれ、その周波数(フォルマント周波数)は、母音の区別や個人性に影響するからである。

 

スペクトル包絡の観察

 5kHz以下の範囲で、被験者eitasoの各音程でのスペクトル包絡を以下に示す(分析条件は末尾を参照)。

f:id:yaki2019:20190609053453p:plain

被験者eitasoのスペクトル包絡

 スペクトル包絡を見ると、以下の3種類のピークが見られる。

(1) 1kHz弱のピーク

(2) 1.5~2kHzのピーク

(3)  3~5kHzの幅広いピーク

 

(1)と(2)はそれぞれ第1フォルマントと第2フォルマントであろう。

今回発声した「らー」の母音である「あ」について、一般的な女性の第1、第2フォルマントは、それぞれ800Hz付近と1500Hz付近である、少々第2フォルマントが高いが、この当てはめで問題ないだろう。

なお、C5などの高い音程でピークが3個に増加しており、それぞれ倍音周波数付近に対応しているが、稿末の分析条件に記載したように、高ピッチでのLPC分析の精度が落ちることと関係があるのであろう。

 

 (3)のピークはいわゆる「シンガーズ・フォルマント」「シンギング・フォルマント」「歌声フォルマント」などと呼ばれる、歌手の歌唱時特有のフォルマントだと考えられる(以下「シンガーズ・フォルマント」で統一)。

シンガーズ・フォルマントは、スウェーデンの音声学者スンドベリが、オペラ歌手の歌唱の観察で発見した音響的な特徴である。訓練により3000Hz付近に強いピークを生じさせることで、オーケストラに埋もれず、しかも遠くの聴衆にまで届くようにできるというものだ。

歌声の科学

歌声の科学

 

スンドベリの報告は男性のオペラ歌手を対象にし、女性や非西洋音楽におけるシンガーズ・フォルマントの存在ついては明確にしていない。しかし、大阪芸術大学の小林教授らによると、女性を歌手を対象に観察を行った結果、女性でも、しかも民謡などの日本伝統音楽の歌唱でも、4kHz付近の顕著なピークがあるとのこと*1。つまり、シンガーズ・フォルマントは男性や西洋音楽に限定されるものではない可能性が高い。であるなら、(3)のピークはシンガーズ・フォルマントといってよいのではないだろうか。

小林教授の挙げた事例ではピークの高さは第1、第2フォルマントと同等のレベルであったのに比べ、若干ピーク低いが。。。

 

考察

比較のために、他の被験者のスペクトル包絡を示す。前回と同様、サンプルの最低音と最高音であるC4とC5を使用する

f:id:yaki2019:20190609053556p:plain

他の被験者のスペクトル包絡

(1)(2)のピークの存在は被験者eitasoと共通している。発生した音声の母音が「あ」なので当然である。

しかし、(3)のピークは被験者eitasoに比べて低い、あるいは狭いことがわかる。

その他、(1)のピークより低い周波数帯域が被験者eitasoに比べ、レベルの低下が見られないことも観察できる。

 

以上から、被験者eitasoのスペクトル包絡の特徴をまとめると次のようになる。

(a) 3kHz~5kHzのピークが強く、幅が広い。

被験者eitasoは1~2kHzの最大値と3~5kHzの最大値の差が2~4dB程度で、かつピークの周辺がなだらかに低下している。これは、C4や、E4~A#4で見られるように、2つのフォルマントが近くにあり、強め合っているためと思われる。複数のフォルマントを近接させることで歌声を聞こえやすくすることは、スンドベリもシンガーズ・フォルマントのメカニズムとして指摘している点である。

一方、他の被験者では強いピークはあるが1つのみ、あるいは2つのピークがあってもそれぞれが弱い。

この帯域は、スンドベリによるとオーケストラの主要な周波数帯域と重ならないため、演奏に埋もれない。また、ラウドネス曲線上も人間の聴覚の感度がよい帯域でもある。

したがって、この特徴が、被験者eitasoの他のメンバーより声が通り、かつ歌声がバックの演奏に埋もれない理由だろう。

 

(b) 1kHz未満の谷が深い。

他の被験者が基音のある250~500Hzと1~2kHzの帯域のレベル差がほとんどないのに対し、被験者eitasoは250~500Hzの間で2~4dB程度低下している。 

これが以前報告した、被験者eitasoの低次倍音構造において基音や2倍音に比べて3~5倍音が強いことと関係していると思われる。基音が上がるにつれて2倍音が強くなっていたが、これは2倍音の周波数が第1フォルマントの周波数帯域に徐々に入っていくからであろう。

yaki.hatenablog.jp

 

次回予告

次回はこれまでの観察結果をまとめて中間報告したい。

分析条件

試料

下記と共通のものを使用

yaki.hatenablog.jp

 

分析方法

スペクトル包絡の抽出にはLPC分析を用いた。LPC分析は音声波形から前述の共鳴フィルタのパラメータを推定する手法である。ただし、LPC分析は女性や子どものように基本周波数(基音)が高い場合、推定精度が落ちるといわれており、高い基音でのスペクトル包絡は参考程度に扱う。

  • 分析窓:Hanning窓、0.045sec(周波数分解能を高めるため長めに設定)
  • プリエンファシスフィルタ:0.97
  • FFTサンプル窓:2048
  • LPC次数:44
ツール

MATLAB  r2019b + signal processing toolbox