弥紀のblog(仮)

アイドル、特にでんぱ組に関する妄想を語ります。twitter(@yaki2019)で記事の正式リリース告知および近況を呟いています。

えいたそボイスの秘密 第7回「知見の検証(1)~方法論~」

これまでの分析で得られた知見は、本当にえいたそらしさに結びついているのでしょうか?今回はその検証方法について説明します*1

目次

はじめに

前回まとめたように、これまでの周波数スペクトルでの観察の結果、えいたその歌声の特徴について次のような知見を得ることができた。

(1)  3~5倍音が、基音や2倍音に比べて強い
(2) 整数次倍音が高域まで強く、非整数次倍音が弱い
(3) 弱いながらもシンガーズ・フォルマントが存在する

 

では、この3要素を備えればえいたその歌声になるのであろうか。これですべてだろうか。その疑問を解くには、実際これらの要素を操作して、その結果をみるのが手っ取り早い。

例えば、えいたその歌声の(1)の要素を弱めることで「えいたそ感」が減少すれば、(1)はえいたそらしさに結びついていると言えるだろう。逆にみりんちゃんの歌声に(1)の要素を加えることで「えいたそ感」が現れても同じである。

今回は、まず歌声の操作を理解するにあたって必要となる、発声のメカニズムと歌声との関係について簡単に紹介し、その後、方法論について説明する。

 

発声のメカニズムと歌声との関係

※音声生成に詳しい方はスキップしてください。

人間の声は、以下のようなメカニズムで生成される。

 

肺→[呼気]→声帯→[パルス波+雑音]→声道→[音声]

 

まず、肺から出た呼気が声帯を通過する際の声帯の震えや摩擦でパルス状の音波と雑音が生じる。次に、声帯から生じた音波が声帯から唇までの管(声道)の共鳴により、特定の周波数が強調され、最終的に音声として出力される。

したがって、人間の声を特徴づける主な要素は以下のようになる。

  1. 呼気の大きさと時間的変化
  2. パルス波の時間的変化
  3. パルス波と雑音のバランス
  4. 声道の共鳴特性

1はピアニシモやクレッシェンドなど声の大きさの抑揚、2は節回しやビブラートなど音程の抑揚、3はハスキーボイス、シルキーボイスといった声の質、4は声の音色や母音の区別に対応する。

純化すると、1と2はいわゆる歌手の歌唱力や表現力、3と4(の音色要素)は歌声の個性に分類することができる*2

 

検証の方法論

知見(1)~(3)は、3と4にそれぞれ次のように対応するだろう。

(1) 3~5倍音が、基音や2倍音に比べて強い⇒4. 声道の共鳴特性

(2) 整数次倍音が高域まで強く、非整数次倍音が弱い ⇒3. パルス波と雑音のバランス

(3) 弱いながらもシンガーズ・フォルマントが存在する⇒4. 声道の共鳴特性

 

したがって、それぞれの知見の有効性を検証するには、とりあえずは「3. パルス波と雑音のバランス」と「4. 声道の共鳴特性」を独立に操作できればよい。

 

そのためのツールとして、今回は"WORLD"と呼ばれる音声分析合成システムを利用する。

 

www.kki.yamanashi.ac.jp

 

WORLDは明治大学の森勢将雅 専任准教授の開発した音声分析合成システムであり 、音声波形を「基本周波数」「スペクトル包絡」「非周期性指標」の3パラメータに分解し、これらのパラメータを操作した上で、音声波形に高品質に再合成することが可能である。例えば、基本周波数を2倍にして再合成すれば音色はそのままで、声の高さだけ2倍になる。そういったシステムである。

WORLDにおける「基本周波数」は「2. パルス波の時間的変化」、「スペクトル包絡」は「4. 声道の共鳴特性」、「非周期性指標」は「3. パルス波と雑音のバランス」に対応しているため、それぞれのパラメータを操作することで今回の目的を達成できる見込みである。

 

次回予告

次回からWORLDを用いて歌声の操作により、知見の検証および新たな知見の発見を進めていく。

*1:予定では知見に基づき考察する予定だったが、こちらの方が面白いので急遽予定変更

*2:もちろんビブラートなどの抑揚も歌手の個性であるが、相対的なものと考えていただきたい。