私のUTAUレシピ [Tips for DTM/作曲など]

私のUTAU曲の作り方。あるいは手軽な調声のごまかし方。
手抜きのためのノウハウwみたいな。守備範囲外のことは割愛してます。


step #0 曲を作る。

私はたいてい曲先なのでmidiとかオケとかを先に作ってしまいます。
この辺はあまりUTAU関係ないですが…
そしてUTAU用にmidiを出力しましょう。

さあ、UTAU起動!
インポート&シンガーを設定(うちは重音テト(tetovoice-3α版)ですね)。
さっき出力したmidiをUTAUにぶっ込みましょうか。


step #1 歌詞を打ち込む。

さて、歌詞を入力していきます。この辺も特筆すべきことはないですが、フレーズの歌詞を入れるごとに音は確認しておきましょう。「ズコー」ポイントを適宜確認しておくと後々便利です。

・自分なりに気を遣っておくといいと思うこと
①「ー」「っ」をどう処理するか
たとえば「アート」という歌詞を「あ|あ|と」「あ  |と」と表現するか、ってのは曲とか好みによって違うので、自分ならどうするか、っていうのを考えておくといいと思います。

②表記≠発音の落とし穴
気を遣っててもついうっかり、「れいぞうこ」とか「わたしは」と入力してしまうことがあるので、なるべく何度も聴いて確認するようにしましょう。

③入力時に日本語ワープロの学習機能を切っとく(かなり任意)
まあ、これは気にしない人は別にいいんですが。UTAU/ボカロ歌詞を入力するときに歌詞の語を何度も入力していると、それを単語として変に学習してしまうことがあります。例えば「れいぞおこ」とかね? そういうのがこう、普通の文章打ってるときに変換候補で頻繁に出てくると、イラッと来ることがあります、少なくとも私は。まあ、そういうことを防ぎたい場合には、辞書を変えたりだとか学習機能を切っておくとかいった措置が必要でしょう。普段ATOKを使ってる人は、歌詞入力時にはIMEにするとかすればいいと思います。


step #2 母音結合。

母音結合です。これもフレーズごとにみながらやっていきます。
デフォルトでは、あ/い/う/え/お/ん、が対象ですが、別にこれ以外の音素でも追加して処理を行うことができます。
しかしながら、かならずしもこれを歌詞のすべての音に適用する必要は勿論ありません。
どこが母音結合が必要でどこが必要でないか、というのは一概には言えません。いくつかポイントを上げるなら、

①アクセントが欲しい母音は、母音結合しない
これはまあ、言わずもがなでしょう。母音結合すると、その母音は前の音素とのつながりがなめらかになるので、アクセントを強調することができないからです。

②文末の「い」は結合した方がいい場合が多い。
文末の-たい、-ない、など(もっと限定的に言うなら「-aI」というような音でしょうか)は、ちゃんとした拍で区切ってしまうと不自然です。これは若干音符の置き場所に気を遣いつつ母音結合によって整える必要があります。

③「ん」はほとんど母音結合してしまってよい
上記①からですが、「ん」にアクセントが来ることは少ないので、ほとんどの「ん」は母音結合してしまって構いません。無論例外もありますが(たとえば、「ん」の所で跳躍するときとか)。

・母音結合のメリット
少なくとも2つあります。

①母音のつなぎがなめらかになること
明らかになめらかな方が「自然」です。これについては特に異論もないでしょう。

②自然な拍に近付く(説明がもったりしてるので飛ばして構いません)
試してみるとわかりますが、すべての音節を均等な長さに区切って発音すると、いわゆるロボットみたいな喋り方になります(音程も統一すれば完璧ですね)。なぜでしょうか?
これは、普通の会話では、均等な割り振りがなされない発音の語句(スマートでない言い方ですみません)がちょくちょく紛れ込むからです。
日本語の発音は均等なリズムで淡々と続いて行きます。たとえば「私は」とか「食べ物」とかいう言葉を発音するときは、均等にリズムが割り振られていますよね。

  わ た し
  - - -

  た べ も の
  - - - -

(拍をとりながら発音するとわかりやすいかも)

ところが、次の例を見てください、
(--はふたつの拍ではなく、ひとまとまりの拍と見なしてください)

「簡単」

A か ん た ん
  - - - -

B かん  たん
  --  --

「食べたい」
A た べ た い
  - - - -

B た べ たい
  - - --

これらを普通の会話の中でAのように発音すると不自然ですよね、おそらく? 実際の発音ではたぶんBのように発音されているはずです。このような発音を母音結合を使えば簡単に表現することができます。自然な拍に近付く、というのはこういう意味です。


step #3 オートピッチ。

オートピッチです。これもフレーズごとにやっていきます。あと、これは好みかもしれませんが、私なりのポイントをひとつ。
跳躍進行にはオートピッチを使わない方が無難です。
順次進行(短二度、長二度)の部分にオートピッチを使うと普通になめらかになっていい感じですが、それ以上の跳躍進行にオートピッチを使うと、ピッチベンドがあからさまになって不自然になる場合があるので気をつけたほうがいいです。特に「ま」行、「な」行、「ん」はその傾向が顕著です。まあ、狙って使う分には何の問題もありませんので安心してください。


optional 音符の設定(エンベロープ・ベロシティ)。
(オプショナル:ここではまあいつやっても別にいいんじゃない? 的な意味で)
個々の音符レベルの設定です。まあ、「自然な」調声を目指すときにちょっと気を遣う程度のこと。

・長い音はしだいに大きくなる-エンベロープ
まず、ちょっと気をつけてみて欲しいのですが、長い音符を歌うときは
①同じ声量で持続するのは難しい
②声量を徐々に増加していくのは自然にできる
③声量を徐々に減少させていくのは非常に難しい
ものではないでしょうか(「ふいご」みたいなものを想像してみるとわかりやすいかも)。逆にいうなら、長い音符では声量は徐々に増していくもの、といえます。なので、エンベロープの右肩をちょっとあげてやるだけで、雰囲気が若干変わったりします。
あと右に下がる勾配の部分は、余韻であるという風にとらえるとエンベロープの設定がしやすいかもしれません。

・そのズコーの原因はひょっとして-ベロシティ
ベロシティ=音符の強さ。ベタ打ちをしただけのファイルでは、当然音符の強さは最適の状態ではありません。そのため、適宜ベロシティを調整してやる必要があります。ちょっとしたコツみたいなもの。

①音程が高ければ音量も大きく、低ければ音量も小さい

↓こういうものがあります

等ラウドネス曲線 出典: フリー百科事典『ウィキペディア(Wikipedia)』
http://ja.wikipedia.org/wiki/%E7%AD%89%E3%83%A9%E3%82%A6%E3%83%89%E3%83%8D%E3%82%B9%E6%9B%B2%E7%B7%9A

音の等感(等ラウドネス)曲線、というものです。これは、ある音量であると人に知覚されるのに必要な周波数ごとの音量を線で結んだものです(同じ音量で出力されていても、周波数によって、音量が違って聞こえるのです)。この表を見ると、低い音ほど、大きく聞こえるためにより大きな音量の出力が必要です…ってわかりにくいですね。
ものすごい簡略化すると、高い声ほど大きい声を出しやすいけど、低い声ほど大きい声が出しにくくなるというふうに考えてみてください。
それがとりあえず「自然」として考えると、高音がいきなり小さかったり、低い音がいきなり大きかったりすると、違和感を覚えるはずですよね? 特に後者は思いっきり不自然に聞こえます。
違和感の正体はひょっとして、こういった音符の強さの問題なのかもしれませんよ?

②大きい音が短い、ということはほとんどない

まず発声上の問題ですが、大声を出すときは自然と間延びになりますよね? また、短く区切って大きな声を出そうとするのにも無理がありますよね(大声で早口が言えないように)? ですので大きなこえを出すときにはそれなりに長い音符が必要だ、ということ。
また、聴覚上の問題としても、ある程度長くないと大きく聞こえないというのがあります。
ですから、いくらベロシティを上げても音が大きくならないってときに、どうしてもその音符の音を大きく聞かせたいなら、ちょっと発声時間を長くしてみてはどうでしょうか?


step #4 最終調整(UTAU)。

音符の長さ・ジェンダーファクター・モジュレーション・ピッチなどを適宜調整します。この辺はノウハウが自分の中で確立されてないので、特に書けることもないですが。まあ全体を見ながら違和感のある部分を削っていくという感じでしょう。
そしてwaveファイルをジェネレイト!


step #5 ミキシング

ミキシングまでが調声です。ってことでwaveをどう加工するか。私の場合むしろここがキモのような気もするけど、これはノウハウ化されてないので一般論的な部分だけを紹介で。実際、ここはもう好き勝手やっていいと思います。

・コンプをかけましょう
ベロシティの所でも述べましたが、それぞれの音符の音量は決して均一化されたものではありません。このままだとそれぞれの音符がばらばらに断続的に鳴っているというものでしかないです。
歌というのは流れですから、連続的に変化していないとやっぱり不自然です。音の粒を揃えないといけません。
コンプレッサーの説明はもっと詳しい人に譲るとしましょう。まあ、私もまだよくわかってないのでプリセットで遊んでるだけなのでw

・イコライザをかけましょう
中音域は気になりませんが、低音域や高音域ではノイズが乗ったりします。そんなときは、イコライザーでノイズ成分を低減すると良くなります。いや、原音設定ができれば一番なんだろうけどさ…

・エフェクトでごまかしましょうw
エフェクトを色々使うとノイズが気にならなくなるかも。でも、頼りすぎたら駄目ですよ。やっぱりそれでも歌詞は聞こえるようにしないといけないし… まあ、ノイズ隠しだけを目的にするのはいただけないかもしれないですね。


step #6 完成。
努力の結晶を堪能しましょう。公開するもよし、ひとりで楽しむのもよしですが、まあせっかく作ったんだからとりあえず人に見せてみるのがいいんじゃないでしょうかね。
ふむ、さてそろそろ次の曲をつくり始めようかな…(完)


……とまあこんな感じです。誰かのなにがしかの参考になればいいですね。

記述に誤りとか不適切な部分とかあれば指摘してくださいね。


コメント(0)  トラックバック(0) 

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

トラックバックの受付は締め切りました
Web拍手

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。