以前公開したやさしい解説記事
当サイトでは、以前、MQAについてのスッキリする解説記事がないという意見を聞いたので、解説しますという記事を公開した。
これは、一般的なオーディオに関心のある人たちに、専門的な技術の話はできるだけ要約して大筋を理解して貰おうという意図でまとめた記事でした。
現在、MQAの公式サイトはじめ、さまざまな解説記事が公開されていますが、概ね公式サイトに沿った解説であり、専門的な技術論まで突っ込んだ内容はあまり無いようです。
開発者はボブ・スチュアート氏
彼(Bob Stuart)は、イギリスのオーディオメーカー「Meridian(メリディアン)」の創業メンバーにして、このMQAという高音質デジタル音声フォーマットのために設立した会社であるMQA社(MQA Ltd.)の中心的存在である。
MQA社は、ロンドンから鉄道で約1時間の場所に位置する。ボブ・スチュアート氏とそのグループは、2014年に、この会社を設立する資金として創業したMeridianの株を売却したらしい。ちなみに、その後、中国で1,400万人の加入者を抱えるAlibabaのXiami音楽ストリーミングサービスに採用され、新会社の経営が軌道に乗ったようだ。
MQAの優れた点は、高音質と技術的利便性の両面
高音質を語るうえで、利便性についておさらいしておきたい。いわゆる「音の折り紙」というものだ。とても高度な符号化技術を使用して、ハイレゾの膨大な情報量を従来のCDレベルまで圧縮する。
ここでさらに凄いのは、そのCDレベルまで圧縮したデータを、MQA解凍(デコード)しなくても従来のCD機器でそのまま聴けるしリッピングもできるということだ。おまけに、そうした場合でも、MQAでデコードしたファイルの方が、しないファイル(つまり従来のCD)よりも高音質に聴こえるという優れもの。
従来CDとの音質比較は、理論上のみならず、ワーナーミュージックやユニバーサルミュージックがMQAに対応する際に、社内のエンジニアに比較させて同様の結論を得たことが採用の大きな決め手になったということからも、その信憑性が感じられる。
つまり、何もしなくてもCDやCDレベルの音楽ファイルとして扱えて、デコーダーがあれば、その最大4-5倍の情報量のハイレゾファイルとして解凍できるという利便性の高い特徴を持っている訳だ。
一部のデータは失われるが、、
失われるのは、人間の検知レベルより下の領域がほとんどであるようだ。しかし、この「失われる」ということがMQAを評価しないアンチMQA派の人々に拡大解釈されがちである。
「失われる」イコール「元に戻せない(不可逆圧縮)」、結果的に「不可逆圧縮(ロッシー)は可逆圧縮(ロスレス)よりも音が悪いはずだ」という何ともステレオタイプな理解をしてしまうようだ。
「影響のごく小さい情報を失ってでも、より多くのメリットを得られる」ということが理解できないようで、ロッシーが音質に劣るというのは、MP3のような音質を犠牲にして利便性を求めた従来の圧縮方法の話であり、混同してはならないものである。
Psychoacoustics(聴覚心理)とNeuroscience(神経工学)
聴覚心理は、音声を扱う従来からの科学で、これまでのオーディオの理論背景となってきたサイエンスである。一方の神経工学は、近年著しく発達した新しい科学ジャンル。
聴覚心理では、耳に入ってから後の脳内処理はブラックボックスとして扱わない。そこで「聴覚は20kHz以上の音は聴けない」と規定している。一方の神経工学では、脳内の聴覚処理まで含めて人間の音の検知を追求するため、単純に聞こえるか聞こえないかというような判断はしない。
聴覚はリニア(直線)ではなく、ノンリニア(非直線)の動作であり、音の強さ/弱さ、ピッチ、レスポンス、歪み、マスキング……などのさまざまな事象の影響を受け、ノンリニアになる。一方自然界では、風や水、動物の声……など、さまざまな音が発せられ、それらが総合されて耳に入る。そこで、人の脳はそれらをどう「聞き分ける」かのメカニズムを探る、という方向で追及していくのが神経工学の手法だ。
神経工学の研究では、人間の距離の判別能力もそれまで考えられていた以上に高度だそうだ。脳の中での判別プロセスはひじょうに複雑で、スーパーコンピューターでも、なかなか解明できないレベルだという。
人間の時間軸の認識能力
2012年に神経工学の研究家であるLewickiが、2013年に同じくOppenheimがデジタル信号処理に関する論文を発表した。これによって、神経工学上、人間の時間軸の解像度(どれくらい細かい時間の変化を認識できるかの能力)が、以前に思われていたより遙かに高いという研究結果が明らかになった。
それまでは、人間は50マイクロ秒(1マイクロ秒は100万分の1秒)の解像度までしか認識できないとされていたのが、これらの研究で、実際にはその5倍細かい10マイクロ秒であることが、分かった。
CDフォーマットの時間解像度は4ミリ秒であるため、これでは桁違いに不足していると考えられる。
訓練によって時間軸の認識能力はさらに
時間解像度は、訓練によってさらに能力が向上するらしい。一般に10マイクロ秒だが、音楽経験者やオーディオの専門家は5マイクロ、指揮者は1〜2マイクロ秒まで、細かく聴き取れることが報告されている。これは、ベテランオーディオマニアの試聴能力が高いことからも頷ける。
さらに、年齢によって周波数特性で高域は衰えるが、時間軸解像度はまったく変わらないようだ。
こうした、最近になって科学分野で明らかになってきたことをベースに、MQAの高音質化は成り立っている。
ハイレゾの時間軸解像度は頭打ちに
サンプリング周波数とビット数の情報量が増えると、時間軸解像度も向上する。しかし、96kHz24ビットまでは顕著な音質の向上が達成されるものの、それ以上は情報量に対しての向上度合いは鈍くなる。これは、通常のPCMにプリエコーやリンギングなどの時間軸ノイズ成分が含まれるため、この度合いによって相対的に解像度が頭打ちとなる。
サンプリング理論の進歩を取り入れて
上記の課題を解決するために、MQAがエンコーディングで使う「DEBLUR」フィルター(時間軸変動除去)は、近年の向上したサンプリング理論を取り入れて開発されている。そのため、エンコーディングには録音時のADコンバーターの特性ごとに異なる(カスタマイズされた)処理が必要となる。そのため、ファーマットを広く普及させるためにライセンスを無償にしたり廉価にすることが難しい(実作業がここに発生するため)。
これまでの圧縮のように、エンコーダーというハードウエアかソフトウエアをコピーして配布すれば済むという事ではないようだ。このライセンスコストやカスタマイズ作業は、一部のオーディオ機器メーカーの負担となり、これを嫌うメーカーも、アンチMQA派となっているようだ。
古いデジタル録音も高音質に
MQAのエンコードに使用する対応済のADコンバーターを使えば、アナログテープにアナログ録音された’70年代以前の音源が、高音質デジタルファイルに加工できることは分かる。ところがMQAは、それだけでなく、デジタル録音の音源であっても、それを録音したADコンバーターの内容が分かれば、その時間軸ノイズ成分を減らして高音質化が可能だということだ。
サンプリング変換の課題にも対応
CDの製造工程を見ると、ミキシングやマスタリングという音の加工は別として、スタジオで収録される規格は、以前は48kHz24ビットが主流で、最近は96kHz24ビットが主流であるようだ(一部の拘ったものは192kHz24ビット)。これを最終的にCDの44.1kHz16ビットにダウンサンプリングする。
一方では、再生機器側のDACで、アップサンプリングしてアナログ変換するという方法が主流だ。つまり、一旦下げてまた上げる。こうしたサンプリング変換の各段階で量子化ノイズを発生し、時間的な“ブレ・ボケ”が増加する結果となっている。
この課題にもMQAは対策に取り組んでいる。ハードウエアから最も正確なアナログ品位の忠実再生を引き出すことを目的に、MQA は、ディザーをうまく組み合わせ、注
意深くエンコード/デコードのフィルター・カーネルを選ぶことで、この歪対策が施されている。
ここまでの細かい技術的な解説は、JAS ジャーナル 2015 年 9 月号に記載した Bob Stuart 氏と Keith Howard 氏による「About MQA (for JAS)」という論文に更に詳しく記載されている。和訳もあるため、こちらの論文も参照していただきたい。
その他の参考資料
ボブ・スチュアート氏は、たびたびオーディオ誌やオーディオ評論家のインタビューを受けて、MQAについて詳しく解説している。なかでも、こちらの麻倉怜士氏のインタビュー記事は、やや古い記事だが大変参考になる。本記事でも参考にさせていただいた。
関連動画
MQAで収録した空気録音や、関連動画も公開している。
空気録音は、こちらがおススメ!
コメント 他者への誹謗中傷はお控え下さい