PC & モバイル

PC & モバイル

Audacityのラウドネスノーマライズは音量差のある動画の補正に有能だった

メニューのエフェクトの中にラウドネスノーマライズがある

ワンオペや低予算のためにビデオカメラ内蔵マイクで録ったインタビューやコメント動画は、どうしても声の大小がバラついて、編集段階で「これどうすんのよ」という扱いにくい素材になりやすい。

PremiereやDaVinci Resolveなどの動画編集ソフトだけで音量差を整えようとすると、設定が複雑だったり、極限まで低予算なのに、逆に補正に手間がかかってしまう。そのうえ、思ったように改善できなかったりすることも多い。

そんな中、古くから音声編集ソフトとして鎮座している無料のAudacityに搭載されている「ラウドネスノーマライズ」は、意外にも実用的な解決策として機能した。

そもそもラウドネス正規化とは何か

よくラウドネスは放送基準だとか、YouTubeではいくらが基準で、音圧がどうのという話になりがちだけど、今回は「どうしようもないワンオペ低予算インタビュー動画」の音声をどうにかするのがテーマなので、その話は横に置いておく。

ラウドネスノーマライズは単純な音量調整ではなく、人間が聴覚的にどれくらい大きく聞こえるかということを考慮しての音量調整である。つまり、同じ音量でも声質や周波数によって聞こえ方の印象が異なるため、波形のピークだけを単純に揃えても実際の聴こえ方はいい感じにはならないということ。

Audacityのラウドネスノーマライズは、自分の声が大きい反面、肝心のインタビューを受ける側の小さくて埋もれていた声を自然に持ち上げ、大きすぎる声を抑えてくれる。しかも、操作は基準になる数値を入れるだけで、ほぼワンクリックで完了する。複数の話者が登場するインタビューでは、聴こえ方の平均値を揃えるだけで視聴体験が大きく改善する。

ノイズ除去やEQも一緒にやると時短になる

小さい声を持ち上げるとノイズも一緒に上がる場合もある。録音状態が悪い素材を一発でどうにかするほどの力はなく、あくまで音量の聴こえ方を整えるための機能に留まる。そのため、ノイズ除去や、EQでの調整もやってしまうと無駄な時間を減らすことができる。

カメラ内蔵マイクで録ったインタビュー音声などは、声の大小が激しく、話者ごとに聴こえ方が違い、そのへんのコンプレッサーをかけるだけでは不自然になりやすい。無料でも有料でもサクッとラウドネス調整ができるツールは多くなく、まず最初に試す選択肢としてAudacityは十分に価値があると感じた。

まぁ、基本は撮影時に何とかする方がずっと楽なので、あくまでも救済手段という話ではあるから、撮影時に頑張るのが最良であることは言うまでもない。

PC & モバイル

ロスレスは容量の無駄でしかなくMP3の320kbpsで十分だったという話

画像は雪虫(記事と関係ありません)

正直に言うと、俺はロスレス音源をありがたがっていた。

理論的にCDと同じ音質のままPCに取り込めるというのがロスレス音源で、Flacなどが代表的なロスレス音源である。

ロスレスとMP3の320kbpsの違いは全く分からない

ほとんど分からないというか、むしろ全くわからない。音楽のジャンルにもよるかもしれないが、騒がしいポップスやロックとか、よくわからんダンスミュージックとかでは違いなんて何もない。

ロスレスの方が原音っぽい気がするだけで、実際には違いがわかったことがない。いや、違いが分かる人間なんて人口の0.1%いるかどうかのレベルだ。生まれ持った才能とか、そういうレベル。

しかも、その0.1%は視聴環境がやたら整っているという条件付きである。ロスレスを本気で聴き分けるには、ヘッドホンもスピーカーもアンプも、部屋の吸音も全部整えないといけない。つまり、ファイル形式だけの話ではない。

ロスレスのファイルサイズは重すぎる

数TBのSSDが何個も搭載されているマニアのPCとか、iPhoneやスマホのスペックに人生を全振りしている人間は別にして、普通の人のPCやスマホでは、ロスレスは音質的に意味がないだけでなく、容量がデカすぎる。

4分くらいの曲だとしても1曲あたり30〜40MBくらいになり、これはMP3の320kbpsと比べて3~4倍にあたる。アルバム2枚で1GBくらいになるのだから溜まったものではない。しかも、音質が3~4倍良いならまだしも、容量がデカいだけで普通の人の耳には全く同じに聴こえるのだから、無駄としか言えない。

特にスマホで聴くメリットは全くなくて、再生の負荷が高いからバッテリー消費も上がる。

そもそも時代は音質なんかどうでもよくなってる

マニア向けのロスレスのストリーミングサービスとかは別にして、一般人が普通に使う音楽配信サービスやYouTubeなどの音質がどうかというと、これは明らかにCDより音が悪い。

だが、99%の人には何の問題もなく不満を感じることはない。そもそも、一般人が使う普通のワイヤレスイヤホンは音がカスカスだ。音の出口がカスカスだから、元の音質が良くても意味がないわけで、合理的とも言える。

それでもロスレスで保存する理由

CDなどの光ディスクは半永久的に使えそうでも、保管状態やプレス品質などが悪いと、80年代や90年代に発売されたものは、2026年現在、ぼちぼち寿命を迎えてきている。

もう二度と手に入らないかもしれないCDは、漬け物みたいな圧縮音源にするより、ロスレスで保存したくもなる。これが理由かな。

それはそうと、VHSのビデオテープがデッキの生産終了だかでDVDにダビングする業者が盛況だと聞いた。だが、光ディスクの方がモノによっては、よっぽど寿命が短いのだから、このムーブメントは疑問に思ってたりする。そのダビングした光ディスクが読めなくなるころには、人間側の寿命が尽きているから関係がないという話だろうか。

PC & モバイル

【手振れ補正】proDAD Mercalliのダンス動画でのパンショット補正とロール・バランス設定のさじ加減

画像はイメージ

手持ちで撮った動画の手振れを安定化するとき、proDAD Mercalliの「パンショット補正」と「ロール・バランス」のさじ加減が重要になる。

特にダンスは動きが速く、複数のダンサーが同時に同じような動きをする場合が多く、これらの設定を誤るとダンスの動きに合わせて画面が動いたり引っ張られたりと、不自然な映像になりやすい。ここではダンス動画に適したパラメーター設定を解説する。

パンショット補正は弱めが基本

パンショット補正はカメラの水平/垂直方向のブレを補正する機能だが、ダンス動画では強くかけるほど破綻しやすい。ダンスでは水平/垂直方向の移動が頻繁に起こるためであり、これらの動きをMercalliが手プレとして誤認しやすい。

強めにかけるとダンスに追従するような誤った補正をしてしまう。したがって、パンショット補正は弱い設定に留めるのが最も自然な結果となるである。

ロール・バランスは中程度が最適

ロール補正はカメラの傾きを水平に戻す機能で、ダンス動画の手持ち撮影では特に効果が大きい。

ダンス動画ではカメラの傾きだけを抑える必要があるため、ロール補正は中程度が最もバランスが良い。これにより手持ち特有のロール揺れは抑えつつ、ダンサーの動きは維持される。

Mercalliがダンスの動きを誤認しやすい理由

Mercalliはカメラの動きを意図的な動きと意図しない揺れに分類して補正する。しかし、ダンス動画ではこの分類が難しい。

ダンサーの水平の動きはカメラの揺れと誤認され、ステップの上下動は手ブレと誤認される。つまり、ダンスの動きそのものが“手揺れ”として認識されてしまう。補正を強くかけるほど、不自然な映像として出力されやすい。

三脚を使うなどして揺れを作らないのが理想

ダンス動画におけるMercalliの最適設定は、手振れだけを抑え、ダンサーの動きの意図は残すというのが正解である。しかし、どれだけ設定を工夫しても、撮影段階で揺れが大きければ、安定化には限界がある。そのため、撮影段階で揺れを減らす工夫が最も効果的になる。

実際、ダンス動画では簡易的なものであっても三脚や一脚を使うだけで、映像の安定性は劇的に向上する。軽量のミニ三脚や自立式一脚などでも、カメラさえ固定できれば、後処理の負担がなくなる。

つまり、最も自然で破綻のないダンス動画を作りたいなら、Mercalli の設定を工夫するだけでなく、状況が許せば撮影時に三脚や一脚を導入することが最も良い選択になる。