儂は、動画ファイルの基本を知らなかったのじゃ

前回は、EOS R50 VとRF-S3.9mm F3.5 STM DUAL FISHEYEで撮影した映像を、EOS Utilityを使ってパソコンに取り込むところまで話したのじゃったな。

今回はそのファイルをApple Vision Proで「イマーシブビデオ」として観られるようにする工程を話そうと思っとったのじゃが……。ふと思い返せば、儂自身が「動画ファイルの基本」を知らなかったために、たいそう苦労したことを思い出した。

なので今回は、急がば回れじゃ。動画ファイルの基本について解説しようと思う。ここを整理しておかんと、これから先に儂が何を話しておるのか、お主がさっぱり分からんようになってしまうからの。まずは聞いておくれ。

EOS R50 Vで撮影した動画の「拡張子」(ファイル名の「.」の後ろにある文字列じゃ)は、「.MP4」となっておる。これは現在、最も汎用性が高い「コンテナ」じゃ。映像の「コーデック」はH.264(AVC)、音声はAAC 16bitじゃな。

……ほら、もう儂が何を言っておるのか分からんようになったじゃろう? 案ずるな、まずは「コンテナ」と「コーデック」の関係から紐解いていこうかの。

動画ファイルの中には、映像と音声のふたつのデータが入っておる。加えて、それらを正しく扱うための情報(メタデータ)も持っておるのじゃ。メタデータには、縦横の画素数(ピクセル)やタイムコード、コーデックの種類など、あらゆる情報が詰まっておる。

コンテナ

映像や音声、メタデータを一つにまとめて収める「箱」がコンテナじゃ。現在は以下の2つが主流じゃな。

形式特徴向いている用途
MP4互換性が非常に高い、圧縮効率良好Web配信、SNS、一般的な保存
MOVAppleが開発、高品質だが重めMac/iPhone、映像編集

一般的にはMP4が広く使われておる。MOVはAppleが作ったコンテナで、iPhoneで撮影した動画などはこれで保存されおるな。MP4はあらゆる機器で再生できるが、MOVは古いWindows機だと正しく動かぬこともある。Apple製品以外でも再生するなら、MP4にしておくのが無難じゃ。

コーデック(圧縮方式)

映像データは、撮影されたままの状態だと膨大なデータ量になる。そのままではストレージがいくつあっても足りぬので、「圧縮」して保存するのが普通なのじゃ。

ちなみに、動画はパラパラ漫画と同じで、静止画を何枚も並べて動きをつけておる。通常は1秒間に30枚程度(30fps)なので、1分間の動画なら 30枚 × 60秒 = 1,800枚 もの写真が必要になるぞ。

もし4K(3,840 × 2,160ピクセル)の画像を無圧縮で保存しようとすると、計算はこうじゃ。

  • 1枚のサイズ: 約8.3MB(8,294,400ピクセル × 8bit換算)
  • 1分間のサイズ: 約14.9GB

……とんでもない数字じゃろう? これを現実的なサイズに「ギュッ」と小さくするのがコーデックの役割じゃ。ただし、無理に圧縮しすぎると画像が荒くなるので注意が必要じゃな。

圧縮には、映像と音声でそれぞれ別の方式がある。主なものをまとめたぞ。

映像コーデック

コーデック特徴
H.264 (AVC)現在最も普及。スマホ・カメラ・Webの標準
H.265 (HEVC)H.264の後継。同画質で約半分のサイズ
ProResAppleの編集向け高品質コーデック

ProResには用途に合わせた以下のバリエーションがあるのじゃ。

種類品質ファイルサイズ用途
ProRes 4444 XQ最高非常に大きいVFX・合成
ProRes 4444非常に高い大きいVFX・合成
ProRes 422 HQ高いやや大きい高品質マスター
ProRes 422標準中程度編集標準
ProRes 422 LTやや低い小さめストレージ節約
ProRes 422 Proxy低い非常に小さいオフライン編集用

音声コーデック

コーデック特徴
MP3最も普及している非可逆圧縮フォーマット。ファイルサイズを小さく抑えつつ、汎用性が非常に高いのが強み。
AACMP3の後継として開発された。同じビットレートならMP3よりも音質が良い。YouTubeやApple製品、地上デジタル放送などで広く採用。
WAVWindows標準の無圧縮フォーマット。音質の劣化がないため編集や保存に適しているが、ファイルサイズは非常に大きくなる。
FLAC音質を完全に維持したままサイズを小さくできる「可逆圧縮」の代表格。ハイレゾ音源の配信によく使われる。
ALACAppleが開発した可逆圧縮フォーマット(Apple Lossless)。Apple製品との親和性が高く、音質を落とさずに管理できる。
Opus低遅延かつ高効率な最新のオープンソースコーデック。ネット電話(VoIP)やYouTube、ゲームの通信などで多用される。
Vorbis (ogg)ライセンスフリーの非可逆圧縮フォーマット。Spotifyなどのストリーミングサービスや、ゲーム内音声などで利用される。

さて、ここからが本題じゃ。
EOS R50 VとDUAL FISHEYEレンズで撮影した画像は、1つのフレームの中に「右目用」と「左目用」の丸い魚眼画像が左右に並んで張り付いておる。

これをそのままVision Proで再生しても、ただの「左右に丸が2つ並んだ変な動画」に見えるだけで、なんも面白うないのじゃ。初めて見たときは儂も心底落胆したわい。

なぜそうなるかと言えば、Vision Pro側が「これはただの平面動画だ」と思い込んでいるからじゃ。だからこそ、Vision Proに「これはイマーシブビデオ(没入型動画)なんじゃよ」と教えてあげねばならん。具体的には、メタデータにその情報を埋め込む作業が必要になる。

……そこでついに登場するのが、「EOS VR Utility」じゃ!
やっと話が戻ってきたのう。じゃが、今回はちと情報量が多くて儂も疲れてしまった。このあたりの続きは次回にしようかの。

次回こそ、EOS VR Utilityを使い倒して、Vision Proで「窓の向こうの世界」を再現する手順を話すぞ。楽しみに待っておくれ。

コメント

タイトルとURLをコピーしました