画像や音声、動画ファイルといったメディアファイルの種類は、メジャーどころだけでもいくつかありますが、それぞれにどんな特徴があるのかいまいち自分で整理できていなかったので、自分への備忘録として、よく利用されている音声や画像ファイルの形式の特徴をまとめてみました。
特徴をざっくりとでも理解しておけば、どんな時にどんなファイル形式が適しているか判断しやすくなりますよ。
目次
画像ファイル
代表的な画像ファイル形式は、次のとおりです。
BMP
BMP(Microsoft Windows Bitmap Image)は、非圧縮の画像形式で、表現できる色数は一般的にはフルカラー1670万色に対応しています。
BMP形式では、画像データが圧縮されていないため、元画像の再現率が高いですが、データ容量が大きいという特徴があり、Webサイトやメール添付には不向きな画像です。
GIF
GIF(Graphics Interchange Format )は、可逆圧縮の画像形式で、表現できる色数は最大256色に対応しています。
GIF形式は、256色という限られた色にしか対応していないため、おもにアイコンややボタン画像など、使用色数の少ない画像への使用に適した形式で、背景を透明にしたり、動きをつけたアニメーション画像などを作成することもできます。
JPEG
JPEG(Joint Photographic Experts Group)は、非可逆圧縮の画像形式で、表現できる色数はフルカラー1670万色に対応しています。
JPEGは、主に色数の多い写真などの画像に適したファイル形式で、デジタルカメラなどではデフォルトの保存形式となっている場合が多いです。
PNG
PNG(Portable Network Graphics)は、可逆圧縮の画像形式で、表現できる色数はフルカラー1670万色に対応しています。
PNGは、GIF形式で実現できる「背景透過」の機能を持ちながら、GIFの「256色」という制限を解消した形式として開発され、イラストや図などを画像形式で保存する際によく利用されます。
なお、可逆圧縮のため、画像の編集/保存を繰り返しても、元の画質を維持できるメリットがありますが、JPEGやGIFに比べて若干データ容量が多いです。
SVG
SVG(Scalable Vector Graphics)は、ベクター形式の画像で、画像や文字などの2次元情報が数値として記録されており、拡大縮小で画質が劣化することがなく、アイコンや地図、平面的なイラスト用として使用されることが多いです。
また、SVG形式は、あとから色やサイズの変更が必要になったときに専用の画像ソフトで編集することなく、WebページならCSSでサイズや色を変更でき、アニメーションや透過といった処理も可能です。
WebP
WebPは、可逆圧縮と非可逆圧縮のいずれにも対応している画像形式で、JPEGやPNGなどの従来の形式より高画質のままデータサイズを小さくできます。
また、WebP形式は、アニメーションや背景の透明化にも対応しています。
AVIF
AVIF(AV1 Image File Format)は、可逆圧縮と非可逆圧縮のいずれにも対応している画像形式で、従来の画像形式と比較して高い圧縮率を誇っており、同等画質のJPEG形式の画像ファイルと比べて、約95%以上のサイズ削減が可能とも言われており、次世代の画像形式として期待されています。
また、AVIF形式は、アニメーションや背景の透明化、HDR(ハイダイナミックレンジ)カラーにも対応しています。
音声ファイル
代表的な音声ファイル形式は、次のとおりです。
WAV
WAV(RIFF waveform Audio Format)は、非圧縮の音声形式で、音質は、ほぼオリジナルを維持でき、データサイズは、1分当たり10MB~30MBで、下記に紹介している圧縮された音声形式と比較すると大きめです。
ちなみに、WAVファイル内には、アーティスト名・作成年・曲名等の情報や、ジャケット写真、歌詞をメタデータとして埋め込むことができ、以降で紹介しているすべての音声形式でも同じようにメタデータを埋め込むことができます。
MP3
MP3(MPEG-1 Audio Layer-3)は、非可逆圧縮の音声形式で、音楽CDなどの曲をデジタルデータとして取り込む用途で広く普及し、再生可能な機器も多く、最も汎用性の高い音声形式です。
音質やデータサイズは、利用するエンコーダーやビットレート(圧縮率)により大きく異なりますが、データサイズは、WAV形式などの非圧縮の音声形式と比較して約10分の1で、ビットレート256kbps/320kbpsならCD相当の音質を維持できます。
非可逆圧縮は、圧縮前のデータと圧縮・展開を経たデータが完全には一致しないデータ圧縮方式のことを指します。
逆に、可逆圧縮は、圧縮前のデータと圧縮・展開を経たデータが完全に一致するデータ圧縮方法のことを指し、 ロスレス圧縮とも呼ばれます。
AAC
AAC(Advanced Audio Coding)は、MP3の後継とされる非可逆圧縮の音声形式で、音質は、低ビットレート(128kbps以下)では、MP3よりも音質が良いといわれていますが、高ビットレート(160kbps以上)では、MP3の方が高音質と言われています。
データサイズは、同程度のビットレートであればMP3より若干小さいようです。
FLAC
FLAC(Free Lossless Audio Codec)は、オープンフォーマットの可逆圧縮(ロスレス)の音声形式で、原音からの劣化が無く高音質なことから、現在主流の音声形式といわれています。
また、近年注目されているハイレゾ(高解像度)音源の提供でも利用されています。
データサイズは圧縮率により異なりますが、圧縮レベル5でおおむね非圧縮の音声ファイルの半分ほどです。
オープンフォーマットとは、通常、非営利の標準化団体が管理し、利用が自由で法的な制約もなく、公開されているファイルフォーマットを指しています。
一方、上述のMP3やAACなどは、プロプライエタリフォーマットと呼ばれ、特許権や著作権で保護されており、それらの音声ファイル形式のファイルを作成するようなソフトウェアを開発するメーカーなどは、ライセンス料を支払っています。(なお、MP3については、すでに特許保護期間が終了しています。)
AC3
AC3は、ドルビーラボラトリーズが開発した非可逆圧縮の音声形式で、一般的には「ドルビーデジタル」と呼ばれています。
AC3は、単体の音声ファイルとして利用されることはなく、DVD・Blu-rayや家庭ゲーム機の音声形式として用いられ、5.1chなどの2ch以上の出力に対応してます。
AC3のデータ圧縮率はそれほど高くはないですが、その分音質が高いのが特徴です。
Opus
Opusは、オープンフォーマットの非可逆圧縮の音声形式で、YouTubeやDiscordで採用されており、Windows 10の標準メディアプレイヤー「Grooveミュージック」でも再生できるようです。
音質やデータサイズは、ビットレートにより異なりますが、同一ビットレートならMP3よりも高音質で、特に低ビットレートで音質が高いと言われています。
動画ファイル
コンテナ
動画ファイルは、映像データと音声データが「MP4」や「AVI」といった入れ物(コンテナ)にまとめられたファイルで「コンテナファイル」と呼ばれます。
代表的なコンテナ形式は、次のとおりです。
MP4
MP4は、拡張子が「.mp4」の動画ファイル形式で、WindowsやMacをはじめとしたさまざまなデバイス、プラットフォームで再生でき、高い圧縮率を誇り動画ファイルのもっとも一般的なファイル形式です。
AVI
AVIは、拡張子が「.avi」の動画ファイル形式で、かつては動画ファイルの形式と言えば「AVI」と言われていた時代もあり汎用性は高いですが、現在ではあまり利用されることはありません。
WebM
WebMは、拡張子が「.webm」の動画ファイル形式で、オープンソースの動画ファイル形式です。MP4よりもやや画質は落ちるものの、圧縮率が高いのが特徴です。
MKV
MKV(Matroska Multimedia Container)は、拡張子が「.mkv」の動画ファイル形式で、オープンソースの動画ファイル形式です。MKVは字幕などの映像と音声以外の情報をコンテナ内に同梱できるのが特徴です。
MOV
MOVは、拡張子が「.mov」の動画ファイル形式で、Apple社製のデバイスではデフォルトの動画保存形式となっており、品質の高い映像や音声を保存できる一方、ファイルサイズが大きいのが特徴です。
映像コーデック
動画ファイルに格納される映像データは、コーデックと呼ばれるプログラムによってエンコード(符号化)された状態で格納されています。
コーデックにはさまざまな種類があり、代表的な映像コーデックは、次のとおりです。
H.264
H.264は、現在もっとも一般的な映像コーデックで、さまざまなデバイス・プラットフォームで再生可能で、低ビットレートでも画質が良いのが特徴です。なお、H.264は再生時の負荷が大きく、4K動画やHDRコンテンツには不向きといわれています。
H.265
H.265は、H.264の後継コーデックで、高い圧縮効率(H.264の2倍の圧縮率)や8K解像度への対応が特徴ですが、再生可能なデバイス・プラットフォームはそれほど多くありません。
AV1
AV1は、オープンソースかつロイヤリティフリーの映像コーデックで、高い圧縮率を誇り次世代の映像コーデックの本命として期待されており、主要なプラットフォームやブラウザでの対応が進んでいます。
VP9
VP9は、オープンソースの映像コーデックで、主にWebブラウザでの再生用として用いられることが多く、幅広いブラウザやデバイスで再生が可能で、4K動画のストリーミング再生も可能です。
あとがき
メジャーどころだけでも画像/音声/映像それぞれにいろいろな形式がありますが、ザックとだけでも特徴をとらえておくと、ファイル形式を選択するときに役立つでしょう。