高校~社会人の情報学基礎知識講座

コンピュータにおける画像・音声・動画表現

»

週末の低気圧で起き上がれなかった吹越です。


コンピュータにおける画像の表現

大まかに分けて「ラスター画像」と「ベクター画像」という2つの表現形式があります。

「ラスター画像」とは、画素(ピクセル)という主に正方形のデータを長方形型に敷き詰めて画像を表現する形式です。
1枚の画像で縦横のピクセル数は大体時代によって変わっていくわけです。画素が多ければいい、という画素戦争は最近は落ち着いたかな...?
https://ja.wikipedia.org/wiki/%E7%94%BB%E9%9D%A2%E8%A7%A3%E5%83%8F%E5%BA%A6 

ラスター画像における色の選択においては「カラーパレット」という「この色とこの色とこの色を使うよリスト」があり、カラーパレットを利用することで色の指定ビット数を減らすパターンがあります。
ちなみに最大では光の三原色の赤緑青に対し、各1B(256段階)を準備して、256の3乗で16,777,216色があります。
これ以上細かくしても人間の識別能力限界を超過するので充分だろう、と言われています。

ファイル形式と圧縮の話については別途圧縮の話が出てくるときにすることにします。

拡大していくと正方形のギザギザ(エッジ・ジャギー)が出てきます。

「ベクター画像」とは、一般人だと不動産屋の部屋画像なんかで見ることが多いです。
中身はテキストで座標を保存していることが多いので、ラスター画像よりデータ量が一般的に少ないことが多いです。

「座標何から座標何への直線」的なデータの組み合わせなので、拡大しても線が滑らかなままで入れることがメリットです。

たまにExcelでとんでもなく細かい絵を描いてくる人とかいるけど一応ベクター分類ですね。
https://nlab.itmedia.co.jp/nl/articles/1801/27/news027.html


コンピュータにおける音の表現

前回のお話で出てくるサンプリング・量子化の話で軽く話しましたが、音圧を何段階で表現するかを量子化・秒間何回データを取るかをサンプリングと言います。
これは基本情報の過去問見るのがわかりやすいかな?

基本情報技術者平成23年秋期 午前問29

音声のサンプリングを1秒間に11,000回行い,サンプリングした値をそれぞれ8ビットのデータとして記録する。このとき,512×10^6バイトの容量をもつフラッシュメモリに記録できる音声の長さは,最大何分か。

1回8bit=1Bなので秒間11,000B,分単位に直すので60倍して660,000B=6.6×10^5B。
512×10^6 ÷ (6.6×10^5)=775.7575・・・分。小数点以下切り捨てで775分です。

まぁこれはPCM符号という方法で録音した際の方法なので、mp3とかにするとまた圧縮されてもっと減るけども。
この辺も圧縮の話が出た時に回します。

ちなみに音のデータにもベクター画像のように表現法を変化させることでデータ量を少なくしてそのまま表現する形式があります。
MIDIと呼ばれるデータ形式です。
これは楽譜データをそのまま記録したものと思ってもらっていいです。

JASRACが嫌われる原因の一つとして、「著作権的に違法状態のmidiが氾濫していた時代に取り締まりを強化した際に著作権的に問題ないサイトにまで支払えと言った」という話があります。その辺は調べてみると良いですが、少なくともこの件のあおりを受けて自作曲のmidiを公開していた違法ではないサイトまでmidiを取り下げることが増えたことだけは事実ですね。


コンピュータにおける動画の表現

動画はいわゆるパラパラ漫画方式で画像を切り替えていきます。
この時、1秒間に何枚の画像を切り替えるかでその動作の滑らかさが変わりますが、この1枚の画像表示を1フレームと言います。
人間の脳処理において視覚情報は概ね30フレーム程度といわれており、サンプリング定理の関係から60フレーム程度あれば十分な滑らかさを確保できます。
よって格闘ゲームなんかだと60fpsと書かれてるものが多いです。frame per second で秒間60フレームということですね。

音声付き動画の音声部分はまんま上記の音の表現のままなので置いておきます。


とりあえず最低限の話はできたかな...?
足らなかったら後で補足入れます。

Comment(0)

コメント

コメントを投稿する