←講義のツボメニューへ
画像の符号化・映像処理
【日付2002,6,28】 【連載回数 第17回・第18回】
[1]符号化方式の分類
画像の種類 | 再現性 | 符号化方式 |
2値画像 | 可逆 | ランレングス符号化、予測符号化、チェイン符号化等 |
不可逆 | 曲線当てはめ符号化等 |
濃淡画像 | 可逆 | 予測符号化、階層的符号化 |
不可逆 | 予測符号化、変換符号化、ベクトル量子化 |
動画像 | 不可逆 | フレーム間予測符号化、動き補償フレーム間予測符号化 |
画像の符号化方式を大別すると、元の画像を完全に修復できる可逆的符号化方式と、元の画像を完全には復元できない不可逆符号化方式に分類できる。
↓
可逆符号化:情報欠損の許されない画像の伝送、蓄積には適しているが、あまり大幅な圧縮は期待できない
不可逆符号化:多少の情報の欠損を犠牲にしても大幅に圧縮したい場合に適している
[2]2値画像の符号化
(1)ランレングス符号化
2値画像において白画素、黒画素のそれぞれの連続する長さを符号化する手法
(2)チェイン符号化
線画像を、画素の連なりに注目して記述する可逆符号方式
[3]濃淡画像の符号化
(1)予測符号化
予測符号化とは、すでにわかっている周囲の画素値から注目画素f(x,y)の予測値g(x,y)を求め、その予測誤差E(x,y)=f(x,y)-g(x,y)を符号化するというもの
(2)変換符号化
通常、画像データをフーリエ変換で空間周波数領域に変換すると、その空間周波数スペクトルは低い周波数成分が卓越したスペクトル分布を示す。このような場合、低周波数成分の係数のみ符号化すれば、有用な情報を保存しながら全体のデータ量を削減することができるというもの
[4]動画像の符号化
(1)フレーム間予測符号化
動画像において、1フレーム前の画像の同一位置の画素値を予測に用い、予測値との誤差分を符号化するという手法。最も簡単な予測方法は前のフレームの画素値をそのまま予測値として使うもので、画面内で動く部分が少ない場合は効率のよい圧縮が期待できる。
(2)動き補償フレーム間予測符号化
一般に、画像内の物体の動きが激しいと、単純なフレーム間予測符号化では予測の精度が低くなり、高い圧縮率は期待できない。こうした場合、前後のフレームを比較して物体の動きを検出し、その動き量分だけ前のフレームで予測に用いる画素の位置を補正することで予測の精度と圧縮率の向上を実現できる。こういった操作のことを動き補償という
[5]ハフマン符号化
ハフマン符号化は、画像の種類によらない符号化方式である。符号割り当ては、濃度やランレングスといった情報源シンボルに符号を割り当てる作業であるが、生起確率の高い情報源シンボルほど短い符号を与えると、符号化に必要な平均の符号長を最小とすることができる。というのがハフマン符号化の原理
符号化技術の標準化
[1]JPEG
マメ知識:JPEGとはカラー静止画像の国際標準符号化方式のことで、この国際標準化作業を行う委員会(Joint Photographic coding Experts Group)の略称がJPEGであったことからその名がある
JPEGには変換符号化の1つであるDCT(離散コサイン変換)を用いた不可逆符号化方式と、予測符号化の1つであるDPCMを用いた可逆符号化方式がある。
映像処理
[1]時間軸のエリアシング
|----------------→ 時間軸⇒フレーム/秒
エリアシングで逆回転して見える場合がある!
※自動車や自転車の車輪が実際の回転方向と逆向きに回っているように見える!
[2]フレーム番号と時間の管理
映像は画像の集まりであるから、処理の対象領域を特定する必要がある。現在ではタイムコードとよぶ指標が利用されている。タイムコードは本来、VTRでテープ上の位置を特定するために導入され、各映像フィールドごとに「時:分:秒:フレーム」の数値が記録されている。
映像処理機器
[1]映像のデータレート
データ量…膨大 ⇒ データレート
NTSC方式: 30枚/1秒 720×480画素=350kB×80
1050KB/1sec
=10MB/sec 白黒2値
[2]複数映像機器の利用

画像の区切りである垂直同期の期間に切り換える
映像の効果
時間&方向…場面を切り換える
特殊効果
ページめくり効果……DVE(ディジタルビデオエフェクト)
メモリの呼び出し技術の進歩によって実現した。