Top

まぁこんなもんでしょ
by rantan-maple
S M T W T F S
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
カテゴリ
以前の記事
リンク
最新のトラックバック
高速バス 大阪 鹿児島
from 旅
桜井和寿 吉野美佳
from 桜井和寿
鮒寿司
from 君は今日からCOOK☆スター!
英語って簡単じゃない?!
from 英語って簡単じゃない?!
491277 Blog ..
from 491277 Blog Ve..
ざくろジュース
from ざくろジュース
aiko 整形
from aikoめっちゃ好き!
キッズ・ウォー
from http://tvdrama..
ドラマ『 新キッズ・ウォ..
from YouTube 無料動画を楽..
賃貸アパート東京
from 東京
検索
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧
画像圧縮について(宿題なのでかなり長いです)


f0034511_132476.jpg

※この画像はJPEG圧縮です

たとえばこの512*512の静止画をビットで表す場合
   "512*512=262,144【画素(bit)】"
必要になる。これは単純に白か黒で表す場合である。(当然ながら灰色等の中間色は含まない)
次に黒→白を256レベルに分けるとする。256は2の8乗つまり8【bit】である。つまりモノクロ画像を現そうとすると
   "262k*8=2096000≒2.1【bit】"
となる。
次にこの画像をカラーにするとしようカラー画像は(赤)(緑)(青)の3色からなりそれぞれ256レベル存在する。
(黒と白もこのうちに含まれる)つまりカラー画像を現そうとすると
   "2.1*3=6.3m【bit】"
必要となるのだ。
又、動画の場合であるが、人は1秒間に30コマあれば滑らかな動きとして見える。(20コマあれば滑らかに見えるらしいが・・・・)画像サイズは252k、1秒当たり30コマ、ビット数は8bitなので6.1Mとなる。これはMP3形式の音楽1曲分、またデジタル電話信号の約1000倍である。さらにカラー動画にすると
"6.1M*24=190M"
にもなるのだ。

つまり
モノクロ静止画   2.1M
カラー静止画    6.3M
モノクロ動画(1s) 63M
カラー動画 (1s) 190M

となる

これでは重過ぎるので圧縮が必要なのだ。
画像を圧縮する手っ取り早い方法には以下の方法がある
1)1画面のビット数を下げる
2)1画面の画素数を下げる
3)1秒あたりの画面数を下げる

※しかしこの方法だと画品質が低下する。

1)のビット数を下げると4bitまでは見ようと思えば見れる。しかし3bitになるとモザイクがまるでかかったようになる。
ちなみに量子化の削減方法とは1,2,3,4,5,6,7,8,9と分かれていたものを1~3,4~6,7~9大まかにする。つまり2,6,8のところに5を入れるともともと6だったものに5が入りその代わりに6が出るということ。

図にすると

1|2|3|4|5|6|7|8|9|→1,2,3|4,5,6|7,8,9|に置き換え、

         5
        ↓
1,2,3|4,5,6|7,8,9|
           ↓
         6

となる。


2)の画素数を下げると128*128までは何とかなるが64*64になるとかなり荒くなる。

3)は当然1秒間の画面数を下げるとかくかくな動画になる。

つまりこんな方法は使えないことはないのだが実用的ではないのだ。
そもそも使わないんだが・・・・・・・

まぁ、基本原理というものが存在するわけで

1)視覚の特質を利用

・高周波成分の劣化は目立ちにくい
・動いている部分の劣化は目立ちにくい
・色は輝度より解消度(きめ細かさ)を低くしたほうが目立ちにくい

2)画像の特質を利用する

・隣り合った画素数は似ている
・低周波成分が多い

簡単に言えば人の目をだまそうってことになる。

1)視覚の特質を利用すると言うことは

画像の劣化の目立ちにくいところを劣化させると言うことである。

画像の劣化が目立ちにくいところというのは高周波成分の部分であるのだが・・・・・・
調べたのですがいまいちわかりません・・・・・・

また動画の場合動いてる部分の劣化は目立ちにくく(おそらく劣化してても次の画像にすぐ移るから?)背景よりも中心物の劣化をしたほうがいいということになる。
でも背景をじっくり見ている人なんているのだろうか・・・?

2)画像の特質を利用するの言うのは

A)画素値を似たものに置き換える
例)
・隣接画素間の差分を取る
・差分値の分布は0近辺に集中

出現頻度の高い値に短い符号を低い値に低い値を割り当てて平均値を低くする。
これは1が12つ2が4つあるとしよう1の符号を1/4、2を1/2とする。
  "12*1/4+4*1/2=5"
たとえば逆にすると
  "12*1/2+4*1/4=7"
つまり数が大きいものの符号を小さくすれば全体の平均値を低くすることができるのだ。

また画像の特質を利用する別の方法としてはエントロピー符号化を利用する方法をある

エントロピーとは
 情報源Xでシンボルx1,x2,...,xn中のどれかを発生する(各々の発生する確率がP(xi)である)場合に、情報源Xの平均情報量とは、各シンボルの情報量に、その生起確率:P(xi)を乗じたものの総和で与えられ、次の式で表す。

H(x)=P(x1)(-logP(x1))+P(x2)(-logP(x2))+...+P(xn)(-logP(xn))
つまりH(X)=-ΣP(xi) logP(xi)となる
           i

エントロピーH(X)の意味
a)情報源Xで発生したシンボルを知った後での情報源Xの平均情報量
b)情報源Xでシンボルが発生する前での情報源Xの不確定度

ここで、最も単純な2個の文字0、1からなる2元情報源を例にとる。
文字0の生起確率:P
文字1の生起確率:1-P

これより、エントロピー:H(P)は次のように書ける。
H(P)=-PlogP-(1-P)log(1-P)


P=1 または P=0の場合
 この場合、エントロピーは最小の零となっている。 これは情報源から発生する文字が完全に予想できるためである。 これがH=0の意味である。
P=0.5の場合
 この場合、エントロピーは最大のlog2=1ビットとなっている。 これは情報源からいずれの文字が発生するかという不確定度が最大となっているた\\めである。これがエントロピーが最大の意味である。

エントロピーの性質
 0 ≦ H(X)≦logn  

 ただし、情報源Xがn個のシンボル持つ。その最大値は各シンボルの発生確率が1/nである時に得られ,その最小値はその中の1つのシンボルの発生確率が1,その他のシンボルの発生確率が0の時に得られる。

発生頻度を


1  1/2
2  1/4
3  1/8
4  1/32
5  1/32
6  1/32
7  1/32

とすると

64/32=2となる(すみません計算式忘れました・・・・・)

また
DPCM - Differential Pulse Code Modulation を利用する方法もある

DPCMとは予測符号化とも言い符号化済み近隣画素値から入力画素値を予測することである

JPEGやらMPEGやらといろいろ使っている割には結構知らないことばっかりでした。
 











いやぜんぜんわからん!
[PR]
by rantan-maple | 2006-10-01 23:42 | リア話のみ