3 - 影像編碼技術 Image Coding Techniques 1 內...

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: 影像編碼技術 Image Coding Techniques 1 內 2)轉換編碼 3)量化觀念 4)資訊壓縮 容 1)圖像的表示 5)國際編碼標準 2 圖像的表示 在電腦中,要如何表示一個圖像?電腦中 並沒有底片或是紙張可供儲存圖案,只能 想辦法將圖像的資料存到記憶體之中。 3 數位化圖像常用名詞 1) 像素:一張圖像可以視為一堆相鄰的點,這些點構 成了一張圖像的基本單位,稱之為「像素」( Pixel) 2) 圖像大小: 即一張圖像的長度和寬度。 3) 解析度: 電腦圖像中,單位面積所包含的像素個 數。在圖像大小不變的情形下,所含的點愈多,點 也就愈小,解析度愈高,圖像看起來就會愈精細。 4) 像素的長寬比: 一個像素長度和寬度的比例。 5) 深度: 表示一個像素的顏色所需用的位元數。對於 黑白的棋子,由於顏色只有兩種,因此記錄方格上 的棋子顏色只需 1 個位元。同理,像素內可能填入 的顏色愈多,所需的位元數也就愈多。 4 電腦儲存圖像的方法 一般可分為兩種: 1)『向量式』的表示法 2)『點矩陣式』的表示法。 5 『向量式』的表示法 『向量式』的表示法為記錄圖像的 (1)圖像種 類、 (2) 座標 與 (3) 相關參數。例如: 表示一個圓,可以記錄它是個 (1)「圓」的形狀 (2)「圓心」座標、以及 (3) 「半徑」長度。 對於幾何圖像而言,這個方式可以說相當的簡 便,但是對於照片,自然景色等影像圖案,則不 容易以這個方法表示。 6 『點矩陣式』的表示法 『點矩陣式』的表示法是不管圖像的內涵而將整 個圖像分割成為如棋盤式的方格點,進而儲存每 一個點的色彩資訊。 一條水平直線可用一串的連續點所構成, (a) 若以點陣表示 (l 代表黑色, O 代表白 色),則「點矩陣式」的電腦儲存結果為: {00000000, 00000000, 00000000, 11111111, 00000000, 00000000, 00000000} (b) 若以向量表示 : {圖像種類,起點座標,長 度,寬度,角度} 則為: {直線, ( 0,4 ) , 8 , 1 , 0} 7 點矩陣式:{00000000,00000000,00000000,11111111,00000000,00000000,00000000} 00000000 00000000 00000000 11111111 00000000 00000000 00000000 (b) 以向量表示 {圖像種類,起點座標,長度,寬度,角度}則為: {直線, ( 0,4 ) , 8 , 1 , 0} 8 圖像之點陣表示法 圖像之 影像表示法 影像表示法 x y 以二維函數 I(x, y) 表示 以二維函數 I 代表亮度,x, y 代表座標 每一座標點代表一個像素 (pixel) 每一座標點代表一個 若像素以 8 bits 表示,其值介於 0~255 若像素以 影像的儲存 影像的儲存 灰階:512 x 512 x 8-bit = 262 k bytes 灰階 黑白:128 x 128 x 1-bit = 2.0 k bytes 黑白 註: 1. 通常 k =103; 數位用法 1K= 1024=210 2. pixel:Picture elements 9 圖像的色彩 1) 單色 ( Mono ) :一張像像只有黑或白兩色,需要1位 元,便可以表示一個像素的顏色資訊。 2) 256 灰階 (256 Gray level):一張像像的顏色是由暗 (黑)到明(白)分成256 個層次,因此有256 灰 階。一個像素要能表示256 種不同的黑白明暗度, 需要 8 個位元(28 = 256) 3) 16 色:16 色的表示模式為最簡單的彩色模式,要表 示16 種顏色的狀況,需要4 個位元( 24 = 16 )。 4) 256 色:由於256 種顏色的色彩表示能力,已可以相 當豐富的將一般圖像表現的相當逼真,因此這個模 式以往是一般彩色圖像最常採用的模式。(28 = 256) 10 10 圖像的色彩 5) 64K顏色 (Hi-Color) : 這個模式中的每一個 像素可以表現出 64x1024 = 65536=216 種顏 色。此模式下,一個像素需要16 個位元, 其中紅藍綠三原色各佔 {5、5、6} 個位 元,所以紅色、藍色、綠色各有32 、 32 、64 種明暗廣的變化,總共可以組合 出64K 種顏色。 11 11 圖像的色彩 6) 全彩模式 (True Color) : 紅色、藍色、綠色 各佔 8 個位元因此三原色各有256 種明 暗廣的鑾化,可以表現出的顏色共有224 = 16777216,也就是一千六百多萬) 種顏 色,因此稱為『全形模式』。這個方式類 以於電視所用的「紅、綠、藍』( RGB ) 三槍投影映像管的原理,可以真實的表現 出一個點的顏色出來。 12 12 記錄數位圖像的要素 數位圖像除了需要圖像中每個像素的內容之 外,還需要記錄以下這些要素包括: 1. 圖像的長寬所佔的像素點數 2. 圖像所採用的色彩模式 3. 16 及256 色模式時所用的調色盤 在16 色及256 色的高彩模式下,每個像素所 存的內容並下是真正的顏色值,而是一個顏 色的編號而已。因此需要有一個調色盤記錄 每個編號所對應的真正顏色。 13 13 圖像中有多少種不同顏色? 14 14 調色盤 (palette) 好比要畫一張畫而畫中總共用了256 種顏 色,因此先把這256 種顏色調出來並且每一 種顏色給一個編號 ( 0~255 ) , 紀錄塗色的時候僅把顏色的編號寫到要塗的 區域就行了。 所以256 色模式的調色盤包含256 種顏色的 RGB 值, 16 色模式的調色盤則有16種顏 色。 15 15 16 16 調色盤 (palette) 一般要表現出一種顏色的真實色彩,需要紅 藍綠三原色各8 個位元的空間。 16 色和256 色模式儲存每個像素的位元數, 無法記錄顏色的真實色彩,所以只記錄色彩 的編號 (稱為『索引值』) 。 因此需要有一個索引參照表 (lookup table, LUT),讓索引值能轉換為真實的顏色資訊。 17 17 數位調色盤示意圖 (a)圖像紀錄 (b)索引參照表 (c)圖像輸出 18 18 24-bit Color Images 19 19 8-bit Color Images Original image 20 20 圖像的大小與解析度 掃描器是常用的圖像輸入工具,在掃瞄過程中,掃 描器會讀取圖片反射回來的光點,圖片上每一吋能 讀取的光點愈多,掃瞄影像的解析度就愈高。 解析度的範圍由每吋 75 點至2400 點(dot per inch, dpi)不等。 如果要把影像印出來,解析度的設定值越高印出圖 像品質就越好。我們來看一個例子 : 一個長 200 像素、寬 300 像素的圖像 (寫成2O0 X 300 ) ,如果解析度設為 72 點/吋,則這張圖像的大 小約為 2.78 X 4.17 吋2 21 21 影像的格式 數位影像常需用不同的壓縮編碼,以利於 存取﹐因此有各式各樣的圖檔格式,這些 格式因發展的年代及使用的背景不同,而 各有特色,茲說明如下: PCX, IMG PCX BMP (Bit-map) BMP TIFF (Tagged Image File Format) TIFF EPS (Encapsulated PostScript) EPS GIF (Graphical Interchange Format) GIF JPG (JPEG, Joint Photographic Experts Group) JPG 22 22 PCX PCX was developed by the ZSoft. It was the PCX native file format for their PC Paintbrush graphics program, which was one of the first popular DOS graphics programs for early PCs PCX was quite popular on early DOS and Windows PCX PCs, but is nowadays rare, having been largely replaced by formats which support better compression, such as GIF, JPEG and PNG. PCX format supports 1 (Monochrome), 4 (16 PCX colors), 8 (256 colors) and 24 (16.7 million) colors 23 23 IMG IMG 圖檔格式是由美國Digital Research 公司所提出,原本主要是針對8bits 的單 色灰階圖像 IMG 的檔頭資料共佔16 Bytes 圖像資料則是使用幾種不同的壓縮方式, 交叉使用來組成。 24 24 BMP BMP (Bit-map) 圖檔格式是由美國微軟公 司所推出,主要是用在Windows 視窗環境 下之圖像介面作業,它可以支援單色或彩 色圖案,亦可提供壓縮(主要是以 RLE (RUN-Length Encoded) 方式來進行)或不 壓縮的方式來儲存圖元資料,但在圖 檔處理時並無太複雜的計算過程,目前在 圖文整合的環境下有很大的運用空間。 25 25 TIFF TIFF (Tagged Image File Format) 檔案格式 是由 Aldus 和 Microsoft以及一些其他的公司 所共同研發訂定而成,目前為 Adobe 所擁 有。 TIFF可以說是工業界數位影像格式標準,具 有彈性、擴充性、可攜性及可增補性,因此有 越來越多的和影像處理有關的廠商採用 TIFF檔案格式其相關的工具程式也越來越多。 但是TIF 檔案格並非沒有缺點,由於它的兼容 並蓄的特性,使得它本身的複雜性很高,在管 理上或程式撰寫上都比其它的檔案格式來得困 難。 26 26 GIF GIF (Graphics Interchange Format) is an 8bit bitmap image format using a palette of up to 256 distinct colors from the 24-bit RGB color space. GIF was introduced by CompuServe in 1987 and has been widespread used on the World Wide Web GIF also supports animations and allows a separate palette for each frame. GIF image employs lossless LZW data compression 27 27 TGA TGA (Truevision Advanced Raster Graphics Adapter ) 為美國TURVISION 公司所提出 一種 raster graphics檔案格式,是24BITS 影像檔案中 常見的圖檔格式,主要是供PC的影像卡之用 其形式多變,具有延展性的考量,並可以由上面 下或由下而上,由左而右,由右而左的作全方位 式的壓縮 因此一方面具有高解析度及多色彩,一方面又擁 有相當不錯的壓縮效率 28 28 JPG JPG (JPEG) 檔案格式是由 Joint Photographic Experts Group 所制定的,主 要是用於靜態視訊影像的壓縮處理,最多可以 做到80:1 的壓縮比 一個影像如果處理成JPG 檔案,可以比GIF 檔 案佔用更小的記憶容量, 壓縮時先將顯像切割成許多8×8 的小方塊,然 後進行離散餘弦轉換 (DCT),最後經過霍夫曼 (Huffman) 編碼,而成壓縮過的資料。 Jpeg2000 (J2K)改用小波轉換(WLT)得到更好 29 29 的壓縮效果 基本影像處理運算 可分為兩類: 1. 空間類 (spatial-domain ): 處理影像 點,包括以下常見運算 點, 1) 2) 3) 4) 灰階分佈運算(gray level histogram op.) 點素運算 (point operation) 空間運算 (spatial operation) 假色運算 (pseudo color operation)等 2. 頻域類 (frequency-domain): 空間與頻 域間轉換 (transform operation) 30 30 空間類影像處理運算 1.灰階分佈運算 灰階分佈圖(gray level histogram): 表示 圖像中像素灰階的分佈 灰階分佈圖的形狀 圖像整體的貌相 分佈圖的 Location 分佈圖的 Width 分佈圖的 peak(s) 31 31 Gray level histogram 32 32 灰階分佈圖 Gray level histogram 33 33 灰階分佈圖 Gray level histogram 34 34 灰階分佈圖 Gray level histogram 35 35 灰階分佈圖 Gray level histogram 36 36 由灰階分佈圖看到結論? 偏黑! 37 37 空間類影像處理運算(c) 2) 點素運算 (point operation):影像的點 素運算處理是對影像的亮度分佈做修正或 組合,不過點素運算作業並未將相鄰像素 之間的關係考慮進去 3) 空間運算 (spatial operation):我們可 以對相鄰各點做進一步的處理,來提供更 多數位影像處理的憑據 4) 假色運算 (pseudo color operation): 使用色彩索引對照表 (look up table), 來得到一逼真又不佔太大的記憶體的影像 38 38 頻域類影像處理運算 頻域類 (frequency-domain) 處理運算: 處理運算 空間與頻域間轉換 (transform operation) 將時間域或空間域的資訊,轉換為頻域係數 將時間域或空間域的 要處理影像之空間域資訊,如影像物件邊緣的 資訊 偵測,常用的處理技巧就是利用轉換運算,例 如 Fourier、DCT、Hilbert 轉換等等,將影像轉 至頻率域後再實施頻域類影像處理,如空間濾 影像處理,如 波 (spatial filtering) 等運算 39 39 採用轉換編碼的動機 轉換編碼 轉換編碼 將時間域或空間域的資訊,轉換為頻域係數 將時間域或空間域的資訊,轉換為頻域係數 採用轉換編碼的動機 採用轉換編碼的動機 相鄰的時間域或空間域資訊,相關性極高 相鄰的 頻域係數兩兩之間幾乎獨立,相關性低 頻域係數兩兩之間幾乎獨立,相關性低 能量集中性 (energy concentration) 能量集中性 頻域係可依照重要性進行排列 頻域係數可依照重要性進行排列 40 40 轉換編碼1 – DFT 離散傅立葉轉換 (Discrete Fourier Transform, 離散傅立葉轉換 DFT) 正轉換 (時間域/空間域 x → 頻率域 u) 正轉換 一維 一維 1 F (u ) = N ∑ N −1 u=0 N −1 f (x) e − j 2 π nu N x=0 反轉換 IDFT (頻率域 u → 時間域/空間域 x) 反轉換 一維 一維 f (x) = ∑ F (u ) ⋅ e j 2 π nx N 41 41 轉換編碼2 – DCT 離散餘弦轉換 (Discrete Cosine Transform, 離散餘弦轉換 DCT) 正轉換 (空間域 x, y → 頻率域 u, v) 正轉換 C (u ) = α (u ) ⋅ ∑ n =0 N −1 (2 x + 1)uπ f ( x ) cos 2N α (u ) = 1 N 2 N , u=0 , u = 1, 2, L , N − 1 反轉換 IDCT (頻率域 u, v → 時間域/空間域 反轉換 N −1 x, y) (2 x + 1)uπ f ( x ) = ∑ α (u ) ⋅ C (u ) cos n =0 2N 多數能量集中於低頻係數 多數能量集中於低頻係數 42 42 DCT 若每個block size 為 8x8,則產生 64 個 DCT 係數 若每個 係數 係數須以鋸齒狀掃描方式排列 係數須以鋸齒狀掃描方式排列 DC AC2 AC3 AC9 AC10 AC20 AC1 AC4 AC8 AC11 AC19 AC22 AC34 AC36 AC5 AC7 AC12 AC18 AC23 AC33 AC37 AC48 AC6 AC13 AC17 AC24 AC32 AC38 AC47 AC49 AC14 AC16 AC25 AC31 AC39 AC46 AC50 AC57 AC15 AC26 AC30 AC40 AC45 AC51 AC56 AC58 AC27 AC29 AC41 AC44 AC52 AC55 AC59 AC62 AC28 AC42 AC43 AC53 AC54 AC60 AC61 AC63 DCT 8x8 image block AC21 AC35 43 43 DCT轉換示意圖 DC成分 DCT 低頻 低頻 高頻 高頻 8 x 8 影像區塊 (i, j) 8 x 8 DCT係數 (u, v) 44 44 Example 保留DCT中所有成分 保留 45 45 45 Example 只保留DCT中之DC成分 只保留 46 46 46 Example 去掉DC成分 去掉 47 47 47 Example 保留DC及水平之AC 保留 48 48 48 Example 保留DC及垂直之AC 保留 49 49 49 Example 保留DC及對角之AC 保留 50 50 50 Example 保留DC及前3個AC 保留 51 51 51 Example 保留DC及前8個AC 保留 52 52 52 2d DCT 編碼之例 (DC~AC5) 編碼之例 DC DC+AC1 DC+AC1+AC2 DC+AC1~AC3 DC+AC1~AC4 DC+AC1~AC5 53 53 53 量化觀念 若量化器的輸入端 X, 輸出端 Y 若量化器的輸入端 輸出端 X 為實數序列,Y 為有限集合 {Y1, Y2, …} X 為輸入值,Y 為重建值 (reconstruction) 利用 Y 代表 X,於傳輸通道中傳遞 利用 輸出端以特定值來表示輸入數值 輸出端以特定值來表示輸入數值 例如:四捨五入 例如:四捨五入 輸入與輸出之間產生誤差 輸入與輸出之間產生誤差 在較早的文獻中,量化亦稱為『搏碼調 在較早的文獻中,量化亦稱為 變』(Pulse Code Modulation, PCM) 54 54 純量量化 Scalar Quantization 純量量化器界定下列三項特性 純量量化器界定下列三項特性 1. 2. 3. 3. 量化運算 Q(x) 函數表示法 量化運算 Q ( x ) = yi b0 X Y code y0 000 y1 001 y2 1 重建階層(reconstruction level), M M 重建值 (reconstruction value), {yi }i =1 界定範圍 (decision boundary), {bi }M i =0 ⇔ bi −1 < x ≤ bi b1 b2 b3 b4 b5 y3 010 y4 011 55 55 純量量化 Scalar Quantization 純量量化器的示意圖,如下所示 純量量化器的示意圖,如下所示 量化運算Q(x)參數 輸入 X 輸出 Y 56 56 向量量化編碼 編碼端 編碼端 將影像 O 切割成多個小方塊 (block) 將影像 每個小方塊視為向量 X 每個小方塊視為向量 選取碼簿 (codebook) 中最相像的碼字 Yi 選取碼簿 中最相像的碼字 • d ( X , Yi ) ≤ d (X , Y j ), ∀j 取最小誤差 將代表碼字的標號 (index) 傳出 將代表碼字的標號 傳出 57 57 向量量化解碼 解碼端 解碼端 將接收到的標號,轉成所對應的碼字 將接收到的標號,轉成所對應的碼字 碼簿事先訓練,編碼與解碼段使用相同碼簿 碼簿事先訓練,編碼與解碼段使用相同碼簿 碼字 Yi 即為向量 X 的近似向量 碼字 結合所有向量,即組成重建影像 O’ 結合所有向量,即組成重建影像 58 58 向量量化 壓縮率 向量化為多媒體壓縮的一種方法 向量量化為多媒體壓縮的一種方法 將輸入影像分割成 m x n 小方塊 將輸入影像分割成 每一方塊有 8 種灰階 每一方塊 碼簿大小為 L 碼簿大小為 若m x n = 4x4, L = 256, 4x4, 256, 壓縮率 = (4x4x8) ÷ log 2 256 = 16 壓縮率 59 59 向量量化的架構圖 向量量化的架構圖如下 向量量化的架構圖如下 Codewords Search codewords {c0 , c1 , L, cL −1} Index i Table Look Up codewords {c0 , c1 , L, cL −1} Xt X t′ 60 60 資料壓縮概念 多媒體資訊內含大量資料 (byte, 位元組) 多媒體資訊內含大量資料 位元組 資料壓縮於多媒體處理佔有重要地位 資料壓縮於多媒體處理佔有重要地位 以資訊理論 (information theory) 為基礎, 以資訊理論 為基礎, 進行探討 無損壓縮 (lossless compression) 無損壓縮 多餘量減少 (redundancy reduction) 多餘量減少 重建資料與原始資料完全相同 重建資料與原 有損壓縮 (lossy compression) 有損壓縮 減少不為人眼明顯看到的資訊 減少不為人眼明顯看到的資訊 重建資料為原始資料的近似值 重建資料為原始資料的近似值 61 61 資料壓縮方法 無損資料壓縮 應用程式與演算法 無損 zip (pkzip, pkunzip) – LZ77 + Shannon-Fano arj – LZ77 + Huffman arj arc – LZW arc pak – LZW pak compact (in Unix) – Adaptive Huffman (FGK) compact compress (in Unix) – LZW compress Fax G3, G4 Fax 無損壓縮演算法,可以整合至 MPEG, 無損 JPEG 等等有損壓縮系統之中 等等 62 62 Lempel-Ziv Coding Dictionary-based Compression Algorithm Dictionary Transfer the index instead of characters Transfer Ex. Sending “Multimedia” sender 1100..11 (15bits) 1100..11 (15bits) 1100..11 (15bits) receiver “Multimedia ” “Multimedia ” Both sender and receiver have the same dictionary, for example, contain 25000 words, hence 15bits 63 63 Lempel-Ziv Coding Disadvantage of LZ coding Disadvantage LZ Hard to update, each sender and receiver Hard should have the same dictionary, Inefficient, if text comprises only a small Inefficient, subset of words stored in the dictionary 64 64 Lempel-Ziv-Welsh (LZW) coding Enhance from LZ coding Enhance Both encoder and decoder build the Both dictionary dynamically as the text is being transferred Initially, the dictionary contains only the Initially, character set, the remaining entries are built up dynamically with words occur in the text 65 65 LZW coding Text Book: Encoding (8bits 256 entries) sender Send T129’’,andsrecorde“,”” ” Send si’,’,’’ ’’m,’ ’p’,of ,’ i” itand Send a ’is s ’i’ ’, ’ record’ s t and record and ’l’ Send ‘‘‘‘’’,,’h’,insteadand“record ““as ” “ dictionary is dictionary to ” to dictionary “recordtosimple” to dictionary This” to dictionary NUL SOH … DEF This is simple as it … 0 Basic 1 Character … Set 127 128 129 Code 130 word 131 occurs 132 in the text 133 string … 255 66 66 This is simple as it is LZW coding Decoding is the same as Encoding Decoding Words are separated by separator (space) Words Dynamically construct dictionary Dynamically Efficiency is decided by dictionary size Efficiency size Dynamically expand code’s length Dynamically Both encoder and decoder can utilize the Both dictionary space and network bandwidth efficiently 67 67 LZW coding Text: Dynamic Expand Code Length NUL SOH … DEF This is … fish pond … 0 Basic 1 Character … Set 127 128 129 Existing … Dictionary 255 256 257 Extended … Dictionary 511 68 68 Initial Index = 8 bits Index incremented to 9 bits This is … fish pond 霍夫曼碼 (Huffman Code)特點 可變長度編碼 (Variable-Length Coding, 可變長度編碼 VLC) 針對數位訊號的無損熵編碼 (lossless 針對數位訊號的無損熵編碼 entropy coding) 較常出現的事件,以較短的長度表示 較常出現的事件,以較短的長度表示 Prefix code Prefix 解碼時不會產生混淆 解碼時不會產生淆 Prefix code has the property that no codeword is a prefix of any other codeword 69 69 霍夫曼碼的編碼方式 第一步 第一步 由事件中建構二元樹 (binary tree) 由事件中建構二元樹 選擇兩個具有最小機率的節點 A, B,將其合 選擇兩個具有最小機率的節點 併,合併後節點的機率為 A, B 兩節點機率和 兩節點機率和 持續上一步驟,直到所有節點合併為一個節 持續上一步驟,直到所有節點合併為一個節 點,稱為根部 第二步 第二步 由根部開始,依序將位元 (0 或 1) 指定到各個 由根部開始,依序將位元 指定到各個 節點 70 70 霍夫曼碼舉例 (I) 第一步 第一步 由事件中建構二元樹 (binary tree) 由事件中建構二元樹 Symbol 1 2 3 4 5 Pi Step 1 2 3 4 0.35 0.35 0.35 0.35 0.17 0.17 0.17 0.17 0.16 0.15 0.34 0.65 1.0 0.31 0.31 71 71 霍夫曼碼舉例 (II) 第二步 第二步 指定碼字 指定碼字 0.35 0.17 0.17 0.16 0.15 0 0 0.34 1 0.31 1 1 0 0.65 0 Symbol 1 1.0 2 Pi 0.35 0.17 0.17 0.16 0.15 Codes 0 100 101 110 111 72 72 3 1 4 5 b = 2.3 bit/letter 實際的影像轉換-編碼/解碼 Encoder Encoder Image Block S C ~ C Transform Quantizer Entropy coder codes Decoder Decoder Entropy decoder ~ C codes Inverse transform Reproduced Image Block ~ S 73 73 實際的轉換編碼/解碼參數 Block size: Block 8x8 (標準界定) 或 16x16 8x8 Transform: Transform: DCT, DWT (Digital wavelet Transform小波轉換) DCT, Quantizer: Quantizer 均勻純量量化器 (uniform SQ) 均勻純量量化器 非均勻純量量化器 (non-uniform SQ) 非均勻純量量化器 Entropy coding Entropy Huffman, arithmetic coding, … Huffman, 74 74 國際編碼標準 JPEG JPEG: Joint Photographic Expert Group JPEG: ISO/JTC1/SC2/WG10: Information Technology ISO/JTC1/SC2/WG10: 靜態影像編碼標準 靜態影像編碼標準 相關歷史 相關歷史 1986 年 12 月:JPEG 由 CCITT 與 ISO 共同成立 1986 月: 共同成立 1987 年 6 月:10 個提案被評估 1987 月: 個提案被評估 Adaptive DCT, Adaptive DPCM, Generalized Block Adaptive Truncation Coding (BTC) 等三大類提案參與競賽 等三大類提案參與競賽 1988 年 1 月:Adaptive DCT 於競賽中勝出 1988 月: 於競賽中勝出 1989 年 10 月:主要技術部份達成協議 1989 月:主要技術部份達成協議 1991 年 2 月:委員會草案 (committee draft) 定稿 1991 月:委員會草案 定稿 1992 年 7 月:國際標準 10918-1 確立 1992 月:國際標準 確立 75 75 JPEG 基線編碼器 (Baseline 基線編碼器 Encoder Encoder coder) Decoder Decoder 76 76 Run-length Coding on AC coefficients Run-length Coding (RLC) aims to turn the Run aims AC coefficients, F (u; v) values into sets of AC {#-zeros-to-skip , next non-zero value}. Example of general RLC Example a b aaaa bbbbbbb a1 b1 a4 b7 a1 0000000 111111111 000000 11 0,7 1,10 0,5 1,2 7, 10, 5, 2 if 0 is always the start code 7, 77 77 Run-length Coding on AC coefficients To make it most likely to hit a long run of zeros: a zig-zag scan is used to turn the 8x8 matrix ^F(u; v) into a 64-vector 78 78 Comparison of JPEG and JPEG2k by visual checking (a) Original image. 79 79 Comparison of JPEG and JPEG2k by visual checking (b) JPEG (left) and JPEG2000 (right) images compressed at 0.75 bpp (bits per pixel) . (c) JPEG (left) and JPEG2000 (right) images compressed at 80 80 0.25 bpp. JPEG 2000 Standard JPEG is the most successful and popular JPEG image format to date JPEG2000 is wavelet based image JPEG2000 compression standard JPEG2000 aims to JPEG2000 Low Bit-rate Compression for web & Internet Low large Images: handle image size up to 232 - 1 large Single Decompression Architecture Single Transmission in Noisy Environments Transmission Progressive Transmission Progressive Region of Interest Coding (ROI): … Region 81 81 Region of Interest Coding Goal: Region of Interest may contain Region important information, thus should be coded with better quality than others. using the embedded coding process, to scale using up the coefficients within the ROI, and the resulting bits are placed in front of the non-ROI part of the image. the ROI will be decoded and refined before the the rest of the image. 82 82 ROI coding examples Region of interest (ROI) coding of an image using a circularly shaped ROI: (a) 0.4 bpp, (b) 0.5 bpp, (c) 0.6 bpp, and (d) 0.7 bpp. bpp (bits per pixel): measurement of picture quality in bitrate 83 83 China Spring 2002 B ye! eb y 84 84 ...
View Full Document

This note was uploaded on 12/25/2010 for the course ALL 0204 taught by Professor 79979 during the Spring '10 term at National Chiao Tung University.

Ask a homework question - tutors are online