240 likes | 450 Views
畵像認識 / 理解 image recognition / understanding. 畵像處理 (image processing) 目的 • 對象이 多樣 接近方法의 相異하고 , 共通點 ( 方法論 ) 이 적음. • P.R 의 對象 : 2D image 가 主對象 動畵像 (motion image), 靜止畵像 (still image) • computer vision (AI) 의 硏究對象 : 3D image 入出力裝置에 크게 依存
E N D
畵像認識 / 理解 image recognition / understanding 畵像處理 (image processing) 目的 •對象이 多樣 接近方法의 相異하고, 共通點(方法論)이 적음 • P.R의 對象 : 2D image가 主對象 動畵像(motion image), 靜止畵像(still image) • computer vision (AI)의 硏究對象 : 3D image 入出力裝置에 크게 依存 相對的重要性!!!
Image processing system image input device Image output device processor output image input image memory device analog digital I/Odevice [1] 入力裝置 optical system sensor A/D converter image to processor lenz, 거울 photo-electric prism, conversion optical (光電變換) fiber, (半導體의 境遇 統合)
•入力裝置의 機能 1. 入力對象 : 2D 平面媒體(종이, film), 3D物體 / scene 2. 受光方式 反射式, 透過式 3. 照明光 自然光, 人工光 4. 走査方式 raster scan, vector scan 5. 走査 機構 電子式( 例 FSS) 機械式(入力 對象移動, sensor部 移動) 6. 入力畵像情報 •色 monochrome, color •量子化 level binary, gray scale(多値)
光導電面(出力) 信號轉換 SnO2 In2O3 (透明, 導電性) + electron gun - 光電子放出部 光導電面(出力) SiO2 n-si ※ 撮像裝置 (image device) + 撮像管(image tulle) ① 光導電 形 ② image 형 image intensifier 採用(高感度) ① vidicon, orthicon ② chalnicon, saticon newbicon, harpicon + solid device - CCD (charge coupled device) 1,000~4,000 bits 1D, 2D array - amorphous(非晶質) - photodiode ※ 畵像入力方式 - TV camera 方式 analog / digital color TV camera, monochrome camera + R.G.B filter - drum scanner 方式 - 300 ~ 600 rpm, 4 ~ 20 lines/mm resolution
FSS(flying spot scanner) 方式 • FSS-CRT利用 • - CCD scanner • fax, OCR 등에 사용. • laser scanner • high revolution [2] 出力裝置 ① hard copy device ② display device (solf copy) - imaging engineering - image fixing technology (像固定技術) ① hard copy device hard copy 裝置의 機能要素 1. 記錄媒體 film, 用紙(普通紙(PP : plain paper), 特殊用紙(例 : thermal paper, 印畵紙) 2. 記錄色 monochrome, color
3. 記錄 level 二値, 多値 4. 記錄媒體裝着方式 圓筒型, 平面型 5. 記錄方式 直接記錄, 間接記錄 * impact printing (衝擊式) - serial printer : golf ball type / cylinder type - line printer - wire dot matrix printer * nonimpact printing(非衝擊式) - ink jet printer continuous jet type drop-on-demand(DOD)type bubble jet 長點 : 不均一平面이나 大畵面記錄可 無騷音(low noise)
Xerography (電子寫眞, 電子複寫機) • LBP (laser beam printer) • NP process 基盤(Canon) • 銀鹽寫眞 • AgCl(Ag+VII族元素, F, Cl, Rr, I) • 乳劑 (特히color) * 明暗 / 色彩表現 ① 單色의 gray level 表現方法 i) 粒子의 半徑을 變化 網點(mesh)의 變化 ii)單位面積當 粒子數를 變化 (粒子 크기 一定) ink jet 式 ② color 色의 標準化(標準色表) color science : 色의 表現, 計測, 色彩心理, 눈(視覺), 材料, 物理, 數學 =>綜合科學 multidimensional scaling
0.4 i(入) E(入) g(入) 0.2 0.0 wavelength (入), nm 400 500 600 700 546.1nm 435.8nm 700.0nm colorimetry(色彩計測學) CIE colorimetric system Commission Internationale de l'Eclairage = International Lighting Commission •三元色 (trichromatic generalization) • color difference formulae •可視光線 ; 波長 入= 360~830 nm RGB system의 混色函數 trisitmulus value 主波長 : R = 630nm G = 542nm B =460nm 原刺戟 (fundamental stimuli)
RGB color system = additive color system 加法混色 : 빛 : TV R : red G : green B : blue C : cyan M : magenta Y : yellow W : white Bl : black R G B Y M W C 補色 CMY color system = subtractive color system 減法混色 : 染料 : 印刷, 寫眞(印畵) ex) negative film C M Y B G BI R
* * ② DISPLAY DEVICE (表示裝置) 機能要素 1. 表示色 : monochrome, color 2. 表示level : 二値, 多値 3. 表示動作 : 靜止畵像, 動畵像 4. 表示方式 : random scan, raster scan 5. 表示畵像 : 線圖形, 面圖形 6. 表示device : CRT , 平面 device 性能評價 項目 •表示畵素數 •表示速度 •表示畵像의 크기 •輝度(intensity) • contrast •色再現의 充實度(fidelity) • flickering / 殘像特能 눈 : 1/36sec
① ② ③ storage tube panel display CRT ① 陰極線管 (CRT : cathode ray tube) 電子銃, 偏向 system, 螢光面 shadow mask, flat CRT - NTSC 525 lines * 50 fields 2 : 1(interlace scan) aspect ratio = 4 : 3 - PAL / SECAM 625 lins * 50 fields 2 : 1 aspect ratio = 4 : 3 - HDTV (high definition TV) 1.125 lines * 60 fields 2 : 1 aspect ratio = 16 : 9 ② 蓄積管 (storage tube) 表示內容이 持續的으로 蓄積됨(重疊表示) ③ panel display (平面display) - EL display - plasma display - LCD - 發光diode - 螢光表示管
* * * EL (electroluminescence) display 半導體材料(ZnS)에 電壓을 加하면 發光 固體, high resolution (10~20 lines/mm) 超薄形으로 面照明, 壁걸이 TV 배면전극 절연층 투명전극층 유리 N 發光層 液晶 display (LCD : liquid cystal display) 液晶分子의 配列을 電磁氣的 / 物理的으로 變化시킴 => 液晶層을 透過하는 빛의 量 또는 透過面을 變化시킴(光變調) •非發光 (back-lit), low contract, low power consumption (손목時計, calculator) • LCD monitor / TV 40” color 以上 ; 52”量産 • TFT-LCD •發光角, 밝기, 畵面크기 發光 diode (LED : light emitting diode) • PN junction에 順方向電壓을 加하면 發光 • GaP, GaAs •波長 550nm 이상(G~R)이 一般的
* * 螢光物質 • blue가 課題 解決됨! • resolution : 畵素間隔 1mm 前後 plasma display panel(PDP) 유리 •電極간의 放電發光利用 • Ne + Xe gas •表示面積이 넓음 • resolution : 5 lines/mm • > 70” color PDP TV(量産段階) 保護層 (Mgo) 誘電體層 放電gas 螢光表示管(vacuum fluerescent display) •低價 •簡單한 數字等表示 • dot matrix形態 0.4mm pitch
畵像處理의 入出力別 分類 變換(前處理) 傳送(壓縮) ① 入力 出力 畵像 畵像 ② 生成 記述 記述 ③ 計測(特徵抽出) 認識(識別) 畵像處理의 目的 1. 人間이 보기 쉽도록 改善하여 表示 ① 2. 畵像傳送을 위한 壓縮 ① 3. 畵像의 再構成(低次元 -> 高次元) ② 4. 畵像 識別 / 理解 ③
* * 1. 計測 / 觀測(measurement) 對象 : •靜止畵像(still image) •動畵像(motion image) • motion detection / analysis 內容 : •距離計側(range finder) •位置計測(GPS) <- 三角測定法 •單眼視(monocular vision) / 兩眼視(stereo vision) • remote sensing • thermography radiation energy 檢出(0.1度 resolution) 2. 標本化, 量子化(sampling & quantization) gray scaler 8 bits (image 256 levels) 256 dpi (0.1 mm pitch) 以上 color (image 10 bits(1,024 段階) : R, G, B 當
3. 畵像傳送, 帶域壓縮 image transmission image compression JPEG (joint photographer experts group) MPEG (Motion picture experts group) redundancy, 規則性, 視覺特性 等 利用 JPEG baseline standard 畵素當 1byte ; luminance Y 4畵素 block 當1byte ; chrominence CbCr (各4bit) =>4畵素 12 bytes 5 bytes (12 values) (6 values) MPEG 初期畵面 : JPEG baseline standard 以後畵面 : relative coding
RGB color YCbCr system [8 bits] [256 levels] Y = 0.299R + 0.587G + 0.114B Cb = -0.1687R - 0.3313G + 0.5B +128 Cr = 0.5R - 0.4187G -0.0813B + 128 YCbCr system RGB color system R = Y + 1.402(Cr - 128) G = Y - 0.34414(Cb - 128) - 0.71414(Cr - 128) B = Y + 1.722 (Cb - 128)
* * * * 直交變換 서로 獨立인 特徵量抽出 -> 帶域壓縮 多變量解析(multivariate analysis) factor analysis, Kahrunen - Loeve transform, Fourier transform) binary : Hadamard, Walsh, Haar transform PCA (principal cromponent Analysis 主成分分析) ICA (independent component analysis 獨立成分分析) 非直交 變換 : multi channel data 必要 4. 畵像變換 (修正, 强調) spatial filtering(空間濾波) median / Kalman filter smoothing, prediction & estimation homomorphic filter granular noise 除去 blurred image restoration (復元) 幾何學的 變換(修正) 座標變換 •移動, 廻轉, 擴大 •縮小 位置補正 distortion compensation
* 畵像變換 / 加工 • 2値化, 細線化 •色彩變換(color filtering) 照明歪曲 畵像의 / 補正, 目的色彩로 • image subtraction • pseudo color(擬似色彩)transform color temperature(色溫度)等 考慮 •距離變換 : 遠近感 5. 畵像生成 / 再構成 (image generation / reconstruction) •畵像生成 CG (computer graphics) computer animation -> cell animation 脫皮 VR (virtual reality 假想現實) flight simulator, war game •畵像再構成 再構成理論 J.Radon(1917) computed tomography (CT) : 斷層撮影裝置
* * Cormack, A. M. (1963) CT 理論 Hounsfield, G. N. (1973) 實用化(英 EMI) 1979 Nobel 醫學賞 CT - X-ray - 超音波 - NMR (nuclear magnetic resonance) - ECT (emission CT), 放射線同位元素, r線 - PET (positron emission tomography) •腦室髓液과 血液의 吸收係數 / 共鳴特性의 差異로 腦卒中의 原因判定 腦出血 腦血栓 : 腦血管內血液의 凝固 腦塞栓 : 心臟凝固物에 依한 막힘 6. 畵像認識 畵像特徵量의 計測 幾何學的 / 色彩特徵 및 統計的 性質 計算
* 特徵抽出 및 表現(記述) •境界, 邊(테두리 : edge) 抽出 •畵像의 領域(region) 分割 •線의 追跡(line tracking) •線圖形의 chain coding •圖形의 構文的(syntactic) 表現 ① PDL(picture description langnage) primitive 選定 primitive 間의 幾何學的關係 構造의 表現 2次元的配置 + 各 primitive 間의 演算子(operator) ② Backus form nonterminal, terminal symbol의 recursive form <- metalanguage ③ 線畵記述 꼭지점(vertex)座標 - link - 隣接꼭지점
* * 畵像의 識別(classification) 一般的인 P.R. system 과 同一 認識으로 부터 理解로!!! P.R. system 出力 對象 觀測 特徵抽出 識別/分類 前處理 control model pattern understanding system 各 處理段階의 흐름이 汎用性, 柔軟性을 가짐 feedback, adaptation 機能을 積極的으로 活用함
* * * 一般化 되고 (generalized) 柔軟性 있고 (flexible) 適應的(adaptation)인 system으로!! 窮極的 目標(發展方向) ╔ 人間을 人間답게 해 주는데 寄與 ╝ 單純作業, 危險한 作業으로부터의 解放!!!