660 likes | 994 Views
21C 멀티미디어. 인간이 정보입수를 80% 이상을 시각적인 정보를 통하여 얻어진다고 볼 때 이미지가 갖고 있는 정보는 엄청나게 많다고 본다. 제 5 장 그래픽과 이미지. 5.1 기본 개념. 멀티미디어를 구성하는 다섯 가지 미디어인 텍스트 , 이미지 , 사운드 , 비디오 , 애니메이션 중에서 이미지는 특히 중요한 위치 이미지를 자유롭게 사용하려면 이미지의 특성을 이해 텍스트로는 전달하기 어려운 내용을 그림이나 그래프를 이용
E N D
21C 멀티미디어 인간이 정보입수를 80%이상을 시각적인 정보를 통하여 얻어진다고 볼 때 이미지가 갖고 있는 정보는 엄청나게 많다고 본다. 제 5 장 그래픽과 이미지
5.1 기본 개념 • 멀티미디어를 구성하는 다섯 가지 미디어인 텍스트, 이미지, 사운드, 비디오, 애니메이션 중에서 이미지는 특히 중요한 위치 • 이미지를 자유롭게 사용하려면 이미지의 특성을 이해 • 텍스트로는 전달하기 어려운 내용을 그림이나 그래프를 이용 • 인간의 오각인 시각, 청각, 후각, 촉각, 미각 중에서 80 % 이상을 시각을 통해서 정보를 입수 • 이것은 그림, 그래픽과 같은 이미지 매체들이 많은 정보를 함축적으로 표현
5.1 기본 개념 • 디지털 정보의 표현은 점(point), 선(line), 다각형(polygon)을 만들 수 있으며, 다각형은 하나의 평면(plane)을 구성하며 이로부터 2차원 이미지로 표현이 가능 • 2차원 이미지가 Z축상으로 연속된 이미지로 이어진다면 이는 입체적으로 표현이 가능한 하나의 3차원 이미지를 생성 • 이러한 과정에서 이미지를 생성시키는 학문분야를 컴퓨터 그래픽스라고 정의 • 컴퓨터 그래픽스는 이미지를 생성시키는 기법과 표현(Visualization)으로 시작 • 프로그램 라이브러리로는 OpenGL(Open Graphical Library)을 주로 사용하며, 복잡하고 많은 계산을 요하기 때문에 그래픽 가속기에 영향을 받음 • 응용분야에서는 산업디자인, 웹디자인을 비롯하여 영화
5.1 기본 개념 • 2 차원 이미지에서 필터링(filtering)을 시킨다든지, 잡음을 제거한다든지 하여 질이 좋은 이미지를 복원하든지 혹은 다른 얻고자하는 이미지로 변형을 시킨 결과 이미지를 보고자 하는 학문분야를 이미지처리(image processing)라 함 • 이미지처리를 통하여 특별한 객체(object) 혹은 특성이 같은 그룹을 추출하여 이를 수치화 된 데이터로 표현하는 학문분야를 이미지분석(image analysis)이라고 정의 • 응용분야로는 컴퓨터비젼, 의료이미지, 생명공학, 우주공학에 이르기까지 광범위
5.2 이미지 표현 방식 • 비트맵(bitmap) 방식은 점묘화를 그리는 것과 같이 점의 조합으로 이미지를 표현하는 방식 • 모니터의 화면에 표현되는 각각의 점을 화소 또는 픽셀(pixel: picture element)이라 정의 • 2 차원에서는 I(r,c)로 표현하며 I는 명도(Brightness)를, r과 c는 각각 행과 열 • 비트맵 방식은 그림을 모니터의 화면에 표현함에 있어 데이터를 비디오 메모리로 옮겨 직접 처리하므로 표시 속도가 벡터 방식에 비하여 빠름 • 비트맵 방식은 픽셀 각각에 대한 명암과 색상 정보를 모두 저장해야 하기 때문에 많은 디스크 공간을 소모 • 비트맵은 그림을 확대하거나 축소할 경우 그림의 모양이나 외곽선 부분이 변형되는 단점
5.2 이미지 표현 방식 • 비트맵 방식에 따라 작성된 그림을 비트맵 이미지 또는 래스터(raster)이미지 • 비트맵 방식으로 작성된 이미지는 평면 또는 공간상에 특정한 좌표 값으로 표현 • 그림을 나타내기 위해서 간단한 명령어와 좌표 값을 표현하는 방식을 벡터 방식
5.3 파일 저장 방식 • 이미지 파일의 포맷을 살펴보면 다른 미디어 파일의 포맷보다 훨씬 많은 종류 • 흑백 명암만을 사용하는 프로그램에는 컬러 정보가 불필요 • 그래픽 형태로 그림 정보를 저장할 경우에는 각 픽셀의 값을 기록할 필요성은 없음 • 이미지 편집 프로그램은 여러 가지 포맷의 파일을 읽을 수 있는 기능을 포함
5.3.1 BMP • 비트맵(BMP: Bitmap)은 마이크로소프트에서 지원하는 가장 대표적인 파일 포맷 • 파일의 크기 및 기타 파일 관련 정보를 파일헤더에 두고 각 픽셀의 컬러 값을 그대로 표시하는 방법으로 모든 이미지 편집 프로그램과 대부분의 워드 프로세서에서 지원 • 압축 방법을 사용하지 않기 때문에 파일 크기가 큰 것이 단점이다. • 비트맵을 저장하는 여러 파일 중에서 간단한 것이 BMP파일이며, 원도우즈에서 사용하는 표준 장치독립(Device Independent Bitmap)인 파일 포맷
5.3.1 BMP • 1) 비트맵 파일에 대한 정보 • BITMAPFILEHEADER는 비트맵 파일에 대한 정보를 저장하기 위해 구조체로서 정의 • bfType는 어떤 파일이 BMP 파일인지를 확인 • 항상 ASCII 캐랙터갃M"으로 시작 • bfReserved는 미래의 확장성을 고려하여 준비되어진 것 • 2) 비트맵 자체에 대한 정보 • BITMAPINFOHEADER는 전체 40바이트로 비트 자체에 대한 정보를 저장하기 위한 구조체 • 3) 비트 맵 팔레트 • 팔레트는 아래의 표 6.4와 같이 RGBQUAD구조체의 배열로 정의 • 맵 인덱스가 RGB(Red, Green, Blue)색상치를 소유 • 윈도우즈 포맷의 색상치는 RGB 순서대로 나열되어 있는 것이 아니고 BGR순서대로 되어있으며, 트루 칼러인 경우에는 팔레트가 필요 없음 • 4) 이미지 픽셀 데이터 • Pixel data에는 이미지 정보의 상하가 거꾸로 저장되어 있는 점을 유의
5.3.2 JPG, JPEG • JPEG는 Joint Photographic Experts Group에서 개발한 압축 방법 • 보편적으로 손실압축을 사용하기 때문에 중간 저장용으로는 적합하지 않은 경우가 있음 • 압축을 사용하면 24 비트의 화상에 대해서 손실이 없이 최대 1/25 까지 압축이 가능하며 약간의 손실을 감수했을 때는 최대 1/100 까지도 압축이 가능한 방법 • JPEG 은 주로 멀티미디어 분야에서 사진 압축에 가장 유리한 포맷 • 웹에서는 표준으로 널리 이용 • Huffman 부호화와 연속적(sequential) JPEG 그리고 8 비트의 샘플링을 사용 • 점진적(progressive) JPEG는 컴포넌트들이 멀티스캔에서 부호화 되어짐
5.3.2 JPG, JPEG • JPEG 부호화 되는 과정을 4 단계로 • 첫 단계로서 픽셀 데이터들은 RGB에서 YCbCr 컬러공간으로 변환되며 샘플링을 수행 • 두 번째 단계로는 8 비트 블록을 한 데이터 단위로 보면서 DCT(Discrete Cosine Transform) 변환 • 세 번째 단계로는 정량화 단계이며 이 과정에서 손실압축이 발생 • 네 번째 단계로는 정량화 되어진 DCT계수를 부호화 하는 과정
5.3.3 GIF • GIF(Graphical Interchange Format)는 미국의 CompuServe사에서 자체 온라인 서비스를 통해 이미지를 빨리 전송하기 위하여 개발하였으며 팔레트를 사용하는 256 컬러만을 지원하는 대표적인 압축 포맷 • 사진의 경우에는 압축의 효과가 크지 않으나 일러스트레이션으로 제작된 그래픽 파일의 경우에는 높은 압축효과 • 파일 크기가 작은 것을 중요시하는 웹에서 JPEG 포맷과 함께 가장 널리 사용 • 색상의 정보는 그대로 둔 체 압축을 하는 JPG와는 달리 GIF는 색상정보를 낮추어서 크기를 줄이는 것 • 다양한 색상영역을 가지고 있는 이미지들은 색상영역을 낮추는 것보다 압축하는 것이 효과적이며, 반대로 많은 색상이 사용되지 않는 이미지들은 색상영역을 낮추는 것이 효과적 • GIF 이미지 포맷에는 GIF98a포맷과 GIF87포맷의 두 가지가 있는데, 1989년에 개정된 GIF89 포맷에서는 256 개 컬러 중 하나를 투명 색으로 지정하여 투명효과를 줄 수 있으며 이미지에 관한 설명을 추가할 수 있음
5.3.3 GIF • ※ 인터레이스 GIF:이미지가 로딩될 때 왼쪽위에서 오른쪽으로 순서대로 위에서 아랫 방향으로 이미지의 선명도를 높여가며 그려주는 형식 • ※ 투명 GIF:Photoshop에서 파일메뉴의 Export에서 GIF89a를 선택하여 적용할 수 있으며, 웹 페이지에서 제목이나 이미지가 배경화면과 색상이 자연스럽게 붙어지도록 지원하는 형식
5.3.4 TIFF • TIFF(Tagged Image File Format)이름 그대로 태그 정보를 사용하여 모든 이미지 파일을 수용할 수 있는 구조 • 디지털 이미지가 사용되기 시작한 초창기에 유일하게 24 비트 컬러를 지원하였기에 전자출판에 사용하는 대부분의 컬러프린터 시스템에서 지원 • 압축기능을 옵션으로 포함하고 있으나 압축하지 않는 포맷을 함께 지원하고 있어 이를 적절히 선택하여 사용 • TIFF형식 내에 너무 많은 서브포맷을 지원하고 있어 프로그램간에 호환 기능이 약함
5.3.5 PCX • PCX(ZSoft PC Paintbrush Bitmap file, Packbits Compression indeX)는 윈도우 환경에서 기본적으로 제공되었던 페인트브러시 프로그램에서 사용되는 파일 포맷 • 16 컬러를 사용하는 프로그램에서 시작되었기에 같은 컬러가 연속되는 경우에 연속되는 컬러 값과 연속되는 픽셀 개수로 표시하는 Run Length Encoding 방법을 사용하여 그래픽에 대해서는 어느 정도의 압축의 효과를 획득 • 최신 버전에서는 65,536 컬러를 지원하며, 윈도우 환경의 대부분의 이미지 편집 프로그램에서 지원
5.3.6 TGA • TGA(Targa)는 비디오 처리를 위한 전용 보드인 TARGA 보드 이름에서 연유한 포맷을 32 비트의 이미지를 지원하며 이 가운데 8 비트는 알파채널용으로 사용 • 알파채널을 통해 비디오를 나타낼 수 있게 만든 포맷 • 점차로 사용 빈도는 줄고 있으나 대부분의 이미지 편집 프로그램이 지원하는 포맷
5.3.7 PNG • GIF 포맷의 압축 알고리즘이 유니시스(UniSys)라는 회사에서 특허로 제출되었음이 밝혀지게 되어 이를 대체하기 위해 PNG(Portable Network Graphics)로 개발된 포맷 • GIF에서 제공하지 못하는 24 비트 컬러를 제공하고 GIF의 특징인 인터레이싱(Interlacing)과 투명 컬러를 제공하는 포맷 • JPG와 GIF의 장점만을 고루 갖추었으며 PSD 파일처럼 알파 채널 정보를 그대로 유지 • 손실 없는 압축 알고리즘을 사용하면서도 파일 크기 면에서는 JPG나 GIF와 크게 차이가 없어 향후 웹에서 사용되는 대부분의 이미지가 이 포맷으로 대체될 가능성이 있음
5.3.8 ICO(ICONs) • ICO(ICONs)는 아이콘의 비트맵 표시에만 사용되는 포맷 • 출력 장치가 프린터나 스크린이라는 것과 무관하게 정의되었다는 메타파일(Metafile)이라는 개념을 사용
5.3.9 CGM • CGM(Computer Griphics Matafile)는 여러 표준단체의 공동개발 결과로서 여러 PC용 소프트웨어들이 지원 • 원, 사각형 등 여러 가지의 그래픽 구조를 정의하여 표현하는 방식이며 각 구조에 비트맵을 포함할 수 있어 비트맵과 벡터 모두에 사용 가능 • ISO 국제 표준으로 정의되어 있으나 사용 빈도는 비교적 적음
5.3.10 EPS • EPS(Encapsulated PostScript)는 프린터 그래픽 정보를 보내기 위해 등장한 포스트스크립트(PostScript) 언어를 활용한 포맷으로서 *.eps 혹은 *.ps로도 표현 • 전문 그래픽 출력장치 등을 위해 최적화 된 파일 포맷으로 가장 뛰어난 출력물을 얻을 수 있으며, 텍스트 그래픽 구조 및 폰트, 비트맵 정보를 표시하며 개발 목적에 따라 프린터 제어에 사용
5.3.11 WMF • WMF(Windows Matafile Format)는 MS 윈도우 애플리케이션간의 이미지 교환을 위한 형식으로 개발되었으며, 윈도 밖에서의 지원은 제한되어 있지만 많은 윈도 프로그램이 지원을 하기 때문에 많이 사용 • 윈도우에서 사용되는 메타파일 방식으로 비트맵과 벡터 정보를 함께 표현하고자 할 경우 가장 접합한 포맷
5.3.12 PICT • PICT(Picture)는 1984년 Apple Computer에서 그래픽 파일의 표현과 저장의 표준으로 개발되었으며, 매킨토시의 퀵드로우(QuickDraw)라는 드로잉 루틴에 사용된 포맷으로 매킨토시에서는 표준 파일포맷 • 그래픽 프로그램과 페이지 조판 프로그램에서 광범위하게 사용
5.4 보간법 • 보간법(Interpolation)에는 크게 선형보간법(Linear Interpolation)과 큐빅보간법(Cubic Interpolation)으로 나눔 • 선형보간법은 선상에서 두 점 사이에 새로운 포인트를 생성하는 것이며 큐빅보간법은 3차원 공간상에서 8개의 포인트를 고려하여 하나의 새로운 포인트를 생성하는 것 • 엘리어싱(aliasing)현상은 보간법(interpolation)을 통하여 다시 보정을 하여야만 보다 자연스러운 선으로 표현이 가능 • 레이 캐스팅(ray casting)은 볼륨 렌더링에서 최종 픽셀 값을 결정하기 위해서 사용 • 각각의 레이가 복셀(voxel: volume element)들 사이를 지나갈 때 샘플링과 합성(compositing)과정을 거치면서 최종 픽셀 값을 결정 • 레이는 각각의 슬라이스 이미지의 픽셀들 사이를 지날 때도 있는데, 이럴 경우에는 샘플링을 통하여 레이와 교차하는 지점에 새로운 픽셀 값을 생성
5.5 조명과 음영 • 사실감 있는 실제 장면을 생성하기 위해서는 광원 모델(Lighting Model)과 조명 모델(Illumination Model)효과를 적용 • 물체가 한가지 색으로 표현하는 것보다는 사실감과 입체감을 주기 위하여 조명과 음영처리를 하게됨 • 더욱 외양을 색상, 텍스처, 광원에 따른 빛의 반사율, 관찰자의 위치와 방향에 따라서 처리하게 된다면 물체의 성질이 확연하게 달라짐 • 빛은 크게 분위기 빛(ambient light), 방향성 빛(directional light), 스포트라이트(spotlight), 점광(point light)등으로 나눔 • 분위기 빛이란 여러 종류의 광원에서 나오는 빛의 반사와 산란으로 생기며 방향성 빛은 불규칙하게 퍼지지 않으며 객체를 정확하게 조절될 수 있는 조명이 필요하면 방향성 빛을 사용하는 것이 편리 • 스포트라이트는 최대한 현실감과 조절감을 주도록 혹은 원추모양으로 빛을 보낼 때 사용하므로 무대조명 등으로 사용하며, 점광은 백열전구와 같은 빛을 말함 • 이러한 것은 많은 계산량을 요구하기 때문에 컴퓨터 용량 및 속도에 크게 영향
5.5 조명과 음영 [그림 5.6] Ray Tracing을 이용한 사실감과 입체감 표현 • 텍스처를 이용해서 실제 골프공과 비슷한 색상을 만들어 냈으며, 분위기 빛, 스포트라이트 광원을 이용해서 그림자와 입체감을 생성하여 실제로 잔디 위에 골프공이 있는 것처럼 사실성 있게 렌더링 된 것을 볼 수 있음
5.6 볼륨 렌더링 • 볼륨 렌더링은 연속적인 2차원 슬라이스들을 기본으로 하기 때문에 슬라이스 이미지들을 조합하는 방식에 따라서 여러 가지 방법이 있음 • 대표적으로 이미지공간(image space) 렌더링 방법과 물체공간(object space) 렌더링 방법 • 이미지 공간 렌더링 방법은 뷰잉(viewing) 시점을 결정하고 이미지 평면(image plane)의 각 픽셀에 레이를 통과시켜서 일정한 간격으로 픽셀 값과 위치를 샘플링 할 때, 각각의 레이가 일직선상에 놓이는 복셀들의 명도와 불투명도를 합성해서 이미지를 생성해내는 알고리즘 • 대표적인 렌더링 방법에는 광선 추적법(ray tracing)이 있음 • 이미지공간 렌더링 방법에는 볼륨 데이터를 순차적으로 순회하면서 복셀을 이미지 평면으로 투영하여 이미지를 생성하는 알고리즘으로 splatting이 이에 속함
5.6 볼륨 렌더링 • 일반적으로 볼륨 렌더링은 음영(shading)단계에서는 복셀의 명도값을 결정 • 분류(classification)단계에서는 복셀의 불투명도를 결정하는 단계이며, 객체 내부의 서로 다른 재질로 인해서 불투명도 값이 다양하게 변하는데, 이런 정보들을 모아서 렌더링 할 때 내부 경계 영역을 구분할 수 있게 함으로써 객체의 내부 모습을 가시화 할 수 있음 • 합성은 음영과 분류단계에서 얻어진 값들을 최종적으로 누적해서 하나의 최종 픽셀치로 결정하는 단계
5.6 볼륨 렌더링 [그림 5.7] 볼륨 그래픽스 시뮬레이션
5.6 볼륨 렌더링 • 유리와 같은 얇은 객체만 가능하고 반투명하고 일정한 형태가 없는 구름, 연기, 불 등과 같은 객체는 폴리곤으로 표현 할 수 없음 • 이러한 문제는 불투명 객체인 비행기와 반투명적인 구름 객체가 같이 섞어 있는 경우에는 더욱 명백해짐 • 그림 6.7에서 보듯이 비행기가 구름 속을 뚫고 지나가는 장면은 현재의 3D 그래픽 가속 카드로는 불가능한 부분
5.7 컬러모델 • 1931년에 조명을 위한 국제위원회(CIE: Commission Internationale de ㅣ껬clairage)에서 인간의 컬러인지를 감안하여 3차원 모델을 소개 • 가시광선은 파장이 380nm에서 789nm까지를 말하며 적색은 r = 700nm, 녹색은 g= 546.1, 청색은 b = 435.8의 파장 • 하이컬러(High color)라고 알려진 16 비트의 컬러를 사용할 경우 적색, 녹색, 청색 중의 한 가지 원색에 대해 32 가지색의 처리를 따로 표현 • 8비트 컬러를 사용할 경우, 최대한 사용할 수 있는 색상은 2^8 즉, 256가지로 제한 • 이미지에서 비교적 자주 사용되는 색상 256개를 선정하여 선정된 색상만을 사용하도록 하며 이러한 색상 표시 방식을 팔레트 방식
5.7.1 HLS 컬러 모델 • 적색, 녹색, 청색을 색조(hue), 명도(lightness), 채도(saturation)로 변환이 가능 • 시각적인 표현상에서 각각의 장단점이 있으나 직관적인 표현에서는 RGB에서 분간하기 힘든 것이 HLS로 표현하여 줌으로서 두드러지게 나타나는 부분이 있음 • 색조와 채도는 0에서 1까지 표현하며 색조는 0도에서 359도까지의 각도로 표현 • 채도는 명도 축에서부터의 거리이므로 모니터상에 표현한다면 256 픽셀치로 비율 축적
5.7.1 HLS 컬러 모델 [그림 5.8] 그래프상으로 표현한 RGB와 HLS 컬러 모델
5.7.2 CMYK 컬러 모델 • 그림 물감의 3원색으로 청록색(cyan), 심홍색(magenta), 노란색(yellow)이 있으며 물감을 합치게되면 검은색(K)이 되며, 프린트를 할 경우에 이러한 컬러 염료를 사용 • RGB의 색으로부터 CMY로 변환이 가능하며 간단한 수식으로 표현이 가능 • 청록색은 1에서 빨강을 뺀 값이 되며, 심홍색은 1에서 녹색을 뺀 값이 되며, 순수 노랑은 1에서 청색을 뺀 값
5.7.2 CMYK 컬러 모델 [그림 5.9] RGB와 CMY의 상관관계
5.7.3 YIQ 컬러 모델 • YIQ 모델은 주로 TV 방송에 사용되며 조명 변화에 따른 인간의 시각 시스템을 색조나 채도보다도 잘 반영한 것 • 광휘를 나타내는 Y는 색상을 나타내는 I나 Q보다도 넓은 대역폭을 갖는다는 것이 하나의 장점 • 행렬식 계수를 사용하며 역변환도 RGB의 표현도 가능
5.7.4 팔레트 • 팔레트(Palette)란 이용자가 이미지를 표현하는데 필요한 색상만을 모아놓은 컬러 테이블 • 팔레트를 사용하지 않는 이미지를 팔레트 방식으로 바꾸기 위해서는 해당 픽셀과 가장 가까운 컬러를 팔레트에서 찾아 그 컬러 값을 표현
5.7.4 팔레트 [그림 5.10] (a) 포토샵에서의 팔레트, (b) 파워포인트에서의 팔레트
5.7.4 팔레트 • 시스템에서 임의로 정한 팔레트를 사용하면 컬러가 부족하여 원래의 픽셀에서 표현하고자 하는 컬러와 차이가 큰 컬러로 대체되는 경우가 자주 발생 • 이러한 문제를 일부나마 해결 • 커스텀팔레트(Custom Palette)를 사용 • 이미지를 가장 잘 표현할 수 있는 팔레트를 만들고 그 팔레트에 적합하게 컬러 수를 생성하는 방법 • 예를 들면 바다나 하늘을 표현할 적에는 푸른색 계통의 색을 많이 내포하고 있으므로 256가지의 색을 이곳을 집중적으로 분배하여 표현 • 컬러가 결정된 이후 이미지를 해당되는 팔레트에 적용하기 위해서 디더링(dithering)이 사용 • 원래의 값과 가깝고 팔레트에 포함된 두 개 이상의 컬러를 조합하여 특정 컬러를 표시하면 원래의 이미지와 좀더 가까운 이미지를 표현가능
5.7.4 팔레트 • 픽셀은 화면에 표시될 경우 정사각형으로 표시 • 윤곽선이 대각선 형태인 경우 배경과 접촉면은 계단 형태로 표시 • 계단 형태의 경계선이 나타나는 것을 앨리어싱(aliasing) • 부자연스러움을 없애기 위해 앤티앨리어싱(antialiasing)이라는 기법이 사용 • 물체와 배경과의 경계면에 있는 픽셀을 경계선과 얼마나 많이 접촉하였느냐에 따라 물체의 색과 바탕면 색의 중간 값을 정하여 표시하는 방법 • 이미지에 텍스트로 된 설명을 추가할 때 텍스트의 대각선 경계면에 앤티앨리어싱을 사용하는 경우가 많음
5.8 이미지 처리 • 이미지처리(Image Processing)란 인간이 이해하기 편하게 이미지 정보를 개선하는 학문이라고 정의 • 조작을 통하여 원하고자하는 이미지를 획득 • 이미지를 평활화(smoothing) 하여 블러링(blurring) 현상 줄임 • 뚜렷한 이미지를 얻기 위하여 선명화(sharpening) 필터를 사용 • 이미지에 대비도를 증가 • 문자나 그림의 복원도 가능 • 이미지와 이미지간에 논리적인 연산으로 합산 및 감산도 가능 • 처리된 이미지는 웹, 비디오, TV, 영화등의 멀티미디어 분야에 다방면으로 사용
5.8.1 히스토그램 • 히스토그램(histogram)이란 이미지의 픽셀 값들을 막대그래프 혹은 선그래프로 나타낸 것 • X축은 픽셀 값이 되고 Y축은 픽셀의 수를 나타냄 • 그래프를 보고 문턱치(thresholding)를 설정하여 객체를 추출 • 이미지 전체에 대해 문턱치를 설정하는 경우가 있고 이미지를 블록으로 나누어서 문턱치를 설정하는 두 가지의 경우가 있음 • 문턱치는 히스토그램을 미분하여 최소치를 찾아 설정
5.8.1 히스토그램 [그림 5.11] (a) 면역조직항체에 의해 염색되어진 유방암 조직 이미지이며 (b)는 RGB 밴드에 의한 우측 칼라이미지의 히스토그램.
5.8.2 이미지 필터 • 이미지는 획득과정에서 잡음이 포함되어 있거나 이미지가 훼손된 부분을 원 이미지에 가깝도록 하기 위하여 처리 • 흐릿한 부분은 픽셀의 대조도를 높여주어 뚜렷하게 하거나 윤곽선을 검출 • 필터(filter)처리과정에서 컨벌루션(convolution)을 사용 • 컨벌루션은 마스크를 처리하고자 하는 이미지에 씌워서 연산 • 연산과정은 마스크에서 갖고 있는 값과 이미지가 갖고 있는 값을 곱한 다음 이것들을 모두 더함 • 이를 마스크의 절대값의 합으로 나누면 표준화(Normalization)가됨 • 필터는 쓰고자 하는 목적에 따라서 여러 많은 양상이 있음 • 이미지를 부드럽게 하기 위해서는 Low Pass Filter • 이미지를 뚜렷하게 하기 위해서는 High Pass Filter를 사용
5.8.2 이미지 필터 • 아래 그림 5.13에서와 같이 3X3 마스크로 컨벌루션을 할 경우에는 이미지의 가장자리는 처리를 할 수 없게되므로 검정이나 백색으로 처리하게 되며, 가장자리를 추출하기 위한 아래의 라플라시안(Laplacian)필터의 컨벌루션 결과 값은 +1이 됨 [그림 5.14] (a) 원 이미지 (b) Canny edge detection 적용 결과 이미지
5.9 이미지 분석 • 이미지 전처리 과정에서 처리과정을 하며 이로부터 얻어진 객체에 대해서 수치화된 데이터를 추출하여 객체를 추출하는 과정을 이미지분석(Image Analysis)이라 정의 • 객체의 형태학적인 특성 • 색상들의 특성 • 텍스처의 특성 추출 • 여러 수학적인 수식을 사용하며 이로부터 얻어진 데이터를 통계학적으로 혹은 신경망이론(neuron networks)이나 퍼지이론(fuzzy)등을 사용하여 분류 • 이 결과가 이미지 분할(segmentation)로 나타나며 정량적 분석을 하게 됨 • 응용분야 : • 인공위성 이미지로부터 지상의 주요 지리 정보분석 • 환경오염에 대한 이미지의 정확한 분석 • 산업체에서 잘못된 부품을 검출 • 의료분야에서 세포의 크기 혹은 종양의 크기를 정확하게 분석
5.9.1 이미지 분할 • 이미지 분할(Image Segmentation)은 컴퓨터 비젼과 이미지 처리에서 매우 중요한 부분 • 이미지 분할의 목적은 오브젝트의 표현을 위한 영역을 찾아내거나 오브젝트의 일부분을 분리하는 것 • 동질성의 부분을 하나의 오브젝트로 보는 것 • 경계선 부분의 대조도를 평가하여 나누는 방법 • 동질성과 대조도에는 단색조, 컬러, 질감등의 특성들이 포함
5.9.1 이미지 분할 [그림 5.15] (a) 면역조직항체에 의해 염색되어진 유방암 조직 이미지 (b) 분할된 positive cell 이미지
5.9.2 특성추출 • 오브젝트의 정확한 분할을 위해서는 오브젝트의 특성 추출(Feature Extraction)이 필요 • 특징값들을 판단하여 정확히 적용시켜야 정확한 분석이 가능 • 이미지의 특징값은 이미지 전체에 대해서 구할 수 있고, 이미지 분할 후 관심있는 영역에 대해서만 특징값을 구할 수 있음 • 그림 6.16에서는 색상의 특성 값과 Wavelet에 의한 텍스쳐의 특성 값들을 추출하였음 • 특징값은 이미지의 특성에 따라 구분 • 이진 이미지에서는 둘레, 넓이, 반지름, 장축, 단축 혹은 오브젝트의 개수 • 단색조 이미지에서는 동질성(Homogenity), 대조도(Contrast), 평균(Mean), 분산(Variance), 첨도(Kurtosis), 왜도(Skewness) • 컬러 이미지에서는 RGB 밴드별 특징값과 컬러 특징값 • 영역주파수 변환(wavelet transform), 주파수 변환(fourier transform), 주파수 변환중의 코사인 변환(cosine transform)등을 이용하여 주파수 영역에서의 특징값도 구함 • 수많은 특징값중에서 이미지의 특성에 맞게 적절한 특징값을 찾아 적용하여 응용하는 것이 필요
5.9.2 특성추출 [그림 5.16] 컬러 이미지의 wavelet 적용후 각 영역별 특징값 추출
5.9.3 이미지 복원 • 이미지 복원(Image Restoraion)은 저하된 이미지의 질을 대수학적인 방법이나 주파수 영역에서의 개념 등을 이용하여 향상시키어 원 영상을 찾음 • 이미지가 질이 저하되는 원인 • 영상의 노화 • 움직임이나 방해물 • 렌즈의 불안정