프로젝트 파일이 열리지 않는다면 하기 링크 중 하나를 이용해주세요!
코랩 링크
Jupyter Notebook Viewer
Super Resolution
을 사용하여 저해상도의 이미지를 고해상도의 이미지로 변환한다.
GAN
은 정밀한 고해상도 이미지를 생성하기에 효과적이지만 시간이 오래걸린다는 특징이 있다.
Super Resolution(초해상화): 저해상도 영상을 고해상도 영상으로 변환하는 작업
픽셀
: 디스플레이를 구성하는 가장 작은 단위
RGB
: 빛의 3원색을 혼합하여 색을 나타내는 방식
해상도
: 픽셀의 개수가 많을수록 선명해진다(고해상도).
CCTV
해상도 문제, 의료 영상
등에 효과적으로 사용될 수 있다.
-
ill-posed (inverse) problem: 1개의 저해상도 이미지에 대해 다수의 고해상도 이미지가 나올 수 있는 점
-
super Resolution 문제의 복잡도: 제한된 정보만을 이용해 많은 정보를 만들어내는 과정은 매우 복잡함 → 잘못된 정보 생성 가능성 증가
-
정량적 평가 척도와 사람의 시각적 관찰 평가가 잘 일치하지 않음
보간법(interpolation): 값을 알고 있는 두 점 사이 지점의 값이 얼마일지를 추정하는 기법.
많은 딥러닝 기반 Super Resolution 연구에서 결과를 비교하기 위해 수행
선형보간법(linear interpolation)
: 두 점 사이에 직선을 이용해 f(x)를 추정
이미지 출처
삼차보간법(cubic interpolation)
: 3차(cubic) 함수를 활용하여 f(x)를 추정. 선형보간법과 달리 네 개의 점을 참조
이미지 출처
쌍선형보간법(bilinear interpolation)
: 선형보간법을 2차원으로 확장시킨 것. 4(=2x2)개의 점 참조
쌍삼차보간법(bicubic interpolation)
: 삼차보간법을 2차원으로 확장시킨 것. 16(=4x4)개의 점을 참조
Super Resolution Convolutional Neural Networks.
MSE(Mean Squared Error) loss function 사용
-
과정
- Patch extraction and representation: 저해상도 이미지에서 patch 추출
- Non-linear mapping: 다차원의 patch들을 non-linear하게 다른 다차원의 patch들로 매핑
- Reconstruction: 다차원 patch들로부터 고해상도 이미지를 복원
- 저해상도 이미지의 크기를 늘려 입력으로 사용 (interpolation)
- 20개의 convolutional layer
- residual learning 이용: 고해상도 이미지 생성 직전 원본 이미지를 더함
- 각 layer에서 나오는 출력을 최대한 활용 → 출력된 특징들을 이후에도 재활용
- 각각의 특징 맵을 대상으로 일부 중요한 채널에만 선택적으로 집중하도록 유도(Channel attention)
Super Resoultion + GAN: GAN(Generative Adversarial Networks) 을 활용한 Super Resolution
-
k: kernel size, n: 필터의 수, s: stride
-
생성된 이미지와 실제 이미지를 이미지넷으로 사전 학습된 VGG 모델에 입력하여 나오는 feature map에서의 차이를 계산
-
perceptual loss
=content loss
+adversarial loss
content loss
: VGG를 이용한 lossadversarial loss
: GAN을 사용함으로써 발생하는 loss
원 데이터가 가지고 있는 확률분포를 추정하도록 하고, 인공신경망이 그 분포를 만들어 낼 수 있도록 한다
-
랜덤변수에 대한 확률분포를 안다 → 랜덤변수 즉 데이터에 대한 전부를 이해하고 있다!
-
Generator: 학습 완료 후 데이터의 확률분포를 따르는 새로운 데이터 생성
-
Discriminator: 학습 완료 후 분류에 의미가 없는 0.5의 확률값을 출력
peak Signal-to-Noise Ratio.
영상 내에서 가질 수 있는 최대 신호 대 잡음(noise) 비
-
영상을 압축했을 때 화질이 얼마나 손실되었는지 평가하는 목적으로 사용
-
데시벨(db) 단위
-
높을수록 원본에 비해 손실이 적다는 의미
Structural Similarity Index Map
얼마나 구조 정보를 변화시키지 않았는지를 계산
- 높을수록 원본 품질에 가깝다는 의미
Deep Learning for Single Image Super-Resolution: A Brief Review
2D 이미지 품질 평가에 구조변화를 반영하는 SSIM과 그의 변형들