본문 바로가기

전체 글35

Min-Max Normalization (정규화) 함수 설명 Min-Max Normalization은 가장 많이 사용하는 정규화 방법입니다. 이미지마다 제각각의 픽셀 값의 범위를 가지고 있을경우, 이를 이미지의 최대, 최소 픽셀값을 이용해 [0-1] 사이로 통일시켜줄때 사용합니다. 위의 수식을 이용하여 이미지의 최소값이 0, 최대값이 1이 되도록 픽셀 값을 조정합니다. 코드 설명 python3 기반 numpy 라이브러리를 사용했습니다. min_value = np.min(image) max_value = np.max(image) output = (image - min_value) / (max_value - min_value) 이미지의 최소, 최대 픽셀값을 구한 뒤, 수식처럼 최소값을 빼고 (최대-최소) 값으로 나누어줍니다. 예제 import cv2 imp.. 2021. 11. 4.
Resize 함수 설명 Resize 함수는 원하는 크기로 이미지를 조절할때 사용하는 방법입니다. 이미지의 크기를 확대 혹은 축소 시켜 변형하는 경우, 변형된 이미지의 픽셀 값을 추정해서 할당해야만 합니다. 픽셀 값을 추정하는 방법을 보간법 (Interpolation)이라고 합니다. 보간법에는 이웃 보간법 (Nearest neighbor Interpolation), 선형 보간법 (Linear Interpolation), 이중 선형 보간법 (Bilinear Interpolation), 큐빅 보간법 (Cubic Interpolation) 등이 있습니다. 여러 보간법 중 이미지 처리에서 가장 많이 사용하는 보간법은 이중 선형 보간법입니다. 이중 선형 보간법은 1차원 직선에서 이루어지는 선형 보간법을 2차원인 이미지 평면에 .. 2021. 11. 3.
FUNIT : Few-Shot Unsupervised Image-to-Image Translation (2019) 기존의 딥러닝 기반 학습들의 문제점은, 학습에 사용하지 않은 데이터를 테스트 하려할때 제대로 되지 않는다는 한계점이 있습니다. Few-Shot Unsupervised Image-to-Image Translation은 이러한 한계점을 극복하고자 학습에 사용하지 않은 class 혹은 적은 수의 테스트 이미지만 가지고 있을때도 자연스러운 변환이 되도록 구현한 논문입니다. https://arxiv.org/abs/1905.01723 FUNIT Framework 위 figure는 이 논문의 학습과 테스트시의 framework입니다. 먼저, source class라고 불리는 다양한 class의 이미지들을 준비합니다. 물론 모두 정확히 같은 포즈의 이미지들이 아니고 다양한 포즈, 다양한 종들의 강아지 사진들입니다. 그.. 2021. 10. 31.
SAGAN : Self-Attention Generative Adversarial Networks (2018) Self-Attention Generative Adversarial Networks는 기존 convolution layer의 한계를 극복하고자 attention 개념을 GAN에 처음으로 적용한 논문입니다. https://arxiv.org/abs/1805.08318 Convolution layer의 한계 GAN, CNN 등의 기존 네트워크들은 보통 convolution layer 기반입니다. 이러한 convolution 기반 네트워크들은 class가 많은 데이터셋(ex. ImageNet) I의 generator 모델을 학습할때, 특정 class의 이미지를 잘 생성하지 못한다는 단점이 있습니다. 바다나 하늘같은 풍경들은 잘 생성해내지만, 동물들 같은 texture가 많은 이미지들을 잘 생성하지 못했습니다. .. 2021. 10. 24.
Image Style Transfer Using Convolutional Neural Networks (2016) Image Style Transfer Using Convolutional Neural Networks는 Image에서의 Style를 변화시킨 최초의 논문으로 이 논문을 기점으로 다양한 style transfer 논문들이 나오게 됩니다. https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Gatys_Image_Style_Transfer_CVPR_2016_paper.pdf Content + Style Style transfer란 하나의 이미지를 내가 원하는 다른 이미지처럼 변형시켜주는 것입니다. 즉, 위의 figure처럼 input image(강가의 집)의 content는 그대로 둔 채 다른 image의 style(고흐의 별이 빛나는 밤)을 .. 2021. 10. 17.
StyleGAN : A Style-Based Generator Architecture for Generative Adversarial Networks (2018) StyleGAN은 기존의 latent 벡터 z로부터 target군의 이미지를 직접 생성해내는 기존 GAN 방법과 다르게 Style에 초점을 맞춰 다양한 이미지를 생성할 수 있도록 디자인한 논문입니다. NVDIA 연구진이 발표한 논문으로 성능이 기존 GAN보다 훨씬 뛰어나면서도 안정적이어서 각광받고 있는 논문입니다. https://arxiv.org/abs/1812.04948 Entangle vs Disentangle 기존의 GAN을 사용한 Image Generator, Style Transfer는 일종의 블랙박스 형태로, style만 바꾸고 싶지만 제어할 수 있는 방법이 없었습니다. 그러므로 이미지의 전체적인 형상은 그대로 둔채 style 요소만 원하는 형태로 바꾸는 것에 많은 연구가 진행되었습니다. 논문.. 2021. 10. 9.
728x90