Computer Vision 3

[GAN 시리즈] StackGAN에 대한 모든 것 (논문 리뷰)

StackGAN 이라는 이름을 보건데, GAN을 stack(쌓다)하였음을 유추할 수 있다. ​ StackGAN은 text condition을 줌으로써 이미지 생성을 했을 때, 성능이 그리 좋지 못한것을 보고 더 명확하고, 고화질의 이미지를 생성하기 위해 다음과 같은 아이디어를 제시했다. ​ 2개의 GAN을 사용하는 것이다. ​ 첫번째 GAN은 대략적인 형태, 사물과 배경의 색깔등에 중점을 둔 스케치 이미지 생성을 담당한다. 두번째 GAN은 앞서 생성한 스케치 이미지의 오류를 고치면서 디테일을 추가하고, 더 고화질의 이미지를 최종적으로 생성한다. ​ 이렇게 세부 역할 분담을 하면, 어려운 문제가 그나마 쉬운 여러 문제로 나뉘게 되고 덕분에 더 좋은 성능의 이미지를 얻을 수 있다. 목차 1. 전반적인 도식도..

Computer Vision 2023.02.05

[GAN 시리즈] CGAN(Conditional Generative Adversarial Nets) 간단 정리

GAN이 나온 2014년 이후 이미지 생성 모델 분야는 한 동안 GAN의 변형 모델들이 주름잡았다. ​ GAN의 아쉬운 점이라 한다면 다양한 이미지를 생성함에 있어서는 성공을 거두었지만 의도된 이미지를 생성하지는 못하였다는 점이라 할 수 있다. ​ 입력 데이터 자체에 conditional한 부분이 존재하지 않았기 때문이다. ( 특정 경향성을 지니는 이미지를 모델이 내뱉게 시키기 위해서는, 입력에 그 경향성에 대한 정보를 추가적으로 전달해 주면 된다. ) ​ ​ 의도된 이미지 생성 영역에 발을 내민 시도는 2014년 11월 Mehdi Mirza 등이 발표한 Conditional Generative Adversarial Nets 에서 확인할 수 있다. ​ ​ cGAN cGAN이라고 불리는 이 모델의 아이디어..

Computer Vision 2023.01.22

[GAN 시리즈] GAN(Generative Adversarial Networks)에 대한 모든 것

인간은 지금껏 무언가를 생성해냄으로써 발전해왔다. ​ 시간이 흘러 아날로그에서 디지털로 넘어감에 따라 컴퓨터라는 뛰어난 계산기는 드디어 인간을 모방하기 시작한다. ​ 두려움을 느낀 인간은 대비책을 제시해 보았다. " 인공지능(Artificial Intelligence)이 하지 못하는 분야인 독창성(creativity)를 키워야 한다! " ​ 하지만 문제가 있다. 독창성이란 무엇일까? 사람이 진정으로 무(無)에서 유(有)를 만들어 낼 능력이 있을까? ​ 인간이 만들어내는 모든 부산물들은 그 인간이 학습한 지식들에서 나온다. ​ 학습한 지식을 그대로 따라하는 사람이 아닌 학습한 지식들을 합성하여 새롭고 더 탁월한 지식을 만드는 사람을 우리는 독창적인 사람이라고 부르는 것이 아닐까? ​ 하지만 이 독창성의 영..

Computer Vision 2023.01.20