GaN 3

Recent trends of text-to-image translation models [3/4] ( UNIST 유재준 교수님 ) / 이미지 생성모델의 역사 2016-2020

| From 2016 to 2020 ​ 이제 datasets까지 다뤄보았으니 Text-to-Image Synthesis가 시작된 2016년으로 거슬러 올라가본다. 2016 2016 Reed et al.,“Generative Adversarial Text to Image Synthesis,” ICML’16 지금 LG에서 AI 연구를 하고 계시는 이홍락 교수님이 2016년 5월에 발표하신 Generative Adversarial Text to Image Synthesis는 처음으로 Text로 이미지 생성을 control하려는 시도를 한다. ​ 2014년에 GAN이 등장하고, 그 해 말 cGAN이 나옴으로 인해 conditional(이전 사건에 의존)한 방법을 통한 의도된 이미지 생성 시도가 이뤄지고 나서 ​..

Recent trends of text-to-image translation models [2/4] ( UNIST 유재준 교수님 ) / 학습 데이터

앞선 포스트를 통해 아래와 같은 내용을 정리했다. ​ 이미지 생성 모델이 왜 요즘 핫한가 현재 이미지 생성 모델이 좋은 성능을 냄에도 불구하고 부족한 점 이런 부족한 점을 채우기 위해 모델을 controllable하게 만들 필요가 있음 이제 그 방법론 중에 Conditional Image Synthesis의 Text control에 대해 집중적으로 다뤄 보고자 한다. text-to-image (T2I) synthesis ​ 이 분야는 어떤 datasets을 다룰까? ​ 대표적으로 쓰이는 것이 아래 3가지 정도 된다. ​ ​ | Oxford-102 Flowers(Nilsback& Zisserman, 2008) | CUB-200 Birds(Wah et al., 2011) 10k개 정도의 이미지가 존재하는 상..

[GAN 시리즈] GAN(Generative Adversarial Networks)에 대한 모든 것

인간은 지금껏 무언가를 생성해냄으로써 발전해왔다. ​ 시간이 흘러 아날로그에서 디지털로 넘어감에 따라 컴퓨터라는 뛰어난 계산기는 드디어 인간을 모방하기 시작한다. ​ 두려움을 느낀 인간은 대비책을 제시해 보았다. " 인공지능(Artificial Intelligence)이 하지 못하는 분야인 독창성(creativity)를 키워야 한다! " ​ 하지만 문제가 있다. 독창성이란 무엇일까? 사람이 진정으로 무(無)에서 유(有)를 만들어 낼 능력이 있을까? ​ 인간이 만들어내는 모든 부산물들은 그 인간이 학습한 지식들에서 나온다. ​ 학습한 지식을 그대로 따라하는 사람이 아닌 학습한 지식들을 합성하여 새롭고 더 탁월한 지식을 만드는 사람을 우리는 독창적인 사람이라고 부르는 것이 아닐까? ​ 하지만 이 독창성의 영..

Computer Vision 2023.01.20