1. GAN ์๊ฐยถ
๊ฐ์ (Overview)ยถ
GAN์ Generative Adversarial Networks์ ์ฝ์๋ก ์ฐ๋ฆฌ๋ง๋ก๋ โ์ ๋์ ์์ฑ ์ ๊ฒฝ๋งโ์ด๋ผ๊ณ ๋ฒ์ญ๋๋ AI๊ธฐ์ ์ค ํ๋์ ๋๋ค. GAN์ ์ค์ ์ ๊ฐ๊น์ด ์ด๋ฏธ์ง๋ ์ฌ๋์ด ์ด ๊ฒ๊ณผ ๊ฐ์ ๊ธ ๋ฑ ์ฌ๋ฌ ๊ฐ์ง ๋ฐ์ดํฐ๋ค์ ์์ฑํ๋ ๋ชจ๋ธ์ ๋๋ค. โ์ ๋์ ์์ฑ ์ ๊ฒฝ๋งโ์ด๋ผ๋ ์ด๋ฆ์์ ์ ์ ์๋ฏ GAN์ ์๋ก ๋ค๋ฅธ ๋ ๊ฐ์ ๋คํธ์ํฌ๋ฅผ ์ ๋์ ์ผ๋ก(adversarial) ํ์ต์ํค๋ฉฐ ์ค์ ๋ฐ์ดํฐ์ ๋น์ทํ ๋ฐ์ดํฐ๋ฅผ ์์ฑ(generative)ํด๋ด๋ ๋ชจ๋ธ์ด๋ฉฐ ์ด๋ ๊ฒ ์์ฑ๋ ๋ฐ์ดํฐ์ ์ ํด์ง label๊ฐ์ด ์๊ธฐ ๋๋ฌธ์ ๋น์ง๋ ํ์ต ๊ธฐ๋ฐ ์์ฑ๋ชจ๋ธ๋ก ๋ถ๋ฅ๋ฉ๋๋ค.
GAN์ ๊ตฌ๊ธ ๋ธ๋ ์ธ์์ ๋จธ์ ๋ฌ๋์ ์ฐ๊ตฌํ๋ Ian Goodfellow์ ์ํด 2014๋ ์ฒ์์ผ๋ก ์ ๊ฒฝ์ ๋ณด์ฒ๋ฆฌ์์คํ ํํ(NIPS)์์ ์ ์๋์๊ณ ์ดํ ์ด๋ฏธ์ง ์์ฑ, ์์ ์์ฑ, ํ ์คํธ ์์ฑ ๋ฑ์ ๋ค์ํ๊ฒ ์์ฉ๋๊ณ ์์ต๋๋ค.
์ด๋ฒ 1์ฅ์์๋ GAN์ ๊ฐ๋ ์ ๋น๋กฏํ์ฌ GAN ๋ชจ๋ธ์ ๊ตฌ์กฐ์ ํ๊ฐ์งํ, ์ ์ฉ ์ฌ๋ก ๋ฑ์ ๋ํด ์์๋ด ๋๋ค. 1.1์ ์์๋ GAN์ ๋ฑ์ฅ๊ณผ ๊ฐ๋ ์ ๋ํด์ ์ค๋ช ํ๊ณ 1.2์ ์์๋ GAN ๋ชจ๋ธ์ ๊ตฌ์กฐ์ GAN์ ํ ์ข ๋ฅ์ธ Conditional GAN (cGAN) ๋ชจ๋ธ, ๊ทธ๋ฆฌ๊ณ GAN ๋ชจ๋ธ์ ํ๊ฐ์งํ์ ๋ํด์ ์ค๋ช ํฉ๋๋ค. ์ด์ด 1.3์ ์์๋ GAN์ ์ ์ฉํ ์ฌ๋ก๋ค์ ์ดํด๋ณด๋ฉฐ 1.4์ ์์๋ GAN์ด ๊ฐ์ง ํ๊ณ์ ์ ์์ ๋ด ๋๋ค.
1.1. ๊ฐ๋ (Concept)ยถ
GAN์ Generator(G,์์ฑ๋ชจ๋ธ/์์ฑ๊ธฐ)์ Discriminator(D,ํ๋ณ๋ชจ๋ธ/ํ๋ณ๊ธฐ)๋ผ๋ ์๋ก ๋ค๋ฅธ 2๊ฐ์ ๋คํธ์ํฌ๋ก ์ด๋ฃจ์ด์ ธ ์์ผ๋ฉฐ ์ด ๋ ๋คํธ์ํฌ๋ฅผ ์ ๋์ ์ผ๋ก ํ์ต์ํค๋ฉฐ ๋ชฉ์ ์ ๋ฌ์ฑํฉ๋๋ค. ์์ฑ๋ชจ๋ธ(G)์ ๋ชฉ์ ์ ์ง์ง ๋ถํฌ์ ๊ฐ๊น์ด ๊ฐ์ง๋ถํฌ๋ฅผ ์์ฑํ๋ ๊ฒ์ด๊ณ ํ๋ณ๋ชจ๋ธ(D)์ ๋ชฉ์ ์ ํ๋ณธ์ด ๊ฐ์ง๋ถํฌ์ ์ํ๋์ง ์ง์ง๋ถํฌ์ ์ํ๋์ง๋ฅผ ๊ฒฐ์ ํ๋ ๊ฒ์ ๋๋ค. ์ด 2๊ฐ์ง ๋ชจ๋ธ์ ํฌํจํ GAN์ ๊ถ๊ทน์ ์ธ ๋ชฉ์ ์ โ์ค์ ๋ฐ์ดํฐ์ ๋ถํฌโ์ ๊ฐ๊น์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๊ฒ์ด๋ฉฐ, ๋ฐ๋ผ์ ํ๋ณ๊ธฐ๊ฐ ์ง์ง์ธ์ง ๊ฐ์ง์ธ์ง๋ฅผ ํ ์ชฝ์ผ๋ก ํ๋จํ์ง ๋ชปํ๋ ๊ฒฝ๊ณ(๊ฐ์ง์ ์ง์ง๋ฅผ 0๊ณผ 1๋ก ๋ณด์์ ๋ 0.5์ ๊ฐ)์์ ๊ฐ์ง ์ํ๊ณผ ์ค์ ์ํ์ ๊ตฌ๋ณํ ์ ์๋ ์ต์ ์๋ฃจ์ ์ผ๋ก ๊ฐ์ฃผํ๊ฒ ๋ฉ๋๋ค. ์ ์์ Ian Goodfellow์ ๋ ผ๋ฌธ์์ ๋ค์๊ณผ ๊ฐ์ด โ๊ฒฝ์ฐฐ๊ณผ ์์กฐ์งํ๋ฒโ์ ์์๋ก ๋ค์ด GAN ๋ชจ๋ธ์ ๊ฐ๋ ์ ์ค๋ช ํ๊ณ ์์ต๋๋ค.
๊ทธ๋ฆผ 1-1 ๊ฒฝ์ฐฐ(์ผ์ชฝ)๊ณผ ๋๋(์ค๋ฅธ์ชฝ) ์ด๋ฏธ์ง
์์ฑ ๋ชจ๋ธ์ ์ง์ง ์งํ์ ๋น์ทํ ๊ฐ์ง ์งํ๋ฅผ ๋ง๋ค์ด ๊ฒฝ์ฐฐ์ ์์ด๋ ค ํ๋ ์์กฐ์งํ๋ฒ๊ณผ ๊ฐ๊ณ , ๋ฐ๋๋ก ํ๋ณ๋ชจ๋ธ์ ์์กฐ์งํ๋ฒ์ด ๋ง๋ค์ด๋ธ ๊ฐ์ง ์งํ๋ฅผ ํ์งํ๋ ค๋ ๊ฒฝ์ฐฐ๊ณผ ์ ์ฌํฉ๋๋ค. ์ด๋ฌํ ๊ฒฝ์์ด ๊ณ์๋จ์ ๋ฐ๋ผ ์์กฐ์งํ๋ฒ์ ๊ฒฝ์ฐฐ์ ์์ด์ง ๋ชปํ ๋ฐ์ดํฐ๋ฅผ, ๊ฒฝ์ฐฐ์ ์์กฐ์งํ๋ฒ์๊ฒ ์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ฐ ์ ๋ ฅ๋ฐ์ ์ ๋์ ์ผ๋ก ํ์ตํ๊ฒ ๋๋ ๊ฒ์ ๋๋ค. ์ด ๊ฒ์์์์ ๊ฒฝ์์ ์์กฐ์งํ๊ฐ ์ง์ง ์งํ์ ๊ตฌ๋ณ๋์ง ์์ ๋๊น์ง ์ฆ, ์ฃผ์ด์ง ํ๋ณธ์ด ์ค์ ํ๋ณธ์ด ๋ ํ๋ฅ ์ด 0.5์ ๊ฐ๊น์ด ๊ฐ์ ๊ฐ์ง ๋๊น์ง ๊ณ์๋ฉ๋๋ค. ๊ฐ์ง๋ก ํ์ ํ๋ ๊ฒฝ์ฐ ํ๋ณ๊ธฐ์ ํ๋ฅ ๊ฐ์ด 0, ์ค์ ๋ก ํ์ ํ๋ ๊ฒฝ์ฐ ํ๋ณ๊ธฐ์ ํ๋ฅ ๊ฐ์ด 1์ ๋ํ๋ด๊ฒ ๋๋ฉฐ, ํ๋ณ๊ธฐ์ ํ๋ฅ ๊ฐ์ด 0.5๋ผ๋ ๊ฒ์ ๊ฐ์ง์ธ์ง ์ง์ง์ธ์ง ํ๋จํ๊ธฐ ์ด๋ ค์ด ๊ฒ์ ์๋ฏธํ๊ฒ ๋๋ ๊ฒ์ ๋๋ค.
๋ค์ ์ ์์๋ GAN ๋ชจ๋ธ์ ๊ตฌ์กฐ์ ๊ทธ ํ ๊ฐ๋์ธ cGAN ๋ชจ๋ธ, ๊ทธ๋ฆฌ๊ณ GAN ๋ชจ๋ธ์ ํ๊ฐ์งํ์ ๋ํด์ ์ดํด๋ด ๋๋ค.
1.2. GAN ๋ชจ๋ธยถ
1.2.1. ๋ชจ๋ธ ๊ตฌ์กฐยถ
GAN์ ์ํคํ ์ฒ๋ฅผ ๋์ํํ๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
๊ทธ๋ฆผ 1-2 GAN์ ์ํคํ ์ฒ (์ถ์ฒ: Hamed Alqahtani. 2019. An Analysis Of Evaluation Metric Of GANs)
์์ฑ๊ธฐ(G)๋ ์ค์ ๋ฐ์ดํฐ์ ๋น์ทํ ๋ฐ์ดํฐ๋ฅผ ๋ง๋ค์ด๋ด๋๋ก ํ์ต๋๋ฉฐ, ํ๋ณ๊ธฐ(D)๋ ์ค์ ๋ฐ์ดํฐ์ G๊ฐ ์์ฑํ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ๊ตฌ๋ณํ๋๋ก ํ์ต๋ฉ๋๋ค. GAN์ ๋ชฉ์ ํจ์๋ ๋ค์๊ณผ ๊ฐ์๋ฐ, ์ด๋ ๊ฒ์์ด๋ก ํ์ ์ ๋ชฉ์ ํจ์๋ก G์ D 2๋ช ์ ํ๋ ์ด์ด๊ฐ ์ธ์ฐ๋ฉด์ ์๋ก ๊ท ํ์ (nash equilibrium)์ ์ฐพ์๊ฐ๋๋ก ํ๋ ๋ฐฉ์์ ๋๋ค.
๊ทธ๋ฆผ 1-3 GAN Value Function (์ถ์ฒ: Ian J.Goodfellow. 2014. Generative Adversarial Nets)
์ฌ๊ธฐ์ V(D,G)์ ๊ฐ์ ํ๋ฅ ๊ฐ์ผ๋ก ๋์ถ๋๋๋ฐ, ์ด ์์์ ๊ฐ๊ฐ D์ G์ ๊ด์ ์์ ์ดํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
๋จผ์ D์ ๊ด์ ์์ ์ค์ ๋ฐ์ดํฐ(x)๋ฅผ ์
๋ ฅํ๋ฉด D(x)๊ฐ ์ปค์ง๋ฉด์ log๊ฐ์ด ์ปค์ง๋ฉด์ ๋์ ํ๋ฅ ๊ฐ์ด ๋์ค๋๋ก ํ๊ณ , ๊ฐ์ง ๋ฐ์ดํฐ(G(z))๋ฅผ ์
๋ ฅํ๋ฉด log๊ฐ์ด ์์์ง์ ๋ฐ๋ผ ๋ฎ์ ํ๋ฅ ๊ฐ์ด ๋์ค๋๋ก ํ์ต๋ฉ๋๋ค. ๋ค์ ๋งํด D๋ ์ค์ ๋ฐ์ดํฐ์ G๊ฐ ๋ง๋ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์ ๊ตฌ๋ถํ๋๋ก ์กฐ๊ธ์ฉ ์
๋ฐ์ดํธ๋๋ ๊ฒ์
๋๋ค.
G์์๋ Zero-Mean Gaussian ๋ถํฌ์์ ๋
ธ์ด์ฆ z๋ฅผ ๋ฉํฐ๋ ์ด์ด ํผ์
ํธ๋ก ์ ํต๊ณผ์์ผ ์ํ๋ค์ ์์ฑํ๋ฉฐ ์ด ์์ฑ๋ ๊ฐ์ง ๋ฐ์ดํฐ G(z)๋ฅผ D์ input์ผ๋ก ๋ฃ์์ ๋ ์ค์ ๋ฐ์ดํฐ์ฒ๋ผ ํ๋ฅ ์ด ๋๊ฒ ๋์ค๋๋ก ํ์ต๋ฉ๋๋ค. ์ฆ D(G(z))๊ฐ์ ๋๋๋ก, ๊ทธ๋ฆฌ๊ณ ์ ์ฒด ํ๋ฅ ๊ฐ์ด ๋ฎ์์ง๋๋ก ํ๋ ๊ฒ์ด๋ฉฐ ์ด๋ ๋ค์ ๋งํด G๊ฐ โD๊ฐ ์ ๊ตฌ๋ถํ์ง ๋ชปํ๋โ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋๋ก ์กฐ๊ธ์ฉ ์
๋ฐ์ดํธ๋๋ ๊ฒ์
๋๋ค.
์ค์ ํ์ต์ ์งํํ ๋๋ G์ D ๋ ๋คํธ์ํฌ๋ฅผ ๋์์ ํ์ต์ํค์ง ์๊ณ ํ๋์ ๋คํธ์ํฌ๋ฅผ ๊ณ ์ ํ ์ํ์์ ๋ค๋ฅธ ํ ๋คํธ์ํฌ๋ฅผ ์ ๋ฐ์ดํธํ๋ ๋ฐฉ์์ผ๋ก ๋ฐ๋ก๋ฐ๋ก ์ ๋ฐ์ดํธํฉ๋๋ค.
1.2.2. cGANยถ
cGAN์ Conditional Generative Adversarial Networks์ ์ฝ์๋ก ์์ฑ๊ธฐ์ ํ๋ณ๊ธฐ๊ฐ ํ๋ จํ๋ ๋์ ์ถ๊ฐ ์ ๋ณด๋ฅผ ์ฌ์ฉํด ์กฐ๊ฑด์ด ๋ถ๋ ์์ฑ์ ์ ๋ ์ ๊ฒฝ๋ง์ ๋๋ค. GAN๊ณผ๋ โ์ํ๋ง์ ์ด๋์ ํด์ค๋์งโ์ โ๋ฐ์ดํฐ์ ์ ๋ผ๋ฒจ์ด ์์ด์ผ ํ๋์งโ, 2๊ฐ์ง ์ธก๋ฉด์์ ์ฐจ์ด๊ฐ ์์ต๋๋ค. cGAN์ ์ด์ฉํ๋ฉด ์ธ์์ ์ผ๋ก ์ํ๋ ํด๋์ค์ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ์ ์์ผ๋ฉฐ ์์ฑ๊ธฐ์ ํ๋ณ๊ธฐ๋ฅผ ํ๋ จํ๋ ๋ฐ์ label์ ์ฌ์ฉํฉ๋๋ค.
๊ทธ๋ฆผ 1-4 GAN๊ณผ cGAN ์ฐจ์ด์
์ฝ๊ฒ ๋งํ๋ฉด Generator์ Discriminator์ ํน์ condition์ ๋ํ๋ด๋ ์ ๋ณด y๋ฅผ ์ถ๊ฐํด์ฃผ๋ ๊ฒ์ธ๋ฐ, ์ด ๋ y๋ ํํ๊ฐ ์ ํด์ง ๊ฒ์ ์๋๊ธฐ ๋๋ฌธ์ ๋ค์ํ ํํ๋ฅผ ๊ฐ์ง ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ํ๊ธฐ๋ ์ซ์๋ฅผ ์ธ์ํ๋ MNIST ๋ฐ์ดํฐ์์ ์ํ๋ ์ซ์๋ฅผ ์์ฑํ๊ณ ์ถ๋ค๋ฉด ์ซ์์ class์ ํด๋นํ๋ label์ ์ถ๊ฐ ์ ๋ณด y๋ก ์ ๋ ฅํด์ฃผ๋ ๊ฒ์ ๋๋ค. ๋ ผ๋ฌธ์์๋ ์์ฑํ๊ณ ์ถ์ ์ซ์ class๋ฅผ one-hot encoding ํ์๋๋ฐ, MNIST ๋ฐ์ดํฐ์ ์์๋ ์ด class๋ฅผ one-hot encodingํ๊ฒ ๋๋ฉด 10bit๊ฐ ํ์ํ๊ธฐ ๋๋ฌธ์ ์ ๋ณด y๋ 10bit ํฌ๊ธฐ๋ฅผ ๊ฐ์ง๊ฒ ๋ฉ๋๋ค.
๊ทธ๋ฆผ 1-5 cGAN Value Function (์ถ์ฒ: Mehdi Mirza. 2014. Conditional Generative Adversarial Nets)
cGAN์ value ํจ์๋ ์์ ๊ฐ์ด ์ ์๋๋๋ฐ ์์ GAN์ ๊ฒฝ์ฐ์ ๋น๊ตํด ๋ณด๋ฉด Generator์ Discriminator ๊ฐ๊ฐ์ ์ถ๊ฐ๋ ์ ๋ณด y์ ๋ํด ์กฐ๊ฑด๋ถ ํ๋ฅ ์ธ ์ ์ด ์ฐจ์ด์ ์ผ๋ก ๋ํ๋ฉ๋๋ค. ์๋๋ cGAN์ ๊ฐ๋จํ ๊ตฌ์กฐ๋ก input์์ y์ ๋ณด๊ฐ ์ถ๊ฐ๋ก ๋ค์ด๊ฐ๋ ๊ฒ๊ณผ output์ผ๋ก ๋์ค๋ ํ๋ฅ ๊ฐ์ด y์ ๋ณด์ ๋ํ ์กฐ๊ฑด๋ถ์ธ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
๊ทธ๋ฆผ 1-6 Conditional adversarial net (์ถ์ฒ: Mehdi Mirza. 2014. Conditional Generative Adversarial Nets)
2014๋ 11์ ๋ชฌํธ๋ฆฌ์ฌ๋ํ๊ต์์ ์ต์ด๋ก ๋ฐํ๋ cGAN ๋ ผ๋ฌธ์์๋ ์๋์ ๊ฐ์ด MNIST ๋ฐ์ดํฐ์ ์ผ๋ก๋ถํฐ ์ํ๋ ์ซ์(0~9๊น์ง ๊ฐ๊ฐ)์ ๋ํ ์์ฑ ๊ฒฐ๊ณผ๋ฅผ ํ๋ณ๋ก ์ด 10ํ์ ๊ฒฐ๊ณผ ์ด๋ฏธ์ง๋ก ๋ณด์ฌ์ฃผ๊ณ ์์ต๋๋ค.
๊ทธ๋ฆผ 1-7 Generated MNIST digits, each now conditioned on one label
(์ถ์ฒ: Mehdi Mirza. 2014. Conditional Generative Adversarial Nets)
1.2.3. ํ๊ฐ ์งํ (Evaluation Metrics)ยถ
GAN ์ฐฝ์์ Ian Goodfellow๋ 2014๋ GAN์ ์๊ฐํ ์ดํ 2016๋ ์ ํ์ต(training)๋ฐฉ์์ ํฅ์์ํค๋ ๊ธฐ์ ์ ์ถ๊ฐ๋ก ๋ฐํํ๋๋ฐ ๋ ผ๋ฌธ์์ ์ ์๋ค์ โGAN์ object function์ด ์์ผ๋ฉฐ ์ด๋ ์๋ก ๋ค๋ฅธ ๋ชจ๋ธ๋ค์ ํผํฌ๋จผ์ค๋ฅผ ๋น๊ตํ๋ ๊ฒ์ ์ด๋ ต๊ฒ ๋ง๋๋ ์์ธ์ด๋คโ๋ผ๊ณ ์ธ๊ธํ์ต๋๋ค. ์ฆ ์ฃผ์ด์ง GAN ๋ชจ๋ธ์ ๋ํด ์ผ๋ฐ์ ์ผ๋ก ํฉ์๋ ํ๊ฐ ๋ฐฉ์์ด ์๋ค๋ ๊ฒ์ธ๋ฐ, ์ด๋ ํ์ต(training)์ด ์คํ๋๊ณ ์๋ ๋์ ์ต์ข ์ ์ธ GAN ๋ชจ๋ธ์ ์ ํํ ๋, GAN ๋ชจ๋ธ์ ํ์ฉ์ฑ์ ์ฆ๋ช ํ๊ธฐ ์ํด ์์ฑ๋ ์ด๋ฏธ์ง๋ฅผ ์ ํํ ๋, GAN ๋ชจ๋ธ ์ํคํ ์ฒ ๊ฐ ๋น๊ตํ ๋ ๋ฑ์ ๊ฒฝ์ฐ์ ์ด์๊ฐ ๋๊ณค ํฉ๋๋ค.
2018๋ GAN์ ํ๊ฐ ์งํ์ ์ฅ๋จ์ ์ ๊ธฐ์ ํ ๋ ผ๋ฌธ์์ Ali Borji๋ โGAN ๋ชจ๋ธ์ ๊ฐ์ ๊ณผ ํ๊ณ์ ์ ๋ฐ์ํ๋ ๊ฐ์ฅ ์ ์ ํ ์งํ์ ๋ํด์๋ ์์ง๋ ์๊ฒฌ์ ์ผ์น๊ฐ ์ด๋ฃจ์ด์ง์ง๋ ์์๋คโ๊ณ ์ธ๊ธํ์ต๋๋ค. ์ด์ ๊ฐ์ด GAN ๋ชจ๋ธ์ ์์ฑ ๋์์ ๋๋ฉ์ธ ๋ฌธ๋งฅ์ ๋ฐ๋ผ ์์ฑ๋ ์ด๋ฏธ์ง์ ํ๋ฆฌํฐ์ ๊ธฐ๋ฐํ์ฌ ํ๊ฐ๋๊ณ ๋ ํ์ต๋๋ค.
๊ทธ ์ดํ์ธ 2019๋ Macquarie ๋ํ๊ต์ Hamed Alqahtani๊ฐ ๋ฐํํ ๋ ผ๋ฌธ์์๋ GAN ๋ชจ๋ธ์ ํ๊ฐ์งํ์ ๋ํ ์ฐ๊ตฌ๋ฅผ ํตํด 10์ฌ ๊ฐ์ GAN ๋ชจ๋ธ์ ํ๊ฐ์งํ๋ฅผ ์ ์ํ์์ต๋๋ค. Hamed์ ๋ฐ๋ฅด๋ฉด GAN์ ํ๊ฐ์งํ๋ ํฌ๊ฒ ์ ์ฑ์ ์ธ ์งํ์ ์ ๋์ ์ธ ์งํ 2๊ฐ์ง๋ก ๋ถ๋ฅ๋๋ฉฐ ์ผ๋ฐ์ ์ผ๋ก ์ ์ฑ์ ์ธ ์งํ๋ ์ฌ๋์ด ์ด๋ฏธ์ง๋ฅผ ํ๊ฐํ๋ฏ๋ก ๋น์ฉ์ด ๋ง์ด ๋ ๋ค๊ณ ํฉ๋๋ค.
์ ์ฑ์ ์ธ ์งํ์๋ Nearest Neighbor, Rating and Preference Judgement, Rapid Scene Categorization์ด ์์ผ๋ฉฐ ์ ๋์ ์ธ ์งํ์๋ FID(Freechet Inception Distance), IS(Inception Score), Mode Score, Maximum Mean Discrepancy ๋ฑ์ด ์์ต๋๋ค. ์ฐ๋ฆฌ๋ ์๋์์ NVIDIA์ ๋ ผ๋ฌธ์ ๋ชจ๋ธ ๋น๊ต์ ํต์ฌ์ ์ผ๋ก ์ฌ์ฉํ๋ IS์ ์์ฃผ ์ฐ์ด๋ FID 2๊ฐ์ง์ ๋ํด์ ์์๋ณด๊ฒ ์ต๋๋ค.
Inception Score (IS)ยถ
Inception Score๋ Salimans et al.์ ์ํด ์ ์๋์๋๋ฐ GAN์ ํ๊ฐ์ ๋๋ฆฌ ์ฐ์ด๋ ์งํ์ ๋๋ค. ์ด ์งํ๋ ํด๋์ค label๊ณผ ๊ด๋ จํ์ฌ ํน์ง์ ์ธ ์์ฑ๋ค์ ์ก์๋ด๊ธฐ ์ํด pre-trained ์ ๊ฒฝ๋ง์ ์ฌ์ฉํฉ๋๋ค. ์๋๋ IS ๊ฐ์ ๋์ถํ๋ ์์์ธ๋ฐ ์ํ์ ์กฐ๊ฑด๋ถ ๋ถํฌ p(y|x)์ ๋ชจ๋ ์ํ์์ ์ป์ ์ฃผ๋ณ๋ถํฌ p(y) ์ฌ์ด์ ํ๊ท ์ ์ธ KL ๋ฐ์ฐ ์ ๋(Average KL Divergence)๋ฅผ ์ธก์ ํ๋ ๊ฒ์ด๋ฉฐ ์ด ๊ฐ์ด ๋์์๋ก ์ข์ ์ฑ๋ฅ๋ฅผ ๋ธ๋ค๊ณ ํด์ํ ์ ์์ต๋๋ค. ํ์ง๋ง IS์๋ ์ค์ ์ํ ๋์ ์์ฑ๋ ์ด๋ฏธ์ง๋ฅผ ์ฌ์ฉํด ๊ณ์ฐํ๊ณ ํด๋์ค ๋น ํ๋์ ์ด๋ฏธ์ง๋ง ์์ฑํ๋ฉด ๋ค์์ฑ์ด ๋ถ์กฑํ๋๋ผ๋ p(y)๊ฐ ๊ท ๋ฑ ๋ถํฌ์ ๊ฐ๊น๊ฒ ๋์ค๊ธฐ ๋๋ฌธ์ ์ฑ๋ฅ์ ์๊ณกํ ์ ์๋ค๋ ๋จ์ ์ด ์์ต๋๋ค.
๊ทธ๋ฆผ 1-8 Average KL Divergence (์ถ์ฒ: Hamed Alqahtani. 2019. An Analysis Of Evaluation Metric Of GANs)
Frechet Inception Distance (FID)ยถ
Frechet Inception Distance๋ ์์ฑ๋๋ ์ด๋ฏธ์ง์ ํ๋ฆฌํฐ ์ผ๊ด์ฑ์ ์ ์งํ๊ธฐ ์ํด ์ด์ฉ๋๋ ์งํ์ ๋๋ค. ์ค์ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ํ์ฉํ์ง ์๋ ๋จ์ ์ ๋ณด์ํ์ฌ ์ค์ ๋ฐ์ดํฐ์ ์์ฑ๋ ๋ฐ์ดํฐ์์ ์ป์ feature์ ํ๊ท ๊ณผ ๊ณต๋ถ์ฐ์ ๋น๊ตํ๋ ๋ฐฉ์์ด๋ฉฐ FID๊ฐ ๋ฎ์์๋ก ์ด๋ฏธ์ง์ ํ๋ฆฌํฐ๊ฐ ๋ ์ข์์ง๋๋ฐ ์ด๋ ์ค์ ์ด๋ฏธ์ง์ ์์ฑ๋ ์ด๋ฏธ์ง์ ์ ์ฌ๋๊ฐ ๋์์ง๋ ๊ฒ์ ๋งํฉ๋๋ค. ์ฆ ์ฝ๊ฒ ๋งํด FID๋ ์์ฑ๋ ์ํ๋ค์ ํต๊ณ์ ์ค์ ์ํ๋ค์ ํต๊ณ๋ฅผ ๋น๊ตํ๋ ๊ฒ์ ๋๋ค.
์ด์ด์ ๋ค์ ์ ์์๋ GAN์ ์ ์ฉํ ์ฌ๋ก๋ค์ ๋ํด์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
1.3. ์ ์ฉ ์ฌ๋ก (Use Case)ยถ
GAN์ ์ด๋ฏธ์ง ์์ฑ์ ์ค์ฌ์ผ๋ก ๋ค์ํ๊ฒ ์์ฉ๋์ด ์๋๋ฐ ์์๋ฅผ ์ดํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
1.3.1. ๊ฐ์ง์ด๋ฏธ์ง ์์ฑ / NVIDIAยถ
๊ทธ๋ฆผ 1-9 Images generated using the CELEBA-HQ dataset
(์ถ์ฒ: Tero Karras. 2018. Progressive Growing of GANs for Improved Quality, Stability, and Variation)
2017๋ ๊ธ๋ก๋ฒ GPU ์ค๊ณ ํ์ฌ NVIDIA์์ ๊ณต๊ฐํ โ์ค์กดํ์ง ์๋ ์ฌ๋๋ค์ ์ด๋ฏธ์งโ๊ฐ GAN์ ๋ํ์ ์ธ ์ ์ฉ ์ฌ๋ก์ ๋๋ค. ๋น์ NVIDIA๋ ๊ธฐ์กด์ GAN ๊ฒฐ๊ณผ๋ค๋ณด๋ค ์ด๋ฏธ์ง ํ์ง, ์์ ์ฑ, ๋ค์์ฑ ๋ฑ์ ํฅ์์ํจ ์๋ก์ด ํ๋ จ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ์๊ณ ๊ทธ ๊ฒฐ๊ณผ ์์ฑ๋ ์ด๋ฏธ์ง๋ ์์ ๊ฐ์ด ์ฌ๋์ ๋์ผ๋ก๋ ์ค์กด ์ธ๋ฌผ์ธ์ง ๊ฐ์ ์ธ๋ฌผ์ธ์ง ํ๋ณํ๊ธฐ ์ด๋ ค์ด ์์ค์ผ๋ก ๋ํ๋ฌ์ต๋๋ค.
NVIDIA๊ฐ ์ ์ํ GAN์ ์๋ก์ด ํ๋ จ ๋ฐฉ๋ฒ๋ก ์ ํต์ฌ์ Generator์ Discriminator๋ฅผ ๋ ๋ค ๋ฎ์ โ๊ฒฐ๊ณผ๊ฐโ์์ ์์ํ์ฌ ํ๋ จ์ด ์งํ๋๋ฉด์ ๋ชจ๋ธ์ด ์์ฃผ ์์ํ โํ์ตโํ๋๋ก ์๋ก์ด ๋ ์ด์ด๋ฅผ ์์๊ฐ๋ฉฐ ์ ์ง์ ์ผ๋ก ์ฑ์ฅ์ํค๋ ๊ฒ์ ๋๋ค. NVIDIA๋ ์ด ๋ฐฉ์์ ํตํด ๊ธฐ์กด๋ณด๋ค ๋์ IS ๊ฐ(GAN์ ํ๊ฐ์งํ)๋ฅผ ๋ฌ์ฑํ์ผ๋ฉฐ ๋์๊ฐ ์ด๋ฏธ์ง ํ๋ฆฌํฐ์ ๋ค์์ฑ์ ๋ชจ๋ ๊ณ ๋ คํ ์๋ก์ด ํ๊ฐ์งํ๋ฅผ ์ ์ํ๊ณ ์์ต๋๋ค.
๋ํ, ๋ ผ๋ฌธ์์ NVIDIA๋ ์ฌ๋๋ฟ ์๋๋ผ ์นจ์ค, ํ๋ถ, ์ํ, ๋ฒ์ค ๋ฑ์ ์ฌ๋ฌผ๋ ์ค์ ์ ๊ฐ์ ์ด๋ฏธ์ง๋ก ๋ง๋ค์ด๋ผ ์ ์์์ ๋ณด์ฌ์ฃผ๊ณ ์์ผ๋ฉฐ ์ด๋ ์ ํด์๋์ ์ฌ์ง์ ๊ณ ํด์๋๋ก ๋ง๋๋ ๋ฑ ์์๋ ์ด๋ฏธ์ง๋ฅผ ๋ณต์ํ ๋์๋ ํ์ฉ๋ ์ ์์ต๋๋ค.
1.3.2. ๊ฐ์ง ์ค๋ฐ๋ง ์ฐ์ค ์์ / University of Washingtonยถ
๊ทธ๋ฆผ 1-10 Fake Obama Video (์ถ์ฒ: Supasorn Suwajanakorn. 2017. Synthesizing Obama: Learning Lip Sync from Audio)
2017๋ ์์ฑํด๋ํ๊ต(University of Washington)์์๋ GAN์ ์ด์ฉํ์ฌ ๋ฒ๋ฝ ์ค๋ฐ๋ง(Barack Obama) ์ ๋ฏธ๊ตญ ๋ํต๋ น์ ๊ฐ์ง ์ฐ์ค ์์์ ๋ง๋ค์ด ๋ฐํํ์ต๋๋ค. ์ด ์์์ ์ค๋ฐ๋ง ์ ๋ํต๋ น์ ๊ณผ๊ฑฐ ์ฐ์ค ์์๋ค๋ก๋ถํฐ ์์ฑ์ ๋ฐ๊ณ , ์ด ์์ฑ์ ๋ง๋ ์ ๋ชจ์์ ๋ง๋ค์ด ํฉ์ฑํ ๊ฒ์ผ๋ก ๊ฐ์ง์ ๋๋ค. ๋ ผ๋ฌธ์์ ์ ์๋ ๋จผ์ ์ค๋์ค ์ธํ์ ์๊ฐ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ ์ ๋ชจ์์ผ๋ก ๋ณํํ ํ ์ง์ง๊ฐ์ ์ ๋ชจ์์ ์์ฑํ๊ณ , ์ด๋ฅผ ๋์(ํ๊ฒ) ๋น๋์ค์ ์ ๋ชจ์ ๋ถ๋ถ์ ์ฝ์ ํ์ฌ ์์ฑํ๋ค๊ณ ๋ฐํ์ต๋๋ค. ์ด๋ ๊ฒ ์ต์ข ํฉ์ฑ ์ ์ ๋ชจ์ ์ํ์ค์ ๋์ ๋น๋์ค๋ฅผ ์ผ์น์ํค๊ณ ํ์ด๋ฐ์ ๋ค์ ๋ง์ถ์ด ๋จธ๋ฆฌ ์์ง์๊ณผ ์ธํ ์คํผ์น๊ฐ ์์ฐ์ค๋ฝ๊ฒ ๋ํ๋ ์ ์๋๋ก ํ ๊ฒ์ ๋๋ค. ์์์ ๋งํฌ์์ ์์ฒญํ ์ ์์ต๋๋ค.
1.3.3. Eye In-Painting / Facebookยถ
๊ทธ๋ฆผ 1-11 Eye In-Painting Examples from Facebook Inc.
(์ถ์ฒ: Brian Dolhansky. 2018. Eye In-Painting with Exemplar Generative Adversarial Networks)
2017๋ 12์ Facebook์ ExGAN ๊ธฐ์ ์ ๊ฐ๋ฐํ์ฌ ์ฌ๋์ด ๋์ ๊ฐ์ ์ฌ์ง์์ ๋์ ๋ฌ ์ฌ๋์ ๋ชจ์ต์ ์ฌ์ง์ผ๋ก ๋ฐ๊พธ๋ ๊ณผ์ ์ ๊ณต๊ฐํ์ต๋๋ค. Real Eye Opener๋ผ๋ ๋ช ์นญ์ผ๋ก ๋ถ๋ฆฌ๋ ์ด ์์ ์ GAN์ ํตํด ์ง์ง๊ฐ์ ๊ฐ์ง ๋์ ๋ง๋ค์ด ๋์ ๊ฐ์ ์ฌ์ง์ ํฉ์ฑ์ํจ ์ด๋ฏธ์ง์ ๋๋ค. ํน์ ์ฅ์๋ ๋ค์ ์ฐ์ ์ ์๋ ์ฌ์ง์์ ๋์ ๊ฐ๊ณ ์๋ ๋ชจ์ต์ ๋ณด์ ํ ๋์ ํ์ฉํ ์ ์๋ ๊ฒ์ ๋๋ค.
1.4. ํ๊ณ์ ยถ
์ง๊ธ๊น์ง GAN์ด๋ ๋ฌด์์ธ์ง, GAN ๋ชจ๋ธ์ ๋ด๋ถ์ ์ฑ๋ฅ ํ๊ฐ ๋ฐฉ์, ๊ทธ๋ฆฌ๊ณ GAN์ ์ ์ฉํ ์ฌ๋ก๋ค์ ๋ํด์ ์ดํด๋ณด์์ต๋๋ค. ์ด๋ ๋ฏ ์ ์ฉํด ๋ณด์ด๋ GAN ๋ชจ๋ธ ์ญ์ ์ด๊ธฐ๋ถํฐ ํ๊ณ์ ์ ๊ฐ์ง๊ณ ์์ด ์๋๋ฐ ์ด๋ฅผ ์ดํด๋ณด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
GAN์ ๊ธฐ์ ์ ์ผ๋ก ๊ณ ํด์๋ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ ์ ์๋ค๋ ์ ๊ณผ ํ์ต์ด ๋ถ์์ ํ๋ค๋ ์ ์ ํ๊ณ์ ์ผ๋ก ๊ฐ์ง๊ณ ์์ต๋๋ค. ์ด๋ฌํ ํ๊ณ์ ๋ค์ ๊ทน๋ณตํ๊ณ ๋ค์ํ๊ฒ ์์ฉ๋๋ฉด์ ์ฒ์ Ian Goodfellow์ ์ํด ์ ์๋ Vanilla GAN์ ์์์ผ๋ก DCGAN, SRGAN, CycleGAN ๋ฑ์ GAN ๋ชจ๋ธ์ด ๊ฐ๋ฐ๋์ด ์์ต๋๋ค.
์ฌ์ฉ์ฑ ์ธก๋ฉด์์๋ ์์ ์์๋ค์์์ฒ๋ผ ์ง์ง๊ฐ์ ๊ฐ์ง๋ฅผ ์์ฑํ๋ ๊ฒ์ด ํ์ฉ๋๊ฐ ๋์ ๋ฐ๋ฉด ๊ทธ๋งํผ์ ์ ์ฉ ๊ฐ๋ฅ์ฑ๋ ์กด์ฌํฉ๋๋ค. ์ง์ง์ ๊ฐ์ง๋ฅผ ๊ตฌ๋ณํ๊ธฐ ํ๋ค๋ค๋ ์ ์ ์ด์ฉํ ๋ฅํ์ดํฌ ๊ธฐ์ ๋ก ๋ง๋ ํฌ๋ฅด๋ ธ ์์์ด ๋ํ์ ์ธ ์์์ธ๋ฐ, ์ ๋ช ์ธ์ฌ๋ค์ ์ด๋ฏธ์ง๋ฅผ ํฌ๋ฅด๋ ธ์ ํฉ์ฑํ์ฌ ๋ฐฐํฌํ๋ ๊ฒ์ ๋๋ค. ๋ํ์ฌ GAN์ ์ด์ฉํ๋ฉด ์ด๋ฌํ ๋ฌธ์ ๊ฐ ๋๋ ๋ฐ์ดํฐ๋ค์ ๋น ๋ฅด๊ฒ ๋ง์ด ๋ง๋ค์ด๋ผ ์ ์๊ธฐ์ ๋์งํธ ์ฑ๋ฒ์ฃ ๋ฑ ์ค๋ฆฌ์ ์ธ ์ด์๋ ์๋ฐํฉ๋๋ค.
์ด ์ธ์๋, GAN์ ํตํด ์์ฑ๋ ๋ฏธ๋์ด์ ์ง์์ฌ์ฐ๊ถ ์ด์, ๊ฐ์ง ์ด๋ฏธ์ง๋ฅผ ์ด์ฉํ ์ฌ๊ธฐ ๋ฑ ์ฌ๋ฌ๊ฐ์ง ๋ฒ์ , ์ค๋ฆฌ์ ์ธ ๋ฒ์ฃผ์ ์ด์๊ฐ ์กด์ฌํ๋๋ฐ ์ด๋ GAN์ ๊ธฐ์ ์ ๋ฐ์ ์ ๋ฐ๋ฅธ ์ ๋์ ๋์์ด ์๋ฐ๋์ด์ผ ํจ์ ์์ฌํฉ๋๋ค.
์ด์ด์ง๋ 2์ฅ์์๋ Victorian400 ๋ฐ์ดํฐ์ ์ ์ ์ฅ๋ ์ด๋ฏธ์ง๋ฅผ ๋ถ์ ํ๊ฒฝ์ผ๋ก ๊ฐ์ ธ์ค๊ณ ์๊ฐํ ํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.