1.
yapay zekayla görsel oluşturma servislerinin (bkz: wombo dream) ve deepfake'in temelini oluşturan teknolojidir. genellikle gan kısaltmasıyla bahsediliyor bu kavramdan. türkçeye ise çekişmeli üretici ağ şekliyle çevrilmiş. kariyerini teknoloji sektörünün doruklarında geçiren mühendis lan goodfellow tarafından 2014 yılında geliştirilmiştir.
bu konu aslında çok derin fakat daha kolay anlaşılması açısından kısaca özetlemek istiyorum. gan sisteminin ana görevi gerçeğe en yakın görseller oluşturabilmek. bunun için bünyesinde iki tane yapay sinir ağı var: üretici ve ayırt edici ağ. bu ağlar yaptıkları hataları öğrene öğrene birbirleriyle rekabet etmeye başlıyor ve en sonunda ortaya çok gerçekçi görseller çıkıyor.
üretici ağ, kendisine sunulan gerçek görsel örneklerle öğrenme sürecine girer ve bu örneklerden kaptığı bilgilerle kendi sanal görsellerini üretmeye çalışır.
ayırt edici ağ ise ilk baştaki gerçek örnekler ile üretici ağın sunduğu sanal görseli sınıflandırmaya çalışır. bu sınıflandırmanın tahmin edebileceğiniz üzere iki başlığı var: gerçek ve sanal. bu ağın, gerçek görsele 1 değerini; sanal görsele ise 0 değerini kesinlikle vermesi gerekir. tespit işlemleri esnasında da küçük oranlarla sapma yaşanır ve gelişimin kırılma noktası budur. örneğin, üretici ağın yarattığı sanal ve değeri 0 olması gereken bir görsele ayırt edici ağ, 0.6 değerini verirse 0.6-0=0.6 hata yapmış olur. ayırt edici ağın asıl hedefi bu hata oranını 0 yapana kadar çalışmaktır. yani başka bir değişle sahte (sanal) görselleri en iyi şekilde tespit etmek ister.
aynı örneği aynı değer kuralıyla bir de üretici ağ için ele alalım. üretici ağın asıl hedefi ise 1 değerine, yani en gerçekçi görsel niteliğine sahip çıktılar sunmak. az önce bahsettiğim gibi, sanal görsele 0.6 değerini veren ayırt edici ağın yaptığı hata, aslında üretici ağ için gelişimin göstergesi. zira bu noktada üretici ağ ise 1-0.6 = 0.4 hata yapmış, gelişerek ayırt edici ağı kandırmıştır. ayrıca bu ağ da elbette hata oranını 0'a çekene kadar çalışır. özetle gan, büyük bir rekabet ortamına ev sahipliği yapar. üretilecek her görseldeki yarışmada galibiyet küçük bir payla üretici ağda oldukça başarı sağlanır ama bu kesin olmak zorunda değil.
peki bu kadar çekişmenin sonucunda ne mi oluyor? gerçeklikten ayırt edilemeyecek kalitede yapay zeka tarafından oluşturulmuş görsellere sahip oluyoruz.
aslında bu sistemi öğretmen - kopya çeken öğrenci arasındaki ilişkiye benzetebiliriz. öğrenci kopya çekmek için yeni yollar bulup kendini ilerlettikçe, öğretmen kopyacıyı bulmada daha başarılı olur ve deneyim kazanır.
bu konu aslında çok derin fakat daha kolay anlaşılması açısından kısaca özetlemek istiyorum. gan sisteminin ana görevi gerçeğe en yakın görseller oluşturabilmek. bunun için bünyesinde iki tane yapay sinir ağı var: üretici ve ayırt edici ağ. bu ağlar yaptıkları hataları öğrene öğrene birbirleriyle rekabet etmeye başlıyor ve en sonunda ortaya çok gerçekçi görseller çıkıyor.
üretici ağ, kendisine sunulan gerçek görsel örneklerle öğrenme sürecine girer ve bu örneklerden kaptığı bilgilerle kendi sanal görsellerini üretmeye çalışır.
ayırt edici ağ ise ilk baştaki gerçek örnekler ile üretici ağın sunduğu sanal görseli sınıflandırmaya çalışır. bu sınıflandırmanın tahmin edebileceğiniz üzere iki başlığı var: gerçek ve sanal. bu ağın, gerçek görsele 1 değerini; sanal görsele ise 0 değerini kesinlikle vermesi gerekir. tespit işlemleri esnasında da küçük oranlarla sapma yaşanır ve gelişimin kırılma noktası budur. örneğin, üretici ağın yarattığı sanal ve değeri 0 olması gereken bir görsele ayırt edici ağ, 0.6 değerini verirse 0.6-0=0.6 hata yapmış olur. ayırt edici ağın asıl hedefi bu hata oranını 0 yapana kadar çalışmaktır. yani başka bir değişle sahte (sanal) görselleri en iyi şekilde tespit etmek ister.
aynı örneği aynı değer kuralıyla bir de üretici ağ için ele alalım. üretici ağın asıl hedefi ise 1 değerine, yani en gerçekçi görsel niteliğine sahip çıktılar sunmak. az önce bahsettiğim gibi, sanal görsele 0.6 değerini veren ayırt edici ağın yaptığı hata, aslında üretici ağ için gelişimin göstergesi. zira bu noktada üretici ağ ise 1-0.6 = 0.4 hata yapmış, gelişerek ayırt edici ağı kandırmıştır. ayrıca bu ağ da elbette hata oranını 0'a çekene kadar çalışır. özetle gan, büyük bir rekabet ortamına ev sahipliği yapar. üretilecek her görseldeki yarışmada galibiyet küçük bir payla üretici ağda oldukça başarı sağlanır ama bu kesin olmak zorunda değil.
peki bu kadar çekişmenin sonucunda ne mi oluyor? gerçeklikten ayırt edilemeyecek kalitede yapay zeka tarafından oluşturulmuş görsellere sahip oluyoruz.
aslında bu sistemi öğretmen - kopya çeken öğrenci arasındaki ilişkiye benzetebiliriz. öğrenci kopya çekmek için yeni yollar bulup kendini ilerlettikçe, öğretmen kopyacıyı bulmada daha başarılı olur ve deneyim kazanır.
devamını gör...