1.
geleceğin zeki bilgisayarlarına yönelik bir çeşit yapay zekâ uygulaması.
bilgisayarlı örüntü tanıma, bilgisayarların görüntüleri teşhis etme, anlamlandırma, isimlendirme gibi işlemleri yapabilmesini sağlar ama insan benzeri bir makine tasarlamak istiyorsanız yeterli değildir. bunun yanında ses konusunu da ele almanız gerekir. zira sesli iletişim yazılı olandan çok daha kolaydır ve zaman kazandırır.
bir bilgisayarın bir insanla iletişim kurabilmesinin -ses konusu üzerinden düşündüğümüzde- temelinde sesin analizi ve sentezi yatar. bilgisayara sesli komut verdiğinizde, bilgisayarın bu sesi ele alarak konuşmacı hakkında bilgi elde edebilmesi mümkündür ancak zor bir süreçtir. bilgisayar, sesin sahibinin bulunduğu ortam, duygusal ya da fiziksel durumu nedeniyle seste değişim olup olmaması gibi özelliklerin yanında arka plan gürültüsü gibi harici kaynakları da göz önünde bulundurmalıdır.
bilgisayara girilen sesli bir komutun tanınması için, bilgisayar belleğinde belirli kalıplar bulunur. girilen komuttaki kelimelerle bu kalıplar kıyaslanarak en yakın olanlar belirlenir. böylece sesin ve söylenen sözcüklerin analizi yapılır. sentez kısmındaysa kodlar sese dönüştürülür. elbette bu aşamada bir insanın duygularını sesinden bile anlayabileceğimiz kadar büyük bir hassasiyet beklenmemelidir. zira makineler sesleri taklit edebilse de duyguları taklit edemezler. en azından şu an için...
birçok alanda kullanılabilen bu çalışmalar, kullanıcının bilgisayara olduğu kadar bilgisayarın kullanıcıya sesli olarak ulaşımı bakımından da çeşitli konularda kullanım alanına sahiptir. görme engelliler için sesli kitap uygulamaları buna bir örnektir.
ses işleme konusunda herkesin bildiği en meşhur örneğimiz:
bilgisayarlı örüntü tanıma, bilgisayarların görüntüleri teşhis etme, anlamlandırma, isimlendirme gibi işlemleri yapabilmesini sağlar ama insan benzeri bir makine tasarlamak istiyorsanız yeterli değildir. bunun yanında ses konusunu da ele almanız gerekir. zira sesli iletişim yazılı olandan çok daha kolaydır ve zaman kazandırır.
bir bilgisayarın bir insanla iletişim kurabilmesinin -ses konusu üzerinden düşündüğümüzde- temelinde sesin analizi ve sentezi yatar. bilgisayara sesli komut verdiğinizde, bilgisayarın bu sesi ele alarak konuşmacı hakkında bilgi elde edebilmesi mümkündür ancak zor bir süreçtir. bilgisayar, sesin sahibinin bulunduğu ortam, duygusal ya da fiziksel durumu nedeniyle seste değişim olup olmaması gibi özelliklerin yanında arka plan gürültüsü gibi harici kaynakları da göz önünde bulundurmalıdır.
bilgisayara girilen sesli bir komutun tanınması için, bilgisayar belleğinde belirli kalıplar bulunur. girilen komuttaki kelimelerle bu kalıplar kıyaslanarak en yakın olanlar belirlenir. böylece sesin ve söylenen sözcüklerin analizi yapılır. sentez kısmındaysa kodlar sese dönüştürülür. elbette bu aşamada bir insanın duygularını sesinden bile anlayabileceğimiz kadar büyük bir hassasiyet beklenmemelidir. zira makineler sesleri taklit edebilse de duyguları taklit edemezler. en azından şu an için...
birçok alanda kullanılabilen bu çalışmalar, kullanıcının bilgisayara olduğu kadar bilgisayarın kullanıcıya sesli olarak ulaşımı bakımından da çeşitli konularda kullanım alanına sahiptir. görme engelliler için sesli kitap uygulamaları buna bir örnektir.
ses işleme konusunda herkesin bildiği en meşhur örneğimiz:
devamını gör...
2.
4 yilin sonunda bi guncelleme gecilir bu yaziya :) artik kelime kaliplariyla kiyaslama bitti :') konusma tanima sistemleri dogrudan ham ses datasindan anlam cikariyor.
sesleri de taklit ediyorlar, edemez dedigimiz mutluluk, ofke, yorgunluk, fisilti gibi ton ve duygulari da taklit ediyorlar, hepsi parametreye baglandi. hatta nefes alis verisleri bile.. artik bizim gibi ama bizden daha duzgun diksiyonla konusuyorlar :') boyle istedik cunku.
maalesef ki :') artik sesimizin vurgusundan temposundan yola cikarak %80 oranlarinda duygularimizi tahmin edebiliyorlar.
basligin acildigi gunden bugune ne cok sey degismis.. cokta uzun bir sure degil cok kisa bir zaman oysa ama artik makineler bizi dinliyor, sozumuzu kesmeden cevapliyor (biz kesebiliyoruz), tonlamamizi anliyorlar, arka plandaki sesleri umursamiyorlar, hatta hem goruntu hem sesi ayni anda isliyor ve sohbette baglam kuruyorlar.
bir suru sey..
konusmamizdan yani sesimizin tonundan depresyonda miyiz bunu bile anlayabiliyorlar :') tabi arkaplanda hepsi istatistik, hepsi tahmin.
4 yil sonraya not olsun bakalim ne kadari gerceklesecek:
cihazlarla konusarak is yapacagiz, dil ogrenme gibi bir bariyer herkes icin tamamen yok olacak, engelliler de artik 'konusabilecek', kisisel asistanlarimiz acimasizca bizi bizden iyi taniyip destek atabilecek (duygusal durumlarimiz icin), bizim gibi konusmayacaklar, bizden daha iyi konusacaklar. umarim dusuncelerimizi derleyip toplayip soyleyemedigimiz seyleri de soylerler :d
tedirgin edici, umarim bu gucu iyi niyetten yana kullaniriz.
sesleri de taklit ediyorlar, edemez dedigimiz mutluluk, ofke, yorgunluk, fisilti gibi ton ve duygulari da taklit ediyorlar, hepsi parametreye baglandi. hatta nefes alis verisleri bile.. artik bizim gibi ama bizden daha duzgun diksiyonla konusuyorlar :') boyle istedik cunku.
maalesef ki :') artik sesimizin vurgusundan temposundan yola cikarak %80 oranlarinda duygularimizi tahmin edebiliyorlar.
basligin acildigi gunden bugune ne cok sey degismis.. cokta uzun bir sure degil cok kisa bir zaman oysa ama artik makineler bizi dinliyor, sozumuzu kesmeden cevapliyor (biz kesebiliyoruz), tonlamamizi anliyorlar, arka plandaki sesleri umursamiyorlar, hatta hem goruntu hem sesi ayni anda isliyor ve sohbette baglam kuruyorlar.
bir suru sey..
konusmamizdan yani sesimizin tonundan depresyonda miyiz bunu bile anlayabiliyorlar :') tabi arkaplanda hepsi istatistik, hepsi tahmin.
4 yil sonraya not olsun bakalim ne kadari gerceklesecek:
cihazlarla konusarak is yapacagiz, dil ogrenme gibi bir bariyer herkes icin tamamen yok olacak, engelliler de artik 'konusabilecek', kisisel asistanlarimiz acimasizca bizi bizden iyi taniyip destek atabilecek (duygusal durumlarimiz icin), bizim gibi konusmayacaklar, bizden daha iyi konusacaklar. umarim dusuncelerimizi derleyip toplayip soyleyemedigimiz seyleri de soylerler :d
tedirgin edici, umarim bu gucu iyi niyetten yana kullaniriz.
devamını gör...