Hide/Show Apps

Derin Sinir Ağı Tabanlı Nesne Algılama Yöntemlerine Bağlam Modeli Entegre Edilmesi

Nesne algılama (İng. object detection) problemini kısaca, girdi olarak verilen bir görüntüde yine girdi olarak verilen bir nesne sınıfına ait örnekler var ise bunların her birinin bir sınırlayıcı kutu (İng. bounding box) aracılığıyla işaretlenmesi olarak tanımlayabiliriz. Nesne algılamada bağlam (İng. context) kullanımı çokça çalışılmış olmasına rağmen (bknz. Literatür Özeti), bugün en iyi en güncel (İng. state of the art) nesne algılama yöntemleri (örneğin, Girshick, 2015; Ren vd., 2015; Lin vd. 2017), nesne örneklerini ararken sadece yerel görüntü özniteliklerinden yararlanmakta ve genel olarak bağlamı kullanmamaktadır. Bunda, nesne algılama için bağlam kullanımının bazı nesne sınıfları için başarımı arttırması, bazı sınıflar için azaltması ve ortalamada çok az bir artış getiriyor olması gibi “karışık” sonuçların (Divvala vd., 2009) etkisi olduğu düşünülmektedir. Fakat bağlam kullanımı için iki temel, çok güçlü motivasyon vardır. Bunlardan ilki, yeteri kadar görsel kanıt vermeyen ve bu yüzden algılanması zor küçük nesneler için bağlamın kritik önemde olmasıdır (bknz. Şekil 1). İkinci motivasyon ise nesne algılama problemini çok yüksek başarımla çözen biyolojik görü sistemlerinde bağlamdan yanlış pozitifleri (İng. false positives) azaltan ve arama uzayını (İng. search space) daraltan bir şekilde yararlanılmasıdır (bknz. Şekil 2). Bu projede amaç, derin sinir ağı tabanlı yeni nesil nesne algılama yöntemlerine bir bağlam modeli entegre etmektir. Bu amaç doğrultusunda belirledi