BigDiv: Arama Sonuçlarında Cevap Çeşitlendirme için Verimli ve Ölçeklenebilir Yöntemler

2020-06-01
Modern kelime-tabanlı arama sistemleri, cevap listesinde sorguyla en ilgili ve aynı zamanda sorgunun farklı anlam/yorumlarını en geniş şekilde kapsayabilen (yani, çeşitlendirilmiş) cevapları en üst sıralarda getirmeyi hedeflerler. Bu projenin amacı, genel-amaçlı veya dikey arama sistemlerinde ihtiyaç duyulan sorgu cevabı çeşitlendirme işlevi için dağıtık mimari üzerinde ve sistemin diğer bileşenleriyle uyumlu olarak etkin şekilde çalışabilecek verimli ve ölçeklenebilir yöntemler geliştirmektir. Bu amaca ulaşmak için dört ana hedef doğrultusunda çalışmalar gerçekleştirilmiştir. İlk hedefimiz olan 'Çeşitlendirme yöntemlerinde verimlilik' kapsamında çok-boyutlu cevap çeşitlendirme yaklaşımı önerilmiş, denetimli makine öğrenmesi kullanan cevap çeşitlendirme yaklaşımları geliştirilmiş, görsel arama senaryosu için yine denetimli öğrenme kullanan bir yaklaşım genişletilmiş, ve her sorgu için aday cevap kümesi büyüklüğünü kestirmek üzere bir yaklaşım önerilmiştir. Bu yaklaşımların her birinin literatürdeki rakiplerinden etkinlik ve/veya verimlilik bazında daha başarılı olduğu gösterilmiştir. İkinci hedef olan 'Cevap çeşitlendirme yöntemlerinde ölçeklenebilirlik' kapsamında cevap çeşitlendirme başarımı dağıtık mimarinin farklı katmanlarında ve sorgu işlemenin farklı aşamalarında incelenmiş, ve çeşitlendirme sırasında belgelerin kelime kodlamaları (word embeddings) kullanılarak temsil edilmesi önerilmiştir. Ele alınan dağıtık arama senaryosunda hem çeşitlendirme başarımının hem verimliliğin arttığı gösterilmiştir. Üçüncü hedef olan 'Cevap çeşitlendirme yöntemlerinin diğer verimlilik-odaklı bileşenlerle etkileşimi' kapsamında ise öncelikle cevap önbelleklerinde frekans geçmişini saklamak için bir yaklaşım uyarlanmış, ikinci olarak dinamik budama yaklaşımlarında verimliliği artıran bir skor önbelleği önerilmiş ve son olarak da çeşitlendirme-farkında bir statik endeks budama yöntemi geliştirilmiştir. Böylece arama motorlarında en çok kullanılan önbellekleme, dinamik budama ve statik endeks budama mekanizmalarının cevap çeşitlendirmeyle etkileşimine ışık tutulmuş ve/veya bu mekanizmalar cevap çeşitlendirmeyi destekleyecek şekilde geliştirilmiştir. Son hedefimiz olan 'Prototip tweet-arama sistemi' kapsamındaysa ilk olarak literatürde farklı alanlardaki yöntemleri de kapsayan bir cevap çeşitlendirme kütüphanesi gerçeklenmiş ve bu yöntemlerin başarımları değerlendirilmiştir. İkinci olarak da verimli çeşitlendirme yöntemlerinin kullanıldığı ve başarısının gösterildiği faydalı bir uygulama olarak Türkçe sorgular için Twitter API ile elde edilen cevapların çeşitlendirildiği bir prototip arama sistemi gerçeklenmiştir.

Suggestions

Açık Anahtarlı Kriptografi için Verimli Algoritmaların Geliştirilmesi
Cenk, Murat; Özbudak, Ferruh(2018)
Projenin genel amacı, kriptografide sıklıkla kullanılan modüler üst alma, polinom çarpması veeliptik egriler üzerindeki islemlerin karmasıklıgını iyilestirecek gelistirmelerin yapılması ve eldeedilecek yeni algoritmaların çesitli platformlar üzerinde gerçeklenmesidir. Bu çalısmalarsonucunda modüler üst alma, eliptik egri aritmetigi ve polinom çarpma islemlerindeiyilestirmeler elde edilmistir. Çalısmalar kapsamında P-521, E-521 ve Curve25519 egrileriüzerindeki islemler Toeplitz matris vektör çarpımları (TMVÇ...
Taşınım Ağırlıklı Eniyilemeli Kontrol Problemleri için Çoklu Ağ Yöntemleri
Karasözen, Bülent(2014-12-31)
Taşınım ağırlıklı eniyilemeli kontrol problemlerinin çözümleri genellikle, çözümlerin yüksek eğilime sahip olduğu bölgelerde, katman ve salınımlar oluşmaktadır. Bu yüksek eğilimlerin yumuşatılması için Gauss-Seidel veya Jacobi gibi temel tekrarlamalı yöntemler kullanılabilir. Fakat bu yöntemlerin gerçek çözüme yakınsamalarının yavaş olduğu bilinmektedir ve kabul edilebilir yakınsama düzeyine ulaşabilmek için çoklu ağ yöntemlerinin kullanması gerekmektedir. Bu çalışmada, çoklu ağ yöntemlerinin taşınım ağır...
Bankacılık sektöründe gözetimli öğrenme yaklaşımları kullanılarak kredi riskinin belirlenmesi
Kestel, Sevtap Ayşe; Uğur, Ömür(2018-12-31)
Bu projede alışılmış kredi riskinin değerlendirilmesinde kullanılan ve kredi veren kuruluşlar tarafından büyük bir öneme sahip olan kredi derecelendirilmesi için literatürdeki metotların uygulanması, kredi derecelendirmesinde kullanılan veri seti temel alınarak derecelendirmedeetkisi olan ve olmayan değişkenlerin belirlenmesi ve bunların farklı kombinasyonlarının test edilmesi, kredi derecelendirme metotlarının performanslarının objektif şekilde değerlendirilmesi, kredi verme kararlarında oluşabilecek beşer...
Ekonomik ve Sosyal Göstergelerin Gayrimenkul Piyasaları Üzerindeki Etkisinin Parametrik ve Parametrik Olmayan Yöntemler ile Tahmini
Kestel, Sevtap Ayşe; Bayram, Ayça(2017-12-31)
Konut piyasalarını etkileyen faktörler ve bu faktörlerin bu piyasayı nasıl etkilediği mantıksal olarak tahmin edilmesine rağmen, konut piyasalarını inceleyen parametrik ve non parametrik modeller literatürde gereken önemi hala görmemiştir. Bu proje ile gayrimenkul piyasalarının tanımlanması, ulusal ekonomik ve sosyo ekonomik göstergelerin gayrimenkul piyasaları üzerindeki etkilerinin araştırılması ve bu göstergelere dayanan bazı popüler parametrik ve parametrik olmayan modelleme teknikleri uygulanarak bu pi...
Hayat ve Hayat Dışı Sigorta Şirketlerinde Mali Yeterlilik Kriterlerine ait Faktörlerin Modellenmesi
Kestel, Sevtap Ayşe; Yıldırım Külekci, Bükre; Şimşek, Meral; Mert, Özenç Murat(2018-12-31)
Solvency II sisteminin etkinliğini sağlayacak olan içsel modeller ve bu modellere dayalı olarak sektörde faaliyet gösteren hayat ve hayat-dışı sigorta şirketlerine yönelik erken uyarı ölçütü oluşturacak bir skala geliştirilmesi önemlidir. Hayat ve hayat dışı branşlarda mali yeterlilik gereklerinin şirket özvarlıkları ve önemli finansal göstergeleri altında değerlendirilmesi şirkete özel içsel modellerin oluşturulmasını gerektirmektedir. Bu proje, her iki brans, hayat ve hayat-dışı sigortalar, için Solvency ...
Citation Formats
İ. S. Altıngövde, “BigDiv: Arama Sonuçlarında Cevap Çeşitlendirme için Verimli ve Ölçeklenebilir Yöntemler,” 2020. Accessed: 00, 2022. [Online]. Available: https://hdl.handle.net/11511/95938.