Kümeleme probleminde küme bazlı öznitelik seçimi

2019-06-12
İyigün, Cem
Onen Oz, Sena
Kümeleme algoritmaları, noktalar arasındaki önceden bilinmeyen gizli ilişkileri belirleyip birbirine benzeyen veri noktalarını aynı gruba, birbirinden farklı veri noktalarını ise ayrı gruplara koymayı hedefleyen gözetimsiz bir öğrenme yöntemidir. Ancak veri setinin boyutu arttıkça verinin anlaşılması zorlaştığından doğru kümelemeyi elde etme ihtimali düşer. En iyi kümelemeyi bulmak için kümeleri tanımlayan öznitelikleri belirlemek kümeleme algoritmalarının performansını arttırmak amacıyla büyük ölçekli veri setlerinde en çok kullanılan ön işleme tekniğidir. Özniteliklerin ayırt edici olarak seçilip seçilmemesi, tümzniteliklerin her k¨ume i¸cin aynı ilgi d¨uzeyine sahip oldu˘gu varsayımıyla ortaya ¸cıkmaktadır. Bu ¸calı¸smada, k¨umelemede kullanılacak ¨ozniteliklerin her bir k¨ume i¸cin farklılık g¨osterebilece˘gi varsayılmaktadır. K¨ume sayısı ve her k¨umedeki ¨oznitelik sayısı ¨onceden verilmektedir. K¨ume merkezleri bazlı bir k¨umeleme yakla¸sımı kullanılarak, veri noktalarının kendilerine en yakın k¨umelere atanması ve her bir k¨ume i¸cin ¨oznitelik se¸cimi e¸s zamanlı olarak yapılmaktadır. Bu ¸calı¸sma kapsamında k¨ume i¸cindeki noktaların ilgili k¨ume merkezine se¸cilen ¨oznitelikler ¨uzerinden uzaklıklarının toplamını enazlayan karma tamsayılı bir matematiksel model ¨onerilmi¸stir. Onerilen model do˘grusal olmadı˘gı i¸cin prob- ¨ lemin ¸c¨oz¨um¨unde farklı do˘grusalla¸stırma y¨ontemlerinin uygulandı˘gı matematiksel modeller kullanılmı¸stır. Bunun yanı sıra, belirtilen problem i¸cin ¨u¸c farklı sezgisel ¸c¨oz¨um y¨ontemi geli¸stirilmi¸stir. Onerilen matematiksel modeller ¨ ve geli¸stirilen sezgisel ¸c¨oz¨um y¨ontemleri nokta ve ¨oznitelik sayısı a¸cısından farklı b¨uy¨ukl¨ukteki veri setleri ¨uzerinde denenmi¸s ve sonu¸cları raporlanmı¸stır
Citation Formats
C. İyigün and S. Onen Oz, “Kümeleme probleminde küme bazlı öznitelik seçimi,” Ankara, Türkiye, 2019, p. 67, Accessed: 00, 2021. [Online]. Available: https://hdl.handle.net/11511/74826.