Kısmi Gözlemlenebilir Ardışık Karar Vermede Alt Hedef Tespiti

Download

TVRreE1EVTE.pdf

Date

2018

Author

Polat, Faruk

Metadata

Show full item record

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Item Usage Stats

239
views

411
downloads

Kısmi gözlemlenebilirlik durumunda ardısık karar verme, algısal aynılıgın ve büyükboyutlulugun getirdigi sorunlar nedeniyle zor bir problem olarak bilinmektedir. Ögrenmealgoritmaları, ardısık karar verme problemine adaptif etmen bakıs açısıyla yaklasmaya çalısır,ve bazı yaklasıklastırma yöntemleri kullanarak söz konusu problemle basa çıkmayı dener.Takviye ögrenme (RL), özerk etmen modeline uyumlulugu, gerçeklestiriminin göreceli olarakkolay olması ve gerçek dünyadaki durumlara adaptasyonunun rahatlıgı gibi bilinen bazıözellikleri nedeniyle, güçlü bir çevrim-içi ögrenme yöntemi olarak kabul görür. Teorik olarakMarkov karar süreci (MDP) modelini temel alan RL yöntemlerinin, bazı varsayım vekısıtlamalar çerçevesinde kısmi gözlemlenebilir MDP (POMDP) versiyonları mevcuttur.Literatürde, MDP problemlerinin küçük alt problemlere bölünerek her bir problemin daha azeforla çözüldügü ve bu çözümlerin sonradan birlestirilip problemin bütünü için büyük çözümünüretildigi yöntemler vardır. Bu yöntemler arasında popüler olan bir yaklasım, problemi dogalolarak parçalara ayıran alt-hedeflerin tespitidir. Bu kapsamda MDP-RL yöntemleri içinyöntemler önerilmisse de kısmi gözlemlenebilir problemler için alt-hedef tespiti konusu halenolgunluga ulasmamıstır.Bu projenin amacı, POMDP-RL için alt-hedef tespiti alanında henüz hiçbir çalısmayapılmamıs olan, gizli durumlar içeren problemler için bellek tabanlı RL algoritmalarıkonusunda yeni yöntemler üretmektir. Bu çalısma, hal-i hazırda MDP-RL için mevcut olançevrim-içi alt-hedef tespit yöntemlerinin POMDP-RL modeline adaptasyonuna veya yenidentasarlanmasına odaklanmakta, böylece ögrenme performansının herhangi bir çevrim-dısımüdahaleye gerek kalmaksızın artırılmasını amaçlamaktadır.Öncelikle, gerek MDP-RL, gerekse POMDP-RL yöntemleri için mevcut alt-hedef tespityaklasımları -ögrenme çıktılarını kullanan yöntemlere agırlık verilerek- analiz edilmistir.Ardından, olgun bir POMDP-RL yöntem ailesi olan bellek tabanlı algoritmalara odaklanılarakyeni bir alt-hedef tespit yöntemi gelistirilmistir. Son olarak, literatürde yaygın kabul gören farklıproblemler üzerinde karsılastırmalı kosumlarla, önerilen yöntemlerin etkinliginin dogrulanmasısaglanmıstır.

Subject Keywords

Bilgisayar Bilimleri, Teori ve Metotlar

URI

https://app.trdizin.gov.tr/publication/project/detail/TVRreE1EVTE
https://hdl.handle.net/11511/50517

Collections

Department of Computer Engineering, Project and Design

Suggestions

OpenMETU
Core

Dinamik Ürün Hatlarında Otonom Evrim Oğuztüzün, Seyfullah Halit Mehmet(2018) Bir dinamik yazılım ürün hattı (DYÜH), bir degiskenlik modelinin güdümünde, dinamik olarakyeniden-yapılandırılabilir bir sistemdir. Bir DYÜH, yasam döngüsü boyunca degisengereksinimlere karsılık verebilmek için evrilmek durumundadır. Degiskenlik modeli bu evrimsürecinin bir parçasıdır. Çalısmamızda degiskenlik modellemesi için özellik modellerinibenimsedik. Özellik modelinin evrilmesi bir üst-model ile temsil edilmis ve buradan FEMELadını verdigimiz özel amaçlı dile ulasılmıstır. FEMEL özellik modelinin evr...
Anlamsal olarak zenginleştirilmiş mobil servisler platformu Doğaç, Asuman(2004) Mobil-Pazar uygulamaları pazarlaması yavaş ilerlemekte ve bu tür servislerin yayılması ekran koruyucusu, zil sesleri indirmek ya da son haberlere ulaşmak gibi basit bilgi-eğlence servisleri ile sınırlı kalmıştır. Bunun bazı sebebleri pazarlama ile ilgili olsa da gerçek etkileşimli Mobil-Pazar kullanıcı deneyimlerinin yayılması altında zorlu birtakım teknik sorunlar yatmaktadır. Bunların başında: 1. Uygun, tutarlı ve güvenilir bir şekilde kullanıcı kontekstinin yer, servis teklifleri, diğer kullanıcılar ve o...
Image segmentation and smoothing via partial differential equations Özmen, Neslihan; Leblebicioğlu, Mehmet Kemal; Department of Scientific Computing (2009) In image processing, partial differential equation (PDE) based approaches have been extensively used in segmentation and smoothing applications. The Perona-Malik nonlinear diffusion model is the first PDE based method used in the image smoothing tasks. Afterwards the classical Mumford-Shah model was developed to solve both image segmentation and smoothing problems and it is based on the minimization of an energy functional. It has numerous application areas such as edge detection, motion analysis, medical i...
Jeoloji haritalarında bölütleme uygulamaları Yalabık, Neşe; Atalay, Mehmet Volkan; Göktepe, Mesut; Arcasoy, Arda(1997) Bu çalışmada, tek ve çok bandlı uzaktan algılama görüntülerinin bölütlemesi araştırılmaktadır. Bölütleme yaklaşımı, temel olarak incelenen arazinin doku özniteliklerinin farklılığına dayalı olarak gerçekleştirilmektedir. Hiyerarşik özdüzenlemeli haritalar kullanarak gözetimsiz bir bölütleme yaklaşımı önerilmektedir. Öznitelik derleme aşamasında Markov rasgele alan doku modeli temel alınmaktadır. Bu bağlamda, çeşitli algoritmalar geliştirilip, tek bandlı ve çok bandlı Landsat 5 TM uydu görüntüleri üzerinde d...
Komplike objelerin belirsiz özellikleriyle simgelenmesi Koyuncu, Murat; Yazıcı, Adnan(1995) Geleneksel veritabanı sistemleri, anlamsal destekten yoksun oldukları halde bilgiye-dayah sistemler (knowledge-based systems), büyük miktardaki bilgilerin saklanması ve erişimi açısından yetersiz kalmaktadır. Bilgiye-dayah sistemler veritabanı sistemlerine anlamsal zenginlik verirken, veritabanı sistemleri de bilgiye dayalı sistemlere bilgilerin tutulması ve korunmasında büyük yarar sağlar. Bu iki sistemin bağlaştınlması sonucunda her iki sistemin fonksiyonelliğinin artacağı açıktır. Bu projenin asıl amacı ...

Citation Formats

F. Polat, “Kısmi Gözlemlenebilir Ardışık Karar Vermede Alt Hedef Tespiti,” 2018. Accessed: 00, 2020. [Online]. Available: https://app.trdizin.gov.tr/publication/project/detail/TVRreE1EVTE.