İlişkisel veri ayrıştırılmasında model seçimi
Citation
Hızlı, Ç., Cemgil, T., Kirbiz, S. (2019). 27th Signal Processing and Communications Applications Conference (SIU) in Model Selection for Relational Data Factorization. Turkey, Sivas : IEEE. DOI: 10.1109/SIU47150.2019.8977398Abstract
İlişkisel veri analizinde temel bir problem olan topluluk seziminde, ilişkisel veri için model seçimi hala açık bir problemdir. Bu bildiride, Bayesçi atama modelinin (BAM) genel atama çerçevesi içinde, karmaşık üyelik rastlantısal öbek modellerinin (KÜRÖB) model boyutunun tahmin edilmesi önerilmektedir. İlişkisel verilerin atama modelindeki Poisson sayıları olarak nasıl temsil edildiği açıklanmaktadır. Deney sonuçları sentetik ve gerçek veri kümeleri üzerinde gösterilmektedir. Genelleyici atama yaklaşımı, sadece model boyutunu değil, aynı zamanda en uygun ayrıştırmayı seçebilen genelleştirilmiş bir model seçimi çözümü vaat etmektedir Abstract—As a fundamental problem in relational data analysis, model selection for relational data factorization is still an open problem. In our work, we propose to estimate model order for mixed membership blockmodels (MMSB) within the generic allocation framework of Bayesian allocation model (BAM). We describe how relational data is represented as Poisson counts of the allocation model, and demonstrate our results both on synthetic and real-world data sets. We believe that the generic allocation perspective promises a generalized model selection solution where we do not only select the model order, but also choose the most appropriate factorization.