660 likes | 925 Views
Estimasi Prob. Density Function dengan EM. Sumber: Forsyth & Ponce Chap. 7 Standford Vision & Modeling. Probability Density Estimation. Parametric Representations Non-Parametric Representations Mixture Models. Metode estimasi Non-parametric. Tanpa asumsi apapun tentang distribusi
E N D
Estimasi Prob. Density Function dengan EM Sumber: Forsyth & Ponce Chap. 7 Standford Vision & Modeling
Probability Density Estimation • Parametric Representations • Non-Parametric Representations • Mixture Models
Metode estimasi Non-parametric • Tanpa asumsi apapun tentang distribusi • Estimasi sepenuhnya bergantung ada DATA • cara mudah menggunakan: Histogram
Histograms Diskritisasi, lantas ubah dalam bentuk batang:
Histograms • Butuh komputasi banyak, namun sangat umum digunakan • Dapat diterapkan pada sembarang bentuk densitas (arbitrary density)
Histograms • Permasalahan: • Higher dimensional Spaces: • - jumlah batang (bins) yg. Exponential • - jumlah training data yg exponential • - Curse of Dimensionality • size batang ? Terlalu sedikit: >> kasar • Terlalu banyak: >> terlalu halus
Pendekatan secara prinsip: • x diambil dari ‘unknown’ p(x) • probabiliti bahwa x ada dalam region R adalah:
Pendekatan secara prinsip: • x diambil dari ‘unknown’ p(x) • probabiliti bahwa x ada dalam region R adalah:
Pendekatan secara prinsip: • x diambil dari ‘unknown’ p(x) • probabiliti bahwa x ada dalam region R adalah:
Pendekatan secara prinsip: Dengan Fix K Tentukan V Dengan Fix V Tentukan K K-nearest neighbor Metoda Kernel-Based
Metoda Kernel-Based: Parzen Window:
Metoda Kernel-Based: Parzen Window:
Metoda Kernel-Based: Parzen Window:
Metoda Kernel-Based: Gaussian Window:
K-nearest-neighbor: Kembankan V sampai dia mencapai K points.
K-nearest-neighbor: Klasifikasi secara Bayesian :
K-nearest-neighbor: Klasifikasi secara Bayesian : “aturan klasifikasi k-nearest-neighbour ”
Probability Density Estimation • Parametric Representations • Non-Parametric Representations • Mixture Models (Model Gabungan)
Mixture-Models (Model Gabungan): Gaussians: - Mudah - Low Memory - Cepat - Good Properties Non-Parametric: - Umum - Memory Intensive - Slow Mixture Models
Campuran fungsi Gaussian (mixture of Gaussians): p(x) x Jumlah dari Gaussians tunggal
Campuran fungsi Gaussian: p(x) x Jumlah dari Gaussians tunggal Keunggulan: Dapat mendekati bentuk densitas sembarang (Arbitrary Shape)
Campuran fungsi Gaussian: p(x) x Generative Model: z P(j) 1 3 2 p(x|j)
Campuran fungsi Gaussian: p(x) x
Campuran fungsi Gaussian: Maximum Likelihood:
Campuran fungsi Gaussian: Maximum Likelihood: E
Campuran fungsi Gaussian: Maximum Likelihood:
Campuran fungsi Gaussian: Maximum Likelihood: Tidak ada solusi pendek ! E
Campuran fungsi Gaussian: Maximum Likelihood: E Gradient Descent
Campuran fungsi Gaussian: Maximum Likelihood:
Campuran fungsi Gaussian: • Optimasi secara Gradient Descent: • Complex Gradient Function • (highly nonlinear coupled equations) • Optimasi sebuah Gaussian tergantung dari seluruh campuran lainnya.
Campuran fungsi Gaussian: -> Dengan strategi berbeda: p(x) Observed Data: x
Campuran fungsi Gaussian: Densitas yg dihasilkan p(x) Observed Data: x
Campuran fungsi Gaussian: Variabel Hidden y 1 2 p(x) Observed Data: x
Campuran fungsi Gaussian: Variabel Hidden y 1 2 p(x) Observed Data: x y Unobserved: 1 1 1111 12 2 2222 2
Contoh populer ttg. Chicken and Egg Problem: p(x) x Max.Likelihood Utk. Gaussian #1 Max.Likelihood Utk. Gaussian #2 Anggap kita tahu y 1 1 1111 12 2 2222 2
Chicken+Egg Problem: p(x) Anggap kita tahu x P(y=1|x) P(y=2|x) y 1 1 1111 12 2 2222 2
Chicken+Egg Problem: p(x) x ? Tapi yg ini kita tidak tau sama sekali ? y 1 1 1111 12 2 2222 2
Chicken+Egg Problem: p(x) x Coba pura2 tahu y 1 1 1111 12 2 2222 2
Clustering: x y Tebakan benar ? 1 1 1111 12 2 2222 2 K-mean clustering / Basic Isodata
Pengelompokan (Clustering): Procedure: Basic Isodata 1. Choose some initial values for the means Loop: 2. Classify the n samples by assigning them to the class of the closest mean. 3. Recompute the means as the average of the samples in their class. 4. If any mean changed value, go to Loop; otherwise, stop.
Ditebak Eggs / Terhitung Chicken p(x) x Max.Likelihood Utk. Gaussian #1 Max.Likelihood Utk. Gaussian #2 Disini kita berada y 1 1 1111 12 2 2222 2