Regresi Binomial negatif : alternatif Regresi diskrit

Regresi Binomial negatif: Pada artikel sebelumnya, telah dibahas tentang regresi poisson dengan menggunakan minitab. Namun penjelasannya belum tuntas karena belum membahas bagaimana jika terjadi overdispersi, dan kebetulan minitab belum mengakomodir sepenuhnya terhadap kebutuhan ini.

Kali ini pembahasan menggunakan SPSS dengan menggunakan data yang sama akan mengetahui apakah data tersebut mengalami overdispersi dan apakah regresi poisson masih bisa digunakan atau perlu alternatif lain. artikel ini disusun berdasarkan beberapa sumber dan tercantum dibagian akhir artikel

Bagi yang belum memahami syarat – syarat regresi poisson ada baiknya membaca artikel sebelumnya yang berjudul : Regresi Poisson untuk data diskrit

Regresi Poisson

Karena penjabarannya sudah diutarakan dalam artikel sebelumnya, kali ini langsung melakukan praktek saja. Buka spss nya, kemudian klik analyze – generalized linear models – generalized linear models

generalized linear model

Akan muncul windows pengaturan GLM ini, perlu diketahui bahwa GLM menganut linear. Jadi tidak akan berbeda jauh apabila mengerti tentang regresi linear atau regresi berganda. Pada tab type of model, pilih poisson loglinear pada pilihan Count.

Kemudian pada tab response, masukkan variabel Y atai dependen variabel, dalam hal ini adalah discoloration

Pada tab predictors, masukkan variabel independen. Saat memasukkan variabel ini, perlu diperhatikan apakah variabel tersebut berupa index atau continous data. Jika merupakan index, maka masukkan dalam grup factors, dan jika berupa data continous data seperti data rasio, maka masukkan dalam kelompok covariates. Pada latihan kali ini variabel size dan temperature dimasukkan dalam kelompok factors, sedangkan variabel hours dan clump dimasukkan dalam variabel covariates.

Kemudian pada tab model, masukkan semua variabel predictors. Pada latihan ini pilihan main effect pada type of modelnya.

Pengaturan regresi poisson cukup sampai disini secara default. Anda bisa juga mengatur pada tab yang lain seperti estimation, statistics, save dan export jika diperlukan. selanjutnya klik OK, dan tunggu hasilnya.

Membaca hasil Regresi Poisson

Pada laporan hasil analisa, pada bagian awal menjelaskan deskriptif masing masing variabel baik dependen maupun independen.

Kemudian bagian kedua merupakan goodness of fit dari model yang dikeluarkan. Disana ada deviance, dan pearson kemudian omnibus test. Pada tabel goodness of fit, lihat nilai pearson chisquare dan deviance pada tabel value/df. Jika bernilai diatas 1 maka menandakan overdispersi, sebaliknya jika dibawah 1 maka menandakan underdispersi. Nilai value/df  yang dihasilkan pada latihan ini adalah 0.550 dan 0.547, artinya menandakan terjadi underdispersi.

Kemudian pada tabel selanjutnya yakni omnibus test, seperti pada umumnya bahwa jika nilainya dibawah atau sama dengan 0.05 maka model dapat merepresentasikan nilai dependen variabel secara signifikan. Sebaliknya, maka model yang dihasilkan tidak bagus.

Tabel berikutnya membahas signifikan secara parsial satu persatu variabel independen. Masih sama, berpatokan pada tingkat kepercayaan yang digunakan. Jika menggunakan tingkat kepercayaan 95%, maka signifikansi harus dibawah 0.05 atau 5%.

Tabel terakhir, tabel yang banyak dinantikan dalam pembahasan adalah estimasi parameter yang berisi nilai konstanta setiap variabel independen

Konstanta masing masing variabel ada pada kolom B. cara membacanya adalah:
Konstanta: jumlah produk cacat warna meningkat 4.090 kali, cateris paribus.
Size : jumlah produk yang cacat warna akan menjadi 0.418 lebih besar pada ukuran size large, dan 0 pada ukuran small.
Temperatur: jumlah produk yang cacat warna akan menjadi  0.071 lebih besar pada temperatur 80 derajad, dan 0 pada temperatur 215 derajad.
Hours : jumlah produk yang cacat warna akan menjadi  0.019 lebih besar pada tambahan setiap jamnya.
Clump: jumlah produk yang cacat warna akan menjadi 0.25 lebih kecil pada tambahan setiap satuannya.

Jika menemukan nilai konstanta diatas 1, misalnya 1.56. maka bisa dijabarkan bahwa jumlah produk yang cacat warna akan menjadi 1.56 lebih besar setiap tambahan satu satuan. Atau bisa dikatakan ada peningkatan 56% jumlah cacat warna untuk setiap tambahan satu satuan independen variabel.

Lalu model regresi dari hasil diatas adalah:

Yi = ti exp (4.09 +0.418 large + 0 small + 0.71 temperatur80 + 0 temperatur 215 + 0.019hours -0.025clump).

Binomial negatif

Pertanyaan di awal, bagaiman jika menemukan regresi poisson yang tidak equadispersi. Bisa terjadi overdispersi maupun underdispersi seperti contoh diatas. Salah satu cara untuk mengatasinya adalah menggunakan regresi binomial negatif.

Caranya sama dengan diatas. Hanya pada waktu memasukkan type of model, pilih negative binomial with log link. Selebihnya masih sama dengan cara sebelumnya.

Klik ok dan akan kita lihat hasilnya:

Terlihat pada goodnes of fit value/df dan omnibus test justru hasilnya lebih buruk. Data semakin underdispersi (karena memang binomial negativ seringnya dipakai untuk overdispersi), dan omnibus test justru menjadi tidak signifikan. Pada kasus latihan ini, kita mengetahui bahwa menggunakan regresi poisson lebih baik dibandingkan binomial negatif.

Menurut long (1997), uji likelihood ratio dapat digunakan untuk memeriksa hipotesis nol tidak ada overdispersi. H0 = tidak overdispersi, H1 = ada overdispersi. Statistik yang digunakan LR = 2(lnLbinomialnegativ – ln Lpoisson) nilai ini dibandingkan dengan nilai chi square pada df = 1 atau nilainya sama dengan 3.841. jika nilai LR < 3.841 maka artinya terima H0 dan model lebih baik menggunakan regresi poisson. Sebaliknya jika LR > 3.841, maka tolak H0 dan model lebih baik menggunakan regresi binomial negatif.

Berdasarkan kedua output spss tadi kita masukkan nilai loglikelihood dari binomial dan poissin. Letaknya ada di tabel goodness of fit.

LR = 2(-183.862 – (-115.360)) = -68.502. hasil < 3.841 maka artinya terima H0 dan menandakan regresi poisson lebih baik digunakan daripada regresi binomial negatif.

Semoga jelas ya… ini juga hasil belajar sekitar satu minggu. Tulisan ini nantinya juga akan saya baca saat saya membutuhkan. Terima kasih

Selamat belajar!

Sumber : tutorial di spss,
Data Latihan:


Similar Posts

2 Comments

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *