Menghitung Manual Regresi Logistik

Menghitung manual regresi logistik yang dimaksudkan disini adalah memprosesnya dengan menggunakan microsoft excel. Regresi logistik merupakan salah satu regresi yang berarti memiliki variabel terikat dan variabel bebas. Ciri khusus regresi logistik adalah memiliki variabel terikat berupa dummy atau skala nominal atau bersifat binary. Penjelasan lengkap mengenai regresi logistik dapat dilihat pada artikel yang berjudul semua tentang regresi logistik.

Salah satu ciri umum regresi adalah memiliki persamaan linear yakni:
Y = a + b X

X yang merupakan variabel bebas atau variabel independen bisa berjumlah lebih dari satu pada regresi berganda. Pada contoh kali ini, dicontohkan regresi logistik dengan satu variabel independen. Hal yang akan dihitung adalah nilai a sebagai konstanta dan nilai b sebagai koefisien variabel X.

Maksimum Likelihood

Perlu diketahui sebelumnya bahwa regresi logistik tidak menggunakan ordinary least square (OLS) yang umum digunakan pada regresi berganda. Regresi logistik menggunakan maksimum likelihood dengan distribusi logistik. Hal ini mengakibatkan asumsi asumsi yang harus dipenuhi pada OLS tidak berlaku pada regresi logistik. Jadi diharapkan tidak ada lagi pertanyaan di kolom komentar tentang uji asumsi klasik di regresi logistik ini.

Konsep perhitungan manual regresi logistik nantinya akan menghitung likelihood terlebih dahulu kemudian mencari nilai maksimum dari penjumlahan likelihood dengan menggunakan addins solver yang ada di excel.

Data yang saya miliki berjumlah 25 dengan nilai 0 berjumlah 11 data dan nilai 1 berjumllah 14 data. Data tersebut dapat diunduh di link :

Data regresi logistik ini terdiri dari satu variabel independen sehingga nilai yang akan dicari adalah b0 dan b1 dengan model Y = b0 + b1.X1

Langkah selanjutnya adalah menuliskan b0 dan b1 dan menuliskan nilai random disampingnya. Nilai ini adalah nilai asumsi dasar untuk menentukan likelihood. Pada kali ini saya menuliskan 0.01 untuk b0 dan 0.02 untuk b2.

mengolah manual regresi logistik

Selanjutnya adalah menghitung logit, atau biasa dikenal dengan nilai Y prediksi dengan model Y = b0 + b1X1 pada kolom disamping X. perhatikan rumus pada screenshot dibawah ini:

Nilai logit ini kemudian di exponensialkan disamping kolom logit tersebut seperti gambar dibawah ini:

Kolom disampingnya, kita menghitung nilai P(X) dengan rumus = exp(logit)/(1+exp(logit)).

Pada tahap selanjutnya kita menghitung log likelihood dengan rumus Yi x LN(P(x)i+(1- Yi) x LN(1-P(x)i

kolom log likelihood ini dijumlahkan untuk data pertama sampai dengan data ke -25 atau semua data yang anda miliki. Nilai log likelihood inilah yang akan kita maksimalkan. Artinya, berapa nilai b0 dan b1 agar nilai sum log likelihood berada pada nilai maksimum.

Mengaktifkan Addins Solver untuk menghitung manual regresi logistik

Guna melengkapi operasi ini, kita memerlukan excel addins yang bernama solver yang telah disediakan bersama excel namun perlu diaktifkan terlebih dahulu. Cara mengaktifkannya adalah klik file – option. Kemudian klik addins di tab samping kiri, kemudian klik Go, selanjutnya akan muncul windows kecil, beri centang solver addins kemudian klik OK.

Addins tersebut berada di ribbons Data di tab paling kanan

Kembali ketopik regresi logistik, untuk mencari nilai b0 dan b1 pada maksimum likelihood, kita arahkan kursor di cell penjumlahan likelihood, kemudian klik solver addins.

Keterangan gambar:
1: cell penjumlahan log likelihood
2: area cell nilai B0 dan B1
3: pastikan unchecklist
4: gunakan GRG Nonlinear

Kemudian klik OK dan OK.

Maka terlihat nilai B0 dan b1 sudah berubah pada nilai loglikelihood yang maksimum. Nilai B0 adalah -11.992 dan nilai B1 adalah 0.60.

Nilai ini menandakan bahwa persamaan linear regresi logistik adalah Y = -11.992 +0.60 X1

Untuk memastikan kebenaran proses ini saya merunning spss dan mendapatkan hasil sama dengan perhitungan excel diatas, yakni output dibawah ini:

Demikian, terima kasih telah berkunjung

Similar Posts

10 Comments

  1. Assalamualaikum pak izin bertanya, apakah ada pembahasan mengenai perhitungan manual uji kesesuaian model, uji serentak dan uji ketepatan klasifikasi untuk regresi logistik?

    1. wa alaikum salam wr wb
      uji serentak itu uji F, uji ketepatan itu t test kan ya?
      harusnya sama saja dengan regresi berganda, yang dicari std error. deviasi, nilai prediksi,. yang beda kan hanya modelnya. dicoba dulu.. nanti silahkan ceritakan pengalamannya

  2. izin bertanya, apakah ada cara manual dengan rumus untuk pencarian nilai koefisien regresinya tanpa menggunakan solver addins??

    1. Untuk saat ini belum ada karena sifat logistik menggunakan kurva sigmoid, bukan linear. Sehingga penentuan best valuenya menggunakan percobaan nilai seperti pada artikel ini.

  3. izin bertanya pak. saya coba aplikasikan rumus ini : Y = -11.992 +0.60 X1 di plotkan pada line graph, hasilnya jadi berupa garis lurus, jadi sama seperti linier regresi

    1. berarti selanjutnya silahkan membaca artikel tentang regresi logistik dalam blog ini. atau ketik kata di google “semua tentang regresi logistik” disana dijelaskan maksud dari persamaan ini. terima kasih

  4. kolom log likelihood ini dijumlahkan untuk data pertama sampai dengan data ke -25 atau semua data yang anda miliki

    Maaf pak saya mau tanya, bagian ini maksudnya bagaimana ya pak? terima kasih

Tinggalkan Balasan ke Agung Batalkan balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *