Regresi logistik merupakan salah satu jenis regression yang menghubungkan antara satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen yang berupa kategori; biasanya 0 dan 1. Jenis variabel independen berupa kategori inilah yang membedakan regresi logistik dengan regresi berganda atau regresi linear lainnya.
Nilai kategori biasanya tertulis 0 dan 1, saat artikel ini ditulis, kebanyakan peneliti menggunakan regresi logistik untuk memproses 2 kategori saja. 0 biasanya digunakan untuk kategori โtidakโ atau โbelumโ. Sedangkan angka 1 biasanya digunakan untuk mendeskripsikan responden yang bersesuaian dengan maksud penelitian. Misalnya, pada skripsi yang saya buat tahun 2008 mengisahkan tentang Faktor โ Faktor yang mempengaruhi keputusan petani wortel memilih sistem pertanian organik di desa Tugu Selatan, Kecamatan Cisarua, Kabupaten Bogorโ
Link skripsi itu adalah:
http://repository.ipb.ac.id/handle/123456789/1293
atau alternatif download lainnya disini
Pada skripsi tersebut menjelaskan variabel dependen yang terdiri dari petani yang tidak atau belum menggunakan sistem pertanian organik (dengan simbol : 0), dan kelompok kedua yakni petani yang sudah menggunakan sistem pertanian organik (dengan simbol : 1).
Karena nilai Dependen berupa kategori 0 dan 1, tentunya penjelasan persamaan yang menghubungkan antara variabel independen dan variabel dependen tidak bisa dilakukan secara linear seperti yang dilakukan pada regression umumnya. Maka penggunaan regresi logistik diperlukan untuk menghitung peluang kecenderungan responden untuk bernilai 0 hingga 1.
Tujuan Menggunakan regresi Logistik
Pemahaman tujuan menggunakan regresi logistik sangat diperlukan sebelum anda menggunakannya sebagai alat penelitian. Anda bisa mendalami dan membahas secara detil jika tujuan penggunaan regresi logistik anda kuasai secara detil. Setelah saya membaca beberapa jurnal yang menggunakan regresi logistik, saya menyimpulkan tujuan penggunaan regresi logistik secara umum ada tiga, yakni
Menghitung peluang
Persamaan yang diperoleh dari proses regresi logistik, dapat digunakan untuk menghitung peluang responden diluar responden yang termasuk dalam penelitian. Contoh yang dapat dipahami adalah proses pengajuan kredit. Pihak bank biasanya melakukan evaluasi kelayakan seseorang layak atau tidak untuk menerima kredit pinjaman dari bank. Beberapa pertanyaan diberikan kepada pihak bank terhadap calon penerima kredit. Pertanyaan yang diberikan seputar karakteristik variabel calon penerima modal tersebut merupakan variabel independen yang akan diinput oleh petugas bank kedalam model. Dari beberapa variabel yang dipertanyakan itulah, petugas bank dapat menentukan peluang calon penerima kredit tersebut untuk bisa mengembalikan pinjaman atau tidak, nilai antara 0 โ 1.
Tentunya model yang digunakan oleh petugas bank adalah model regresi logistik berdasarkan data-data peminjam sebelumnya. Dalam model tersebut terdapat komponen bahwa biasanya peminjam yang memiliki pendapatan dibawah sekian dengan pinjaman yang telah dimiliki sebelumnya sekian, ditambah tanggungan kerja sekian, memiliki peluang untuk mengembalikan pinjaman sebesar sekian ( nilai 0 -1).
Melihat karakteristik
Tujuan kedua ini sering digunakan untuk melihat perbedaan karakteristik antara 2 kelompok. Salah satunya adalah skripsi saya yang saya sebutkan diatas. Skripsi tersebut menggambarkan karakteristik petani anorganik dan petani organik. Hasil kesimpulan bahwa peluang petani mampu beralih dari anorganik ke organik adalah karena perbedaan harga produk hasil kedua proses tersebut. Petani organik bersedia beralih dari anorganik ke organik meskipun produktivitas organik lebih kecil dibanding anorganik. Namun, perbedaan harga yang tinggi menjadikan petani organik memiliki pendapatan yang lebih tinggi dibandingkan petani anorganik.
Tujuan melihat karakteristik ini biasanya membahas nilai odds ratio di masing masing variabel independen (nilai odds ratio adalah (exp(koefisien)) masing-masing variabel). Nilai odds ratio menjelaskan peluang responden beralih ke organik (contoh kasus diatas). Penjelasan nilai odds ratio berbeda dari nilai koefisien regression pada umumnya. Bila koefisien regresi menjelaskan : โ jika variabel X naik 1 satuan, maka nilai Y akan naik sebesar nilai koefisien satuanโ maka exp(koefisien) atau odds ratio pada regresi logistik menjelaskan : โ responden yang memiliki variabel x lebih tinggi, maka akan berpeluang untuk memilih organik (contoh kasus diatas) sebesar โexp(nilai koefisien) atau biasa disebut odds ratioโ kali dibandingkan responden yang memiliki variabel x lebih rendahโ. Iya, nilai exp(koefisien) pada regresi logistik atau disebut sebagai odds ratio menjelaskan peluang, dan tidak menjelaskan berapa yang dimaksud “lebih tinggi” dari variabel X tersebut.
Faktor Yang mempengaruhi
Tujuan ketiga ini merupakan pengembangan dari tujuan kedua, peneliti mampu mengetahui faktor yang mempengaruhi mengapa terdapat perbedaan antara kedua kelompok tersebut. Nilai odds ratio yang tinggi menandakan varaibel tersebut memiliki pengaruh yang tinggi terhadap pemilihan beda dari responden. Tujuan untuk mengetahui faktor yang mempengaruhi ini adalah diharapkan faktor yang signifikan mempengaruhi tersebut merupakan faktor yang bisa diatur oleh peneliti atau pengambil kebijakan sehingga bisa menggiring responden lainnya untuk berbuat yang sama terhadap responden yang bernilai 1 sebelumnya.
Contoh pada skripsi ini adalah bahwa harga merupakan faktor yang paling berpengaruh terhadap preferensi petani memilih pertanian organik, maka pemerintah jika ingin mengembangkan pertanian organik harus melakukan kebijakan yang tetap menstabilkan harga agar terus berada diatas harga produk anorganik sehingga peminat petani organik akan sebakin banyak dan bisa terus berkembang.
Bagaimana Model Persamaan Regresi Logistik?
Jika regresi linear memiliki persamaan :
Y = a + b1X1 + โฆ. + bnXn, dengan a sebagai konstanta, dan b1 hingga bn adalah koefisien, maka regresi logistik juga akan mengeluarkan output yang sama jika anda menggunakan software minitab atau SPSS. Namun, anda akan keliru jika langsung mengambil persamaan itu untuk menjelaskan atau membahas peluang.
Nilai koefisen masing masing variabel dari gambar diatas terletak pada kolom B, sedangkan penjelasan nilai odds ratio dari masing masing variabel adalah pada kolom Exp(B). jika anda menggunakan regresi logistik untuk membuat persamaan dan menginterpretasikan peluang pada responden lain, maka pembahasan anda akan berkutat kepada kolom B untuk membuat persamaan, jika anda akan membahas faktor yang mempengaruhi variabel secara parsial, maka anda akan membahas kolom odd ratio atau exp(B)
Persamaan regresi logistik adalah :
B0 merupakan konstanta, B1 merupakan koefisien masing- masing variabel.
Nilai p atau peluang (Y=1) dapat dicari dengan persamaan :
Persamaan tersebut dapat anda gunakan untuk menghitung peluang responden yang memiliki nilai variabel yang sudah ditetapkan dalam persamaan, hasil akhir nilai p tentunya akan berkisar antara 0 โ 1.
Tahapan Proses Regresi Logistik
Mari kita langsung praktek dengan menggunakan spss 22. Buka spss dan copikan data yang anda miliki. Proses regresi logistik bermula dari klik analyze โ regression โ binary logistic
Kemudian isikan nilai kolom dependen dengan variabel Y dan kolom covariate dengan variabel independen. Anda bisa menggunakan bermacam โ macam methode untuk mengeliminasi variabel dan memperoleh persamaan yang paling baik untuk menginterpretasikan penelitian anda, anda bisa membaca artikel saya tentang cara eliminasi variabel pada regresi. Pada latihan ini, kita pilih methode enter saja. Klik oK
Interprestasi Output
Interpretasi output spss ini dimulai dengan melihat goodness of fit persamaan model regresi logistik apakah telah memenuhi syarat untuk menginterpretasikan nilai y atau kah belum. Beberapa syarat yang harus diperhatikan dalam goodness of fit regresi logistik adalah :
Omnibus Test dan R Squared
Nilai signifikan omnibus test harus berada dibawah 0.05 jika anda menggunakan taraf kepercayaan 95%. Omnibus Test dengan jumlah variabel independen sebanyak x menghasilkan nilai signifikansi yang lebih rendah dari 0.05. Hal ini menunjukkan bahwa terdapat pengaruh yang signifikan dari x variabel independen secara simultan mempengaruhi variabel dependen.Kemudian nilai nagelkerke R Square merupakan nilai R squared pada regresi linear. Variabel independen mampu menjelaskan 86 persen variabel dependen yang terlihat dari nilai Square nagelkerke sebesar 0.86. Sedangkan 14 persen lainnya dapat dijelaskan oleh faktor lain diluar variabel independen dalam persamaan hasil regresi logistik.
Hosmer and lemeshow Test
Berbeda dengan omnibus test, nilai hosmer and lemeshow test justru dikatakan baik jika nilai signifikannya > 0.05.
Nilai Hosmer tersebut lebih besar dibandingkan ฮฑ = 0.05, artinya terima H0 yakni model regresi logistik mampu menjelaskan data dan tidak terdapat perbedaan antara model dan nilai observasinya. Hal ini menunjukkan bahwa persamaan regresi logistik dapat digunakan untuk menjelaskan hubungan variabel independen dan variabel dependen
Signifikan Tiap Variabel
Ketiga indikator tersebut merupakan goodness of fit apakah model tersebut cukup baik untu menginterpretasikan hubungan variabel independen dan variabel dependen. Jika ada masalah dengan ketiga indikator tersebut, anda bisa melakukan seleksi variabel dengan tehnik backward atau forward seperti yang saya jelaskan di artikel Cara eliminasi variabel pada regresi
Selanjutnya anda harus menilai variabel secara individu mana yang mempengaruhi variabel dependen dengan cara melihat nilai signifikansi masing masing variabel. Variabel dikatakan signifikan mempengaruhi varaiabel dependen jika nilai signifikannya < 0.05.
Interpretasi nilai Odds ratio
Pada gambar pertama diatas terlihat bahwa SPSS menyediakan range peluang atau nilai odds ratio dari batas bawah (lower) hingga batas atas (upper). Artinya bahwa interpretasi setiap variabel bisa dilakukan dengan menambahkan range peluang tersebut. Contohnya: variabel luas ( petani yang memiliki luas sawah lebih luas memiliki peluang untuk bernilai Y = 1 sebesar 3.267 hingga 176.130 kali dibandingkan petani yang memiliki luas lahan lebih sempit.
Gunakan variabel yang signifikan tersebut untuk dibahas secara mendetil dengan menambahkan penjelasan deskripsi, argumen, dan daftar pustaka yang kuat sehingga analisis anda bisa diterima oleh pembaca. Nilai nilai odds rasio inilah inti dari pembahasan anda jika bertujuan untuk melakukan perbedaan karakteristik dua kelompok atau analisis faktor yang mempengaruhi.
Membuat persamaan
Persamaan diperlukan apabila anda selanjutnya ingin membahas atau meramal suatu peluang dimana kondisi โ kondisi variabel telah anda peroleh. Contoh simple seperti diatas adalah penentuan layak atau tidak seseorang mendapatkan kredit pinjaman. Atau, bisa juga memprediksi peluang keberhasilan suatu program apabila memiliki kondisi kkondisi yang mirip dengan variabel yang ada di persamaan tersebut.
Cara membuat persamaan sudah saya jelaskan diatas, namun sebagai gambaran saya ilustrasikan sebuah contoh:
Hasil interpretasi nilai logistic regression adalah sebagai berikut:
B0 = -4.2
B1 = 2.3
Variabel independen yang diproses adalah : IP semester 1 mahasiswa dengan variabel dependennya : 0 berarti lulus lebih atau sama dengan 4 tahun, nilai 1 berarti lulus kurang dari 4 tahun.
Jika IP semester 1 seorang mahasiswa adalah 3, maka berapa peluang mahasiswa tersebut untuk lulus kurang dari 4 tahun?
Kita tentukan persamaannya yakni :
p = e(B0+B1X) / (1+ e(B0+B1X) )
p = e(-4.2+2.3(3)) / (1+ e(-4.2+2.3(3)))
p = 0.94
Peluang mahasiswa tersebut untuk lulus kurang dari 4 tahun adalah 0.94%. Dengan cara yang sama, mahasiswa yang memiliki IP semester 1 = 2, memiliki peluang lulus kurang dari 4 tahun sebesar 0.59%.
Terima kasih telah berkunjung
Tinggalkan Balasan