Koefisien di regresi tidak sama dengan ODDS Ratio, menyatakan hubungan searah atau berbalik arah antara variabel independen dan variabel dependen. Jika koefisien bernilai positif, maka hubungan variabel independen dan variabel dependen adalah hubungan searah. Artinya jika terjadi peningkatan nilai X maka akan terjadi peningkatan di Y atau variabel dependennya.
Sebaliknya koefisien negatif menyatakan hubungan berbalik arah. Jika ada peningkatan pada nilai X maka akan terjadi penurunan pada nilai Y. Namun perlu diingat bahwa penjelasan tersebut adalah untuk regresi linear atau regresi berganda. Sedangkan pada regresi logistik, ada tambahan informasi karena pada regresi logistik terdapat ODDS RATIO.
Koefisien Positif dan Nilai Odds Ratio
Bagi anda yang belum mengerti tentang apa itu odds ratio, regresi logistik dan cara menghitungnya, sudah kami jelaskan secara tuntas pada artikel semua tentang regresi logistik.
Pada regresi logistik, selain memperhatikan koefisien, juga memperhatikan nilai odds ratio. Sebagai contoh perhatikan sebuah komentar pembaca berikut ini:
Jadi pembaca merasa kebingungan karena koefisien yang diharapkan tidak terjadi sesuai hipotesis. Harapan variabel umur adalah positif ternyata justru negatif. Begitupun dengan jarak dan tanggungan yang memiliki koefisien yang berbeda dengan harapan atau hipotesis awal.
Ternyata, permasalahan ini diperkuat pada komentar selanjutnya seperti ini:
“baik mas,aku mau tanya lagi untuk intepretasinya, untuk kesediaan masyarakat membayar. yang signifikan ada 4 variabel ini, ini jadi untuk
umur koefisen negatif odds 0,94
tanggungan koe positif odds 2,69
jarak ke taman koe positif ods 5,97
status kepemilikan rumah koe negatif ods 0,06″
Hal yang mau saya bahas dan menjadi contoh disini adalah umur dan status kepemilikan rumah. Umur memiliki koefisien negatif (harapan awal positif). Jadi semakin tinggi umur maka peluang kesediaan membayar taman akan semakin rendah. Pertanyaannya adalah:
Seberapa besar peluang tersebut?
Ternyata jika dibuat kalimat lebih lengkap: semakin tinggi umur seseorang maka kecenderungan membayar 0.94 kali. Perhatikan angka 0.94 yang lebih rendah dari 1. Nilai yang lebih rendah dari 1 merupakan penguatan dari koefisien yang negatif, meskipun sebenarnya peluang tersebut sangat kecil karena hampir mendekati 1.
Begitupun dengan variabel kepemilikan rumah dengan koefisien negatif. Artinya orang yang memiliki rumah sendiri memiliki kecenderungan sebesar odds rasio dibandingkan orang yang menyewa. Angka odds rationya sebesar 0.06.
Mungkin angka 0.06 yang lebih kecil dari 1 ini sedikit menimbulkan permasalahan atau kebingungan dalam interpretasi. Maka akan saya coba balik menjadi bernilai diatas 1 tetapi koefisiennya pun menjadi kebalik (yang tadi negatif menjadi positif).
Perhitungan ODDS Ratio dalam Peluang
Perhatikan contoh peluang yang terjadi sebagai berikut: misalnya dalam sebuah penelitian orang yang menyewa rumah. Dari 15 orang yang ditanya, 5 diantaranya bersedia membayar tiket taman, selebihnya tidak. Kemudian pada group orang yang memiliki rumah, dari 9 orang yang ditanya 7 diantaranya bersedia membayar tiket masuk taman.
Jika dibuat tabel akan seperti berikut:
Ya | Tidak | Odds | |
Sewa | 5 | 10 | 0.5 |
milik | 7 | 2 | 0.72 |
Odds didefinisikan sebagai perbandingan antara jumlah peluang yang diharapkan dengan jumlah yang tidak diharapkan. Sewa memiliki odds 0.5 dan miliki memiliki odds 0.72. sedangkan odds ratio merupakan perbandingan kedua kelompok tersebut.
Jika kelompok sewa menjadi tujuan atau patokan, maka odds ratio sebesar 0.5/0.72 = 0.69. artinya bahwa orang sewa akan memiliki kecenderungan membayar taman 0.69 kali dibanding orang yang memiliki rumah.
Jika kelompok milik menjadi tujuan atau patokan, maka odds ratio sebesar 0.72/0.5 = 1.44. artinya bahwa orang yang memiliki rumah akan memiliki kecenderungan membayar taman 1.44 kali dibanding orang yang sewa.
Perhatikan odds ratio keduanya, 0.69 = 1/1.44 , dan 1.44 = 1/0.69. yang artinya jika kita merubah tujuan atau patokan, maka nilai odds ratio menjadi 1/odds ratio awal.
Jadi, pada contoh awal diatas, jika odds ratio awalnya 0.06 (koefisien negatif) dengan kondisi dummy sewa = 0 dan milik = 1, maka nilai odds ratio untuk sewa = 1 dan milik = 0 adalah 1/0.06 = 16.67 (koefisien positif).
Dengan koefisisen positif tentunya akan lebih mudah menginterpretasikan yakni orang yang sewa memiliki kecenderungan membayar 16.67 kali dibandingkan orang yang memiliki rumah.
Note: hal ini dilakukan pada variabel dummy, bukan variabel continous. Jika anda memiliki banyak waktu, silahkan berexperimen dengan mengubah nilai 0 pada dummy yang sebelumnya terletak pada orang yang sewa diubah menjadi 0 pada orang yang milik rumah. Kemudian nilai 1 pada orang yang memiliki rumah diubah nilai 1 pada orang sewa. Maka nilai odds rationya akan seperti yang sudah diterangkan diatas, karena saya sudah mencobanya.
Koefisien dan odds ratio pada regresi logistik
Dalam pembacaan output koefisien dan odds ratio, perlu dibaca secara keseluruhan. Malahan, saya berkesimpulan bahwa faktor pembacaan inti pada regresi logistik ada pada odds rationya. Jika koefisien bernilai negatif, pasti nilai oddsnya lebih kecil dari 1 karena dalam rumusnya menggunakan exponential.
Nilai odds ratio pada koefisien negatif bisa diubah dengan cara mengubah posisi dummy. Hasilnya koefisien akan positif dengan nilai odds ratio yang baru = 1/odds ratio lama.
untuk lebih jelas, odds ratio saya sajikan dalam bentuk video dibawah ini:
Terima kasih
Maaf mas mau tanya, kalo misal yang koefisiennya negatif itu variabel continuous, cara merubah koefisien variabel tsb menjadi positif gimana ya mas? Terimakasih
Odds rasio tidak diterjemahkan sebagai peluang, mohon untuk diperbaikiartikel ini.
terima kasih atas koreksinya, sudah saya perbaiki..
Kak exponential itu apa ya kak
Eksponensial e pangkat n. Atau jika digambarkan grafik seperti huruf s. Coba googling lagi mbk.
Asslamualaikum wr.wb.
Mau tanya, regresi logistik terbagi dua ada logistik biner dan logistik ordinal, kenapa pada logistik biner dia berskala nominal?
Assalamualaikum wr.wb.
Mau tanya, apakah dalam regresi logistik diharuskan min 50 sampel data?
Jika tidak diharuskan apakh ada teorinya?