Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS

Posted on

Regresi logistik merupakan salah satu jenis regresi yang menghubungkan antara satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen yang berupa kategori; biasanya 0 dan 1. Jenis variabel independen berupa kategori inilah yang membedakan regresi logistik dengan regresi berganda atau regresi linear lainnya.

Nilai kategori biasanya tertulis 0 dan 1, saat artikel ini ditulis, kebanyakan peneliti menggunakan regresi logistik untuk  memproses 2 kategori saja. 0 biasanya digunakan untuk kategori “tidak” atau “belum”. Sedangkan angka 1 biasanya digunakan untuk mendeskripsikan responden yang bersesuaian dengan maksud penelitian. Misalnya, pada skripsi yang saya buat tahun 2008 mengisahkan tentang Faktor – Faktor yang mempengaruhi keputusan petani wortel memilih sistem pertanian organik di desa Tugu Selatan, Kecamatan Cisarua, Kabupaten Bogor”

Link skripsi itu adalah:

http://repository.ipb.ac.id/handle/123456789/1293

atau alternatif download lainnya disini

Pada skripsi tersebut menjelaskan variabel dependen yang terdiri dari petani yang tidak atau belum menggunakan sistem pertanian organik (dengan simbol : 0), dan kelompok kedua yakni petani yang sudah menggunakan sistem pertanian organik (dengan simbol : 1).

logo Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS statistik regresi logistik logistic regression binary logistic
terima kasih telah menyimpan blog ini di bookmarks

 

Karena nilai Dependen berupa kategori 0 dan 1, tentunya penjelasan persamaan yang menghubungkan antara variabel independen dan variabel dependen tidak bisa dilakukan secara linear seperti yang dilakukan pada regresi umumnya. Maka penggunaan regresi logistik diperlukan untuk menghitung peluang kecenderungan responden untuk bernilai 0 hingga 1.

Tujuan Menggunakan regresi Logistik

Pemahaman tujuan menggunakan regresi logistik sangat diperlukan sebelum anda menggunakannya sebagai alat penelitian. Anda bisa mendalami dan membahas secara detil jika tujuan penggunaan regresi logistik anda kuasai secara detil. Setelah saya membaca beberapa jurnal yang menggunakan regresi logistik, saya menyimpulkan tujuan penggunaan regresi logistik secara umum ada tiga, yakni

Menghitung peluang

Persamaan yang diperoleh dari proses regresi logistik, dapat digunakan untuk menghitung peluang responden diluar responden yang termasuk dalam penelitian. Contoh yang dapat dipahami adalah proses pengajuan kredit. Pihak bank biasanya melakukan evaluasi kelayakan seseorang layak atau tidak untuk menerima kredit pinjaman dari bank. Beberapa pertanyaan diberikan kepada pihak bank terhadap calon penerima kredit. Pertanyaan yang diberikan seputar karakteristik variabel calon penerima modal tersebut merupakan variabel independen yang akan diinput oleh petugas bank kedalam model. Dari beberapa variabel yang dipertanyakan itulah, petugas bank dapat menentukan peluang calon penerima kredit tersebut untuk bisa mengembalikan pinjaman atau tidak, nilai antara 0 – 1.

Tentunya model yang digunakan oleh petugas bank adalah model regresi logistik berdasarkan data-data peminjam sebelumnya. Dalam model tersebut terdapat komponen bahwa biasanya peminjam yang memiliki pendapatan dibawah sekian dengan pinjaman yang telah dimiliki sebelumnya sekian, ditambah tanggungan kerja sekian, memiliki peluang untuk mengembalikan pinjaman sebesar sekian ( nilai 0 -1).

Melihat karakteristik

Tujuan kedua ini sering digunakan untuk melihat perbedaan karakteristik antara 2 kelompok. Salah satunya adalah skripsi saya yang saya sebutkan diatas. Skripsi tersebut menggambarkan karakteristik petani anorganik dan petani organik. Hasil kesimpulan bahwa peluang petani mampu beralih dari anorganik ke organik adalah karena perbedaan harga produk hasil kedua proses tersebut. Petani organik bersedia beralih dari anorganik ke organik meskipun produktivitas organik lebih kecil dibanding anorganik. Namun, perbedaan harga yang tinggi menjadikan petani organik memiliki pendapatan yang lebih tinggi dibandingkan petani anorganik.

Tujuan melihat karakteristik ini biasanya membahas nilai odds ratio di masing masing variabel independen (nilai odds ratio adalah (exp(koefisien)) masing-masing variabel). Nilai odds ratio menjelaskan peluang responden beralih ke organik (contoh kasus diatas). Penjelasan nilai odds ratio berbeda dari nilai koefisien regresi pada umumnya. Bila koefisien regresi menjelaskan : “ jika variabel X naik 1 satuan, maka nilai Y akan naik sebesar nilai koefisien satuan” maka exp(koefisien) atau odds ratio pada regresi logistik menjelaskan : “ responden yang memiliki variabel x lebih tinggi, maka akan berpeluang untuk memilih organik (contoh kasus diatas) sebesar “exp(nilai koefisien) atau biasa disebut odds ratio” kali dibandingkan responden yang memiliki variabel x lebih rendah”. Iya, nilai exp(koefisien) pada regresi logistik atau disebut sebagai odds ratio menjelaskan peluang, dan tidak menjelaskan berapa yang dimaksud “lebih tinggi” dari variabel X tersebut.

Faktor Yang mempengaruhi

Tujuan ketiga ini merupakan pengembangan dari tujuan kedua, peneliti mampu mengetahui faktor yang mempengaruhi mengapa terdapat perbedaan antara kedua kelompok tersebut. Nilai odds ratio yang tinggi menandakan varaibel tersebut memiliki pengaruh yang tinggi  terhadap pemilihan beda dari responden. Tujuan untuk mengetahui faktor yang mempengaruhi ini adalah diharapkan faktor yang signifikan mempengaruhi tersebut merupakan faktor yang bisa diatur oleh peneliti atau pengambil kebijakan sehingga bisa menggiring responden lainnya untuk berbuat yang sama terhadap responden yang bernilai 1 sebelumnya.

Contoh pada skripsi ini adalah bahwa harga merupakan faktor yang paling berpengaruh terhadap preferensi petani memilih pertanian organik, maka pemerintah jika ingin mengembangkan pertanian organik harus melakukan kebijakan yang tetap menstabilkan harga agar terus berada diatas harga produk anorganik sehingga peminat petani organik akan sebakin banyak dan bisa terus berkembang.

Bagaimana Model Persamaan Regresi Logistik?

Jika regresi linear memiliki persamaan :

Y = a + b1X1 + …. + bnXn, dengan a sebagai konstanta, dan b1 hingga bn adalah koefisien, maka regresi logistik juga akan mengeluarkan output yang sama jika anda menggunakan software minitab atau SPSS. Namun, anda akan keliru jika langsung mengambil persamaan itu untuk menjelaskan atau membahas peluang.

01 Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS statistik regresi logistik logistic regression binary logistic

Nilai koefisen masing masing variabel dari gambar diatas terletak pada kolom B, sedangkan penjelasan nilai odds ratio dari masing masing variabel adalah pada kolom Exp(B). jika anda menggunakan regresi logistik untuk membuat persamaan dan menginterpretasikan peluang pada responden lain, maka pembahasan anda akan berkutat kepada kolom B untuk membuat persamaan, jika anda akan membahas faktor yang mempengaruhi variabel secara parsial, maka anda akan membahas kolom odd ratio atau exp(B)

Persamaan regresi logistik adalah :

06 Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS statistik regresi logistik logistic regression binary logistic

B0  merupakan konstanta, B1 merupakan koefisien masing- masing variabel.

Nilai p atau peluang (Y=1) dapat dicari dengan persamaan :

07 Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS statistik regresi logistik logistic regression binary logistic   Persamaan tersebut dapat anda gunakan untuk menghitung peluang responden yang memiliki nilai variabel yang sudah ditetapkan dalam persamaan, hasil akhir nilai p tentunya akan berkisar antara 0 – 1.

Tahapan Proses Regresi Logistik

Mari kita langsung praktek dengan menggunakan spss 22. Buka spss dan copikan data yang anda miliki. Proses regresi logistik bermula dari klik analyze – regression – binary logistic

02 Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS statistik regresi logistik logistic regression binary logistic

Kemudian isikan nilai kolom dependen dengan variabel Y dan kolom covariate dengan variabel independen. Anda bisa menggunakan bermacam – macam methode untuk mengeliminasi variabel dan memperoleh persamaan yang paling baik untuk menginterpretasikan penelitian anda, anda bisa membaca artikel saya tentang cara eliminasi variabel pada regresi. Pada latihan ini, kita pilih methode enter saja. Klik oK

03 Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS statistik regresi logistik logistic regression binary logistic

Interprestasi Output

Interpretasi output spss ini dimulai dengan melihat goodness of fit persamaan model regresi logistik apakah telah memenuhi syarat untuk menginterpretasikan nilai y atau kah belum. Beberapa syarat yang harus diperhatikan dalam goodness of fit regresi logistik adalah :

Omnibus Test dan R Squared

04 Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS statistik regresi logistik logistic regression binary logistic

Nilai signifikan omnibus test harus berada dibawah 0.05 jika anda menggunakan taraf kepercayaan 95%. Omnibus Test dengan jumlah variabel independen sebanyak x menghasilkan nilai signifikansi yang lebih rendah dari 0.05. Hal ini menunjukkan bahwa terdapat pengaruh yang signifikan dari x variabel independen secara simultan mempengaruhi variabel dependen.Kemudian nilai nagelkerke R Square merupakan nilai R squared pada regresi linear. Variabel independen mampu menjelaskan 86 persen variabel dependen yang terlihat dari nilai Square nagelkerke sebesar 0.86. Sedangkan 14 persen lainnya dapat dijelaskan oleh faktor lain diluar variabel independen dalam persamaan hasil regresi logistik.

Hosmer and lemeshow Test

Berbeda dengan omnibus test, nilai hosmer and lemeshow test justru dikatakan baik jika nilai signifikannya > 0.05.

05 Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS statistik regresi logistik logistic regression binary logistic

Nilai Hosmer tersebut lebih besar dibandingkan α = 0.05, artinya terima H0 yakni model regresi logistik mampu menjelaskan data dan tidak terdapat perbedaan antara model dan nilai observasinya. Hal ini menunjukkan bahwa persamaan regresi logistik dapat digunakan untuk menjelaskan hubungan variabel independen dan variabel dependen

Signifikan Tiap Variabel

Ketiga indikator tersebut merupakan goodness of fit apakah model tersebut cukup baik untu menginterpretasikan hubungan variabel independen dan variabel dependen. Jika ada masalah dengan ketiga indikator tersebut, anda bisa melakukan seleksi variabel dengan tehnik backward atau forward seperti yang saya jelaskan di artikel Cara eliminasi variabel pada regresi

Selanjutnya anda harus menilai variabel secara individu mana yang mempengaruhi variabel dependen dengan cara melihat nilai signifikansi masing masing variabel. Variabel dikatakan signifikan mempengaruhi varaiabel dependen jika nilai signifikannya < 0.05.

Interpretasi nilai Odds ratio

Pada gambar pertama diatas terlihat bahwa SPSS menyediakan range peluang atau nilai odds ratio dari batas bawah (lower) hingga batas atas (upper). Artinya bahwa interpretasi setiap variabel bisa dilakukan dengan menambahkan range peluang tersebut. Contohnya: variabel luas ( petani yang memiliki luas sawah lebih luas memiliki peluang untuk bernilai Y = 1 sebesar 3.267 hingga 176.130 kali dibandingkan petani yang memiliki luas lahan lebih sempit.

Gunakan variabel yang signifikan tersebut untuk dibahas secara mendetil dengan menambahkan penjelasan deskripsi, argumen, dan daftar pustaka yang kuat sehingga analisis anda bisa diterima oleh pembaca. Nilai nilai odds rasio inilah inti dari pembahasan anda jika bertujuan untuk melakukan perbedaan karakteristik dua kelompok atau analisis faktor yang mempengaruhi.

Membuat persamaan

Persamaan diperlukan apabila anda selanjutnya ingin membahas atau meramal suatu peluang dimana kondisi – kondisi variabel telah anda peroleh. Contoh simple seperti diatas adalah penentuan layak atau tidak seseorang mendapatkan kredit pinjaman. Atau, bisa juga memprediksi peluang keberhasilan suatu program apabila memiliki kondisi kkondisi yang mirip dengan variabel yang ada di persamaan tersebut.

Cara membuat persamaan sudah saya jelaskan diatas, namun sebagai gambaran saya ilustrasikan sebuah contoh:

Hasil interpretasi nilai logistic regression adalah sebagai berikut:
B0 = -4.2
B1 = 2.3
Variabel independen yang diproses adalah : IP semester 1 mahasiswa dengan variabel dependennya : 0 berarti lulus lebih atau sama dengan 4 tahun, nilai 1 berarti lulus kurang dari 4 tahun.
Jika IP semester 1 seorang mahasiswa adalah 3, maka berapa peluang mahasiswa tersebut untuk lulus kurang dari 4 tahun?

 

Kita tentukan persamaannya yakni :

p = e(B0+B1X) / (1+ e(B0+B1X) )

p = e(-4.2+2.3(3)) / (1+ e(-4.2+2.3(3)))

p = 0.94

Peluang mahasiswa tersebut untuk lulus kurang dari 4 tahun adalah 0.94%. Dengan cara yang sama, mahasiswa yang memiliki IP semester 1 = 2, memiliki peluang lulus kurang dari 4 tahun sebesar 0.59%.

Terima kasih telah berkunjung

Gravatar Image
Menjadi blogger untuk bisa memperluas pengetahuan, belajar, banyak teman serta menjadi sarana penyaluran hobi.

89 thoughts on “Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS

  1. selamat malam pak agung, meminta waktunya sebentar, saya ingin bertanya mengenai skripsi saya, judul yang saya angkat adalah faktor yang mempengaruhi petani melakukan alih fungsi lahan. jikalau variabel dependen nya dibuat kategori 1 melakukan alih fungsi lahan dan 0 tidak melakukan alih fungsi lahan. dengan variabel berupa harga lahan, tingkat pendidikan, umur petani, pengalaman bertani, jumlah tanggungan keluarga, pendapatan, luas lahan, kendala saluran irigaisi dan juga pengetahuan petani terkait konversi lahan. yang mana 2 dari 9 menggunakan variabel dummy. apakah bisa menggunakan regresi logistik? terimakasih banyak pak

  2. selamat malam pak.
    saya mau bertanya, disini saya melakukan penelitian dengan 6 variabel independen yang terdiri dari 3 variabel dengan perhitungan ratio dan 3 variabel menggunakan dummy dan untuk variabel dependen (audit delay) menggunakan jumlah hari atau bukan hitungan dummy. jadi pertanyaan saya disini apakah saya harus menggunkan regresi logistik atau linier berganda? terima kasih pak.

  3. selamat siang pak semoga sehat selalu, saya mau tanya penelitian saya dengan variabel independen (X) 3 variabel skala likert dan variabel dependen (y) sebagai skala kategorik yaitu ya atau tidak. jadi untuk ujinya apa saja yg d perlukan. saya bingung sewaktu input ke spss, yg di input total dari skala likert atau mean-nya? terimakasih

    1. Selamat pagi.. variabel dependennya berupa kategori berarti menggunakan regresi logistik. Untuk variabel likert biasanya yang dimasukkan adalah meannya. Jadi satu variabel terdiri dari beberapa pertanyaan yang digabung. Terima kasih.

  4. siang pak… saya ingin bertanya sebetulnya apa ya pak penyebabnya uji normalitas, uji autokorelasi dan uji heteroskedastisitas tidak perlu diujikan untuk regresi logistik pada variabel dummy ? terimakasih…

  5. MAu nanya soal nilai hosmer lemeshow lebih kecil dari dari nilai sig.
    bagaiman caranya agar nilai nilai hosmer lemeshow lebih besar dari nilai sig.?
    apakah bisa dilanjutkan uji hipotesis apabila nilai hosmer lemeshow lebih kecil dari dari nilai sig. ? mohon penjelasan beserta dengan teori pendukungnya.
    trima kasih

    1. secara teori silahkan baca buku “applied logistic regression” yang ditulis D.W. Hosmer dan S. Lemeshow.
      secara teknis silahkan cari artikel yang telah saya tulis yang membahas tentang cara meningkatkan r squared. biasanya keduanya hasilnya tidak jauh berbeda. jika satu signifikan maka yang lain juga signifikan. Terima kasih

  6. pak, saya mau tanya, kenapa yaa data saya hasil hosmer and lemeshow test saya selalu bernilai 1.000 padahal saya sudah mengunakan 10 variabel independen dan itu selalu saya coba acak dan kurangi variabelnya. dan sig di variable in the equation selalu bernilai >0.990 apakah mungkin data saya yang jelek atau bagaimana yaa pak? terimakasih banyak sebelumya pak

    1. Klo liat dari ciri cirinya mbk menghadapi masalah complete separation atau overfit. Baca artikel saya tentang complete separation. Temukan variabel yang menyebabkannya.. terima kasih

  7. Sore, saya mau tanya untuk regresi logistik biner. Jika hasil omnibus lebih tinggi dari 0.05, tapi saat uji wald (variables in the equation) ada satu variabel yang signifikannya 0.04 itu bagaimana ya? Uji hosmer sudah diatas 0.05. Apa ada kesalahan? Terima kasih.

    1. Tidak ada kesalahan. Memang bisa seperti itu. Uji wald menjelaskan tentang masing masing variabel signifikan atau tidak dengan variabel dependen. Tapi semua itu percuma jika model tidak signifikan secara keseluruhan dari uji omnibus. Jadi harus berurutan ya mbak.. terima kasih

      1. Kalau begitu apa ada yang bisa dilakukan supaya uji omnibus menjadi signifikan selain mengganti atau menambah variabel? Saya sempat baca soal transformasi data, apa itu bisa dilakukan ke salah satu variabel independennya? Terima kasih sebelumnya mas.

        1. Silahkan di explore di blog ini tentang cara meningkatkan r squared, tehnik setrika data, atau eliminasi variabel atau responden. Saya sudah menerangkan semua. Kasus yg dijumpai tidak pernah sama mbk. Tergantung data masing masing. Terima kasih. Oh iya, saya sedang menyusun buku yang sistematis tentang semua regresi ini agar lebih mudah. Semoga akhir bulan ini bisa terbit

  8. siang mas agung, perkenalkan saya sarah. saya ingin bertanya mengenai regresi logistik ini pada spss 24. jika var dependen sy sustainability report. var dependen sy gender,rangkap jabatan,ukuran perusahaan,komite audit. jadi sy melakukan uji regresi dengan:
    1.hosmer&lemeshow
    2.uji overall model fit
    3.uji normalitas
    4.uji multikolonearitas
    5.uji autokorelasi
    6.uji heteroskedastisitas
    7.model summary
    8.omnibus test
    jadi mas seharusnya sy melakukan ke 8 uji tersebut atau ada uji yg tidak perlu dilakukan atau perlu ditambah lagi ya? terimaksihhh

    1. Kenapa semuanya variabel dependen mbk sarah? Tapi saya ngerti kok mksudnya..
      Betul.. demikian ujinya.. u no 3 5 6 tdk diperlukan untuk dummy.
      Tapi jika skala rasio, justru ditambah uji linearitas. Terima kasih

      1. oyah salah maksud saya var dependen sustainability report. var.independen:
        -gender (0=laki2, 1=perempuan)
        -rangkap jabatan(0=ada rangkap dlm perusahaan, 1=tdk ada rangkap)
        -ukuran perusahaan(logaritma dari total aset)
        -komite audit(jml komite audit)
        jika ada bbrp var yg bukan skala rasio spt itu jd bagaimana ya mas tetap no 3 5 6 tdk diperlukan dan ditambah uji linearitas? atau ada perubahan?terimakasih…

          1. ohh begitu berarti maksudnya untuk var gender dan rangkap jabatan 3 5 6 tdk perlu. tp untuk var ukuran pserusahaan dan komite audit semua uji dilakukan termasuk uji yg 3 5 6 ditambah linearitas ya?

  9. Selamat sore pak, skripsi saya menggunakan variabel independen leverage dan menggunakan metode regresi logistik dan disampelnya ada yang nilai DER atau leverage nya 0 apakah tetap dijadikan sampel tidak ada apa-apa pak?
    DER = hutang/modal, lah hutangnya 0 pak

    1. pertanyaannya masih kurang lengkap mbak. yang jadi masalah DER ini skalanya rasio atau ordinal? jika memang skalanya rasio, maka nilai 0 tidak masalah karena memang nilai rasio memiliki nilai 0 mutlak.

  10. Pak, saya mau tanya dalam penelitian yang akan saya lakukan saya ingin melihat faktor-faktor yang mempengaruhi petani untuk melakukan alih fungsi lahan dan tidak melakukan alih fungsi lahan, tetapi pada variabel bebasnya semuanya berskala ordinal (skoring: rendah, sedang, tinggi) karena variabel bebasnya itu tingkat penyimpangan sosial yang terjadi pada petani.
    jadi Y1 = Melakukan Alih Fungsi, Y0 = Tidak Melakukan Alih Fungsi Lahan
    X1 = Tingakat Penyimpngan Sosial-Psikologis
    X2 = Tingkat Penyimpangan Sosial-Ekologi
    X3 = TIngkat Penyimpangan Sosial-Ekonomi
    X4 = Tingkat PEnyimpangan Sosial-BUdaya

    Apakah bisa seperti itu pak, apa benar analisis yang bisa saya gunakan analisis regresi logistik ? atau saya harus melakukan beberapa langkah terlebih dahulu sebelum memenuhi analisi tersebut seperti dengan mengubah skala ordinal menjadi interval dengan metode MSI (Methods Successive Interval) ? atau saya harus melakukan analisis lain ?

    1. Karena ini topiknya pertanian saya sedikit tau soal ini. Saran saya mas ttp mencari variabel skala rasio misalnya harga lahan, luas lahan, harga produk pertanian. Karena pengalaman saya klo kita tidak menggaet variabel dominan, sulit menyimpulkan hasilnya.

      Saya tidak mengecilkan peran psikologis ataupun ekologi dan budaya, tapi mmg seperti itulah kondisinya. Terima kasih

        1. Kira kira begitu.. atau variabel yg digunakan hanya faktor kecil terhadap variabel dependennya. Sebenarnya ini jika dipahami dosen tidak masalah r squarednya nanti kecil. Hanya saja terkadang tuntutan dosen harus signifikan.

          Tapi jika benar benar untuk penelitian murni terhadap tingkat psikologis, saya rasa bagus. Hanya perlu dipertajam lagi. Terima kasih

  11. selamat siang pak, maaf ingin bertanya. omnibus test itu termasuk dalam uji kelayakan model atau untuk menguji pengaruh IV terhadap DV secara simultan (bersama-sama)? jika nilai sig omnibus testnya lebih dari 0,05 apakah penelitian masih layak untuk dilanjutkan? terima kasih.

    1. selamat siang mbk. omnibus test termasuk dalam uji kelayakan model. tapi pengertiannya ya menguji pengaruh IV terhadap DV secara bersama – sama. karena memang itulah tujuan untuk mengetahui kebaikmodelan. jika omnibust test lebih dari 0.05 maka penelitian masih layak dilanjutkan dengan kesimpulan bahwa model yang terbentuk tidak signifikan. jangan terpaku dengan hasil yang harus signifikan. yang namanya penelitian, apapun hasilnya ya penelitian tetap harus jalan.
      terima kasih.

  12. Mas kalo di dalam tabel variabel in the equation, nilai sig diatas 0.05 semua (tidak ada variabel yang significant) gimana mas? Tapi semua uji goodness of fit cocok. Makasih

    1. Saya ragu nilai r squared nya pada kasus ini. Tapi klo secara teori artinya semua variabel independen tersebut klo bersama sama dapat mempengaruhi variabel dependen. Namun, jika bergerak secara individu, tidak ada yang signifikan. Artinya tdk ada variabel yanh dominan.

      1. Nilai r squared mampu menjelaskan 100% variabel dependent nya mas, jd dengan kasus seperti ini. Apa penelitian saya masih layak dilanjutkan. Makasih sekali lagi

        1. 100 persen? Rasanya tidak mungkin mas… berarti model yang mas temukan mengalami over fit. Adjusted r squared dan predicted r squarednya berapa mas?

  13. bagaimana mas kalo variabel independen rasio (hanya 1 variabel) dan variabel independen saya nominal. uji apa saja yaang harus saya buat ?

  14. maaf sebelumnya, yang ingin saya tanyakan jika dari regresi logistik ini yang ingin dijadikan output adalah persamaan dari regresi, kemudian ditemukan bahwa konstanta bernilai negatif, itu artinya apa ya? dan bagaimana menginterpretasikan tiap variabel (yang bernilai positif/negatif) jika konstanta nya bernilai negatif? terimakasih

    1. Untuk koefisien di dalam persamaan menunjukkan nilai odds ratio. Koefisien pada regresi logistik bernilai negatif, biasanya odds rationya akan bernilai kurang dari 1. Apa artinya nilai antara 0 – 0.9 jika bicara peluang?

      Artinya peluang itu kecil sekali sebanyak apapun variabel trsebut bertambah.
      Topik ini menarik u saya tulis lbh detil. Terima kasih

      1. Jadi, jika nilai konstanta (bukan koefisien tiap variabel penelitian) yang (mungkin) sy ketahui sebagai nilai yang mewakili besarnya pengaruh dari variabel di luar penelitian (yang tidak dipertimbangkan sebagai variabel penelitian), jika bernilai negatif maka itu berarti variabel di luar penelitian tersebut memiliki peluang yang kecil bagi y=1 ya mas?

        1. Sy dibawah keliru membaca koefisien dan konstanta. Tapi jwbnnya ga salah. Koefisien dan konstanta, dua duanya ada nilai odsnya mbk. Iya…begitu cara interpretasinya.

          Atau… bila semua nilai x =0 maka peluang y bernilai 1, akan kecil. Antara 0 sampai 1

          1. itu kalimatnya kepotong ya mas..
            baik, dari jawaban mas juga sy sudah paham, terimakasih atas waktu dan jawabannya

  15. maaf mas sy ingin bertanya, jika yang ingin saya hasilkan adalah bentuk persamaan dari regresi logistik dan menghasilkan nilai konstanta yang bernilai negatif, itu artinya apa ya? dan apakah saat menginterpretasikan tiap variabel (yang bernilai positif/negatif) akan berbeda maknanya dengan hasil persamaan yang memiliki nilai konstanta positif?

  16. maaf sebelumnya, saya ingin bertanya jika otput dari regresi logistik telah keluar, tabel yang seharusnya dimasukkan dalam hasil skripsi tabel yang mana ya? juga untuk hasilnya dapat dilihat dari mana? mohon responnya

    1. Saya sarankan mbk melihat skripsi skripsi sebelumnya di perpustakaan jika hanya untuk mencari format tabel. Hasilnya dapat dilihat dimana?
      Jika mbk menggunakan minitab biasanya ada area diatas data yang khusus untuk output.
      Jika menggunakan spss bisanya sheet terpisah. Mbk bisa temukan di windows-output.

      Terima kasih

  17. Halo mas mau tanya, apa varisbel independent dalam regresi logistik harus data dikotomi 0-1 juga?
    Bagaimana jika datanyanya berskala nominal.

  18. Maaf pak mau bertanya, saya mempunyai variabel independen sebanyak (X1,X2,X3,X4) dengan variabel dependen (Y0 Keputusan tidak bekerja, Y1 Keputusan untuk bekerja). Setelah di analisis, menghasilkan karakteristik sebagai berikut :
    1. X1 beperngaruh signifikan dan mempunya hubungan positif terhadap Y
    2. X2 berpengaruh tidak signifikan dan mempunyai hubungan positif terhadap Y
    3. X3 berpengaruh signifikan dan mempunyai hubunfan negatif terhadap Y
    4. X4 berpengaruh tidak signifikan dan mempunya hubungan positif terhadap Y
    Yang ingin saya tanyakan, bagaimanakan baiknya untuk meng intreprestasikan untuk variabel yang signifikan namun mempunyai hubungan negatif dan untuk variabel yang tidak signifikan namun mempunyai hubungan positif

    1. selamat siang mbk april. jika yang mbak maksud adalah regresi logistik, maka sebenarnya pembacaan hasil regresi logistik hanya terletak pada nilai odd rasionya saja, tidak lagi membaca positif atau negatif. berbeda dengan regresi berganda yang melihat positif/negativ koefisiennya sebagai arah hubungan.
      pada regresi logistik, berbeda. semua negatif positif itu sudah ada di dalam nilai odds ratio. biasanya jika koefisiennya negatif, maka peluang (odds rationya) akan dibawah 1. artinya peluangnya sedikit sekali, jika kurang dari 1 justru bukannya memang tidak berpeluang ya?
      jika koefisiennya positif, biasanya nilai odds rationya diatas 1.

      jadi, jika sudah bahas odds ratio, jgn membahas hubungan positif dan negatif lagi, karena kita sudah membahas peluang.
      oh ya, bagaimana cara menginterpretasikannya? deskripsikan dan perhatikan lagi dengan seksama data mentahnya.. pasti akan ketemu jawabnya mengapa demikkian… terima kasih

  19. Hallo mas, maaf jika mengganggu, mau nanya kalo dalam pengujian regresi logistik, saya pernah membaca buku setelah didapatkan hasil variabel in the equationnya, yg variabel signifikan diuji kembali utk melihat sbrapa besar pengaruhnya terhadap y, intinya terjadi pengujian dua kali, yg pertama menguji semua variabel x terhadap y, yg kedua pengujian variabel x yg signifikan saja terhadap y. Mohon pencerahannya utk literatur dlm skripsi atau jurnal yg menjelaskan pengujian dua kali ini. Terimakasih.

    1. Hallo mas, pengujian kedua kali menurut saya tidak perlu dilakukan. karena dalam regresi, semakin banyak variabel justru modelnya akan semakin bagus. variabel yang valid dalam kumpulan variabel justru akan lebih kuat dibandingkan hanya sebuah regresi sederhana, karena terdapat interaksi ke semua variabel dalam variabel berganda atau logistik. hal berbeda jika regresi sederhana, hanya menghitung pengaruh langsung kepada nilai Y. padahal, dalam kesinambungan variabel yang kompleks (dunia nyata) nilai Y pasti banyak dipengaruhi faktor lain.
      untuk melihat seberapa besar pengaruh dalam regresi berganda atau regresi logistik, cukup melihat uji T yang menerangkan satu persatu koefisien dan variabel dalam model, tidak perlu menguji dalam regresi sederhana. terima kasih

    1. selamat pagi adelia,
      odds ratio biasanya juga ditulis sebagai exp(b). artinya koefisien hasil eviews di olah lagi dengan cara e pangkat koefisiennya. kemudian cara menginterpretasinya sama dengan menginterpretasikan odds ratio. terima kasih

    1. karena variabel independennya berupa kategorik 0 dan 1, sehingga konstanta yang dihasilkan pada regresi logistik harus dikonversi dalam bentuk peluang. itulah mengapa digunakan odds ratio.

  20. maaf pak saya ingi bertanya
    saat kita menggunakan analisis regresi logistik di penelitian skripsi,yang saya mau tanyakan apakahh uji asumsi klasik nya kita uji semua,seperti uji multikolinearitas,uji heteroskedastisitas,uji auotokorelasi,dan uji normalitas???atau hanya satu uji saja.mohon di jawab pak.terimakasih

  21. Maaf mas mau tanya, saya melakukan penelitian dengan 4 variabel independen misalkan A,B,C,D. Nah waktu saya lakukan uji coba multikol ternyata variabel A, dan C terkena multikol, sementara saya menghiraukan dulu data yang terkena multikol saya lanjutnya dengan melakukan analisis logit, dan terjadi permasalahan dimana variabel yang berpengaruh itu ternyata A dan C. Nah saya bertanya kepada teman saya bagaimana solusinya dan dijawab coba dilakukan analisis satu per satu jadi misal di lakukan dulu analisis pada variabel A setelah beres B dan seterusnya. Apakah boleh dilakukan hal seperti itu?

    1. mungkin yang dimaksud teman anda adalah regresi dengan step forward di spss. memang langkah tersebut salah satu cara untuk mengetahui model yang paling fit. tapi untuk multikol, paling cepat adalah mengetahui korelasi antar variabel x menggunakan pearson

  22. Pagi pak, jika saya ingin melihat kuat hubungan antara masing-masing variabel independen terhadap variabel dependen bagaimana ya Pak? terimakasih

    1. pengaruh kuat secara bersama sama ditunjukkan dengan r squared. sedangkan pengaruh kuat di satu persatu variabel, ditunjukkan di nilai logit.

  23. malam pak, mau tanya, apabila hasil 2-log dengan 1 variabel IV lebih besar dari chi square berarti tandanya H0 ditolak ya pak? dan omnibus saya signifikannya lebih dari o.o5, yang berarti tidak ada pengaruh signifikan dari IV ke DV. kalau seperti itu apakah cukup hanya untuk dianalisis saja atau gimana pak? terimakasih..

    1. Malam sheila. . Maksud dianalisis aja itu bagaimana ya? Tentu klo data tidak signifikan, bisa melakukan upaya upaya yang diperbolehkan agar tujuan penelitian tercapai.

  24. Persmisi pak agung, saya Adi..
    maaf mau tanya. apakah dalam regresi logit nilai r-square itu penting banget ? pasalnya saya pernah baca di blog ada yang menyebutkan bahwa penelitian sosial yang menggunakan regresi logit jika nilai r-square sudah mendekati 30% berarti sudah baik, mengingat variabel sosial yang banyak sekali. kemudian ada juga yang menyebutkan yang penting adalah pengaruh variabel itu sendiri ke variabel dependen. menurut pak Agung gimana ya pak, saya masih bingung soalnya penelitian saya sudah menggunakan 14 varibale independen tapi nilai r-square cuma 36,9% dan yang tidak signifikan 4 variabel.terima kasih bapak…

    1. Halo mas adi,
      R square itu penting tidak hanya di logistik, melainkan di semua regresi. Karna r squared itu mengindikasikan kebaikmodelan atau goodness of fit dari hasil analisis.
      Mengenai masalah bidang sosial, biasanya yg ditolerir adalah nilai signifikannya, atau p value pervariabel, yg biasanya 5 persen, ditolerir hingga 10 sampai 20 persen u sosial, bukan r squarednya.
      Jadi meskipun semua variabel signifikan tapi r squarednya rendah, ttp model tersebut tdk baik untuk dijadikan model.

      Tapi,..kembali lagi ke pembimbing. Ada sebagian dosen tidak menuntut r squared. Terlebih lagi untuk skripsi, karna tahapan skripsi yang paling utama adalah mahasiswa mengerti proses penelitiannya.

  25. Halo Pak Agung, saya Andre mau bertanya,
    Saya mempunyai data penelitian berupa data populasi customer yang kualitas kreditnya macet dan lancar. Masing masing data customer tersebut mempunyai informasi seperti: income, pekerjaan, usia, area pengajuan, dan banyak lagi (kebanyakan data nominal). Saya ingin menentukan dari sekian banyak prediktor tersebut, prediktor apa saja yang menentukan customer tersebut bagus (kreditnya lancar). Lalu saya ingin membuat model dan skoring untuk prediktor yang berpengaruh tersebut. Jadi misalkan ada customer baru dengan kondisi income sekian, usia sekian, jenis pekerjaan tertentu, maka berapakah skornya. Apakah customer tersebut layak diterima atau ditolak (tergantung skornya dan berapa limit skor agar layak terima/tolak berdasarkan kualitas kreditnya tersebut).
    Kira-kira saya harus menggunakan metode apa yang tepat untuk melakukan penelitian tersebut ya Pak? Terima kasih banyak atas bantuannya ya pak. Mohon penjelasannya.

    1. Halo mas Andre.
      mas bisa menggunakan regresi logistik dengan keterangan variabel Y=0 untuk responden yang memiliki kredit macet, dan Y=1 untuk responden yang kreditnya lancar. nanti model hasil regresi digunakan untuk memperkirakan skor dari customer baru. skor yang dimaksud adalah nilai peluang dari 0 sampai 1 sesuai contoh di artikel ini, semakin besar nilai peluangnya berarti semakin besar peluang responden baru untuk dapat mengembalikan kreditnya. Terima kasih

  26. Siang Pak. Jika variabel dependen berbentuk data continue, sementara 6 dari 8 variabel independen dalam bentuk kategori (1-0), apakah tetap bisa menggunakan regresi logistik? Jika tidak, regresi apa yg harus digunakan?

    1. Selamat siang.. kuncinya ada di variabel dependen. Jika datanya kontinyu, sudah pasti tidak bisa menggunakan regresi logistik. Logistic regression hanya digunakan saat variabel dependennya biner atau kategorik.

      Kasus yang dijabarkan menggunakan regresi berganda. Tapi sepertinya variabel dummy nya terlalu banyak. Dicoba saja dan lihat r squarednya. Silahkan temukan paket variabel independen yang optimal mennghasilkan r squarednya. Silahkan baca artikel lainnya tentang eliminasi variabel atau eliminasi responden untuk mendapat r squared yang baik di blog ini. Gunakan fasilitas search di sebelah kanan jika menggunakan desktop atau dibawah jika versi mobile. Selamat belajar!
      Terima kasih

      1. Terima kasih atas respon cepatnya Pak. Saya sudah coba run dengan regresi berganda, tapi nilai R square kecil sekali, kurang dari 20 persen. Sudah coba eliminasi variabel yg nilai vif >10. Tapi hasil regresi ulang nilai R square tidak jauh berbeda. Masih terlalu kecil. Mengapa bisa seperti itu, dan bagaimana langkah solusinya?

        Satu lagi, jika regresi logistik dengan variabel dependen biner, dan setelah di run, ternyata ada salah 1 variabel yg omitted karena kolinear, sementara variabel tsb sangat penting utk analisa. Adakah langkah olusi yg bisa dilakukan?

        Terima kasih banyak atas perkenan dan jawaban-jawabannya Pak

        1. Sudah baca artikel berikut:
          https://agungbudisantoso.com/2017/03/29/cara-mengeliminasi-variabel-pada-regresi/

          https://agungbudisantoso.com/2017/07/16/cara-mengeliminasi-data-responden/

          Dan
          https://agungbudisantoso.com/2018/04/11/memahami-r-square-secara-konsep/

          Sementara untuk regresi logistic, jika variabel tersebut adalah variabel yang penting, maka cari tau mengapa bisa kolinear.. atau lbh mudah dipahami variabel lain yang dieliminasi dan perhatikan r squarednya. Langkah awal coba running regresi logistik dengan satu variabel independen (variabel yang penting itu), lalu pahami outputnya.

  27. Maaf mas saya ingin bertanya skripsi saya menggunakan regresi logistik dengan spss 22, tetapi apakah bisa menggunakan regresi panel dengan software eviews?

  28. Bila dalam uji interaksi menggunakan regresi logistik tetapi pada output ada 1 variabel yang tidak ada apa peyebabnya dan bagaimana caranya agar bisa tampil dioutput?

    1. saya paham dengan pertanyaan mbak. tapi saya tidak bisa komentar karena informasi yang diberikan sangat sedikit, dan itu bisa beberapa kemungkinan. biasanya spss atau minitab memberikan alasan mengapa variabel tersbeut tidak valid atau tidak dapat diproses. bisa juga karena kekeliruan penginputan. dan saya tidak bisa menduga duga hanya informasi yang mbak berikan.

      terima kasih

    1. Saya juga mengalami hal yang sama. Kalau dalam masalah yang saya hadapi, hal ini dinamakan “dummy variable trap”. singkatnya, jika dalam regresi logistik terdapat independen variabel yang semuanya merupakan kategorikal (Ex: Probabilitas kebangkrutan berdasarkan jenis kelamin, dengan independen variabel pria dan wanita). Maka, secara otomatis SPSS (software yang saya pakai) otomatis menghilangkan variabel tersebut karena terdapat “perfect collinearity”. Solusinya hilangkan konstanta (terdapat opsi ini dalam SPSS) atau hilangkan salah satu variabel independen tersebut. Lebih jelasnya, silahkan googling 🙂

      1. Masukan yang bagus dari mas raka. Betul sekali jika ada masalah multikolinearitas antar variabel, pasti jadi tidak signifikan.
        Bisa dilihat dari nilai VIF klo regresi berganda, atau running correlation terlebih dahulu antar variabel independen. Jika ada hub kuat, maka bisa diduga terdapat multikol. Terima kasih

    1. website repository IPB mungkin lagi ada gangguan,. tunggu saja. nanti klo sudahaktiv, saya coba sediakan alternatif link lainnya.

Leave a Reply

Your email address will not be published. Required fields are marked *