Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS

Posted on

Regresi logistik merupakan salah satu jenis regresi yang menghubungkan antara satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen yang berupa kategori; biasanya 0 dan 1. Jenis variabel independen berupa kategori inilah yang membedakan regresi logistik dengan regresi berganda atau regresi linear lainnya.

Nilai kategori biasanya tertulis 0 dan 1, saat artikel ini ditulis, kebanyakan peneliti menggunakan regresi logistik untuk  memproses 2 kategori saja. 0 biasanya digunakan untuk kategori “tidak” atau “belum”. Sedangkan angka 1 biasanya digunakan untuk mendeskripsikan responden yang bersesuaian dengan maksud penelitian. Misalnya, pada skripsi yang saya buat tahun 2008 mengisahkan tentang Faktor – Faktor yang mempengaruhi keputusan petani wortel memilih sistem pertanian organik di desa Tugu Selatan, Kecamatan Cisarua, Kabupaten Bogor”

Link skripsi itu adalah:

http://repository.ipb.ac.id/handle/123456789/1293

atau alternatif download lainnya disini

Pada skripsi tersebut menjelaskan variabel dependen yang terdiri dari petani yang tidak atau belum menggunakan sistem pertanian organik (dengan simbol : 0), dan kelompok kedua yakni petani yang sudah menggunakan sistem pertanian organik (dengan simbol : 1).

agungbudisantoso.com
terima kasih telah menyimpan blog ini di bookmarks

 

Karena nilai Dependen berupa kategori 0 dan 1, tentunya penjelasan persamaan yang menghubungkan antara variabel independen dan variabel dependen tidak bisa dilakukan secara linear seperti yang dilakukan pada regresi umumnya. Maka penggunaan regresi logistik diperlukan untuk menghitung peluang kecenderungan responden untuk bernilai 0 hingga 1.

Tujuan Menggunakan regresi Logistik

Pemahaman tujuan menggunakan regresi logistik sangat diperlukan sebelum anda menggunakannya sebagai alat penelitian. Anda bisa mendalami dan membahas secara detil jika tujuan penggunaan regresi logistik anda kuasai secara detil. Setelah saya membaca beberapa jurnal yang menggunakan regresi logistik, saya menyimpulkan tujuan penggunaan regresi logistik secara umum ada tiga, yakni

Menghitung peluang

Persamaan yang diperoleh dari proses regresi logistik, dapat digunakan untuk menghitung peluang responden diluar responden yang termasuk dalam penelitian. Contoh yang dapat dipahami adalah proses pengajuan kredit. Pihak bank biasanya melakukan evaluasi kelayakan seseorang layak atau tidak untuk menerima kredit pinjaman dari bank. Beberapa pertanyaan diberikan kepada pihak bank terhadap calon penerima kredit. Pertanyaan yang diberikan seputar karakteristik variabel calon penerima modal tersebut merupakan variabel independen yang akan diinput oleh petugas bank kedalam model. Dari beberapa variabel yang dipertanyakan itulah, petugas bank dapat menentukan peluang calon penerima kredit tersebut untuk bisa mengembalikan pinjaman atau tidak, nilai antara 0 – 1.

Tentunya model yang digunakan oleh petugas bank adalah model regresi logistik berdasarkan data-data peminjam sebelumnya. Dalam model tersebut terdapat komponen bahwa biasanya peminjam yang memiliki pendapatan dibawah sekian dengan pinjaman yang telah dimiliki sebelumnya sekian, ditambah tanggungan kerja sekian, memiliki peluang untuk mengembalikan pinjaman sebesar sekian ( nilai 0 -1).

Melihat karakteristik

Tujuan kedua ini sering digunakan untuk melihat perbedaan karakteristik antara 2 kelompok. Salah satunya adalah skripsi saya yang saya sebutkan diatas. Skripsi tersebut menggambarkan karakteristik petani anorganik dan petani organik. Hasil kesimpulan bahwa peluang petani mampu beralih dari anorganik ke organik adalah karena perbedaan harga produk hasil kedua proses tersebut. Petani organik bersedia beralih dari anorganik ke organik meskipun produktivitas organik lebih kecil dibanding anorganik. Namun, perbedaan harga yang tinggi menjadikan petani organik memiliki pendapatan yang lebih tinggi dibandingkan petani anorganik.

Tujuan melihat karakteristik ini biasanya membahas nilai odds ratio di masing masing variabel independen (nilai odds ratio adalah (exp(koefisien)) masing-masing variabel). Nilai odds ratio menjelaskan peluang responden beralih ke organik (contoh kasus diatas). Penjelasan nilai odds ratio berbeda dari nilai koefisien regresi pada umumnya. Bila koefisien regresi menjelaskan : “ jika variabel X naik 1 satuan, maka nilai Y akan naik sebesar nilai koefisien satuan” maka exp(koefisien) atau odds ratio pada regresi logistik menjelaskan : “ responden yang memiliki variabel x lebih tinggi, maka akan berpeluang untuk memilih organik (contoh kasus diatas) sebesar “exp(nilai koefisien) atau biasa disebut odds ratio” kali dibandingkan responden yang memiliki variabel x lebih rendah”. Iya, nilai exp(koefisien) pada regresi logistik atau disebut sebagai odds ratio menjelaskan peluang, dan tidak menjelaskan berapa yang dimaksud “lebih tinggi” dari variabel X tersebut.

Faktor Yang mempengaruhi

Tujuan ketiga ini merupakan pengembangan dari tujuan kedua, peneliti mampu mengetahui faktor yang mempengaruhi mengapa terdapat perbedaan antara kedua kelompok tersebut. Nilai odds ratio yang tinggi menandakan varaibel tersebut memiliki pengaruh yang tinggi  terhadap pemilihan beda dari responden. Tujuan untuk mengetahui faktor yang mempengaruhi ini adalah diharapkan faktor yang signifikan mempengaruhi tersebut merupakan faktor yang bisa diatur oleh peneliti atau pengambil kebijakan sehingga bisa menggiring responden lainnya untuk berbuat yang sama terhadap responden yang bernilai 1 sebelumnya.

Contoh pada skripsi ini adalah bahwa harga merupakan faktor yang paling berpengaruh terhadap preferensi petani memilih pertanian organik, maka pemerintah jika ingin mengembangkan pertanian organik harus melakukan kebijakan yang tetap menstabilkan harga agar terus berada diatas harga produk anorganik sehingga peminat petani organik akan sebakin banyak dan bisa terus berkembang.

Bagaimana Model Persamaan Regresi Logistik?

Jika regresi linear memiliki persamaan :

Y = a + b1X1 + …. + bnXn, dengan a sebagai konstanta, dan b1 hingga bn adalah koefisien, maka regresi logistik juga akan mengeluarkan output yang sama jika anda menggunakan software minitab atau SPSS. Namun, anda akan keliru jika langsung mengambil persamaan itu untuk menjelaskan atau membahas peluang.

regresi lgistik 01

Nilai koefisen masing masing variabel dari gambar diatas terletak pada kolom B, sedangkan penjelasan nilai odds ratio dari masing masing variabel adalah pada kolom Exp(B). jika anda menggunakan regresi logistik untuk membuat persamaan dan menginterpretasikan peluang pada responden lain, maka pembahasan anda akan berkutat kepada kolom B untuk membuat persamaan, jika anda akan membahas faktor yang mempengaruhi variabel secara parsial, maka anda akan membahas kolom odd ratio atau exp(B)

Persamaan regresi logistik adalah :

persamaan regresi logistik

B0  merupakan konstanta, B1 merupakan koefisien masing- masing variabel.

Nilai p atau peluang (Y=1) dapat dicari dengan persamaan :

Persamaan tersebut dapat anda gunakan untuk menghitung peluang responden yang memiliki nilai variabel yang sudah ditetapkan dalam persamaan, hasil akhir nilai p tentunya akan berkisar antara 0 – 1.

Tahapan Proses Regresi Logistik

Mari kita langsung praktek dengan menggunakan spss 22. Buka spss dan copikan data yang anda miliki. Proses regresi logistik bermula dari klik analyze – regression – binary logistic

regresi logistik 02

Kemudian isikan nilai kolom dependen dengan variabel Y dan kolom covariate dengan variabel independen. Anda bisa menggunakan bermacam – macam methode untuk mengeliminasi variabel dan memperoleh persamaan yang paling baik untuk menginterpretasikan penelitian anda, anda bisa membaca artikel saya tentang cara eliminasi variabel pada regresi. Pada latihan ini, kita pilih methode enter saja. Klik oK

regresi logistik 03

Interprestasi Output

Interpretasi output spss ini dimulai dengan melihat goodness of fit persamaan model regresi logistik apakah telah memenuhi syarat untuk menginterpretasikan nilai y atau kah belum. Beberapa syarat yang harus diperhatikan dalam goodness of fit regresi logistik adalah :

Omnibus Test dan R Squared

regresi logistik 04

Nilai signifikan omnibus test harus berada dibawah 0.05 jika anda menggunakan taraf kepercayaan 95%. Omnibus Test dengan jumlah variabel independen sebanyak x menghasilkan nilai signifikansi yang lebih rendah dari 0.05. Hal ini menunjukkan bahwa terdapat pengaruh yang signifikan dari x variabel independen secara simultan mempengaruhi variabel dependen.Kemudian nilai nagelkerke R Square merupakan nilai R squared pada regresi linear. Variabel independen mampu menjelaskan 86 persen variabel dependen yang terlihat dari nilai Square nagelkerke sebesar 0.86. Sedangkan 14 persen lainnya dapat dijelaskan oleh faktor lain diluar variabel independen dalam persamaan hasil regresi logistik.

Hosmer and lemeshow Test

Berbeda dengan omnibus test, nilai hosmer and lemeshow test justru dikatakan baik jika nilai signifikannya > 0.05.

logistic regression

Nilai Hosmer tersebut lebih besar dibandingkan α = 0.05, artinya terima H0 yakni model regresi logistik mampu menjelaskan data dan tidak terdapat perbedaan antara model dan nilai observasinya. Hal ini menunjukkan bahwa persamaan regresi logistik dapat digunakan untuk menjelaskan hubungan variabel independen dan variabel dependen

Signifikan Tiap Variabel

Ketiga indikator tersebut merupakan goodness of fit apakah model tersebut cukup baik untu menginterpretasikan hubungan variabel independen dan variabel dependen. Jika ada masalah dengan ketiga indikator tersebut, anda bisa melakukan seleksi variabel dengan tehnik backward atau forward seperti yang saya jelaskan di artikel Cara eliminasi variabel pada regresi

Selanjutnya anda harus menilai variabel secara individu mana yang mempengaruhi variabel dependen dengan cara melihat nilai signifikansi masing masing variabel. Variabel dikatakan signifikan mempengaruhi varaiabel dependen jika nilai signifikannya < 0.05.

Interpretasi nilai Odds ratio

Pada gambar pertama diatas terlihat bahwa SPSS menyediakan range peluang atau nilai odds ratio dari batas bawah (lower) hingga batas atas (upper). Artinya bahwa interpretasi setiap variabel bisa dilakukan dengan menambahkan range peluang tersebut. Contohnya: variabel luas ( petani yang memiliki luas sawah lebih luas memiliki peluang untuk bernilai Y = 1 sebesar 3.267 hingga 176.130 kali dibandingkan petani yang memiliki luas lahan lebih sempit.

Gunakan variabel yang signifikan tersebut untuk dibahas secara mendetil dengan menambahkan penjelasan deskripsi, argumen, dan daftar pustaka yang kuat sehingga analisis anda bisa diterima oleh pembaca. Nilai nilai odds rasio inilah inti dari pembahasan anda jika bertujuan untuk melakukan perbedaan karakteristik dua kelompok atau analisis faktor yang mempengaruhi.

Membuat persamaan

Persamaan diperlukan apabila anda selanjutnya ingin membahas atau meramal suatu peluang dimana kondisi – kondisi variabel telah anda peroleh. Contoh simple seperti diatas adalah penentuan layak atau tidak seseorang mendapatkan kredit pinjaman. Atau, bisa juga memprediksi peluang keberhasilan suatu program apabila memiliki kondisi kkondisi yang mirip dengan variabel yang ada di persamaan tersebut.

Cara membuat persamaan sudah saya jelaskan diatas, namun sebagai gambaran saya ilustrasikan sebuah contoh:

Hasil interpretasi nilai logistic regression adalah sebagai berikut:
B0 = -4.2
B1 = 2.3
Variabel independen yang diproses adalah : IP semester 1 mahasiswa dengan variabel dependennya : 0 berarti lulus lebih atau sama dengan 4 tahun, nilai 1 berarti lulus kurang dari 4 tahun.
Jika IP semester 1 seorang mahasiswa adalah 3, maka berapa peluang mahasiswa tersebut untuk lulus kurang dari 4 tahun?

 

Kita tentukan persamaannya yakni :

p = e(B0+B1X) / (1+ e(B0+B1X) )

p = e(-4.2+2.3(3)) / (1+ e(-4.2+2.3(3)))

p = 0.94

Peluang mahasiswa tersebut untuk lulus kurang dari 4 tahun adalah 0.94%. Dengan cara yang sama, mahasiswa yang memiliki IP semester 1 = 2, memiliki peluang lulus kurang dari 4 tahun sebesar 0.59%.

Terima kasih telah berkunjung

Gravatar Image
Peneliti bidang sosial ekonomi pertanian. Pernah bekerja di bidang supply chain. Detil info silahkan kunjungi laman about me.

129 thoughts on “Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS

  1. Selamat malam pak , saya melakukan penelitian dengan judul pengaruh audit tenure fee audit, rotasi audit, ukuran perusahaan terhadap kualitas audit dengan opini going concern sebagai proksi pengukuran kualitas audit . setelah saya melakukan analisis dengan spss 23 nilai nagelkerke R Square yang saya dapat 46,5%. yang berarti Variabel independen hanya mampu menjelaskan 46,5 persen variabel dependen . Apakah itu bermasalah pak . Mohon pencerahannya

    1. Selamat malam eka. Mengenai bermasalah atau tidak sebenarnya tergantung apakah variabel independen tersebut secara teori dominan pengaruh atau tidak terhadap variabel dependennya.

      Saya berikan ilustrasi: jika ada penelitian pengaruh luas lahan terhadap produksi padi. Pasti r squarednya tinggi, diatas 80 persen. Itu karna faktor luas memang pengaruh dominan terhadap produksi.

      Tapi jika penelitian tentang pengaruh persepsi organik petani terhadap produksi padi, jangan harap r squarednya diatas 50 persen. Karna persepsi secara teori tidak berpengaruh langsung terhadap produksi dan klo penelitiannya dapat r squared besar justru jadi pertanyaan besar.

      Sama halnya dengan kasus eka. Skr secara logika silahkan direnungkan apakah r squared itu cukup atau tidak. Memang secara teori r squared 45 persen menunjukkan hubungannya lemah atau model tidak cukup bagus.

      Kedua, tergantung dosen eka. Klo dosennya sepaham dengan pendapat saya, berarti tidak ada masalah. Jika dosennya menginginkan r squared diatas 80, itu pasti masalah.

      Terima kasih

  2. Assalamualaikum pak. Saya mau bertanya apakah maximum likehood estimation perlu digunakan dlm regresi logistik? Jika iya, apa alasannya pak. Terimakasih

    1. Saya pribadi berpendapat bahwa perhitungan ordinary least square atau juga maksimum likelihood estimation itu hampir mirip dengan nilai r squared.
      Tapi klo mbak mau menggunakannya ya silahkan saja… Terutama jika memiliki model lebih dari satu.
      Saya bukan orang yang menentukan harus dipakai atau tidak.

  3. Assalamualaikum pak. Sy mau bertanya kan judul saya “pengaruh kesulitan keuangan & pergantian manajemen terhadap pergantian auditor” sy menggunakan analisis regresi logistik. Apa2 saja yg diperlukan dlm pengujian datanya pak? Mohon penjelasannya. Trimakasih sebelumnya

    1. Wa alaikum salam. Pengujian data sepertinya sudah dijelaskan dikomentar2 bawah mbk.. tergantung jenis data. Klo dummy dan data rasio akan berbeda ujinya.terima kasih..

  4. Selamat sore pak, saya ada tugas dari dosen pembimbing saya, sebelum melakukan olah data menggunakan spss terlebih dahulu menghitung secara manual menggunakan satu variabel respon dan satu variabel prediktor (regresi logistik). Bagaimana tahapan pengerjaannya ya pak? Mohon bantuannya.. Terimakasih

    1. Wah…ini sebaiknya tanyakan dosen anda mbk.. hehehehe. Minimal minta bukunya. Di bulan puasa seperti ini saya belum ada rencana menulis artikel statistik lagi… Hanya artikel ringan saja. Klo mau menunggu, saya buatkan abis lebaran.

  5. Pagi pak, saya mau bertanya, nilai chi-square dan df di hasil uji hosmer itu maksudnya gimana ya pak? Dan hasilnya itu darimana ya pak? Apakah ada rumusnya? Terima kasih sebelumnya

      1. Saya sebenarnya masih kurang paham mengenai chi-square dan df pak. Pengertian dan maksudnya chi-square dan df dalam penelitian itu apa ya pak? Mohon pencerahannya pak hehe. Terima kasih sebelumnya pak

        1. Chi-square itu adalah sebuah sebaran distribusi, seperti sebaran lainnya semacam distribusi normal, poisson, binomial, dll. Kebayang? Yang bentuknya semacam bukit atau gunung?

          Nilai dari chi-square ini tergantung dari nilai df. Katakanlah df ini disumbu x nya. Jadi nilai df menentukan berapa nilai chi-squarenya.

          Kegunaannya biasanya untuk uji hipotesis, kebanyakan untuk nonparametrik. Ho dan h1. Nilai ho biasanya yang berisi apakah proporsi kedua variabel sama. Atau apakah variabel tersebut saling bebas.

  6. Selamat pagi pak saya mau bertanya. Apakah pada uji regresi logistik itu tidak uji autokorelasi walaupun data penelitian menggunakan data time series? Terima kasih pak

    1. selamat pagi… berbicara tentang time series tentu tidak lepas dari autocorrelation. meskipun regresi logistik tidak mensyaratkan uji autokorelasi, tapi penting mengetahuinya saat menggunakan variabel time series. silahkan cari artikel jurnal yang berjudul “autocorrelation in logistic regression modelling of species’ distributions”. terima kasih

  7. Selamat pagi pak. Saya ingin menanyakan, regresi logistik itu kan tidak perlu uji normalitas, heteros, Dan autokorelasi. Apakah ada Sumber buku yg bisa saya jadi kan referensi pak?

    1. Pertanyaannya saya balik mbak. Adakah mbak jumpai di buku regresi berganda yang menerangkan tentang omnibus test? Jawabannya pasti ga ada karna omnibus dipakai di regresi logistik. Klo ditanya kenapa, ya ga akan ada yang menerangkan omnibus di regresi berganda. Ibarat petani ditanya “kenapa bpk tidak pakai perahu?”

      Regresi logistik membicarakan peluang, sedangkan regresi berganda membicarakan hubungan linear. Keduanya punya aturan yang berbeda.

      1. Selamat pagi pak saya mau bertanya. Apakah pada uji regresi logistik itu tidak uji autokorelasi walaupun data penelitian menggunakan data time series? Terima kasih pak

      1. baik pak terimakasih banyak.. saya ingin tanya lagi, penelitian saya kan mengenai faktor yang mempengaruhi petani melakukan alih fungsi lahan, dan variabel yang memiliki nilai koef 0.00 adalah biaya produksi pertanian dan penerimaan, akan tetapi kedua variabel tersebut signifikan pak. apakah benar pak jikalau koef tersebut hanya dilihat dari tandanya saja, apakah positif atau negatif bukan dari nilai koefisiennya, karena nnti akan dilihat dari nilai odd rationya? terimakasih pak

  8. pak saya mau tanya
    1. kalau saya 1 variabel independen teridiri dari beberapa pertanyaan, untuk regresi logistik apakah perlu digabung dengan mean atau ujinya tetap dalam bentuk satu2 tiap pertanyaan?
    2. saya coba menggabungkan dengan variabel di identitad diri dengan variabel di pertanyaan(pakai model UTAUT) nah itu kenapa ya pak hasilnya p-value mendekati 1 bahkan ada yang satu semua?
    terima kasih

    1. hmmm… pertanyaannya saya masih belum ngerti mbk dinda ayu… mengenai variabel yang terdiri dari bbrp pertanyaan sih boleh saja… artinya kita membuat index menggabungkan bbrp indikator. mean bisa digunakan jika skalanya rasio.
      pertanyaan kedua: artinya model yang dihasilkan tidak bagus dan variabel tidak signifikan mempengaruhi.

    2. Selamat malam pak. Postingannya bagus sekali. Oh iya, saya mau bertany, jika saya menggunakan 2 variabel independen, apakah wajar jika secara simultan variabel saya berpengaruh keduanya terhadap variabel dependen (tabel model summary sig bernilai 0,000), namun jika secara parsial variabel tersebut tidak berpengaruh semua (pada tabel variabel in the equation, kedua variabel tsb punya nilai sig seperti 0,999 dan 0,846)? Bagaimana pak? Apakah wajar bila secar simultan berpengaruh, tetapi secara parsial tidak ada yang berpengaruh. Btw sampel saya jumlahnya 64 (32perusahaanx2tahun). Mohon pencerahannya pak. Terima kasih

      1. selamat pagi mbk cindy.. jawabannya wajar. bisa terjawab jika melihat nilai R squarednya. jika r squarednya besar, kemungkinan terjadi over fit. jika r squarednya kecil, modelnya memang valid, tapi hanya mencakup sekian persen (nilai r squared) dari keseluruhan variabel dependen.sehingga ditingkat parsial tidak ada yang valid.

        kemudian komentar saya tentang datanya, coba dulu dengan 32 perusahaan di tahun yang sama. saya kuatir ada efek random yang terpola akibat menggunakan data time series. terima kasih

  9. Hallo pak,
    Pak saya mau tanya kenapa Kolok sig dari hasil omnibus tests of model coefficients saya ga bernilai “nol” ya pak?
    Dan exp (B) pada variables in the equation juga sangat2 besar angkanya pak?

  10. Hallo pak,
    Pak saya mau tanya kenapa Kolok sig dari hasil omnibus tests of model coefficients saya ga bernilai “nol” ya pak?
    Dan exp (B) pada variables in the equation juga sangat2 besar angkanya pak?

  11. pak saya mau tanya, skripsi saya tentang “faktor-faktor yang mempengaruhi pemahaman mahasiswa tentang akuntansi keuangan menengah” saya menggunakan 6 variabel independen, dan saya menggunakan kuisioner. yang mau saya tanyakan pak itu termasuk analisis regresi linear berganda atau regresi logistik? mohon penjelasannya pak

    1. Tergantung dari jenis variabel y yang dalam hal ini pemahaman mahasiswa mbk…

      Klo variabel tersebut berupa 1 dan 0 atau paham dan tidak, maka pakainya regresi logistik.

      Tapi jika variabelnya skala interval atau rasio, maka menggunakan regresi berganda.

  12. Pak mau tanya saya ada pertanyaan dari dosen pembimbing saya mengapa di reglog 0,1 di ln kan? (Ada dipenelitian jurnal) Mohon bantuannya 🙂

    1. Pada dasarnya, regresi itu mencari hub variabel x terhadap Y secara linier. Jadi jika datanya menyebar terlalu luas atau simpangannya itu besar, misalnya range antara 1 sampai 1000 (contoh ya..), maka akan sulit diketahui persamaannya dengan linier. Dengan transformasi data menggunakan Ln, data yang menyebar itu akan menyusut dengan range yang jauh lebih rapat. Ini akan memudahkan mencari persamaannya.

  13. Siang pak, nama saya Dinda, saya mau bertanya, hasil penelitian saya nilai konstanta negatif,sig konstanta 0, dan odds ratio konstanta juga 0. Ini maksudnya gimana ya pak? Tolong saran dan masukannya pak, terima kasih

    1. siang dinda… untuk regresi logistik, nilai positif negatifnya tidak perlu dilihat lagi di output spss atau minitab. karena konstanta konstanta tersbeut sudah dihitung pada indikator odds ratio. jadi jika odds rationya tinggi berarti peluangnya tinggi. namun biasanya memang yang memiliki konstanta negatif, biasanya odds rationya kecil. terima kasih

      1. Terima kasih banyak pak. Iya saya pake logistik pak, berarti kalau konstanta negatif gpp kan pak? berarti penelitian saya masih bisa dilakukan kan pak?

        1. iya..ga papa..hanya tergantung nanti cara mbk mendeskripsikan hasilnya saja. soal penelitian masih bisa lanjut atau enggak, ini pertanyaan yang lebih luas sebenarnya, tidak bisa hanya melihat karna konstanta negatif atau positif. klo misalnya masih sesuai hipotesis, ya bisa lanjut.
          Terima kasih

          1. Hasilnya sudah lumayan pak, dari 7 variabel independen, 3 berpengaruh positif, uji yang lainnya juga sudah memenuhi syarat, tinggal yang masalah konstanta saja itu pak, kalau menurut bapak, konstanta negatif itu karena apa dan alasan kenapa konstanta negatif tidak berpengaruh di logistik itu karena apa ya pak? Mohon penjelasannya pak, terima kasih banyak

          2. jika y = a +bx, maka nilai a yang kita sebut konstanta kan?

            apa artinya jika dihubungkan dengan regresilogistik? artinya jika semua variabel bernilai 0, maka peluang y untuk bernilai 1 sebesar odds ratio. karena konstantanya negatif artinya kemungkinan itu keciiil sekali. artinya tanpa ada campur tangan variabel2 tersebut, hampir mustahil Y bernilai 1.
            ini pengembangan jawaban mengapa konstanta bisa negatif.

            lalu alasan mengapa konstanta negatif tidak berpengaruh di logistik? sebenarnya bukan tidak berpengaruh mbak. hanya saja… dalam logistik, konstanta tersebut sudah digunakan untuk menghitung odds ratio (peluangnya) ini yang membedakan dengan regresi berganda. klo berganda masih menyatakan arah korelasi karena persamaannya linear. tapi klo logistik, konstanta tersebut langsung dihitung odds rationya. rumusnya ada di atas tuh.. pake eksponen pangkat, artinya klo negatif pasti kecil.

  14. selamat malam pak agung, meminta waktunya sebentar, saya ingin bertanya mengenai skripsi saya, judul yang saya angkat adalah faktor yang mempengaruhi petani melakukan alih fungsi lahan. jikalau variabel dependen nya dibuat kategori 1 melakukan alih fungsi lahan dan 0 tidak melakukan alih fungsi lahan. dengan variabel berupa harga lahan, tingkat pendidikan, umur petani, pengalaman bertani, jumlah tanggungan keluarga, pendapatan, luas lahan, kendala saluran irigaisi dan juga pengetahuan petani terkait konversi lahan. yang mana 2 dari 9 menggunakan variabel dummy. apakah bisa menggunakan regresi logistik? terimakasih banyak pak

  15. selamat malam pak.
    saya mau bertanya, disini saya melakukan penelitian dengan 6 variabel independen yang terdiri dari 3 variabel dengan perhitungan ratio dan 3 variabel menggunakan dummy dan untuk variabel dependen (audit delay) menggunakan jumlah hari atau bukan hitungan dummy. jadi pertanyaan saya disini apakah saya harus menggunkan regresi logistik atau linier berganda? terima kasih pak.

  16. selamat siang pak semoga sehat selalu, saya mau tanya penelitian saya dengan variabel independen (X) 3 variabel skala likert dan variabel dependen (y) sebagai skala kategorik yaitu ya atau tidak. jadi untuk ujinya apa saja yg d perlukan. saya bingung sewaktu input ke spss, yg di input total dari skala likert atau mean-nya? terimakasih

    1. Selamat pagi.. variabel dependennya berupa kategori berarti menggunakan regresi logistik. Untuk variabel likert biasanya yang dimasukkan adalah meannya. Jadi satu variabel terdiri dari beberapa pertanyaan yang digabung. Terima kasih.

  17. siang pak… saya ingin bertanya sebetulnya apa ya pak penyebabnya uji normalitas, uji autokorelasi dan uji heteroskedastisitas tidak perlu diujikan untuk regresi logistik pada variabel dummy ? terimakasih…

  18. MAu nanya soal nilai hosmer lemeshow lebih kecil dari dari nilai sig.
    bagaiman caranya agar nilai nilai hosmer lemeshow lebih besar dari nilai sig.?
    apakah bisa dilanjutkan uji hipotesis apabila nilai hosmer lemeshow lebih kecil dari dari nilai sig. ? mohon penjelasan beserta dengan teori pendukungnya.
    trima kasih

    1. secara teori silahkan baca buku “applied logistic regression” yang ditulis D.W. Hosmer dan S. Lemeshow.
      secara teknis silahkan cari artikel yang telah saya tulis yang membahas tentang cara meningkatkan r squared. biasanya keduanya hasilnya tidak jauh berbeda. jika satu signifikan maka yang lain juga signifikan. Terima kasih

  19. pak, saya mau tanya, kenapa yaa data saya hasil hosmer and lemeshow test saya selalu bernilai 1.000 padahal saya sudah mengunakan 10 variabel independen dan itu selalu saya coba acak dan kurangi variabelnya. dan sig di variable in the equation selalu bernilai >0.990 apakah mungkin data saya yang jelek atau bagaimana yaa pak? terimakasih banyak sebelumya pak

    1. Klo liat dari ciri cirinya mbk menghadapi masalah complete separation atau overfit. Baca artikel saya tentang complete separation. Temukan variabel yang menyebabkannya.. terima kasih

  20. Sore, saya mau tanya untuk regresi logistik biner. Jika hasil omnibus lebih tinggi dari 0.05, tapi saat uji wald (variables in the equation) ada satu variabel yang signifikannya 0.04 itu bagaimana ya? Uji hosmer sudah diatas 0.05. Apa ada kesalahan? Terima kasih.

    1. Tidak ada kesalahan. Memang bisa seperti itu. Uji wald menjelaskan tentang masing masing variabel signifikan atau tidak dengan variabel dependen. Tapi semua itu percuma jika model tidak signifikan secara keseluruhan dari uji omnibus. Jadi harus berurutan ya mbak.. terima kasih

      1. Kalau begitu apa ada yang bisa dilakukan supaya uji omnibus menjadi signifikan selain mengganti atau menambah variabel? Saya sempat baca soal transformasi data, apa itu bisa dilakukan ke salah satu variabel independennya? Terima kasih sebelumnya mas.

        1. Silahkan di explore di blog ini tentang cara meningkatkan r squared, tehnik setrika data, atau eliminasi variabel atau responden. Saya sudah menerangkan semua. Kasus yg dijumpai tidak pernah sama mbk. Tergantung data masing masing. Terima kasih. Oh iya, saya sedang menyusun buku yang sistematis tentang semua regresi ini agar lebih mudah. Semoga akhir bulan ini bisa terbit

  21. siang mas agung, perkenalkan saya sarah. saya ingin bertanya mengenai regresi logistik ini pada spss 24. jika var dependen sy sustainability report. var dependen sy gender,rangkap jabatan,ukuran perusahaan,komite audit. jadi sy melakukan uji regresi dengan:
    1.hosmer&lemeshow
    2.uji overall model fit
    3.uji normalitas
    4.uji multikolonearitas
    5.uji autokorelasi
    6.uji heteroskedastisitas
    7.model summary
    8.omnibus test
    jadi mas seharusnya sy melakukan ke 8 uji tersebut atau ada uji yg tidak perlu dilakukan atau perlu ditambah lagi ya? terimaksihhh

    1. Kenapa semuanya variabel dependen mbk sarah? Tapi saya ngerti kok mksudnya..
      Betul.. demikian ujinya.. u no 3 5 6 tdk diperlukan untuk dummy.
      Tapi jika skala rasio, justru ditambah uji linearitas. Terima kasih

      1. oyah salah maksud saya var dependen sustainability report. var.independen:
        -gender (0=laki2, 1=perempuan)
        -rangkap jabatan(0=ada rangkap dlm perusahaan, 1=tdk ada rangkap)
        -ukuran perusahaan(logaritma dari total aset)
        -komite audit(jml komite audit)
        jika ada bbrp var yg bukan skala rasio spt itu jd bagaimana ya mas tetap no 3 5 6 tdk diperlukan dan ditambah uji linearitas? atau ada perubahan?terimakasih…

          1. ohh begitu berarti maksudnya untuk var gender dan rangkap jabatan 3 5 6 tdk perlu. tp untuk var ukuran pserusahaan dan komite audit semua uji dilakukan termasuk uji yg 3 5 6 ditambah linearitas ya?

  22. Selamat sore pak, skripsi saya menggunakan variabel independen leverage dan menggunakan metode regresi logistik dan disampelnya ada yang nilai DER atau leverage nya 0 apakah tetap dijadikan sampel tidak ada apa-apa pak?
    DER = hutang/modal, lah hutangnya 0 pak

    1. pertanyaannya masih kurang lengkap mbak. yang jadi masalah DER ini skalanya rasio atau ordinal? jika memang skalanya rasio, maka nilai 0 tidak masalah karena memang nilai rasio memiliki nilai 0 mutlak.

  23. Pak, saya mau tanya dalam penelitian yang akan saya lakukan saya ingin melihat faktor-faktor yang mempengaruhi petani untuk melakukan alih fungsi lahan dan tidak melakukan alih fungsi lahan, tetapi pada variabel bebasnya semuanya berskala ordinal (skoring: rendah, sedang, tinggi) karena variabel bebasnya itu tingkat penyimpangan sosial yang terjadi pada petani.
    jadi Y1 = Melakukan Alih Fungsi, Y0 = Tidak Melakukan Alih Fungsi Lahan
    X1 = Tingakat Penyimpngan Sosial-Psikologis
    X2 = Tingkat Penyimpangan Sosial-Ekologi
    X3 = TIngkat Penyimpangan Sosial-Ekonomi
    X4 = Tingkat PEnyimpangan Sosial-BUdaya

    Apakah bisa seperti itu pak, apa benar analisis yang bisa saya gunakan analisis regresi logistik ? atau saya harus melakukan beberapa langkah terlebih dahulu sebelum memenuhi analisi tersebut seperti dengan mengubah skala ordinal menjadi interval dengan metode MSI (Methods Successive Interval) ? atau saya harus melakukan analisis lain ?

    1. Karena ini topiknya pertanian saya sedikit tau soal ini. Saran saya mas ttp mencari variabel skala rasio misalnya harga lahan, luas lahan, harga produk pertanian. Karena pengalaman saya klo kita tidak menggaet variabel dominan, sulit menyimpulkan hasilnya.

      Saya tidak mengecilkan peran psikologis ataupun ekologi dan budaya, tapi mmg seperti itulah kondisinya. Terima kasih

        1. Kira kira begitu.. atau variabel yg digunakan hanya faktor kecil terhadap variabel dependennya. Sebenarnya ini jika dipahami dosen tidak masalah r squarednya nanti kecil. Hanya saja terkadang tuntutan dosen harus signifikan.

          Tapi jika benar benar untuk penelitian murni terhadap tingkat psikologis, saya rasa bagus. Hanya perlu dipertajam lagi. Terima kasih

  24. selamat siang pak, maaf ingin bertanya. omnibus test itu termasuk dalam uji kelayakan model atau untuk menguji pengaruh IV terhadap DV secara simultan (bersama-sama)? jika nilai sig omnibus testnya lebih dari 0,05 apakah penelitian masih layak untuk dilanjutkan? terima kasih.

    1. selamat siang mbk. omnibus test termasuk dalam uji kelayakan model. tapi pengertiannya ya menguji pengaruh IV terhadap DV secara bersama – sama. karena memang itulah tujuan untuk mengetahui kebaikmodelan. jika omnibust test lebih dari 0.05 maka penelitian masih layak dilanjutkan dengan kesimpulan bahwa model yang terbentuk tidak signifikan. jangan terpaku dengan hasil yang harus signifikan. yang namanya penelitian, apapun hasilnya ya penelitian tetap harus jalan.
      terima kasih.

  25. Mas kalo di dalam tabel variabel in the equation, nilai sig diatas 0.05 semua (tidak ada variabel yang significant) gimana mas? Tapi semua uji goodness of fit cocok. Makasih

    1. Saya ragu nilai r squared nya pada kasus ini. Tapi klo secara teori artinya semua variabel independen tersebut klo bersama sama dapat mempengaruhi variabel dependen. Namun, jika bergerak secara individu, tidak ada yang signifikan. Artinya tdk ada variabel yanh dominan.

      1. Nilai r squared mampu menjelaskan 100% variabel dependent nya mas, jd dengan kasus seperti ini. Apa penelitian saya masih layak dilanjutkan. Makasih sekali lagi

        1. 100 persen? Rasanya tidak mungkin mas… berarti model yang mas temukan mengalami over fit. Adjusted r squared dan predicted r squarednya berapa mas?

  26. bagaimana mas kalo variabel independen rasio (hanya 1 variabel) dan variabel independen saya nominal. uji apa saja yaang harus saya buat ?

  27. maaf sebelumnya, yang ingin saya tanyakan jika dari regresi logistik ini yang ingin dijadikan output adalah persamaan dari regresi, kemudian ditemukan bahwa konstanta bernilai negatif, itu artinya apa ya? dan bagaimana menginterpretasikan tiap variabel (yang bernilai positif/negatif) jika konstanta nya bernilai negatif? terimakasih

    1. Untuk koefisien di dalam persamaan menunjukkan nilai odds ratio. Koefisien pada regresi logistik bernilai negatif, biasanya odds rationya akan bernilai kurang dari 1. Apa artinya nilai antara 0 – 0.9 jika bicara peluang?

      Artinya peluang itu kecil sekali sebanyak apapun variabel trsebut bertambah.
      Topik ini menarik u saya tulis lbh detil. Terima kasih

      1. Jadi, jika nilai konstanta (bukan koefisien tiap variabel penelitian) yang (mungkin) sy ketahui sebagai nilai yang mewakili besarnya pengaruh dari variabel di luar penelitian (yang tidak dipertimbangkan sebagai variabel penelitian), jika bernilai negatif maka itu berarti variabel di luar penelitian tersebut memiliki peluang yang kecil bagi y=1 ya mas?

        1. Sy dibawah keliru membaca koefisien dan konstanta. Tapi jwbnnya ga salah. Koefisien dan konstanta, dua duanya ada nilai odsnya mbk. Iya…begitu cara interpretasinya.

          Atau… bila semua nilai x =0 maka peluang y bernilai 1, akan kecil. Antara 0 sampai 1

          1. itu kalimatnya kepotong ya mas..
            baik, dari jawaban mas juga sy sudah paham, terimakasih atas waktu dan jawabannya

  28. maaf mas sy ingin bertanya, jika yang ingin saya hasilkan adalah bentuk persamaan dari regresi logistik dan menghasilkan nilai konstanta yang bernilai negatif, itu artinya apa ya? dan apakah saat menginterpretasikan tiap variabel (yang bernilai positif/negatif) akan berbeda maknanya dengan hasil persamaan yang memiliki nilai konstanta positif?

  29. maaf sebelumnya, saya ingin bertanya jika otput dari regresi logistik telah keluar, tabel yang seharusnya dimasukkan dalam hasil skripsi tabel yang mana ya? juga untuk hasilnya dapat dilihat dari mana? mohon responnya

    1. Saya sarankan mbk melihat skripsi skripsi sebelumnya di perpustakaan jika hanya untuk mencari format tabel. Hasilnya dapat dilihat dimana?
      Jika mbk menggunakan minitab biasanya ada area diatas data yang khusus untuk output.
      Jika menggunakan spss bisanya sheet terpisah. Mbk bisa temukan di windows-output.

      Terima kasih

  30. Halo mas mau tanya, apa varisbel independent dalam regresi logistik harus data dikotomi 0-1 juga?
    Bagaimana jika datanyanya berskala nominal.

  31. Maaf pak mau bertanya, saya mempunyai variabel independen sebanyak (X1,X2,X3,X4) dengan variabel dependen (Y0 Keputusan tidak bekerja, Y1 Keputusan untuk bekerja). Setelah di analisis, menghasilkan karakteristik sebagai berikut :
    1. X1 beperngaruh signifikan dan mempunya hubungan positif terhadap Y
    2. X2 berpengaruh tidak signifikan dan mempunyai hubungan positif terhadap Y
    3. X3 berpengaruh signifikan dan mempunyai hubunfan negatif terhadap Y
    4. X4 berpengaruh tidak signifikan dan mempunya hubungan positif terhadap Y
    Yang ingin saya tanyakan, bagaimanakan baiknya untuk meng intreprestasikan untuk variabel yang signifikan namun mempunyai hubungan negatif dan untuk variabel yang tidak signifikan namun mempunyai hubungan positif

    1. selamat siang mbk april. jika yang mbak maksud adalah regresi logistik, maka sebenarnya pembacaan hasil regresi logistik hanya terletak pada nilai odd rasionya saja, tidak lagi membaca positif atau negatif. berbeda dengan regresi berganda yang melihat positif/negativ koefisiennya sebagai arah hubungan.
      pada regresi logistik, berbeda. semua negatif positif itu sudah ada di dalam nilai odds ratio. biasanya jika koefisiennya negatif, maka peluang (odds rationya) akan dibawah 1. artinya peluangnya sedikit sekali, jika kurang dari 1 justru bukannya memang tidak berpeluang ya?
      jika koefisiennya positif, biasanya nilai odds rationya diatas 1.

      jadi, jika sudah bahas odds ratio, jgn membahas hubungan positif dan negatif lagi, karena kita sudah membahas peluang.
      oh ya, bagaimana cara menginterpretasikannya? deskripsikan dan perhatikan lagi dengan seksama data mentahnya.. pasti akan ketemu jawabnya mengapa demikkian… terima kasih

  32. Hallo mas, maaf jika mengganggu, mau nanya kalo dalam pengujian regresi logistik, saya pernah membaca buku setelah didapatkan hasil variabel in the equationnya, yg variabel signifikan diuji kembali utk melihat sbrapa besar pengaruhnya terhadap y, intinya terjadi pengujian dua kali, yg pertama menguji semua variabel x terhadap y, yg kedua pengujian variabel x yg signifikan saja terhadap y. Mohon pencerahannya utk literatur dlm skripsi atau jurnal yg menjelaskan pengujian dua kali ini. Terimakasih.

    1. Hallo mas, pengujian kedua kali menurut saya tidak perlu dilakukan. karena dalam regresi, semakin banyak variabel justru modelnya akan semakin bagus. variabel yang valid dalam kumpulan variabel justru akan lebih kuat dibandingkan hanya sebuah regresi sederhana, karena terdapat interaksi ke semua variabel dalam variabel berganda atau logistik. hal berbeda jika regresi sederhana, hanya menghitung pengaruh langsung kepada nilai Y. padahal, dalam kesinambungan variabel yang kompleks (dunia nyata) nilai Y pasti banyak dipengaruhi faktor lain.
      untuk melihat seberapa besar pengaruh dalam regresi berganda atau regresi logistik, cukup melihat uji T yang menerangkan satu persatu koefisien dan variabel dalam model, tidak perlu menguji dalam regresi sederhana. terima kasih

    1. selamat pagi adelia,
      odds ratio biasanya juga ditulis sebagai exp(b). artinya koefisien hasil eviews di olah lagi dengan cara e pangkat koefisiennya. kemudian cara menginterpretasinya sama dengan menginterpretasikan odds ratio. terima kasih

    1. karena variabel independennya berupa kategorik 0 dan 1, sehingga konstanta yang dihasilkan pada regresi logistik harus dikonversi dalam bentuk peluang. itulah mengapa digunakan odds ratio.

      1. Hallo mas Agung, nyambung dengan pertanyaan mawar, apa perbedaan antara probabilitas dan odd? Contohnya ? Terima kasih sebelumnya.

        1. Halo evi.. mawar komen tahun kemarin masih disambung rupanya ya…
          Kita lihat perbedaaanya dari definisinya udah cukup keliatan kok. Klo probabilitas biasanya nilainya antara 0 dan 1. Di regresi logistik biasanya terlihat klo kita mau menghitung nilai Y prediksi.
          Contoh : peluang responden n12 untuk melakukan penawaran harga adalah 80%.

          Odd berbeda. Odd menjelaskan peluang antara selisih nilai x terhadap Y. Misal : peluang wanita (variabel x) dua kali lebih besar dibanding pria dalam hal melakukan penawaran harga (variabel y).

  33. maaf pak saya ingi bertanya
    saat kita menggunakan analisis regresi logistik di penelitian skripsi,yang saya mau tanyakan apakahh uji asumsi klasik nya kita uji semua,seperti uji multikolinearitas,uji heteroskedastisitas,uji auotokorelasi,dan uji normalitas???atau hanya satu uji saja.mohon di jawab pak.terimakasih

  34. Maaf mas mau tanya, saya melakukan penelitian dengan 4 variabel independen misalkan A,B,C,D. Nah waktu saya lakukan uji coba multikol ternyata variabel A, dan C terkena multikol, sementara saya menghiraukan dulu data yang terkena multikol saya lanjutnya dengan melakukan analisis logit, dan terjadi permasalahan dimana variabel yang berpengaruh itu ternyata A dan C. Nah saya bertanya kepada teman saya bagaimana solusinya dan dijawab coba dilakukan analisis satu per satu jadi misal di lakukan dulu analisis pada variabel A setelah beres B dan seterusnya. Apakah boleh dilakukan hal seperti itu?

    1. mungkin yang dimaksud teman anda adalah regresi dengan step forward di spss. memang langkah tersebut salah satu cara untuk mengetahui model yang paling fit. tapi untuk multikol, paling cepat adalah mengetahui korelasi antar variabel x menggunakan pearson

  35. Pagi pak, jika saya ingin melihat kuat hubungan antara masing-masing variabel independen terhadap variabel dependen bagaimana ya Pak? terimakasih

    1. pengaruh kuat secara bersama sama ditunjukkan dengan r squared. sedangkan pengaruh kuat di satu persatu variabel, ditunjukkan di nilai logit.

  36. malam pak, mau tanya, apabila hasil 2-log dengan 1 variabel IV lebih besar dari chi square berarti tandanya H0 ditolak ya pak? dan omnibus saya signifikannya lebih dari o.o5, yang berarti tidak ada pengaruh signifikan dari IV ke DV. kalau seperti itu apakah cukup hanya untuk dianalisis saja atau gimana pak? terimakasih..

    1. Malam sheila. . Maksud dianalisis aja itu bagaimana ya? Tentu klo data tidak signifikan, bisa melakukan upaya upaya yang diperbolehkan agar tujuan penelitian tercapai.

  37. Persmisi pak agung, saya Adi..
    maaf mau tanya. apakah dalam regresi logit nilai r-square itu penting banget ? pasalnya saya pernah baca di blog ada yang menyebutkan bahwa penelitian sosial yang menggunakan regresi logit jika nilai r-square sudah mendekati 30% berarti sudah baik, mengingat variabel sosial yang banyak sekali. kemudian ada juga yang menyebutkan yang penting adalah pengaruh variabel itu sendiri ke variabel dependen. menurut pak Agung gimana ya pak, saya masih bingung soalnya penelitian saya sudah menggunakan 14 varibale independen tapi nilai r-square cuma 36,9% dan yang tidak signifikan 4 variabel.terima kasih bapak…

    1. Halo mas adi,
      R square itu penting tidak hanya di logistik, melainkan di semua regresi. Karna r squared itu mengindikasikan kebaikmodelan atau goodness of fit dari hasil analisis.
      Mengenai masalah bidang sosial, biasanya yg ditolerir adalah nilai signifikannya, atau p value pervariabel, yg biasanya 5 persen, ditolerir hingga 10 sampai 20 persen u sosial, bukan r squarednya.
      Jadi meskipun semua variabel signifikan tapi r squarednya rendah, ttp model tersebut tdk baik untuk dijadikan model.

      Tapi,..kembali lagi ke pembimbing. Ada sebagian dosen tidak menuntut r squared. Terlebih lagi untuk skripsi, karna tahapan skripsi yang paling utama adalah mahasiswa mengerti proses penelitiannya.

  38. Halo Pak Agung, saya Andre mau bertanya,
    Saya mempunyai data penelitian berupa data populasi customer yang kualitas kreditnya macet dan lancar. Masing masing data customer tersebut mempunyai informasi seperti: income, pekerjaan, usia, area pengajuan, dan banyak lagi (kebanyakan data nominal). Saya ingin menentukan dari sekian banyak prediktor tersebut, prediktor apa saja yang menentukan customer tersebut bagus (kreditnya lancar). Lalu saya ingin membuat model dan skoring untuk prediktor yang berpengaruh tersebut. Jadi misalkan ada customer baru dengan kondisi income sekian, usia sekian, jenis pekerjaan tertentu, maka berapakah skornya. Apakah customer tersebut layak diterima atau ditolak (tergantung skornya dan berapa limit skor agar layak terima/tolak berdasarkan kualitas kreditnya tersebut).
    Kira-kira saya harus menggunakan metode apa yang tepat untuk melakukan penelitian tersebut ya Pak? Terima kasih banyak atas bantuannya ya pak. Mohon penjelasannya.

    1. Halo mas Andre.
      mas bisa menggunakan regresi logistik dengan keterangan variabel Y=0 untuk responden yang memiliki kredit macet, dan Y=1 untuk responden yang kreditnya lancar. nanti model hasil regresi digunakan untuk memperkirakan skor dari customer baru. skor yang dimaksud adalah nilai peluang dari 0 sampai 1 sesuai contoh di artikel ini, semakin besar nilai peluangnya berarti semakin besar peluang responden baru untuk dapat mengembalikan kreditnya. Terima kasih

  39. Siang Pak. Jika variabel dependen berbentuk data continue, sementara 6 dari 8 variabel independen dalam bentuk kategori (1-0), apakah tetap bisa menggunakan regresi logistik? Jika tidak, regresi apa yg harus digunakan?

    1. Selamat siang.. kuncinya ada di variabel dependen. Jika datanya kontinyu, sudah pasti tidak bisa menggunakan regresi logistik. Logistic regression hanya digunakan saat variabel dependennya biner atau kategorik.

      Kasus yang dijabarkan menggunakan regresi berganda. Tapi sepertinya variabel dummy nya terlalu banyak. Dicoba saja dan lihat r squarednya. Silahkan temukan paket variabel independen yang optimal mennghasilkan r squarednya. Silahkan baca artikel lainnya tentang eliminasi variabel atau eliminasi responden untuk mendapat r squared yang baik di blog ini. Gunakan fasilitas search di sebelah kanan jika menggunakan desktop atau dibawah jika versi mobile. Selamat belajar!
      Terima kasih

      1. Terima kasih atas respon cepatnya Pak. Saya sudah coba run dengan regresi berganda, tapi nilai R square kecil sekali, kurang dari 20 persen. Sudah coba eliminasi variabel yg nilai vif >10. Tapi hasil regresi ulang nilai R square tidak jauh berbeda. Masih terlalu kecil. Mengapa bisa seperti itu, dan bagaimana langkah solusinya?

        Satu lagi, jika regresi logistik dengan variabel dependen biner, dan setelah di run, ternyata ada salah 1 variabel yg omitted karena kolinear, sementara variabel tsb sangat penting utk analisa. Adakah langkah olusi yg bisa dilakukan?

        Terima kasih banyak atas perkenan dan jawaban-jawabannya Pak

        1. Sudah baca artikel berikut:
          https://agungbudisantoso.com/2017/03/29/cara-mengeliminasi-variabel-pada-regresi/

          https://agungbudisantoso.com/2017/07/16/cara-mengeliminasi-data-responden/

          Dan
          https://agungbudisantoso.com/2018/04/11/memahami-r-square-secara-konsep/

          Sementara untuk regresi logistic, jika variabel tersebut adalah variabel yang penting, maka cari tau mengapa bisa kolinear.. atau lbh mudah dipahami variabel lain yang dieliminasi dan perhatikan r squarednya. Langkah awal coba running regresi logistik dengan satu variabel independen (variabel yang penting itu), lalu pahami outputnya.

  40. Maaf mas saya ingin bertanya skripsi saya menggunakan regresi logistik dengan spss 22, tetapi apakah bisa menggunakan regresi panel dengan software eviews?

  41. Bila dalam uji interaksi menggunakan regresi logistik tetapi pada output ada 1 variabel yang tidak ada apa peyebabnya dan bagaimana caranya agar bisa tampil dioutput?

    1. saya paham dengan pertanyaan mbak. tapi saya tidak bisa komentar karena informasi yang diberikan sangat sedikit, dan itu bisa beberapa kemungkinan. biasanya spss atau minitab memberikan alasan mengapa variabel tersbeut tidak valid atau tidak dapat diproses. bisa juga karena kekeliruan penginputan. dan saya tidak bisa menduga duga hanya informasi yang mbak berikan.

      terima kasih

    1. Saya juga mengalami hal yang sama. Kalau dalam masalah yang saya hadapi, hal ini dinamakan “dummy variable trap”. singkatnya, jika dalam regresi logistik terdapat independen variabel yang semuanya merupakan kategorikal (Ex: Probabilitas kebangkrutan berdasarkan jenis kelamin, dengan independen variabel pria dan wanita). Maka, secara otomatis SPSS (software yang saya pakai) otomatis menghilangkan variabel tersebut karena terdapat “perfect collinearity”. Solusinya hilangkan konstanta (terdapat opsi ini dalam SPSS) atau hilangkan salah satu variabel independen tersebut. Lebih jelasnya, silahkan googling 🙂

      1. Masukan yang bagus dari mas raka. Betul sekali jika ada masalah multikolinearitas antar variabel, pasti jadi tidak signifikan.
        Bisa dilihat dari nilai VIF klo regresi berganda, atau running correlation terlebih dahulu antar variabel independen. Jika ada hub kuat, maka bisa diduga terdapat multikol. Terima kasih

    1. website repository IPB mungkin lagi ada gangguan,. tunggu saja. nanti klo sudahaktiv, saya coba sediakan alternatif link lainnya.

      1. Pak mau tanya saya ada pertanyaan dari dosen pembimbing saya mengapa di reglog 0,1 di ln kan? (Ada dipenelitian jurnal) Mohon bantuannya 🙂

Leave a Reply

Your email address will not be published. Required fields are marked *