Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS

Regresi logistik merupakan salah satu jenis regression yang menghubungkan antara satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen yang berupa kategori; biasanya 0 dan 1. Jenis variabel independen berupa kategori inilah yang membedakan regresi logistik dengan regresi berganda atau regresi linear lainnya.

Nilai kategori biasanya tertulis 0 dan 1, saat artikel ini ditulis, kebanyakan peneliti menggunakan regresi logistik untuk  memproses 2 kategori saja. 0 biasanya digunakan untuk kategori “tidak” atau “belum”. Sedangkan angka 1 biasanya digunakan untuk mendeskripsikan responden yang bersesuaian dengan maksud penelitian. Misalnya, pada skripsi yang saya buat tahun 2008 mengisahkan tentang Faktor – Faktor yang mempengaruhi keputusan petani wortel memilih sistem pertanian organik di desa Tugu Selatan, Kecamatan Cisarua, Kabupaten Bogor”

http://repository.ipb.ac.id/handle/123456789/1293

atau alternatif download lainnya disini

Pada skripsi tersebut menjelaskan variabel dependen yang terdiri dari petani yang tidak atau belum menggunakan sistem pertanian organik (dengan simbol : 0), dan kelompok kedua yakni petani yang sudah menggunakan sistem pertanian organik (dengan simbol : 1).

agungbudisantoso.com
terima kasih telah menyimpan blog ini di bookmarks

Karena nilai Dependen berupa kategori 0 dan 1, tentunya penjelasan persamaan yang menghubungkan antara variabel independen dan variabel dependen tidak bisa dilakukan secara linear seperti yang dilakukan pada regression umumnya. Maka penggunaan regresi logistik diperlukan untuk menghitung peluang kecenderungan responden untuk bernilai 0 hingga 1.

Tujuan Menggunakan regresi Logistik

Pemahaman tujuan menggunakan regresi logistik sangat diperlukan sebelum anda menggunakannya sebagai alat penelitian. Anda bisa mendalami dan membahas secara detil jika tujuan penggunaan regresi logistik anda kuasai secara detil. Setelah saya membaca beberapa jurnal yang menggunakan regresi logistik, saya menyimpulkan tujuan penggunaan regresi logistik secara umum ada tiga, yakni

Menghitung peluang

Persamaan yang diperoleh dari proses regresi logistik, dapat digunakan untuk menghitung peluang responden diluar responden yang termasuk dalam penelitian. Contoh yang dapat dipahami adalah proses pengajuan kredit. Pihak bank biasanya melakukan evaluasi kelayakan seseorang layak atau tidak untuk menerima kredit pinjaman dari bank. Beberapa pertanyaan diberikan kepada pihak bank terhadap calon penerima kredit. Pertanyaan yang diberikan seputar karakteristik variabel calon penerima modal tersebut merupakan variabel independen yang akan diinput oleh petugas bank kedalam model. Dari beberapa variabel yang dipertanyakan itulah, petugas bank dapat menentukan peluang calon penerima kredit tersebut untuk bisa mengembalikan pinjaman atau tidak, nilai antara 0 – 1.

Tentunya model yang digunakan oleh petugas bank adalah model regresi logistik berdasarkan data-data peminjam sebelumnya. Dalam model tersebut terdapat komponen bahwa biasanya peminjam yang memiliki pendapatan dibawah sekian dengan pinjaman yang telah dimiliki sebelumnya sekian, ditambah tanggungan kerja sekian, memiliki peluang untuk mengembalikan pinjaman sebesar sekian ( nilai 0 -1).

Melihat karakteristik

Tujuan kedua ini sering digunakan untuk melihat perbedaan karakteristik antara 2 kelompok. Salah satunya adalah skripsi saya yang saya sebutkan diatas. Skripsi tersebut menggambarkan karakteristik petani anorganik dan petani organik. Hasil kesimpulan bahwa peluang petani mampu beralih dari anorganik ke organik adalah karena perbedaan harga produk hasil kedua proses tersebut. Petani organik bersedia beralih dari anorganik ke organik meskipun produktivitas organik lebih kecil dibanding anorganik. Namun, perbedaan harga yang tinggi menjadikan petani organik memiliki pendapatan yang lebih tinggi dibandingkan petani anorganik.

Tujuan melihat karakteristik ini biasanya membahas nilai odds ratio di masing masing variabel independen (nilai odds ratio adalah (exp(koefisien)) masing-masing variabel). Nilai odds ratio menjelaskan peluang responden beralih ke organik (contoh kasus diatas). Penjelasan nilai odds ratio berbeda dari nilai koefisien regression pada umumnya. Bila koefisien regresi menjelaskan : “ jika variabel X naik 1 satuan, maka nilai Y akan naik sebesar nilai koefisien satuan” maka exp(koefisien) atau odds ratio pada regresi logistik menjelaskan : “ responden yang memiliki variabel x lebih tinggi, maka akan berpeluang untuk memilih organik (contoh kasus diatas) sebesar “exp(nilai koefisien) atau biasa disebut odds ratio” kali dibandingkan responden yang memiliki variabel x lebih rendah”. Iya, nilai exp(koefisien) pada regresi logistik atau disebut sebagai odds ratio menjelaskan peluang, dan tidak menjelaskan berapa yang dimaksud “lebih tinggi” dari variabel X tersebut.

Faktor Yang mempengaruhi

Tujuan ketiga ini merupakan pengembangan dari tujuan kedua, peneliti mampu mengetahui faktor yang mempengaruhi mengapa terdapat perbedaan antara kedua kelompok tersebut. Nilai odds ratio yang tinggi menandakan varaibel tersebut memiliki pengaruh yang tinggi  terhadap pemilihan beda dari responden. Tujuan untuk mengetahui faktor yang mempengaruhi ini adalah diharapkan faktor yang signifikan mempengaruhi tersebut merupakan faktor yang bisa diatur oleh peneliti atau pengambil kebijakan sehingga bisa menggiring responden lainnya untuk berbuat yang sama terhadap responden yang bernilai 1 sebelumnya.

Contoh pada skripsi ini adalah bahwa harga merupakan faktor yang paling berpengaruh terhadap preferensi petani memilih pertanian organik, maka pemerintah jika ingin mengembangkan pertanian organik harus melakukan kebijakan yang tetap menstabilkan harga agar terus berada diatas harga produk anorganik sehingga peminat petani organik akan sebakin banyak dan bisa terus berkembang.

Bagaimana Model Persamaan Regresi Logistik?

Jika regresi linear memiliki persamaan :

Y = a + b1X1 + …. + bnXn, dengan a sebagai konstanta, dan b1 hingga bn adalah koefisien, maka regresi logistik juga akan mengeluarkan output yang sama jika anda menggunakan software minitab atau SPSS. Namun, anda akan keliru jika langsung mengambil persamaan itu untuk menjelaskan atau membahas peluang.

regresi lgistik 01

Nilai koefisen masing masing variabel dari gambar diatas terletak pada kolom B, sedangkan penjelasan nilai odds ratio dari masing masing variabel adalah pada kolom Exp(B). jika anda menggunakan regresi logistik untuk membuat persamaan dan menginterpretasikan peluang pada responden lain, maka pembahasan anda akan berkutat kepada kolom B untuk membuat persamaan, jika anda akan membahas faktor yang mempengaruhi variabel secara parsial, maka anda akan membahas kolom odd ratio atau exp(B)

Persamaan regresi logistik adalah :

persamaan regresi logistik

B0  merupakan konstanta, B1 merupakan koefisien masing- masing variabel.

Nilai p atau peluang (Y=1) dapat dicari dengan persamaan :

Persamaan tersebut dapat anda gunakan untuk menghitung peluang responden yang memiliki nilai variabel yang sudah ditetapkan dalam persamaan, hasil akhir nilai p tentunya akan berkisar antara 0 – 1.

Tahapan Proses Regresi Logistik

Mari kita langsung praktek dengan menggunakan spss 22. Buka spss dan copikan data yang anda miliki. Proses regresi logistik bermula dari klik analyze – regression – binary logistic

regresi logistik 02

Kemudian isikan nilai kolom dependen dengan variabel Y dan kolom covariate dengan variabel independen. Anda bisa menggunakan bermacam – macam methode untuk mengeliminasi variabel dan memperoleh persamaan yang paling baik untuk menginterpretasikan penelitian anda, anda bisa membaca artikel saya tentang cara eliminasi variabel pada regresi. Pada latihan ini, kita pilih methode enter saja. Klik oK

regresi logistik 03

Interprestasi Output

Interpretasi output spss ini dimulai dengan melihat goodness of fit persamaan model regresi logistik apakah telah memenuhi syarat untuk menginterpretasikan nilai y atau kah belum. Beberapa syarat yang harus diperhatikan dalam goodness of fit regresi logistik adalah :

Omnibus Test dan R Squared
regresi logistik 04

Nilai signifikan omnibus test harus berada dibawah 0.05 jika anda menggunakan taraf kepercayaan 95%. Omnibus Test dengan jumlah variabel independen sebanyak x menghasilkan nilai signifikansi yang lebih rendah dari 0.05. Hal ini menunjukkan bahwa terdapat pengaruh yang signifikan dari x variabel independen secara simultan mempengaruhi variabel dependen.Kemudian nilai nagelkerke R Square merupakan nilai R squared pada regresi linear. Variabel independen mampu menjelaskan 86 persen variabel dependen yang terlihat dari nilai Square nagelkerke sebesar 0.86. Sedangkan 14 persen lainnya dapat dijelaskan oleh faktor lain diluar variabel independen dalam persamaan hasil regresi logistik.

Hosmer and lemeshow Test

Berbeda dengan omnibus test, nilai hosmer and lemeshow test justru dikatakan baik jika nilai signifikannya > 0.05.

logistic regression

Nilai Hosmer tersebut lebih besar dibandingkan α = 0.05, artinya terima H0 yakni model regresi logistik mampu menjelaskan data dan tidak terdapat perbedaan antara model dan nilai observasinya. Hal ini menunjukkan bahwa persamaan regresi logistik dapat digunakan untuk menjelaskan hubungan variabel independen dan variabel dependen

Signifikan Tiap Variabel

Ketiga indikator tersebut merupakan goodness of fit apakah model tersebut cukup baik untu menginterpretasikan hubungan variabel independen dan variabel dependen. Jika ada masalah dengan ketiga indikator tersebut, anda bisa melakukan seleksi variabel dengan tehnik backward atau forward seperti yang saya jelaskan di artikel Cara eliminasi variabel pada regresi

Selanjutnya anda harus menilai variabel secara individu mana yang mempengaruhi variabel dependen dengan cara melihat nilai signifikansi masing masing variabel. Variabel dikatakan signifikan mempengaruhi varaiabel dependen jika nilai signifikannya < 0.05.

Interpretasi nilai Odds ratio

Pada gambar pertama diatas terlihat bahwa SPSS menyediakan range peluang atau nilai odds ratio dari batas bawah (lower) hingga batas atas (upper). Artinya bahwa interpretasi setiap variabel bisa dilakukan dengan menambahkan range peluang tersebut. Contohnya: variabel luas ( petani yang memiliki luas sawah lebih luas memiliki peluang untuk bernilai Y = 1 sebesar 3.267 hingga 176.130 kali dibandingkan petani yang memiliki luas lahan lebih sempit.

Gunakan variabel yang signifikan tersebut untuk dibahas secara mendetil dengan menambahkan penjelasan deskripsi, argumen, dan daftar pustaka yang kuat sehingga analisis anda bisa diterima oleh pembaca. Nilai nilai odds rasio inilah inti dari pembahasan anda jika bertujuan untuk melakukan perbedaan karakteristik dua kelompok atau analisis faktor yang mempengaruhi.

Membuat persamaan

Persamaan diperlukan apabila anda selanjutnya ingin membahas atau meramal suatu peluang dimana kondisi – kondisi variabel telah anda peroleh. Contoh simple seperti diatas adalah penentuan layak atau tidak seseorang mendapatkan kredit pinjaman. Atau, bisa juga memprediksi peluang keberhasilan suatu program apabila memiliki kondisi kkondisi yang mirip dengan variabel yang ada di persamaan tersebut.

Cara membuat persamaan sudah saya jelaskan diatas, namun sebagai gambaran saya ilustrasikan sebuah contoh:

Hasil interpretasi nilai logistic regression adalah sebagai berikut:
B0 = -4.2
B1 = 2.3
Variabel independen yang diproses adalah : IP semester 1 mahasiswa dengan variabel dependennya : 0 berarti lulus lebih atau sama dengan 4 tahun, nilai 1 berarti lulus kurang dari 4 tahun.
Jika IP semester 1 seorang mahasiswa adalah 3, maka berapa peluang mahasiswa tersebut untuk lulus kurang dari 4 tahun?

Kita tentukan persamaannya yakni :

p = e(B0+B1X) / (1+ e(B0+B1X) )

p = e(-4.2+2.3(3)) / (1+ e(-4.2+2.3(3)))

p = 0.94

Peluang mahasiswa tersebut untuk lulus kurang dari 4 tahun adalah 0.94%. Dengan cara yang sama, mahasiswa yang memiliki IP semester 1 = 2, memiliki peluang lulus kurang dari 4 tahun sebesar 0.59%.

Terima kasih telah berkunjung


Comments

328 tanggapan untuk “Pengertian, Tutorial, dan Interpretasi Regresi logistik dengan SPSS”

  1. Jika output “variables in the equation” pada bagian 95% Cl for Exp(B) hasilnya . (titik saja) bagaimana cara penulisannya di tabel.

    1. maka tuliskan 0.0 saja.

  2. Selamat malam mohon maaf menganggu, pak hendak bertanya kalau saya menggunakan regresi logistik apakah bisa mengeliminasi datanya mengacu pada nilai eror ya untuk ningkatin r square nya?

    1. selamat pagi.. bisa, silahkan lihat video di channel yotube saya ya..

  3. Jadi untuk variabel independen saya tidak boleh nominal ya pak? kalau menggunakan ordinal pak? Apa masih bisa digunakan pada moderating yang interval?
    Kalau iya, data ordinal itu di transformasi ke interval pak? lalu tinggal di kali dengan variabel moderating pak? untuk analisis moderatingnya pak?

    1. ordinal sudah bisa. namun pada dasarnya skala pengukuran semakin keatas semakin baik.

  4. Assalamu’alaikum pak, saya hendak bertanya,
    bagaimana melakukan MRA dengan regresi logistik, variabel Y ada 5, moderasi 1, dan Y nya 1 dengan kategori 1 dan 0 (binary)

    1. maksud saya X nya ada 5

    2. mohon maaf, maksud saya X nya ada 5, terima kasih.

  5. Assalamualaikum pak. mau tanya untuk analisis moderating pada regresi logistik dengan variabel moderatingnya itu interval dan variabel independentnya itu nominal, bagaimana pak

    1. wa alaikum salam.. variabel nominal sebaiknya jangan menggunakan moderating. skala nominal tidak memiliki adanya tingkatan. misalnya pria dan wanita tidak bisa diartikan satu lebih besar dari nol. terima kasih

      1. Jadi kalau saya ganti v.independennya menggunakan ordinal itu perkaliannya dengan v.moderating bagaimana pak?
        apa harus di transformasikan ke interval dulu pak? ini variabel saya opini audit yang v.independent

  6. Pak, saya ingin bertanya, jika variabel Y merupakan variabel dummy, apakah batasan nilai Z (agar dapat digolongkan financial distress atau tidak) ditentukan sendiri oleh peneliti atau punya perhitungan tersendiri? Karena saya menemukan batasan nilai Z yang berbeda setelah melihat beberapa penelitian terdahulu, seperti dibawah ini:
    Z > 2,99 =0 (Non-Financial Distress)
    Z ≤ 2,99 = 1 (Financial Distress)
    ada juga yang menetapkan
    Z > 2 =0 (Non-Financial Distress)
    Z < 2 = 1 (Financial Distress)

    1. jika ada dasar atau teori atau literatur penetapan batas Z akan lebih baik. itu akan membuat argumen mbak lebih kuat. jika tidak ada, maka peneliti sendiri yang menetapkan. tapi itupun harus berdasarkan logika dan perlu dijabarkan mengapa ditetapkan seperti itu. terima kasih

  7. Selamat malam Pak, saya sedang melakukan penelitian dgn variabel Y adalah financial distress dan variabel X merupakan rasio-rasio model Z-Score. Saya berniat menggunakan metode regresi logistik, namun setelah melihat bbrp contoh penelitian terdahulu, beberapa peneliti menentukan suatu batasan untuk dapat dikatakan bernilai 0 atau 1. Contoh: Z > 2,99 = 0 (Non-Financial Distress)
    Z ≤ 2,99 = 1 (Financial Distress).
    Yang ingin saya tanyakan, adalah nilai 2.99, sy menemukan nilai yang berbeda pada penelitian lain (Z > 2 = 0 (Non-Financial Distress)
    Z < 2 = 1 (Financial Distress), apakah nilai tersebut tergantung peneliti saja atau memiliki cara untuk menentukan nilai batasan tersebut?

    1. ini tadi sudah dijawab ya mbak. terima kasih..

  8. maaf pak saya ingin bertanya lagi. apabila salah satu variabel independen saya memiliki tiga skala yaitu variabel tingkat pengetahuan dengan skala: kurang, cukup, dan baik, apakah syarat untuk melakukan uji regresi logistik sama seperti diatas atau berbeda ya pak? terimakasih

    1. independen lho ya… atau variabel X. bisa regresi logistik bisa regresi berganda. regresi logistik itu patokannya variabel dependen atau Y. terima kasih

  9. selamat malam pak. saya ingin bertanya kok di utput spss saya hasil test hosmer dan lemeshownya tidak ada ya? padahal untuk test omnibus sudah memenuhi. terimakasih

    1. maaf pak sudah muncul ternyata dari test hosmer dan lemeshownya. selanjutnya saya ingin bertanya, apabila salah satu variabel independen memiliki skala data yg lebih dari dua apakah syarat yang digunakan sama seperti diatas? pada penelitian saya ini terdapat variabel independen tingkat pengetahuan dengan skala: kurang, cukup, dan baik. terimakasih

      1. iya mbak. variabel itu disebut memiliki skala ordinal. terima kasih

  10. Pak, saya mau bertanya bagaimana cara menaikkan/mengatasi hasil homser and lemeshow test sig nya agar H0 diterima?karena hasil hosmer and lemeshow punya saya sig. .000

    Reply

    1. itu terkait pola datanya ya mbk. jika variabelnya banyak, silahkan cek satu satu dan temukan kira kira variabel mana yang perlu dieliminasi. terima kasih

  11. Mas Agung izin bertanya,
    Skripsi saya menggunakan regresi logistik,
    Variabel X (Pendapatan, Harga, Sertifikasi Halal) = Likert dan Variabel Y (Keputusan Pembelian) = Dummy.

    Pertanyaan saya apakah variabel x nya harus saya coonvert ke Skala Interval dulu?

    1. skala pengukuran ada nominal, ordinal, interval dan rasio. sepertinya pendapatan adalah rasio baiknya jangan dijadikan interval. semakin tinggi skala penguluran semakin baik.

  12. Avatar dertina

    pak agung izin bertanya jika hasil regresi kita keluar warning, apa penyebabnya dan apakah variabel kita bermasalah atau ada kesalahan, kemudian apakah berpengaruh terhadap hasil kita

    1. iya kak.. tentu warning menandakan adanya masalah. cara mengetahuinya dirunut lagi sejak uji klasik dari awal. terima kasih

  13. Siang pak, saya mau tanya, apakah regresi logistik juga membutuhkan uji t? Terima kasih sebelumnya

  14. Pak izin bertanya untuk analisis regresi logistik yang ada variabel moderasinya, cara input variabel moderasinya dibagian mana ya pak sehingga hanya terbentuk satu persamaan yang sudah termasuk variabel moderatingnya? Terima kasih sebelumnya

    1. variabel moderasi sebenarnya sama dengan variabel independen atau variabel X. hanya saja keberadaan variabel ini dilihat pengaruhnya terhadap hubungan variabel Y dengan variabel X yang lain. terima kasih

  15. selamat sore pak. izin bertanya. apakah kualitas persamaan regresi logistik cukup diuji dgn hosmer and lemeshow test? bagaimana dengan menggunakan nilai AUC? karena penelitian saya memiliki nilai hosmer dan lemeshow test yg baik(>0,05), tetapi nilai ROC sebesar 64% yg termasuk kurang baik. apakah persamaan ini bisa digunakan? terima kasih

    1. selamat sore. semakin lengkap indikator yang digunakan akan semakin baik. namun hosmer lemeshow sudah cukup. terima kasih

  16. pak izin bertanya jika nilai odd ratio menunjukkan sig 0,000 lower dan upper 0,000 apakah bisa dikatakan bernilai signifikan? terimakasih

    1. iya..nilai p value tersebut menyatakan signifikan.terima kasih

  17. Pak, izin bertanya, apakah bisa pak jika saya ingin menjadikan Covid-19 variabel dummy, seperti contoh berikut ini “Apakah pendapatan anda menurun karena adanya Covid-19?”
    0 = Ya
    1 = Tidak
    Terimakasih pak sebelumnya.

    1. iya.. bisa. tidak masalah 0 atau 1 nya untuk yang menurun atau naik. nanti interpretasinya saja yang berbeda. ingat, skala nominal tidak memiliki tingkat lebih tinggi dibandingkan nilai yang lain.

  18. Avatar Iesous Rismilda
    Iesous Rismilda

    selamat malam pak, terimaksh telah berbagi ilmunya. begini kk, saya ingin menanyakan sekaligus meminta bantuin sedikit perihal skripsi yg sedang saya krjakan sekrang. begini pak penjelasannya.. skripsi saya kan memiliki 4 var independen, 1 dependen dengan 1 var moderasi. nah! saya kn sdh mencoba mengolah data yg pertama, data yg sy olah blm mencantmkan data var moderasi dan diperoleh hasil utk hosmer and lemeshow test di atas 0.05 atau dpt dikatakan fit sehingga data tsb dpt diolah. kedua, saya mencoba utk mengolah data dgn menambahkan data var moderasi dan diperoleh hasil utk hosmer and lemshow test di bawah 0.05 sehingga data tsb tdk fit. oleh krn itu pertanyaan yg akn sy ajukan yaitu bagaimana cara mengolah data agar hasil hosmer and lemeshow testnya di atas 0.05? mohon penjelasannya. terima ksh.

    1. Jika ingin menggunakan moderasi, baiknya jangan menggunakan regresi logistik. Gunakan path analysis atau SeM. Silahkan browsing di blog ini juga tentang sem. Terima kasih

  19. Pak gimana membuat hasil homser and lemeshow test sig nya >0.05 agar H0 diterima?

  20. Pak gimana caranya agar hosmer and lemeshow test sig nya jadi >0.05 karena sya hasilnya. 000

  21. Avatar Inry Rantika
    Inry Rantika

    Selamat malam pak, maaf saya ingin bertanya skripsi saya tentang pengaruh ukuran perusahaan, profitabilitas, leverage, dan pertumbuhan penjualan terhadap tax avoidance. Bagaimana caranya menetukan nilai 0/ 1 ( melakukan tax avoidance (1) dan tidak melakukan tax avoidance (0) pada suatu sampel? Kemudian apakah yang diberikan nilai 0/1 variabel X dan Y atau Y saja? Terima kasih

    1. saya jawab di video ini ya..terima kasih
      https://youtu.be/tYTxkP3heaE

  22. Avatar Karmilamsr

    Maaf mau tanya pak, penelitian saya itu kan tentang analisis faktor risiko yang berhubungan dengan kejadian pneumonia pada balita di puskesmas x.. terdiri dari 6 variabel. yg mau saya tnyakan apa boleh saya menggunakan uji qhi square sja nggak perlu uji regresi logistik? Mohon saran dan penjelasannya pak. Terimaksih:)

    1. saya jawab di video ini ya..terima kasih
      https://youtu.be/tYTxkP3heaE

  23. Avatar Sania Salsabila
    Sania Salsabila

    Selamat malam pak, saya mau bertanya. Kenapa di output saya hasil wald test nya 0 semua ya pak? Sehingga secara parsial tidak ada variabel independen yang signifikan, padahal waktu uji serentak hasilnya signifikan. Mohon jawabannya pak🙏

    1. sudah lewat uji asumsi klasik apa belum?

      1. maaf pak, izin bertanya, apakah regresi logistik masih memerlukan uji asumsi klasik???

  24. Permisi pak izin bertanya, apakah bisa menggunakan regresi logistik apabila variabel dependen menggunakan rasio? Namun variabel independen campuran nominal dummy dan rasio tp lebih banyak menggunakan dummy utk variabel independen

    1. logistik itu variabel dependennya dummy ya mbak. jadi mestinya tidak bisa menggunakan regresi logistik.

  25. selamat malam pak, skripsi saya telah selesai saya kerjakan akan tetapi ada satu permasalahan yang ditekankan oleh penguji saya. Judul skripsi saya adalah pengaruh debt default, pertumbuhan perusahaan, opini audit going concern tahun sebelumnya, reputasi kap terhadap penerimaan opini audit going concern.
    opini going concern ini merupakan variabel kategorik dimana 1 utk prsh yang menerima opini going concern, dan 0 untuk perusahaan yang tidak menerima audit going concern. Akan tetapi dosen saya mempermasalahkan kenapa sampel saya mengikutsertakan perusahaan yang tidak menerima opini audit going concern, padahal itu merupakan variabel dummy, saya bingung menjelaskannya seperti apa lagi :(. Mohon pencerahaannya pak 🙁

    1. perlunya mengambil sample pada perusahaan dengan nilai 0 adalah untuk menghitung peluang dan membndingkan karakteristik dua kelompok. jawaban lebih detil silahkan melihat video TJBudi#02. terima kasih

  26. Avatar Angki Ghani
    Angki Ghani

    Selamat malam Pak Agung. Maaf mengganggu waktunya, saya angki mau bertanya apakah uji regresi logistik memerlukan uji multikolinearitas, seandainya iya apakah cuman perlu multikolinearitas saja. Kalau iya buku siapa yg menyebutkan klu regresi logistik hanya perlu uji multikol. Terimakasih Pak Agung.
    Salam horma

    1. selamat pagi… dalam regresi logistik tidak ada uji asumsi klasik mas.. simak pembahasannya di video youtube channel catatan budi dengan judul TJ Budi #1

  27. Avatar Oshanty

    Selamat malam pak agung, bagaimanakah cara menginterpretasikan hasil logistik regresi dimana Variabel independennya gabungan dari data kontinyu (ex: Jumlah penyakit) dan kategorik(status perkawinan: menikah dan single)?apakah sama cara menginterpretasikannya jika ada referensinya bolehkah sy mendapatkannya pak?terimakasih banyak.

    1. berbeda mbk. untuk data continyu: setiap satu satuan X memiliki peluang sebesar (odd ratio) kali dibandingkan nilai sebelumnya. untuk yang kategorik misalnya : menikah memiliki peluang sebesar (odds ratio) kali dibandingkan yang single.

  28. Avatar fadil R

    malam pakk aku lagi skripsian dimana tujuan 3 aku menganalisis faktor-faktor yang mempengaruhi kesediaan masyarakat membayar untuk kelestarian lingkungan Ruang terbuka hijau(taman)
    dimana y nya bersedia/tidak
    var independen nya ada
    umur(Thn)
    kelamin(L&P),
    pendidikan(1 SD,2SMP,3SMA sampai 6 S2),
    pendapatan(03jt),
    tanggungan keluarga(orang),
    jarak ke RTH(02km),
    status tempat tinggal (1 milik pribadi 0 sewa)
    dan status kepndudukan (1 asli 0 pendatang).

    aku mentok di implementasinya karena koefisiennya terbalik.
    dimana var independen aku yang signifikan ada
    umur, tanggungan keluarga,jarak dan status tempat tinggal.
    tapi hubunganya kok aneh.

    koefisien negatif ada umur dan status tempat tinggal dimana harusnya positif
    semakin tua umur kesediaan membayar harusnya makin besar
    status tempat tinggal milik sendiri harusnya lebih besar dibanding yang ngontrak

    koefisien positif ada jarak dan tanggungan (yang harusnya negatif)
    harusnya semakin banyak tanggungan kesediaan membayarnya berkurang
    dan semakin jauh jarak tempat tinggal ke RTH kesediaanya membayarnya semakin kecil :(.

    kira” aku salah masukin data yang 0 dan 1 atau implementasinya harus gimana pak?

    1. pertanyaannya kurang lengkap mas. jadi yang bersedia membayar pada variabel dependennya diberi nilai 1 atau 0 ya?

      1. Bersedia membayar 1
        Tidak bersedia 0

        1. Oke.. ini hanya hipotesis aja ya. Tentang umur lebih tinggi malah enggan membayar, mungkin kaitannya dengan bauran pengguna taman. Apa sudah dipastikan mayoritas orang yang berumur? Siapa tau justru yang menikmati adalah kaum muda dan pasangan muda. Tentang kepemilikan rumah (ini juga masih hopotesis), taman biasanya ada di perkotaan dan kebanyakan orang di perkotaan lebih banyak yang menyewa dibandingkan kepemilikan sendiri, terlebih disangkut pautkan dengan umur tadi yang masih muda muda.

          Sekali lagi ini hipotesis. Saran saya baiknya diperiksa bauran umur data yang anda miliki nanti akan terlihat deskripsinya disana. Terima kasih.

        2. halo mas fadil, permasalahan mas tentang koefisien dan odds ratio saya jadikan bahan artikel dan video pembahasan youtube. silahkan disimak ya… kemungkinan tanggal 18 sudah saya upload videonya. artikel blog saya upload malam ini. terima kasih.

  29. selamat sore.. maaf saya sudah mencoba mencari literatur tersebut. tetapi ternyata prabayar. apakah bpk bisa menjelaskan kenapa regresi logistik tidak pakai uji autokorelasi, sedangkan uji multikolinearitas masih di perbolehkan ? terimakasih, saya sangat menunggu jawaban bpk.

    1. karena regresi menggunakan model logit atau kurva S. berbeda dengan regresi yang mengansumsikan semua linear atau garis lurus. terima kasih

  30. Selamat malam pak saya ingin bertanya
    apakah beda dari Forward conditional, LR, dan wald?
    dan bagaimana jika saya menggunakan model enter tetapi hasil sig nya > 0,05 semua?apa yang harus saya lakukan?
    terima kasih

    1. ini kaitannya tentang cara software mencari model yang terbaik. sepertinya saya sudah bahas ya.. terima kasih

  31. Malam pak saya ingin bertanya, jika Nilai Nagelkerke R Square nya sangatlah kecil sebear 12% padahal jumlah data 180, itu penyebabnya apa ya?

    1. ini ibarat ke dokter kemudian bilang “dok, saya demam, penyebabnya apa ya?” dan kita tau bahwa penyebab demam itu ada banyak.
      saran saya silahkan baca artikel saya dengan kategori regresi ya… selamat bereksplorasi.. terima kasih

  32. pa agung saya mau tanya, ini spss nya pake yang berapa yah ?
    apa tiap versi nnti hasilnya beda?

    makasih…

    1. semua versi hasilnya sama. perbedaan versi hanya pada perbedaan fitur saja. terima kasih

    2. Mohon maaf pak mengganggu. Saya mau nanyak, jika variabel independennya rasio dan variabel dependennya dummy apakah bisa menggunakan regresi logistik?
      Contohnya dalam “pengaruh laporan keuangan dalam memprediksi financial distrees”.
      Mohon pengarahannya pak.

      1. saya jawab di video ini ya..terima kasih
        https://youtu.be/tYTxkP3heaE

  33. Selamat siang pak. Maaf mengganggu waktunya. Saya sedang melakukan penelitian mengenai “faktor yang mempengaruhi terhadap ketepatan waktu penyampaian laporan keuangan”, terdapat 6 variabel x atau 6 faktor yang akan saya uji. Namun 4 variabel menggunakan metric dan 2 variabel menggunalan skala nominal, untuk variabelnya juga menggunakan skala nominal (0 dan 1). Apakah penelitian menggunakan regresi logistik sudah tepat pak? Dan apakah cukup menggunakan regsresi logistik saja? Atau saya harus menambahkan uji lain? Terimakasih pak

    1. menentukan penggunaan regresi logistik atau tidak adalah karakter variabel dependen, bukan variabel independen. jika variabel dependennya dummy maka bisa menggunakan regresi logistik. sudah cukup kah? itu tergantung penelitiannya. tapi klo hanya skripsi saya rasa sudah cukup. terima kasih

  34. Apakah Ada perhitungan manual dengan dataset Yang sangat sederhana ?

    1. Saya pernah berpikir demikian. Tapi belum sempat waktunya.. Terima kasih

  35. Avatar Anisa D.M
    Anisa D.M

    Selamat malam Pak, mohon izin bertanya untuk metode variabel selection di spss kan ada enter, forward, backward dan stepwise kira2 mana yang paling baik ya pak? Atau bagaimana kelebihan dan kekurangannya? Soalnya saya ditanya dosen saya mengapa menggunakan metode enter pak, apakah ada patokan tertentu dalam memilih metode tersebut? Terima kasih

    1. selamat malam mbk..selamat belajar ya.. metode enter secara gampangnya tidak menyertakan seleksi variabel, artinya variabel yang kita masukkan sudah given, tidak boleh spss mengeliminasinya. metode forward, spss memulai dari variabel yang memiliki r square tertinggi, kemudian menambah satu demi satu variabel apakah masih signifikan atau tidak. pada titik sudah tidak signifikan, spss akan stop memproses. kebalikannya metode backward, spss memproses seluruh variabel, kemudian mengelliminasi satu demi satu variabel yang dinilai memiliki signifikan paling kecil, terus demikian sehingga spss menemukan kombinasi variabel independen yang tepat. sedangkan stepwise adalah kombinasi keduanya.

      kelebihannya, kita bisa menganalisa atau bongkar pasang variabel disana. kelemahannya, terkadang variabel yang tereliminasi adalah variabel yang kita harapkan signifikan. terima kasih

  36. Avatar Audita

    Selamat malam pak, mau bertanya, bagaimana cara menginterpretasi nilai EXP(B) apabila variabel dependennya 2 kategori, dan variabel independennya 4 kategori ? Karena yang saya temukan biasanya keduanya hanya terdiri dari 2 kategori.

    1. sama saja.. cara membacanya adalah responden yang memiliki kategori satu tingkat lebih tinggi memiliki peluang exp(B) lebih tinggi dibandingkan kategori tepatnya dibawahnya.

  37. Avatar Liana

    Mohon pencerahannya pak, saya saat ini sedang melakukan penelitian untuk skripsi dengan tujuan mencari faktor-faktor yang berpengaruh pada perempuan berpendidikan tinggi yang menjadi IRT, apakah uji regresi logistik merupakan uji yang tepat untuk digunakan? Selain itu, apakah jika sebuah model tidak fit tetap bisa digunakan pada penelitian tersebut?

      1. Avatar Erikson
        Erikson

        Pak saya mau nanya, untuk regresi logistik apakah diperbolehkan untuk tranformasi data ?

        1. Boleh. Tapi dalam rumusnya nanti dimasukkan transformasi datanya.
          Misal y = ln x , dsb

          1. Halo pak, maaf pak saya mau nanya data saya y pake dummy jadi saya pake regresi logistik. Namun hasil semua variabel tidak berpengaruh. Akhirnya saya lakukan transformasi data baik sqrt lg10 dan ln +0,5 hasil berpengaruh 2 variabel pak. Y dummy itu saya ikut transform pak. Tapi saya jg coba y nya tdk ditransform hasil tetap sama pak masih berpengaruh 2 variabel. Yang mau saya tanyakan apa boleh pak regresi logistik kasus saya ini pake transformasi data? Lalu saya harus memperkuat ini dengan landasan apa ya pak? Mohon dibantu jawab pak. Saya sudah pusing sekali pak 🙏😭

          2. https://youtu.be/hHfQaOGsm9o
            Sudah saya jelaskan divideo ini ya..

  38. Avatar Liana

    Mohon pencerahannya pak, saya sedang melakukan penelitian dengan tujuan mencari faktor apa saja yang berpengaruh terhadap perempuan berpendidikan tinggi yang menjadi IRT, apakah penggunaan uji regresi logistik merupakan hal yang tepat? Selain itu, apakah jika sebuah model tidak fit tetap bisa digunakan pada penelitian tersebut?

  39. Avatar Liana

    Saya sedang melakukan penelitian dengan tujuan mencari faktor apa saja yang berpengaruh terhadap perempuan berpendidikan tinggi yang menjadi IRT, apakah penggunaan uji regresi logistik merupakan hal yang tepat?

  40. Avatar rennyrediawati
    rennyrediawati

    Haloo pak. saya ingin bertanya kenapa hasi dari uji regresi logistik saya pada tabel variabel in the equation hasilnya >0,05 semua? mohon pencerahannya pa saya sudah coba menambah variabel tapi hasilnya tetap sama

    1. Bisa jadi semua variable tersebut memang tidak signifikan terhadap nilai Y. Pastikan uji asumsi klasiknya sudah terpenuhi, jumlah datanya banyak dan heterogen, teori pendukungnya kuat.

    2. Avatar linda mira
      linda mira

      assalamualaikum pak, saya ingin bertanya mengenai skripsi saya berjudul perbandingan kinerja perbankan konvensional dan perbankan syariah di indonesia. itu bagaimana menginterpretasi ke regresi logistik ya pak. syaa bingung, terimakasih.

      1. Avatar linda mira
        linda mira

        assalamualaikum pak, saya ingin bertanya mengenai skripsi saya berjudul perbandingan kinerja perbankan konvensional dan perbankan syariah di indonesia menggunakan RGEC pak. itu bagaimana menginterpretasi ke regresi logistik ya pak. syaa bingung, terimakasih

        1. Wa alaikum salam. Biar ga bingung, coba di list dulu apa yang menjadi variabel Y dan variabel Xnya.
          Kemudian tentukan masing masing variabelnya skalanya apa? Dari situ bisa terlihat mau menggunakan analisis apa. Terima kasih

          1. Avatar linda mira
            linda mira

            variabel X = RGEC (risk profile, GCG, Earning, Capital)
            variabel Y = Tingkat Kesehatan bank
            menggunakan Skala ordinal pak, soalnya menentukan bank sangat sehat, cukup sehat, sehat, tidak sehat.. apa benar pak ?
            mohon pencerahannya, Terimakasih

          2. Klo mau pakai regresi logistik, maka variabel y menggunakan skala nominal. Iya dan tidak. Atau dalam hal ini sehat atau tidak sehat. Nanti yang dihitung adalah peluang sebuah bank apakah dia sehat aoa enggak. Kok ngomongin sehat? Banknya kena covid?

          3. Avatar linda mira
            linda mira

            bapak jangan bercanda hehe, oh berarti pakai skala nominal ya pak.. hehe terimakasih pak
            lalu bagaimana mengintrepetasikan ke analisis logistik ya pak..
            soalnya saya bandingkan antara bank syariah sama bank konven sehat yg mana?

        2. Avatar linda mira
          linda mira

          assalamualaikum pak, tolong saya.. saya mau sempro hari senin besok hehe… terimakasih pakk

          1. Saya rasa mbk harus banyak banyak membaca literatur atau skripsi tentang analisis regresi logistik. Kuncinya ya antara bank sehat atau tidak, entah itu syariah atau bukan

  41. selamat pagi mas, saya mau minta pendapat karena masih bingung dg alat analisis. dengan judul skripsi “analisis penerapan prinsip etika bisnis islam dalam strategi bisnis online” menggunakan regresi logistik biner, apakah cocok? minta sarannya ya mas

    1. selamat pagi mbk.. regresi logistik biasanya mengambil data sample dari 2 kelompok. artinya jika analisis ini dilanjutkan, berarti mbak akan mengelompokkan kumpulan bisnis yang beretika dan yang tidak beretika? apakah itu tidak menyulitkan diri sendiri? yang kedua, biasanya regresi itu membahas pengaruh a terhadap b, jika lihat topiknya yang mbak tulis itu tidak memenuhi. strategi bisnis lebih kearah analisis manajemen. namun jika dipaksa harus menggunakan kuantitatif, SEM lebih mendekati karena nantinya akan menggunakan variabel laten terhadap variabel prinsip etika bisnisnya. demikian pendapat saya

  42. Pak Agung, saya mau bertanya saya sedang megolah data pakai spss dengan model regresi logistik.. di option pada regresi logistik di spss saya tidak mencetangkan “include constan in model” agar modelnya menjadi fit apakah tidak apa-apa Pak? terima kasih

    1. Boleh saja… Asal argumennya dapat kenapa konstanta tidak diikutkan. Tidak ada konstanta bisa diartikan hampir tidak ada variabel lain diluar variabel independen yang mempengaruhi dependen.

  43. Avatar Fera Andriana
    Fera Andriana

    Selamat siang pak, saya mau tanya kenapa regresi logistik di penelitian saya hasil sig di variables in the equation tidak signifikan semua?

  44. Assalamualaikum pak, saya ingin bertanya jika hasil hosmer and lemeshow test dibawah 0,05 apa yang harus saya lakukan yaa agar hasil tersebut bisa diatas 0,05?
    terimaksih

    1. Wa alaikum salam mas… Biasanya jika hosmer lemeshow tdk signigikan, r squarednya juga ikut kecil. Maka caranya adalah meningkatkan r squarednya. Terima kasih

      1. Lalu bagaimana caranya kita meningkatkan r squarednya pak?

        1. Sudah sering saya bahas di blog ini mas. Coba telusuri lebih detil lagi.

  45. Selamat malam pak.. Saya ingin menanyakan interpretasi omnimbust test of model coefficient pak, nilai signifikan omnimbust test of model coefficient dilihat pada step, blok atau model ya pak? Adakah kemungkinan nilai sig. Di step blok dan model berbeda pak? Mohon pencerahan ny pak

  46. Sore pak, mau nanya untuk uji multikolinearitas pada regresi logistik kn dilihat dari matriks korelasi dan nilainya harus < 0,9
    apa yang harus dilakukan jika hasilnya diatas 0,9? apakah boleh jika untuk uji multiko dilihat dr tolerance dan vif yang biasa digunakan pada regresi linear berganda? terima kasih.

    1. Saya biasa melihat multikol dari nilai vif baik regresi berganda ataupun regresi logistik. Cara mengatasinya tentu mengeliminasi variabel yang memiliki korelasi yang tinggi

      1. Terima kasih pak

  47. Pagi pak, mau nanya. Ada pertanyaan dari dosen tapi saya belom bisa jawabnya . Alasan nilai alpha bisa 0,25 pada regresi logistik gimana ya? Disini menggunakan metode backward : LR. Terima kasih. Mohon bantuannya pak

    1. Klo bicara alasan, itu tergantung setiap kasus mbak. Tidak bisa disamaratakan. Klo artinya sudah jelas, variabel atau model tidak signifikan atau tidak bagus. Kenapa? Ya perlu dilihat variabel yang dipakai apa saja, kita sedang bahas topik apa, teorinya apa, dll

  48. mau tanya , kalau variabel lebih dari 2, yang digunakan untuk interaksi variabel yang mana ya? untuk perbaiki hosmer

    1. Pertama, gunakan hipotesis berdasarkan teori. Kira kira mana yang bisa dijadikan variabel moderasi. Kedua, biasanya variabel moderasi justru variabel yang tidak signifikan pada persamaan regresi. Ketiga, hindari dummy untuk ditetapkan sebagai variabel moderasi.

  49. Avatar rista

    Malam Pak,
    Hasil reglog saya menunjukkan konstanta bernilai -11,23 untuk y=1 bukan pekerja anak dan y=2 pekerja anak.
    Apakah benar jika konstanta tersebut saya baca demikian
    jika x=0 maka peluang anak menjadi pekerja anak akan kecil?

    1. penjelasan untuk mengartikan koefisien dan konstanta saya rasa sudah ada dalam artikel ya mbk..terima kasih

    2. Avatar rosarina
      rosarina

      mas agung saya ingin bertanya jadi saya sedang menganalisis data regresi logistik juga, namun sepertinya ada yang salah atau gimana, sehingga data saya jika semua saya kategorikan hasilnya untuk salah satu variabel EXP(B)nya 0,000 tp jika tidak EXP(B)nya jau 12840299,3 mas… saya bingung sekali, saya sudah pakai metode backwrd:wald jadi itu hasil akhirnya tp tetap begitu mas…, selanjutnya pakai metode enter juga sama saja, kira2 mas tau gak ya permasalahannya dimana jika hasilnya jdi seperti itu

      1. Sebenarnya jangan anggap itu sebagai masalah. Dipikirkan dulu apakah nilai 0 pada odds ratio masuk akal atau tidak. Jangan jangan memang variabel tersebut tidak ada perbedaan antara nilai 0 dan 1 pada nilai Y. Klo tentang salah operasional atau tidak saya tidak tau, karna saya tidak lihat bagaimana mbk mengoperasionalkan. Hehehehe..

        Saran: perhatikan sebaran nilai pada variabel. Baca artikel saya tentang overfit pada regresi

        1. Avatar rosarina
          rosarina

          sore pak, saya ingin bertanya lagi, jadi saya juga sedang melaksanakan uji survival pak… nah tapi anehnya di uji survival saya muncul seperti ini Warnings
          Since coefficients did not converge, no further models will be fitted. itu kira2 kenapa ya pak, terimakasih banyak pak

          1. Kemungkinan terjadi overfit atau complete separation pada logistik.

  50. Avatar Dessy Siahaan
    Dessy Siahaan

    Selamat sore pak, saya ingin bertanya mengenai interpretasi koefisien parameter. Jika penelitian saya menggunakan 10 variabel prediktor, sementara hanya 2 variabel prediktor yang bersifat kategorik (0 dan 1), ke 8 variabel lainnya bersifat nominal (1, 2, dan 3). Bagaimana cara untuk menginterpretasi koefisien parameter menggunakan odds rationya pak? Terimakasih..

    1. Nominal dengan notasi 1,2, dan 3 belum bisa digunakan diregresi. Maaf mbk, mungkin krna keterbatasan pengetahuan saya. Regresi mengakomodir nilai nominal hanya pada dummy (0, dan 1).
      Beda halnya jika variabelnya ordinal, kemungkinan besar masih bisa dimasukkan karena nilainya bertingkat (1,2,3) misalnya pendidikan sd smp sma. Cara membaca odds ratio di skala ordinal ini: peluang responden yang memiliki pendidikan lebih tinggi senilai odds ratio kali dibandingkan responden yang berpendidikan rendah.
      Terima kasih

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *