Variabel dummy dalam regresi sedikit berbeda dengan variabel lainnya baik dalam pengolahan data ataupun saat membaca hasil regresi. Regresi linear atau regresi berganda merupakan suatu fungsi yang menjelaskan hubungan varaibel independen dengan variabel dependen. Satu variabel dependen (Y) biasanya dipengaruhi oleh beberapa varaibel independen (X). misalnya variabel produksi dipengaruhi oleh luas lahan, pupuk, jumlah tenaga kerja, modal.

Regresi memiliki beberapa persyaratan yang harus dipenuhi. Karena regresi masuk dalam statistik parametrik, tentunya variabel-variabel didalamnya memiliki skala interval atau rasio. Selain itu data-data yang akan digunakan juga harus memenuhi kaidah asumsi klasik. Tetapi, dari beberapa variable yang kita gunakan, bisa saja satu atau dua variabel tersebut berupa variabel dalam skala nominal atau ordinal. Variabel skala nominal atau ordinal di dalam regresi tersebut biasa dikenal sebagai variabel dummy.

Agar lebih gampang dipahami, saya berikan contoh variabel dummy dalam regresi. Misalkan saja kita ingin mengetahui pengaruh jenis kelamin terhadap pendapatan yang dibelanjakan ke mall. Kita buat variabel jenis kelamin dengan nilai 0 untuk laki-laki dan 1 untuk perempuan. Contoh lain, pengaruh keikutsertaan petani dalam keanggotaan kelompok tani terhadap pendapatan. Kita buat variabel keikutsertaan kelompok tani dengan nilai 0 untuk petani yang tidak menjadi anggota, dan 1 untuk petani yang menjadi anggota kelompok tani.

Variabel dummy dalam regresi berbeda dengan regresi logistik. variabel skala nominal di regresi logistik terletak di variabel dependen atau nilai Y. sedangkan dummy yang dimaksud disini adalah variabel skala nominal atau ordinal pada variabel independen (nilai X). bisakah dummy di dalam regresi logistik? jawabannya tentu saja bisa.

Pemberian nilai 0 dan 1 juga memiliki tehnik tersendiri. Agar mudah dalam menginterpretasikan hasil output regresi, sebaiknya nilai 1 diberikan kepada responden yang diharapkan memiliki pengaruh terhadap nilai Y. Misalnya contoh keanggotaan petani diatas, saya memiliki hipotesis bahwa keanggotaan ini memilikipengaruh terhadap pendapatan petani. Sehingga saya memberikan nilai 1 terhadap petani yang menjadi anggota kelompok tani. Karena nanti hasil koefisien pada variabel ini merupakan pembeda antara petani yang tidak menjadi anggota dan petani yang menjadi anggota kelompok tani. Jika anda memberi nilainya terbalik, sebenarnya tidak ada yang salah, namun besar kemungkinan nilai koefisien yang keluar nantinya bernilai negatif. Tidak ada yang salah dengan hasil perhitungan tersebut, hanya saja anda perlu mengerti cara menjelaskan nilai negatif tersebut.

Saya akan langsung praktekkan penggunaan variabel dummy dalam regresi di aplikasi minitab.

Saya memiliki data latihan yang bisa diunduh disini. Data tersebut merupakan data rekayasa yang secara random saya peroleh melalui excell. Terdapat 5 variabel independen, dimana salah satunya yakni variabel X2 merupakan variabel dummy dalam regresi.

Mari kita buka minitabnya. Saya menggunakan minitab 17.

Kita masukkan datanya di sheet minitab

Kemudian klik stat – regression – regression – fit regression model

Responses kita masukkan variabel Y, continous preditors kita masukkan X1, X3, X4, X5. Sedangkan variabel X2 yang merupakan variabel dummy dalam regresi kita masukkan ke categorical predictors

Klik Ok dan tunggu hasilnya..

Terlihat dari model summary, nilai R-sq pada model memiliki nilai 65.09% artinya bahwa 65% data yang diolah mampu dijelaskan oleh model hasil minitab tersebut. Bisa dikatakan bahwa model ini cukup untuk merepresentasikan data yang ada.

Dilihat dari nilai p value, diantara kelima variabel hanya X2 yang memiliki nilai dibawah 0.05. artinya hanya x2 yang signifikan mempengaruhi nilai Y. dilihat dari nilai VIF, variabel X1 dan variabel X4 memiliki nilai diatas 10, artinya kedua variabel tersebut memiliki masalah multikolinear (sudah saya bahas di uji asumsi klasik).

Asumsi saya bahwa output diatas sudah dibenahi sesuai uji asumsi klasik, saya akan menjelaskan output variabel dummy sesuai tema artikel kali ini.

Pada kolom koeffisien nilai 1 pada variabel X2 memiliki nilai 3876. Artinya bahwa responden yang memiliki nilai 1 secara signifikan memiliki 3876 Y yang lebih tinggi daripada responden yang bernilai 0. Hal ini juga bisa diperoleh dari regression equation pada bagian paling bawah, yakni sbb:

Nilai model regresi saat X2 bernilai 0 adalah : 5468 + 2.89X1 – 19.0X3 – 5.74X4 – 1.49X5. sedangkan model regressi saat X2 bernilai 1 adalah : 9344 + 2.89X1 – 19.0X3 – 5.74X4 – 1.49X5. nilai koefisien 3876 diperoleh dari selisih kedua model tersebut dengan asumsi X1, X3 X4 dan X5 memiliki nilai yang sama.

Sehingga dapat disimpulkan variabel X2 yang bernilai 1 memiliki nilai Y 3876 lebih tinggi daripada variabel X2 yang bernilai 0.

Pahami perbedaan pembacaan koefisien regresi lainnya. Karena jika variabel tersebut merupakan variabel continous atau skala interval dan rasio, maka koefisien variabel akan dibaca setiap tambahan satu satuan variabel independen akan meningkatkan variabel dependen sebesar nilai koefisien.

Beda minitab, beda pula SPSS. Saya juga berikan langkah di SPSS karena SPSS juga banyak digunakan. Pada SPSS variabel skala nominal dan ordinal sudah dipisahkan sejak pertama kali diinput, sedangkan prosesnya sama seperti anda melakukan regresi berganda atau linear. SPSS akan mengenali variabel dummy tersebut setelah anda memberi keterangan bahwa variabel tersebut berskala nominal.

Mari kita buka SPSS, kemudian copy data ke sheet spss

Pada tab variabel view, saya menandai keterangan pada X2 bahwa variabel tersebut adalah variabel dummy atau berskala nominal. Erhatikan di tabel measure pada gambar dibawah ini

Kemudian klik analyze – regression –linear. Kemudian masukkan Y pada kolom dependen, dan semua variabel X ke dalam kolom independen dan klik OK

Hasilnya adalah sebagai berikut

Hasil yang diperoleh sama dengan hasil yang dikeluarkan oleh minitab. Nilai koefisien bisa anda lihat di tabel koefisien pada kolom B dengan nilai 3876. Namun, SPSS tidak menyediakan model untuk kedua nilai pada X2 seperti yang dikeluarkan oleh minitab.

Sekian dan terima kasih sudah berkunjung.

Peneliti bidang sosial ekonomi pertanian. Pernah bekerja di bidang supply chain. Detil info silahkan kunjungi laman about me.

Join the Conversation

267 Comments

Leave a Reply to Afifah Cancel reply

Your email address will not be published. Required fields are marked *

  1. mau nanya lagi, variabel y saya ini pengungkapan csr, cara mengetahuinya dengan angka 1 untuk mengungkapkan 0 untuk tidak dan ada rumusnya dimana jumlah total yang diungkapkan dibagi dengan jumlah itemnya. contoh yang diungkapkan 50 jumlah item 91 jadi (50/91) nah pertanyaannya ini skala pengukurannya apa ya apakah rasio atau nominal dan pengujianya apakah menggunakan regresi berganda atau logistik, terimakasih

  2. jadi apakah boleh menggunakan variabel dummy lebih dari 1 dalam sebuah penelitian. misal ada 4 variabel x ada 2 variabel dummynya. dan apa nanti pengaruhnya saat dalam pengujian di regresi.
    terimakasih

  3. Apakah dengan independen berupa dummy dan dependen juga berupa dummy bisa diolah dengan regresi logistik?

    1. Variabel dummy gambarannya adalah variabel independen yang berpengaruh langsung terhadap variabel dependen. Skalanya hanya nominal.

      Variabel moderasi gambarannya adalah variabel independen yang berpengaruh langsung dan bisa menjadi jembatan atau penghubung bagi variabel independen lain yang berpengaruh tidak langsung terhadap dependen variabel.
      Skalanya bisa nominal sampai rasio.

      Terima kasih

  4. Selamat pagi pak, izin bertanya. Saya sedang melakukan penelitian skripsi dengan regresi logistik karna y saya merupakan variabel dummy. Saya menggunakan 5 variabel x (3 rasio dan 2 dummy) dan 1 variabel moderasi (rasio). Dalam skripsi saya, variabel moderasi digunakan langsung pada 5variabel x saya pak. Yang ingin saya tanyakan, apakah bisa dilakukan perhitungan var moderasi apabila saya memiliki 2 var x dengan skala dummy?

    1. dummy sebaiknya tidak digunakan moderasi. karna akan menghabiskan variabel lainnya yang mungkin bukan dummy. bayangkan saja, variabel dengan skala rasio akan berubah menjadi dummy karena moderasinya dummy. sayang kan?

  5. Assalamualaikum, pak.
    Saya sedang melakukan tugas akhir skripsi dalam bidang manajemen keuangan, dengan profitabilitas sebagai variabel X (rasio), nilai perusahaan sebagai variabel Y (rasio), dan kebijakan dividen sebagai variabel intervening (dummy). Pada uji normalitas data saya tidak normal, kemudian saya transformasi lg10 menjadi normal (pada uji normalitas variabel dummy ini tidak diikut sertakan).
    Pertanyaan saya yaitu pada uji asumsi klasik selanjutnya (multiko, hetero, autokorelasi, dan linearitas) apakah variabel dummy ini di transform juga atau tidak yah pak?

    1. Menggunakan data yang sudah valid pada uji sebelumnya. Jika diuji normalitas ditransform, maka uji asumsi klasik yang lainnya pun menggunakan data yang telah ditransform. Terima kasih

      1. Pada mengobati uji autokorelasi, apakah variabel dummy ikut di transform cochrane orcutt juga atau tidak yah pak?

  6. Pertanyaan lanjutan saya adakah buku referensi yang bisa saya gunakan sebagai rujukan untuk melakukan regresi linier sederhana dengan salah satu variabel dummy dan uji asumsi klasiknya ..terima kasih bantuan pencerahannya om