Mengenal Dummy Dalam Regression

Variabel dummy dalam regresi sedikit berbeda dengan variabel lainnya baik dalam pengolahan data ataupun saat membaca hasil regression. Regresi linear atau regresi berganda merupakan suatu fungsi yang menjelaskan hubungan varaibel independen dengan variabel dependen. Satu variabel dependen (Y) biasanya dipengaruhi oleh beberapa varaibel independen (X). misalnya variabel produksi dipengaruhi oleh luas lahan, pupuk, jumlah tenaga kerja, modal.

Regresi memiliki beberapa persyaratan yang harus dipenuhi. Karena regresi masuk dalam statistik parametrik, tentunya variabel-variabel didalamnya memiliki skala interval atau rasio. Selain itu data-data yang akan digunakan juga harus memenuhi kaidah asumsi klasik. Tetapi, dari beberapa variable yang kita gunakan, bisa saja satu atau dua variabel tersebut berupa variabel dalam skala nominal atau ordinal. Variabel skala nominal atau ordinal di dalam regression tersebut biasa dikenal sebagai variabel dummy.

Agar lebih gampang dipahami, saya berikan contoh variabel dummy dalam regression. Misalkan saja kita ingin mengetahui pengaruh jenis kelamin terhadap pendapatan yang dibelanjakan ke mall. Kita buat variabel jenis kelamin dengan nilai 0 untuk laki-laki dan 1 untuk perempuan. Contoh lain, pengaruh keikutsertaan petani dalam keanggotaan kelompok tani terhadap pendapatan. Kita buat variabel keikutsertaan kelompok tani dengan nilai 0 untuk petani yang tidak menjadi anggota, dan 1 untuk petani yang menjadi anggota kelompok tani.

Variabel dummy dalam regresi berbeda dengan regresi logistik. variabel skala nominal di regresi logistik terletak di variabel dependen atau nilai Y. sedangkan dummy yang dimaksud disini adalah variabel skala nominal atau ordinal pada variabel independen (nilai X). bisakah dummy di dalam regresi logistik? jawabannya tentu saja bisa.

Pemberian nilai 0 dan 1 juga memiliki tehnik tersendiri. Agar mudah dalam menginterpretasikan hasil output regression, sebaiknya nilai 1 diberikan kepada responden yang diharapkan memiliki pengaruh terhadap nilai Y. Misalnya contoh keanggotaan petani diatas, saya memiliki hipotesis bahwa keanggotaan ini memilikipengaruh terhadap pendapatan petani. Sehingga saya memberikan nilai 1 terhadap petani yang menjadi anggota kelompok tani. Karena nanti hasil koefisien pada variabel ini merupakan pembeda antara petani yang tidak menjadi anggota dan petani yang menjadi anggota kelompok tani. Jika anda memberi nilainya terbalik, sebenarnya tidak ada yang salah, namun besar kemungkinan nilai koefisien yang keluar nantinya bernilai negatif. Tidak ada yang salah dengan hasil perhitungan tersebut, hanya saja anda perlu mengerti cara menjelaskan nilai negatif tersebut.

Saya akan langsung praktekkan penggunaan variabel dummy dalam regresi di aplikasi minitab.

Saya memiliki data latihan yang bisa diunduh disini:

Data tersebut merupakan data rekayasa yang secara random saya peroleh melalui excell. Terdapat 5 variabel independen, dimana salah satunya yakni variabel X2 merupakan variabel dummy dalam regression.

Mari kita buka minitabnya. Saya menggunakan minitab 17.

Kita masukkan datanya di sheet minitab

Kemudian klik stat – regression – regression – fit regression model

Responses kita masukkan variabel Y, continous preditors kita masukkan X1, X3, X4, X5. Sedangkan variabel X2 yang merupakan variabel dummy dalam regression kita masukkan ke categorical predictors

Klik Ok dan tunggu hasilnya..

Terlihat dari model summary, nilai R-sq pada model memiliki nilai 65.09% artinya bahwa 65% data yang diolah mampu dijelaskan oleh model hasil minitab tersebut. Bisa dikatakan bahwa model ini cukup untuk merepresentasikan data yang ada.

Dilihat dari nilai p value, diantara kelima variabel hanya X2 yang memiliki nilai dibawah 0.05. artinya hanya x2 yang signifikan mempengaruhi nilai Y. dilihat dari nilai VIF, variabel X1 dan variabel X4 memiliki nilai diatas 10, artinya kedua variabel tersebut memiliki masalah multikolinear (sudah saya bahas di uji asumsi klasik).

Asumsi saya bahwa output diatas sudah dibenahi sesuai uji asumsi klasik, saya akan menjelaskan output variabel dummy sesuai tema artikel kali ini.

Pada kolom koeffisien nilai 1 pada variabel X2 memiliki nilai 3876. Artinya bahwa responden yang memiliki nilai 1 secara signifikan memiliki 3876 Y yang lebih tinggi daripada responden yang bernilai 0. Hal ini juga bisa diperoleh dari regression equation pada bagian paling bawah, yakni sbb:

Nilai model regresi saat X2 bernilai 0 adalah : 5468 + 2.89X1 – 19.0X3 – 5.74X4 – 1.49X5. sedangkan model regressi saat X2 bernilai 1 adalah : 9344 + 2.89X1 – 19.0X3 – 5.74X4 – 1.49X5. nilai koefisien 3876 diperoleh dari selisih kedua model tersebut dengan asumsi X1, X3 X4 dan X5 memiliki nilai yang sama.

Sehingga dapat disimpulkan variabel X2 yang bernilai 1 memiliki nilai Y 3876 lebih tinggi daripada variabel X2 yang bernilai 0.

Pahami perbedaan pembacaan koefisien regression lainnya. Karena jika variabel tersebut merupakan variabel continous atau skala interval dan rasio, maka koefisien variabel akan dibaca setiap tambahan satu satuan variabel independen akan meningkatkan variabel dependen sebesar nilai koefisien.

Beda minitab, beda pula SPSS. Saya juga berikan langkah di SPSS karena SPSS juga banyak digunakan. Pada SPSS variabel skala nominal dan ordinal sudah dipisahkan sejak pertama kali diinput, sedangkan prosesnya sama seperti anda melakukan regresi berganda atau linear. SPSS akan mengenali variabel dummy tersebut setelah anda memberi keterangan bahwa variabel tersebut berskala nominal.

Mari kita buka SPSS, kemudian copy data ke sheet spss

Pada tab variabel view, saya menandai keterangan pada X2 bahwa variabel tersebut adalah variabel dummy atau berskala nominal. Erhatikan di tabel measure pada gambar dibawah ini

Kemudian klik analyze – regression –linear. Kemudian masukkan Y pada kolom dependen, dan semua variabel X ke dalam kolom independen dan klik OK

Hasilnya adalah sebagai berikut

Hasil yang diperoleh sama dengan hasil yang dikeluarkan oleh minitab. Nilai koefisien bisa anda lihat di tabel koefisien pada kolom B dengan nilai 3876. Namun, SPSS tidak menyediakan model untuk kedua nilai pada X2 seperti yang dikeluarkan oleh minitab.

Sekian dan terima kasih sudah berkunjung.

note: dikarenakan dummy adalah data yang bersifat ordinal atau nominal, biasanya model yang dihasilkan pada regresi memiliki error yang cukup tinggi. maka ada baiknya anda juga memahami bagaimana cara menghitung error model regression tersebut dengan menyimak video di artikel ini.

silahkan temukan video lain terkait regresi pada laman video tutorial di menu blog ini.

308 thoughts on “Mengenal Dummy Dalam Regression

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *