Mengenal Dummy Dalam Regresi

Posted on

Variabel dummy dalam regresi sedikit berbeda dengan variabel lainnya baik dalam pengolahan data ataupun saat membaca hasil regresi. Regresi linear atau regresi berganda merupakan suatu fungsi yang menjelaskan hubungan varaibel independen dengan variabel dependen. Satu variabel dependen (Y) biasanya dipengaruhi oleh beberapa varaibel independen (X). misalnya variabel produksi dipengaruhi oleh luas lahan, pupuk, jumlah tenaga kerja, modal.

Regresi memiliki beberapa persyaratan yang harus dipenuhi. Karena regresi masuk dalam statistik parametrik, tentunya variabel-variabel didalamnya memiliki skala interval atau rasio. Selain itu data-data yang akan digunakan juga harus memenuhi kaidah asumsi klasik. Tetapi, dari beberapa variable yang kita gunakan, bisa saja satu atau dua variabel tersebut berupa variabel dalam skala nominal atau ordinal. Variabel skala nominal atau ordinal di dalam regresi tersebut biasa dikenal sebagai variabel dummy.

Agar lebih gampang dipahami, saya berikan contoh variabel dummy dalam regresi. Misalkan saja kita ingin mengetahui pengaruh jenis kelamin terhadap pendapatan yang dibelanjakan ke mall. Kita buat variabel jenis kelamin dengan nilai 0 untuk laki-laki dan 1 untuk perempuan. Contoh lain, pengaruh keikutsertaan petani dalam keanggotaan kelompok tani terhadap pendapatan. Kita buat variabel keikutsertaan kelompok tani dengan nilai 0 untuk petani yang tidak menjadi anggota, dan 1 untuk petani yang menjadi anggota kelompok tani.

Variabel dummy dalam regresi berbeda dengan regresi logistik. variabel skala nominal di regresi logistik terletak di variabel dependen atau nilai Y. sedangkan dummy yang dimaksud disini adalah variabel skala nominal atau ordinal pada variabel independen (nilai X). bisakah dummy di dalam regresi logistik? jawabannya tentu saja bisa.

Pemberian nilai 0 dan 1 juga memiliki tehnik tersendiri. Agar mudah dalam menginterpretasikan hasil output regresi, sebaiknya nilai 1 diberikan kepada responden yang diharapkan memiliki pengaruh terhadap nilai Y. Misalnya contoh keanggotaan petani diatas, saya memiliki hipotesis bahwa keanggotaan ini memilikipengaruh terhadap pendapatan petani. Sehingga saya memberikan nilai 1 terhadap petani yang menjadi anggota kelompok tani. Karena nanti hasil koefisien pada variabel ini merupakan pembeda antara petani yang tidak menjadi anggota dan petani yang menjadi anggota kelompok tani. Jika anda memberi nilainya terbalik, sebenarnya tidak ada yang salah, namun besar kemungkinan nilai koefisien yang keluar nantinya bernilai negatif. Tidak ada yang salah dengan hasil perhitungan tersebut, hanya saja anda perlu mengerti cara menjelaskan nilai negatif tersebut.

Saya akan langsung praktekkan penggunaan variabel dummy dalam regresi di aplikasi minitab.

Saya memiliki data latihan yang bisa diunduh disini. Data tersebut merupakan data rekayasa yang secara random saya peroleh melalui excell. Terdapat 5 variabel independen, dimana salah satunya yakni variabel X2 merupakan variabel dummy dalam regresi.

Mari kita buka minitabnya. Saya menggunakan minitab 17.

Kita masukkan datanya di sheet minitab

Kemudian klik stat – regression – regression – fit regression model

Responses kita masukkan variabel Y, continous preditors kita masukkan X1, X3, X4, X5. Sedangkan variabel X2 yang merupakan variabel dummy dalam regresi kita masukkan ke categorical predictors

Klik Ok dan tunggu hasilnya..

Terlihat dari model summary, nilai R-sq pada model memiliki nilai 65.09% artinya bahwa 65% data yang diolah mampu dijelaskan oleh model hasil minitab tersebut. Bisa dikatakan bahwa model ini cukup untuk merepresentasikan data yang ada.

Dilihat dari nilai p value, diantara kelima variabel hanya X2 yang memiliki nilai dibawah 0.05. artinya hanya x2 yang signifikan mempengaruhi nilai Y. dilihat dari nilai VIF, variabel X1 dan variabel X4 memiliki nilai diatas 10, artinya kedua variabel tersebut memiliki masalah multikolinear (sudah saya bahas di uji asumsi klasik).

Asumsi saya bahwa output diatas sudah dibenahi sesuai uji asumsi klasik, saya akan menjelaskan output variabel dummy sesuai tema artikel kali ini.

Pada kolom koeffisien nilai 1 pada variabel X2 memiliki nilai 3876. Artinya bahwa responden yang memiliki nilai 1 secara signifikan memiliki 3876 Y yang lebih tinggi daripada responden yang bernilai 0. Hal ini juga bisa diperoleh dari regression equation pada bagian paling bawah, yakni sbb:

Nilai model regresi saat X2 bernilai 0 adalah : 5468 + 2.89X1 – 19.0X3 – 5.74X4 – 1.49X5. sedangkan model regressi saat X2 bernilai 1 adalah : 9344 + 2.89X1 – 19.0X3 – 5.74X4 – 1.49X5. nilai koefisien 3876 diperoleh dari selisih kedua model tersebut dengan asumsi X1, X3 X4 dan X5 memiliki nilai yang sama.

Sehingga dapat disimpulkan variabel X2 yang bernilai 1 memiliki nilai Y 3876 lebih tinggi daripada variabel X2 yang bernilai 0.

Pahami perbedaan pembacaan koefisien regresi lainnya. Karena jika variabel tersebut merupakan variabel continous atau skala interval dan rasio, maka koefisien variabel akan dibaca setiap tambahan satu satuan variabel independen akan meningkatkan variabel dependen sebesar nilai koefisien.

Beda minitab, beda pula SPSS. Saya juga berikan langkah di SPSS karena SPSS juga banyak digunakan. Pada SPSS variabel skala nominal dan ordinal sudah dipisahkan sejak pertama kali diinput, sedangkan prosesnya sama seperti anda melakukan regresi berganda atau linear. SPSS akan mengenali variabel dummy tersebut setelah anda memberi keterangan bahwa variabel tersebut berskala nominal.

Mari kita buka SPSS, kemudian copy data ke sheet spss

Pada tab variabel view, saya menandai keterangan pada X2 bahwa variabel tersebut adalah variabel dummy atau berskala nominal. Erhatikan di tabel measure pada gambar dibawah ini

Kemudian klik analyze – regression –linear. Kemudian masukkan Y pada kolom dependen, dan semua variabel X ke dalam kolom independen dan klik OK

Hasilnya adalah sebagai berikut

Hasil yang diperoleh sama dengan hasil yang dikeluarkan oleh minitab. Nilai koefisien bisa anda lihat di tabel koefisien pada kolom B dengan nilai 3876. Namun, SPSS tidak menyediakan model untuk kedua nilai pada X2 seperti yang dikeluarkan oleh minitab.

Sekian dan terima kasih sudah berkunjung.

Gravatar Image
Menjadi blogger untuk bisa memperluas pengetahuan, belajar, banyak teman serta menjadi sarana penyaluran hobi.

99 thoughts on “Mengenal Dummy Dalam Regresi

  1. maaf pak sblmnya, saya saat ini sedang dalam proses skripsi, y saya Ketepatan Waktu Pelaporan Keuangan (dummy) dg 6 x yaitu profitabilitas, Leverage, ukuran perusahaan, kualitas Kap (dummy), opini audit (dummy) , dan likuiditas. nah dsini saya mau tnya beberapa hal pak:
    1) karena mengetahui y saya adalah dummy, saya memilih memakai regresi logistik, sehingga apakah benar jika memakai reg. logistik itu tidak perlu uji asumsi klasik, dan langsung uji t, f, dan r kuadrat?
    2) bentuk persamaan regresi logistik itu apa beda dengan persamaan dlm regresi linier? bentuk nya langsung Y=… atau Y nya dalam bentuk lain sperti per per gitu?

    1. Iya mbk yona… saya maafkan.
      Sebaiknya mbak baca artikel di blog ini yang berjudul “semua tentang regresi logistik” dulu deh..

      Semoga mencerahkan..terima kasih

  2. Selamat sore, pak saya mohon jawabannya.

    Saya melakukan penelitian dengan judul X1 (dummy), X2 (Dummy), Y1 (scala likert) Y2 interverning (Nominal). Saya melakukan uji normalitas dan hasilnya tidak normal. Kira dengan variabel seperti itu apakah memerlukan uji asumsi klasik? dan jika saya menggunakan analisis jalur apakah bisa pak?

    1. uji normalitas merupakan uji asumsi klasik yang berarti syarat untuk regresi berganda. jadi tetap digunakan. analisis jalur bisa juga jika memenuhi syarat..

  3. Permisi pak, mau tanya, salah satu variabel independen saya menggunakan variabel dummy, apakah setelah uji regresi berganda bisa dilanjut dengan uji korelasi parsial dengan variabel kontrol njih?

  4. Permisi pak, saya mau menanyakan perihal uji normalitas pada variabel dummy
    Variabel X saya Profitabilitas, Likuiditas dan Ukuran Perusahaan
    Sedangkan variabel Y saya Ketepatan Waktu
    sudah saya lakukan uji normalitas namun hasilnya data tidak normal
    sudah dilakukan transform dan outlier tapi hasil masih tetap
    Mohon pencerahannya
    Terima Kasih.

    1. Karna variabel independennya semua dummy, jadi agak susah karna kita tdk bisa melakukan transformasi unliniear. Satu satunya jalan untuk dummy seperti ini adalah menambah atau mengeliminasi mbk.. terima kasih

      1. variabel independennya bukan variabel dummy pak (Profitabilitas, Likuiditas dan Ukuran Perusahaan (LnTotalAsset)
        hanya variabel dependennya yang dummy (Ketepatan Waktu, Tepat Waktu=1 dan Tidak Tepat Waktu=0)
        Sudah dilakukan outlier tapi belum normal pak
        Mohon pencerahannya dan maaf merepotkan sebelumnya
        Terima Kasih

        1. dicoba untuk “disetrika” dulu datanya mbk. coba search artikel tehnik setrika data regresi di blog ini. bisa juga coba dianalisis parsial dulu satu persatu variabelnya, dilihat variabel mana yang layak untuk “diperhatikan lebih”. terima kasih

  5. Selamat siang pak, mau izin bertanya.. bagaimana jika variabel independen saya merupakan variabel dummy dengan nilai 1 dan 0 ,dimana juga ada variabel moderasinya. apabila menggunakan uji interaksi maka kan harus dikalikan sehingga nanti ada nilai 0 nya.. apakah uji interaksi dengan menggunakan MRA sudah sesuai ataukah harus menggunakan teknik analisis lainnya? terimakasih

    1. Itulah pentingnya kita harus mengenal jenis jenis variabel. Jika variabelnya berskala nominal (dalam hal ini dummy) tentu tidak bisa dilakukan pengoperasian karna nilai dalam variabel tersebut berfungsi sebagai simbol, tidak bisa dilakukan perbandingan. Sehingga jelaslah tidak bisa dilakukan moderasi.

      Solusinya ubah skala variabelnya terlebih dahulu minimal ke tingkat ordinal.

  6. selamat siang pak, saya mau bertanya terkait penelitian saya.
    salah satu variabel independen yang saya gunakan adalah variabel dummy deng tipe nominal. saya mengolah dengan SPSS. pertama kali olah data tidak berdistribusi normal sehingga saya mengambil tindakan untuk mengeluarkan outlier dari data saya. lalu percobaan kedua masih tidak berdistribusi normal, lalu saya coba dengan me log kan semua variabel yang saya punya (saya tidak tahu apakah variabel dummy juga ikut di log atau tidak). lalu saat saya olah kembali di percobaan ketiga dan data berdistribusi normal namun terdapat autokorelasi, sehingga saya harus menyembuhkannya. lalu saya coba untuk olah kembali pada percobaan keempat dan sudah lolos semua asumsi klasik. namun pada percobaan keempat ini mengapa variabel dummy saya hilang ya pak di hasil/output dari olah data? jadinya hanya muncul hasil olahan untuk 3 variabel rasio, padahal saat saya melakukan uji regresi linear, saya sudah input variabel dummy yang sudah saya sembuhkan dari sakit autokol ke variabel independen.

    mohon bantuannya ya pak.

    1. mbak juvenia pratama, jika kasus begini sebaiknya mbak ikut bimbingan statistik. nanti saya lihat dulu datanya. saya tidak bisa menjelaskan tanpa menjumpai datanya langsung. terima kasih

  7. Selamat pagi pak saya mau tanya,
    Saya sedang mengerjakan skripsi tentang perbandingan dua toko
    Dengan Y minat beli, X (kualitas, promosi,lokasi,brand image)
    Sebelumnya saya pakai rumus linier berganda (y : a+x1b1+x2b2……+e)
    Lalu disuruh dosen saya menggunakan dummy, pertanyaan nya rumus dummy yang harus saya tulis bagaimana? Karena emang sebelumnya saya nggak pernah pakai rumus dummy, terimakasih

    1. Selamat pagi mbk… mungkin maksud dosen mbk itu adalah menggunakan regresi logistik. Sbelumnya saya tanya dahulu, nilai Y (minat atau tidak) skala variabelnya apa ya?

      Akan menarik jika nilai Y nya berbentuk dummy (0 dan 1, minat atau tidak). Kemudian nantinya yang dibahas adalah peluang.

      Soal rumus, silahkan lihat artikel saya tentang regresi logistik.

      Terima kasih

  8. Selamat malam pak, saya mau tanya kalau variabel indepen saya X1(rumus), X2 (dummy) , dependen (rumus/ratio) , untuk uji nya saya menggunakan apa ya ? Apa uji asumsi klasik? Atau uji logistik ? Terimakasih

    1. selamat pagi mbk..penggunaan regresi logistik atau tidak itu tergantung dari jenis variabel dependennya. jika dilihat, variabel dependen yang mbk miliki adalah ratio. berarti menggunakan regresi berganda. uji asumsi klasik itu uji sebelum regresi dilakukan untuk mengetahui apakah data memenuhi syarat atau tidak. terima kasih

  9. selamat malam pak, saya mau bertanya apabila skala variabel x1 (nominal), x2 (rasio0, x3 (rasio), dan variabel Y (rasio). apakah boleh menggunakan regresi logistik? pengujiannya bagaimana?
    apabila memakai regresi berganda, untuk pengujian nya bagaimana?
    terimakasih pak sebelumnya

      1. Pak mau tanya saya sedang mengerjakan skripsi tentang analisis rasio untuk prediksi financial distress untuk variabel independen saya rasio
        Apakah menggunakan regresi logistik?

        1. mbak fira sebaiknya banyak membaca lagi tentang apa itu regresi logistik.. 🙂 jika variabel dependennya berupa dummy variabel (yes/no) maka bisa menggunakan regresi logistik

  10. Selamat pagi pak Agung,

    terima kasih atas artikelnya, saya sedang skripsi dan menggunakan 4 variabel independen antara lain laba/rugi perusahaan (dummy), ukuran perusahaan (Log), opini auidt (dummy) dan konvergensi IFRS (dummy)
    tetapi variabel dependent saya audit delay tidka menggunakan variabel dummy

    sebaiknya saya menggunakan analisis & uji apa saja ya pak?

    mohon pencerahannya..
    terimakasih

        1. Bisa mbk..tapi mmg sebaiknya variabel independennya ditambah yang bukan dummy. Pengaruhnya nanti di signifikansi outputnya. Jgn jadikan dummy sbgai faktor utama di var. Independen

    1. Selamat sore mas faisal. Begitu mas tanya dummy dalam ECM kening saya langsung berkerut. Setau saya ECM kaitannya dengan data time series dan kaitannya dengan stasioner data.
      Lalu bagaimana posisi dummynya?

      Tapi saya pikir jgn dilihat dummy nya saja. Tergantung dari variabel independen yang lain. Silahkan baca artikel jurnal yang berjudul
      Analisis makro kinerja pasar modal indonesia dengan pendekatan error correction model.saya rasa contohnya jelas disana

      Terima kasih.

  11. selamat malam pak agung, saya ingin bertanya. saya sedang mengerjakan skripsi dengan menggunakan data panel dengan metode (least square dummy variable) lsdv tetapi dummy yang saya gunakan adalah time dummy. nah pengunaan time dummy ini kegunaannya apa ya pak ? terima kasih pak.

    1. Selamat malam mas teddy… time dummy sebenarnya sama dengan dummy dummy yang lain. Isinya 0 dan 1. Biasanya untuk menekankan apakah ada pengaruh yang berbeda antra tahun atau periode tahun tertentu dengan periode tahun yang lainnya. Misal periode tahun 1990 sampai 2000 diberi kode 1. Periode tahun lainnya diberi kode 0.

      Kegunaannya seperti yang saya sebutkan tadi. Untuk mengetahui apakah ada pengaruh yg kuat atau tidak di periode tahun yang ditentukan?. Contoh kasus: trending fashion, atau teknologi, dsb.

      Terima kasih..

  12. assalamualaikum bapak punten saya mau nanya. saya sedang melakukan skripsi dan dalam judul saya terdapat variabel x (dummy) dan y (skala likert)

    pertanyaan saya:
    variabel saya terdpaat beberapa indikator yaitu
    jenis kelamin
    umur
    oendapatan
    pendidikan

    apakah variabel x berpengaruh thd Y secara simultan.
    akan tetapi saya masih rancu uji apa yg harus saya gunakan. apakah saya juga harus melakukan uji normalitas utk variabel X? terima kasih pak

    1. mbak adinda jelaskan dulu karakteristik variabel y, karena ini juga menentukan penggunaan alat analisisnya. diatas hanya dijelaskan y skala likert tanpa tau variabel apa.
      pertanyaan apakah x dan Y berpengaruh secara simultan? tentu tergantung dengan teori dan hipotesis yang digunakan. uji normalitas tentu digunakan untuk variabel yng bersifat parametrik (skala interval dan rasio).

      1. punten bapa saya nanya lagi
        jadi, penelitian saya meneliti pengaruh X terhadap Y.
        dimana X (sociodemographics):
        1. jenis kelamin: (laki/perempuan)
        2. penghasilan: (option 1: <2jt, option 2: 2jt-5jt, option 3: 5jt-10jt, dsb)
        3. usia: (option 1: 16-20th, option 2: 21-25th, option 3: 26-30th)
        4. pendidikan (SD/SMP/SMA/S1/S2/S3)

        sedangkan variabel Y (kegiatan online) pada kuesioner dengan option seberapa sering anda melakukan…. dengan skala pengukuran likert 1-5
        1. transaksi finansial
        2. penggunaan di waktu luang
        3. hiburan
        4. informasi
        dsb.

        kira2 bgm ya pak utk variabel Y nya bagaimana saya menguji validitasnya? dan utk normalitasnya? serta teknik analisis apa yg saya gunakan? terima kasih banyak ya pak saya buntu setwlah nanya kesana kemari

        1. Maaf mbk adinda..regresi dengan macam seperti sepertinya blm ada. Regresi logistik nilai Y nya hanya 2 kategori (ya dan tidak). Tidak sampai ada 4 kategori seperti ini.

          Lebih baik variabel y dikonversi dengan mengubah pertanyaan apakah anda menggunakan media online setiap harinya? Atau pertanyaan lain yg Artinya variabel y dikonversi hanya 2 kategori ya dan tidak. Klo seperti ini nanti mbk gunakan regresi logistik.

          Cara lain, variabel y dimasukkan menjadi variabel x. Nanti variabel y yang sebenarnya menggunakan variabel laten. Baca artikel saya tentang perbedaan regresi, path, dan sem. Nantinya alat analisisnya menggunakan SEM.

          Terima kasih

  13. Selamat malam pak, saya ingin bertanya,
    Saya melakukan uji spss regresi logistik, variabel x ada 3(skala,skala,dummy), variabel y (dummy), pda saat uji multikol, hasil di tabel coefficients hanya muncul 2 variabel yg skala, variabel dummy tidak muncul, dan ada warning”for model with dependen variabel timeliness, the following variabel are constants or have missing correlation:opini. They will be delete from analysis” variabel yg tidak muncul yaitu x (opini;dummy) dan y (timeliness;dummy).
    Penyebab variabel dummy tersebut tidak muncul apa ya?

    1. ini terjadi hanya saat uji multikol ya mbak? perlu diketahui uji multikol hanya untuk variabel dependennya saja, jadi variabel Ynya tidak perlu diikutkan. karena multikol ingin melihat adanya hubungan antar variabel dependen. kemudian untuk variabel dummy, memang bisa terjadi seperti itu karena nilai variabel dummy tidak variatif (hanya 0 dan 1). untuk mengetahui apakah ada korelasi antar dummy dan variabel skala lainnya, coba gunakan analisis korelasi, spearman misalnya.

      terima kasih

    1. mbk gita, jika variabel dummynya pada variabel dependen, maka nama analisisnya regresi logistik. silahkan dicari artikel tentang regresi logistik ya… terima kasih..

  14. Selamat Malam Pak,

    maaf sebelumnya, artikel bapak cukup bisa dimengerti, hanya saja saya masih sedikit bingung dan ingin memastikan.

    penelitian saya variabel x ada 4 dimana 3 rasio, 1 dummy, ada 1 variabel moderating (rasio), variabel Y (rasio).

    berarti tdk perlu uji logistik ya Pak? karena variabel Y saya bukan dummy.

    berarti saya bisa melakukan uji regresi di spss yang dimana perlakukan nya sama dengan jika smua variabel x,y,z (moderating) nya rasio?

    mohon bimbingannya Pak,

    terima kasih

    1. Selamat malam mbk. Penentuan berapa variabel independen biasanya tergantung teori yang digunakan. Jika teori atau landasannya kuat, maka tidak masalaj jika hanya satu variabel dan itu dummy. Pertanyaannya adalah apakah nanti akan valid dan memperoleh model yang baik?
      Karna jika variabel yg banyak akan memiliki peluang mendapatkan r square yang baik. Baca artikel saya tentang perbedaan r square, r square adjusted, dan r square predicted.

      Terima kasih

  15. Selamat siang pak, mohon pencerahannya
    Saya sedang membuat skripsi, di variabel independen menggunakan dummy. X1 2 kategori, X2 4 kategori, X3 3 katefori, x 4 3 kategori dan x5 2 kategori. Variabel Y berskala scale. Pertanyaan saya,perlu tidak melakukan uji asumsi klasik dan menginterpretasikan hasil uji regresi nya?

    1. selamat siang mas..sebelumnya saya mau meluruskan bahwa dummy itu menggunakan kode biner (0 dan 1), jadi variabel dummy hanya ada 2 kategory, 0 dan 1. jika lebih, bukan dummy lagi, melainkan variabel dengan skala ordinal, misalnya skala likert (0 sd. 5). tapi masalahnya adalah jika ternyata variabel tersebut sebenarnya variabel nominal yang terdiri lebih dari 2 kategori. maka memang benar dibuat dummy hanya nanti variabelnya lebih dari 1. jika kategorinya ada 3, setidaknya nanti membutuhkan dua variabel dummy. ini sbenarnya akan menjadi pembahsan sendri.

      jadi, perlu diluruskan lagi variabel X2 sampai x4 punya mas denny ya… sedangkan uji asumsi klasik menurut saya setidaknya mas perlu lakukan heterokedastisitas dan uji multikolinear. heterokedastisitas untuk menghindari regresi overfit, sedangkan multikolinear untuk menghindari adanya multivariabel yang menunjukkan parameter yang sama. silahkan membaca lebih detilnya lagi di uji asumsi klasik blog ini.

      terimakasih,. semoga tercerahkan

      1. oh iya..heterokedastisidas untuk dummy berbeda caranya dengan variabel skala numerik. karena dummy hanya bernilai 0 dan 1, maka biasanya yang dihitung adalah proporsi nilai 1 dan 0 dari keseluruhan. lebih baik jika keduanya balance. makin kecil proporsi salah satu nilainya, maka model sulit melakukan prediksi

  16. Hai, pak agung. terima kasih untuk konten yang telah pak agung buat. konten ini sangat membantu. namun saya memiliki pertanyaan, bagaimana cara mengatasi variabel dummy yang menyebabkan near singular matrix pada eviews, saat mencoba model fixed effect pada regresi data panel? terlebih jika variabel dummy tersebut merupakan variabel moderasi yang digunakan untuk menguji apakah variabel dummy tersebut menguatkan atau memperlemah hasil penelitian?

    1. permasalahannya adalah karena fixed effect juga secara otomatis akan membuat dummy, dan kemungkinan dummy yang terbentuk mirip atau mendekati pola dummy yang mas faisal tambahkan. sehingga terjadi near singular matrix tersebut. sebenarnya kemungkinan besar jika dummy-nya dihilangkan tidak terjadi demikian. namun karena dummy tersebut variabel penting, maka untuk membuktikan hipotesis bahwa dummy tersebut (yang merupakan variabel moderasi) menguatkan atau melemahkan, cukup menggunakan regresi linear berganda saja. Terima Kasih

  17. Selamat pagi, pak. Saya ingin bertanya, apakah uji heteroskedastisitas dalam uji asumsi klasik regresi linier berganda harus dilakukan terhadap variabel dummy?

  18. selamat pagi pak agung, saya mau bertanya jika variabel Y (dummy) dan salah satu dari variabel X (dummy), sebaiknya saya menggunakan metode regresi apa..?

    terima kasih

      1. terima kasih pak untuk jawabannya…saya juga menggunakan variabel moderating dalam penelitian saya, nah jika salah satu variabel independent (dummy) dan variabel moderating (rasio) itu menghitungnya bagaimana, sedangkan yang saya ketahui apabila ada variabel moderating itu harus dikalikan antara variabel independen sama variabel moderating

        terima kasih pak

        1. Data dengan skala nominal tidak bisa dilakukan kalkulasi seperti itu mbk.. jadi variabel dummynya harus di konvert ke skala interval atau ordinal terlebih dahulu.

          1. Bagaimana cara mengconvert.nya pak…??
            misalkan variabel independen (dummy) nilainya 0 dan 1
            sedangkan variabel moderatingnya misalkan (0,45 0,35 0,8)
            seperti itu..

          2. Variable moderasinya berasal dari perkalian variabel rasio dan dummy. Permasalahannya ada di dummynya.. hanya peneliti yang menangani langsung yang bisa mngkonvertnya.. krna misal begini… pertanyaan ya dan tidak dikonvert menjadi skala likert misalnya.. pertanyaan status pekerjaan dikonvert menjadi besarnya penghasilan.

            Jadi variabel nominal ke ordinal atau interval lbh sulit drpada sebaliknya krna harus manual

    1. Selamat sore mbk nabilah..jika mendengar variabel kontrol pertama saya membayangkan adalah rancob (rancangan percobaan). Jika iya, maka konteksnya sudah berbeda, tdk bisa menggunakan regresi.

      Tapi jika konteks yang lain..misalnya variabel moderasi, itu bisa saja.terima kasih

  19. Selamat sore Pak saya ingin bertanya
    jika saya menggunakan variabel dummy untuk menjadi variabel moderasi dan ternyata hasil uji asumsi klasik terjadi multikol bagaimana cara mengatasinya?
    nb : variabel dummy saya menggunakan 4 kriteria

    1. selamat sore mas.. variabel moderasi memang masalahnya ada di multikolinear. karena variabel moderasi sendiri merupakan variabel yang menguatkan ata melemahkan variabel independen. terlebih lagi jika mas menggunakan variabel interaksi, sudah pasti punya hub kuat dengan nilai X nya. sebenarnya variabel moderasi dengan data kategorik lebih tepat menggunakan SEM ketimbang regresi mas. namun jika memang harus menggunakan regresi, maka perlu diketahui variabel mana saja yang memiliki hub kuat yang selanjutnya harus dieliminasi dengan alasan kedua variabel tersebut mewakili data yang sama. terima kasih

      1. Selamat siang Pak, terima kasih untuk jawaban sebelumnya
        untuk SEM dapat digunakan aplikasi apa ya Pak? dan apakah ada artikel Bapak yang membahas seputar SEM?

        1. Saya pernah menggunakan lisrel (nama software) untuk memproses SEM. tapi mohon maaf mas, dalam waktu dekat sepertinya saya belum membahas tentang SEM, dan saya belum menulis tentang SEM atau lisrel. mas googling dulu dan mencari di blog yang lain. terima kasih.

  20. Assalamualaikum pak saya mau bertanyaa . Sayaa sdh mengolah variabel dummy dengan aplikasi spss. Dan pada kolom koefisien regresi dummy saya bertanda negatif . Bagaimanaa saya menginterpretasikannya pak ? Dan bagaimnaaa mengetahui selisih antara dummy tersebut??

    1. wa alaikum salam mbk ardah. arti dari tanda negatif pada koefisien dummy yang mbk lakukan adalah bahwa logika 0 dan 1 pada dummy yang mbak munculkan ternyata berbeda dengan hasil /kenyataannya. biasanya peneliti mencantumkan tanda 1 dengan asumsi kelompok yang diberi nilai 1 lebih tinggi dari kelompok yang bernilai 0. betul begitu kan? nah, dalam kasus mbk ardah ini, terjadi kebalikannya. makanya dia negatif. selisih dummy tersbeut ya terletak pada koefisiennya. karena nilai -b pada -bx adalah saat x bernilai 1. sedangkan akan bernilai 0 saat x =0. agar lebih gampang dipahami, jika memungkinkan input vriabel x pada dummy ersebut dibalik. yang 0 jadi 1 yang 1 jadi 0, nanti pasti sudah positif koefisiennya. apakah ini akan merubah interpretasi? tentu tidak. sama saja.

  21. selamat sore Pak. Apa benar pada regregsi logistik harus ada minimal 50 sampel penelitian? Bagaimana kalau sampelnya kurang dari 50 Pak? Padahal variabelnya adalah dummy. Pakai analisis apa ya Pak? Terima kasih.

    1. selamat pagi mbk. regresi minimal data yang dikumpulkan adalah 30 mbk. tapi mmg lebih banyak lebih baik, jadi wajar jika sebagian menerapkan minimalnya 50. jika kurang 50 tidak masalah selagi masih diatas 30. tapi sebenarnya mengacu ke tehnik sampling ya… sesuai populasinya berapa, apakah heterogen atau homogen respondennya? itu lebih tepat menentukan berapa sample yang harus diambil. analisis ya sesuai dengan penelitian yang mbak lakukan. klo variabel independennya dummy bisa regresi berganda, klo variabel dependennya dummy pakai regresi logistik. terima kasih

  22. asalam’alaikum Pak
    Maaf pak mau bertanya, apabila variabel x nya semua dummy, variabel control nya ln (logaritma) dan variabel y nya skala, sebaiknya megunakan metode analisi apa ya dan olah data nya menggunakan spss atau eviews. hatur nuhun Pak

  23. Selamat Sore pak,
    Dalam Variabel dummy, apakah ada dasar penetapan reference kategoriknya dan apakah pemberian code reference kategoriknya diberi code 0, atau 1 dan lainnya else… Terimakasih

    1. Selamat pagi.. untuk penetapan kategori 0 dan 1, biasanya di asumsikan berhubungan positif dengan nilai Y (sesuai hipotesis awal penelitian). nilai 0 digunakan untuk menandakan kelompok yang “kurang berpengaruh” terhadap nilai Y, dan sebaliknya nilai 1 digunakan dengan asumsi “lebih berpengaruh terhadap nilai Y”. sebenarnya itu terserah peneliti dalam menentukannya, namun akan lebih mudah membaca jika koefisien hasil regresinya nanti positif. terima kasih

  24. Pak mau nanya kalau variabel x saya rasio dan variabel Y saya dummy apa boleh pake analisis regresi logistik? Saya cuman punya 2 variabel
    Terima kasih

  25. Pak mau nanya kalau variabel x saya rasio dan variabel Y saya dummy apa boleh pake analisis regresi logistik?
    Terima kasih

  26. hi pak agung, saya punya beberapa pertanyaan:
    1. saya menggunakan eviews 8, variabel y dummy dan satu variabel x saya dummy apakah bisa menggunakan regresi logistik ?
    2. saya ingin tanya utk interpretasi uji hosmer pd eviews, ada prob, chi-sq(8) dan prob chi-sq(10) mana yg harus saya pakai sbgai patokan, krn jujur saya kurang mengerti utk membaca hasil uji tsb.
    3. jika saya menggunakan regresi logit apakah saya harus jg melakukan uji kelayakan model ?
    terima kasih atas jawabannya, ditunggu

    1. (1) bisa. (2) semuanya dipakai karna menginterpretasikan hal yang berbeda. (3) iya, uji kelayakan model dilakukan di semua regresi. terima kasih..

  27. Selamat siang pak mau tanya. Penelitian saya mngenai pengarruh penerapan sistem pelaporan terhadap asimetri informasi. Itu Variabel Independen nya X1 pakai dummy variabel tetapi saya ingin menambahkan variabel lain sebagai variabel kontrol yaitu X2X3 dan X4. Lantas bagaimana nnt memasukan ke SPSS nya pak apakah variabel kontrol bisa disamakan dengan variabel independen? dan nnt ketika interpretasinya apakahjuga disamakan dengan variabel independen? terimaksih

    1. Selamat siang mbk… sy masih blm paham dengan variabel kontrol. Krn biasanya itu sy jumpai di penelitian didalam lab. Pemahaman sy dlm regresi variabel independen akan bersama sama mempengaruhi dependen, bukan bergerak sendiri sendri.

      Terima kasih

  28. Selamat pagi, pak Agung.
    Maaf pak saya mau bertanya.
    Saat ini saya sedang melakukan penelitian ttg “Pengaruh independensi auditir dan kualitas audit terhadap harga saham”. Dimana variabel X1 dan X2 merupakan variabel dummy. Apakah uji yg tepat utk penelitian saya tsb, pak? Sebelumnya saya sudah mencoba menguji menggunakan uji asumsi klasik. Dari hasil uji normalitas, data saya dinyatakan tdk normal. Dan dari hasil uji heterokedastisitas, data saya terkena heterokedastisitas.
    Software yg saya gunakan adalah SPSS versi 22.
    Mohon pencerahannya, pak. Terima kasih.

    1. selamat sore mbak anisa,
      tampaknya permasalahannya cukup rumit ya mbk.. uji normalitas dan uji hetrerokedastisitasnya tidak berjalan dengan baik. namun, saya melihat problem utama adalah bahwa skala data yang mbak gunakan semuanya adalah dummy, baik x dan y nya. saya rasa perlu dipikirkan lagi karena regresi tidak disarankan untuk skala data nominal dan ordinal. dummy hanya diperbolehkan sebagai pelengkap saja. mungkin solusinya adalah menambah variabel dengan skala rasio. Terima Kasih

  29. siang Pak, saya mau tanya. Bagaimana perlakuan variabel dummy jika “y” nya adalah variabel dummy ? apakah variabel y tersebut mesti di transform data dulu atau bagaimana pak solusinya . Dan kira2 uji apakah yang cocok untuk menguji y tersebut pak? soalnya saya sudah pakai uji normalitas untuk menguji variabel y dummy tersebut namun tetep saja data tidak berdistibusi normal. Mohon bantuannya pak. Terima kasih

    1. Selamat siang mbk diah.. jika variabel y nya adalah dummy, maka yang mbk maksud adalah regresi logistik atau biner. Silahkan cari artikel di blog ini tentang regresi logistik di penelusuran. Terima kasih

  30. Selamat malam pak, saya mau nanya. Jenis data saya adalah data panel. Da n menggunakan aplikasi eviews, sdngkan yg bpa jelaskan menggunakan spss, apakah variabel dummy sndiri bisa menggunakan aplikasi eviews?

    1. selamat pagi mas UUS. perlu mas ketahui bahwa dummy dalam regresi itu adalah teori. jadi, mestinya software yang mengikuti teori, bukan sebaliknya. meski saya blm pernah pakai eviews, tapi jika dia tidak bisa menjalankan dummy di regresi, berarti kredibilitas sebagai software statistik perlu dipertanyakan. jawabnnya: seharusnya bisa. terima kasih.

  31. Mas, jadi yang saya tangkap, jika salah satu variabel X nya merupakan variabel dummy, cara mengolah datanya sama saja seperti variabel skala rasio lainnya? Baik variabel dummy maupun variabel berskala rasio tetap disatukan dalam satu data ketika hendak mengolah di SPSS? Hanya saja diberi keterangan nominal pada tabel measure? Atau ada tambahan lain Mas?

    1. Yup…kurang lebih seperti itu.. hanya beda di cara intwrpretasinya.
      Untuk spss biasanya settingannya di tabel measure. Klo minitab biasanya tdk ada seting label, tapi waktu proses regresinya nanti dipisahkan mana yang rasio mana yang dummy.
      Terima kasih

  32. Pak saya mau tanya, kalau penelitian 1 x dengan 5 y dan salah satunya adalah var dummy, cara pengelolahannya seperti apa ya pak? Terimakasih jawabannya

    1. Mungkin yang dimaksud variabel x nya ada 5 dan variabel y ada satu ya? Tergantung skala nilai y nya…jika variabel y adalah biner (1 dan 2) atau dummy, maka menggunakan regresi logistik. Jika y nya rasio atau interval maka bisa gunakan regresi berganda.

      Jika data nya data panel, maka bisa menggunakan regresi panel.
      Terima kasih

  33. Selamat malam pak, jenis data saya adalah data panel.. Di variabel independentnya ada variabel dummy, pertanyaan saya pak.. Kenapa variabel dummy tidak diikutsertakan dalam uji asumsi klasik? Mohon pencerahannya pak

    1. Selamat pagi oci..
      diantara keempat uji asumsi klasik (linearitas, muktikolinearitas, heteroskedasitas, dan normalitas) hanya multikolinearitas yang mungkin bisa dilakukan untuk pengujian variabel dummy di regresi. mengapa demikian?

      tak lain karena regresi sendiri mensyaratkan variabel dengan skala parametrik; yakni interval dan rasio. sedangkan dummy termasuk skala nonparametrik; nominal atau ordinal.
      sehingga tidak bisa diuji asumsi klasik. oci bisa baca artikel saya tentang uji asumsi klasik dan akan mengerti mngapa skala nonparametrik tdk bisa di uji linearitas dll.

      itulah sebabnya mengapa kita sebaiknya jgn terlalu byk membuat dummy u variabel independennya.
      terima kasih.

  34. Pak agung, utk variabel dummy (1 atau 0) apakah tdk apa apa kalau menggunakan PLS? Krn setelah di lakukan uji chow, LM, dan hausman yang keluar adalah PLS. bagaimana caranya agar hasil dari ketiga uji tersebut berubah dari PLS jadi RE/FE..

    1. ini bahas data panel ya? saya sebenarnya belum membahs data panel. mungkin nanti saya akan buat.
      oh ya, tentang PLS, RE, FE merupakan metode yang akan digunakan untuk membahas data tersebut. jadi, tidak ada yg salah dengan ketiga metode tersebut. memang ada kekurangan dan kelebihannya. tapi jika uji chow mrngeluarkan hasil bahwa datanya sebaiknya menggunakan PLS, maka gunakanlah PLS. karna berarti data tersebut tidak berbeda antara cross section dan time seriesnya.

      saya justru kuatir dengan komposisi variabrl yg mbk gunakan. ingat, data sebaiknya di dominasi oleh data parametrik, skala rasio, upayakan variabrl dummy hanya 1 dari 4 atau lima variabel rasio.

      semoga mencerahkan. jika belum, silahkan mengisi form di halaman contact

    1. jika yang dimaksud regresi berganda, pastinya perlu untuk memenuji uji asumsi klasik untuk mendapat hasil yang baik. maka usahakan variabel dummy hanya sedikit saja dalam regresi.

      1. maaf pak mau bertanya, variabel bebas saya semuanya dummy dan dosen bilang jika semuanya dummy berarti tidak logistik sementara variabel terikatnya bersifat dikotomi ( ya atau tidak). mohon pencerahannya

        1. Yang dimaksud dosen mbak adalah regresi mensyaratkan data di skala interval atau rasio. Jadi sebaiknya tambahkan satu atau 2 variabel yang bukan dummy.
          Jika dipaksakan, nanti akan timbul masalah prasyarat penggunaan regresi logistik. Karna data menjadi nonparametrik yang seharusnya tdk layak diolah dengan regresi.
          Terima kasih

Leave a Reply

Your email address will not be published. Required fields are marked *