Variance Inflation Factor atau VIF adalah sebuah indeks yang mencerminkan hubungan antar variabel independen dalam sebuah fungsi atau persamaan. Nilainya dikaitkan dengan multikolinearitas yang merupakan salah satu uji asumsi klasik yang harus dipenuhi dalam proses regresi. Sebuah persamaan yang memiliki nilai VIF dibawah 5 menandakan lolos uji multikolinearitas, tetapi jika nilai VIF lebih dari 5 maka kemungkinan besar terdapat dua atau lebih variabel independen yang memiliki hubungan dalam persamaan tersebut. Apalagi jika sebuah persamaan atau model memiliki nilai VIF diatas 10, maka multikolinearitasnya sangat kuat.
Artikel Mengapa Regresi tidak boleh terkena Multikolinearitas? sudah menjelaskan mengapa sebuah persamaan regresi tidak boleh terkena multikolinearitas dan bagaimana cara mengatasinya. artikel ini akan fokus kepada nilai VIF yang menjadi tanda dari kehadiran multikolinearitas tersebut.
Gambar diatas merupakan rumus mencari VIF. Namun, perlu menjadi catatan bahwa pencarian nilai VIF itu dengan cara meregresikan variabel independennya saja. Jadi dalam hal ini variabel dependen tidak diajak. Kasian?
Agar lebih mudah memahami saya memberikan contoh:
Terdapat sebuah persamaan dengan Y1 = a + bX1 + cX2 + dX3 + eX4,
maka, untuk mencari VIF di setiap variabel independennya adalah mencari nilai R-squared:
VIF X1 >> mencari R squared pada persamaan X1 = a + bX2 + cX3 + dX4,
VIF X2 >> mencari R squared pada persamaan X2 = a + bX1 + cX3 + dX4,
VIF X3 >> mencari R squared pada persamaan X3 = a + bX1 + cX2 + dX4,
VIF X4 >> mencari R squared pada persamaan X4 = a + bX1 + cX2 + dX3,
Masih bingung, yuk praktek!
Menghitung nilai VIF
Saya memiliki data fiktif seperti dibawah ini:
Kemudian saya regresikan dengan menggunakan SPSS, cara menampilkan nilai VIF pada SPSS 25 adalah dengan klik statistic dan memberi centang pada collinearity diagnostic, pada saat kita memasukkan variabel independen dan variabel dependen (perhatikan gambar).
Hasil pengolahan model tersebut menghasilkan nilai vif sebagai berikut:
Hasil menunjukkan adanya nilai VIF sangat tinggi pada variabel X1, X2, dan X3 (memang disengaja menyusun data agar VIF tinggi sebagai contoh). Nah, pertanyaannya sekarang, bagaimana menghitung VIF secara manual?
Perhatikan gambar berikut, saya memproses ulang R-squared sesuai dengan penjelasan sebelumnya:
Hasil perhitungan manual VIF dengan menggunakan rumus di atas, sesuai dengan hasil regresi. Ada selisih sedikit dikarenakan output r-squared hanya menggunakan 3 angka di belakang koma.
Selamat Belajar!