Pentingnya Linearitas pada Regresi dan Cara Jitu Mengatasinya

Uji linearitas adalah salah satu uji asumsi klasik yang dilakukan untuk mengetahui sifat linear pada sebaran data antara variabel X dan Y. Perlunya mengetahui adakah sifat linear pada hubungan X dan Y mempengaruhi tingkat valid atau tidaknya model regresi yang dihasilkan. Jadi, sebagus apapun model regresi yang dihasilkan dengan R squared yang tinggi, namun jika data tersbeut tidak memiliki sifat linear, maka kemungkinan akan terjadi kesalahan estimasi.

Mengapa Perlu uji linearitas?

Pada dasarnya regresi dibentuk dengan dasar linear. Karena model regresi pada umumnya adalah
Y prediksi = a + bx, sedangkan
Y aktual = a + bx + error

Error merupakan selisih antara Y prediksi dan Y aktual. Jika model itu tepat dalam menginterpretasikan Y aktual, maka dikehendaki error akan semakin kecil. Error kecil akan ditunjukkan dengan melihat R squared. Karena semakin tinggi R squared maka akan mencerminkan model akan baik. Satu hal yang bisa kita simpulkan adalah ciri model tersebut memenuhi sifat linearitas adalah nilai R squarednya tinggi.

Tapi, ternyata belum tentu R squared tinggi pasti linearitas akan terpenuhi. Hal ini bisa disebabkan karena ada kemungkinan nilai error yang kecil pada sisa R squared ternyata membentuk pola yang tidak linear. Bingung? Perhatikan contoh berikut:

Misalkan ada model regresi dengan R squarednya 70%, yang artinya 70 persen dari data yang diberikan, dapat diproyeksikan dengan tepat oleh model yang dihasilkan regresi. Mungkin kita akan berpikir, sudah cukup linear karena sudah mengakomodir data sebesar 70%. Namun, ternyata 30 persen sisanya (error) membentuk pola kuadratic yang sangat berbeda dari model regresinya. Ketika di uji linearitas pun ternyata tidak linear. Nanti dibagian akhir artikel ini akan dibahas.

Cara menentukan linearitas menggunakan SPSS

Sebelum membahas apa yang sudah saya sebutkan tadi, mungkin ada yang belum paham bagaimana cara mengetahui linearitas data. Pada artikel uji asumsi klasik, sudah saya terangkan menghitung uji linearitas dengan menggunakan perhitungan manual. Sedangkan perhitungan dengan SPSS ada pada menu analyze – compare means – means. Kemudian pada windows yang muncul isikan variabel Y sebagai dependen varaibel, dan variabel X sebagai independen variabel. Klik tombol option dan beri centang pada test for linearity.

Saya dalam artikel ini tidak akan membahas secara detil bagaimana cara melakukan test linearitas pada SPSS, karena saya lihat di blog yang lain sudah dijelaskan langkah demi langkah. Namun, saya akan sedikit mengkoreksi penjelasan yang sedikit keliru, yakni pada saat membaca hasil atau tabelnya.

Banyak yang menjelaskan bahwa linearitasnya ditentukan oleh diviation from linearity. Jika diatas 0.05 maka dikatakan memenuhi kaidah linear. Hal itu memang benar tapi belum komplit. Kita sebaiknya melihat tabel itu secara utuh. Pertama, kita melihat nilai significant pada linearity. Jika nilai ini dibawah 0.05, menandakan bahwa benar ada hubungan linear antara variabel X dan variabel Y.

Selanjutnya pada “deviation from linearity” yang dimaksud adalah apakah ada pola linear dari error (dalam hal ini diistilahkan deviasi) dalam model linear tersebut. Jika nilai signifikannya dibawah 0.05 berarti benar ada hubungan linear pada error di model linear antara X dan Y. inilah kenapa nilai signifikan disini kita harapkan diatas 0.05. karena pada kondisi linearitas seharusnya tidak ada lagi pola linear pada deviasi atau error.

Jadi arti tabel diatas adalah ada pola linear pada hub X dan Y dan tidak ada pola linear pada deviation from linearity, sehingga dikatakan memenuhi persyaratan linearitas.

Apakah ada x dan y memiliki hubungan linear tapi errornya juga masih memiliki hub linear? Jawabnya ada. Silahkan perhatikan tabel dibawah ini:

Artinya pada X dan Y sudah memiliki hubungan linear tetapi masih menyisakan error yang juga masih berpola. Artinya kemungkinan hubungan X dan Y tersebut tidak mengakomodir semua data. Meskipun sedikit data yang sudah tidak bisa diterangkan, namun jika masih memiliki pola tertentu, besar kemungkinan ada model lain yang lebih tepat untuk menjelaskan keseluruhan data.

Hubungan R squared dengan sifat linearitas

Pada pembukaan awal tadi saya katakan bahwa belum tentu nilai r squared tinggi memiliki sifat linearitas. Perhatikan tabel output uji linearitas dibawah ini:

uji linearitas

R squared pada model diatas adalah 0.645 yang sudah cukup baik merepresentasikan data karena 60 persen sudah dapat dijelaskan. Namun perhatikan signifikan pada uji linearitas ternyata tidak linear. Hal ini  mengindikasikan bahwa error pada model sebesar 0.355 memiliki pola tertentu. Untuk membuktikan ini, kita bisa melakukan plot X dan Y dan hasilnya sebagai berikut:

grafik uji linearitas

Ternyata hubungan pola x dan Y bersifat kuadratic, dan kemungkinan error term terletak pada saat x =0 hingga titik puncak minimum kurva tersebut. Sedangkan model regresinya menjelaskan titik minimum hingga X =4000.

Kesimpulan yang diperoleh dari artikel ini adalah bahwa r squared yang tinggi belum tentu menjelaskan terpenuhinya sifat linearitas. Kemudian transformasi data yang sifatnya meniinggikan r squared perlu di periksa ulang apakah transformasi data tersebut mampu mengubah pola hubungan menjadi linear atau tidak.

Tujuan linearitas pada regresi adalah meyakinkan hubungan slinear pada x dan y dan juga dampak dari model tersebut. Sifat linear tidak hanya antara x dan Y saja, namun diharapkan error yang tersisa sudah tidak memiliki pola tertentu sehingga memastikan bahwa model yang dikeluarkan benar benar tepat.

Lalu bagaimana cara mengatasi data yang seperti ini? Yuk simak video tutorialnya akan dibahas lengkap.

31 thoughts on “Pentingnya Linearitas pada Regresi dan Cara Jitu Mengatasinya

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *