Regresi Nonlinear: Tak selamanya regresi itu linear

Diposting pada

Mungkin sedikit asing bagi para pelajar yang mendengar regresi nonlinear terutama mereka yang baru belajar regresi sederhana dan regresi berganda. Regresi nonlinear termasuk salah satu metode atau alat analisis yang patut dipelajari bagi anda yang tertarik dengan hubungan fenomena alam ataupun sosial dengan tingkat yang lebih lanjut.

Jika kita perhatikan, linear pada model merupakan cara peneliti menyederhanakan suatu fenomena atau hubungan kausal dengan persamaan yang lebih sederhana. misalnya saat kita belajar tentang teori permintaan dan teori penawaran. Peneliti menyederhanakan menjadi garis lurus yang linear. Padahal, jika kita perhatikan lebih seksama. Tidak ada permintaan atau penawaran yang bernilai negatif. Garis penawaran tidak pernah menyentuh atau berpotongan dengan sumbu x. sehingga seharusnya model yang tepat adalah fungs limit.

Regresi nolinear menurut definisinya adalah regresi yang menerangkan hubungan antara variabel independen dengan variabel dependen bersifat nolinear secara parameter.

Nonlinear secara parameter atau secara variabel

Dalam blog ini, saya pernah menerangkan tentang linearitas dan teknik setrika. Tehnik setrika mengupayakan agar variabel yang tampaknya tidak linear dibuat seolah linear dengan fungsi log atau invers atau fungsi lainnya.  Tehnik seperti itu belum dikatakan sebagai regresi nonlinear, karena nonlinear secara variabel.

Perhatikan persamaan berikut:

Y = a + bX1 + cX2

Persamaan tersebeut adalah persamaan linear berganda karena memiliki dua variabel independen. Jika X1 ternyata adalah sebuah kuadrat dari variabel lain, tetap persamaan tersebut dapat diselesaikan dengan regresi berganda. Parameter, dalam hal ini adalah a, b, dan c tetap bersifat linear terhadap Y.

Persamaan lain yang masih bersifat linear:
Y = a + b X2
Y = a + b 1/X
Y = a+ b X
ln Y = a + b ln X1 + c ln X2

sepanjang parameter atau koefisien masing masing variabel masih membentuk pola linear, maka bisa diselesaikan dengan regresi sederhana atau regresi berganda karena pola ini tetap pola linear.

Berbeda jika parameter didalam persamaan membentuk fungsi diluar linear. Perhatikan beberapa persamaan berikut:

Y = Yoexp(-k.t), k adalah konstanta dan t adalah time.

Y = abx1+cx2 , dimana x1 dan x2 adalah variabel independen

Kedua persamana diatas sudah merupakan regresi nonlinear karena hubungan parameter tidak bersifat linear.

Keuntungan regresi nonlinear

Keuntungan yang dapat diperoleh dari penggunaan regresi nonlinear adalah; pertama, data yang digunakan tidak sebanyak data yang digunakan regresi linear karena tidak lagi menggunakan kaidah uji asumsi klasik. Kedua, regresi nonlinear akan memberikan persamaan yang kuat karena diperoleh dari sifat alaminya. Pendekatannya atau persamaan yang dihasilkan akan terlihat secara langsung dalam sebuah rumus sehingga mudah dinterpretasikan.

Ketiga, hasil yang diperoleh akan lebih akurat. Hal ini disebabkan pemilihan model telah ditelusuri sifatnya sejak awal. Contohnya; jika anda meneliti tentang produksi yang bersifat sigmoid, penggunaan persamaan sigmoid tentunya akan langsung tepat sasaran. Data error akan berkurang dan itu tidak terjadi jika anda memaksakan menggunakan regresi linear.

Langkah langkah yang dilakukan dalam regresi nonlinear

Bersumber dari judul artikel jurnal yang berjudul “Nonlinear Regression Models and Applications in Agricultural Research”, penelitian di bidang pertanian merupakan bidang yang banyak menggunakan regresi nonlinear karena bergantung kepada pola alam seperti tumbuhan, foto sintesis, curah hujan, kelembapan, yang kesemua itu sulit dilakukan jika menggunakan regresi linear.

Selain bidang pertanian, bidang sosial juga banyak menggunakan regresi nonlinear contohnya adalah regresi logistik. Regresi logistik memiliki persamaan sigmoid antara 0 dan 1. Sehingga perolehannya menggunakan maximum likelihood berupa percobaan beberapa kemungkinan yang selanjutnya menghasilkan titik atau nilai yang paling baik. Penulis pernah diminta menghitung konstanta dan koefisien secara langsung seperti proses OLS, padahal logistik tidak  menggunakan OLS. Heran tingkat lanjut ketika permintaan itu berasal dari dosennya. Apakah dosennya tidak paham tentang mekanisme OLS dan maximum likelihood? Mungkin cuma ngetest kali ya…

Artikel tersebut membahas secara tuntas tentang regresi nonlinear termmasuk langkah langkah yang perluditempuh dalam menganalisis regresi nonlinear. Langkah tersebut diantaranya adalah:

Menentukan kandidat model

Seperti yang sudah dijelaskan sebelumnya, regresi nonlinear menggunakan simulasi nilai untuk menentukan nilai yang paling baik. Maka kita membutuhkan beberapa kandidat model yang selanjutnya akan dibandingkan mana yang memberikan kinerja paling baik dalam menentukan atau memprediksi nilai Y. langkah ini mirip ketika anda mengolah data time series menggunakan arima dan sarima.

Langkah yang paling mudah dalam menentukan kandidat model adalah menemukan teori atau pemikiran rasional dalam menentukan hubungan x dan y. misalnya y adalah produksi padi, dan x adalah curah hujan. Logika berpikirnya: produksi padi membutuhkan air dari curah hujan. Dari titik 0 hingga titikk tertentu penambahan curah hujan akan menyebabkan kenaikan produksi padi. Tapi jika titik tersebut melewati titik optimal, dalam kata lain curah hujan berlebih, tentunya justru merugikan produksi padi bahkan bisa gagal panen. Pemikiran ini cocok dengan persamaan kuadrat. Kemudian untuk menguatkan kita bisa mencari jurnal yang membahas tentang curah hujan dan produksi padi.

Langkah lainnya bisa diambil dari teori. Jika anda meneliti tentang photosintesis, produksi, regresi logit, tentu hal semacam itu sudah banyak teori yang menerangkan dan anda dapat mengikutinya.

Menentukan nilai parameter dan memeriksa kebaikmodel nya

Setelah model sudah ditentukan, saatnya anda mengetahui berapa nilai a, b dan c dalam persamaan yang sudah ditetapkan. Langkah ini bisa dilakukan dengan bantuan software analisis yang akan diterangkan di bagian akhir artikel ini.

Kebaikmodelan dan uji untuk memeriksa model dalam regresi nonlinear adalah uji normalitas, F test dan R squared. Uji normalitas diperlukan untuk mengetahui apakah error yang terjadi tidak terlalu tinggi variancenya sehingga model yang terpilih dapat mengestimasi secara lebih tepat dan konsisten ketepatannya. Selain normalitas, pengujian lain dapat dilakukan dengan melihat nilai convergence memenuhi syarat atau tidak. Hal ini juga bertujuan yang sama agar model yang dihasilkan memiliki tingkat ketepatan yang tinggi dan konsisten. Penentuan nilai convergence akan dibahas pada artikel yang terpisah.

Kebaikmodelan dapat diwakilkan oleh uji F dan R squared. Uji F menyatakan bahwa variabel independen secara bersama sama secara signifikan mempengaruhi nilai Y dan R squared mengukur ketepatan error yang terjadi pada model yang dihasilkan terhadap nilai Y aktual.

Menentukan model terbaik dan menarik kesimpulan

Kandidat model yang ditentukan diawal akan tereliminasi berdasarkan nilai kebaikmodelannya. Model yang baik tentunya memiliki data iterasi yang convergence, memiliki probabilitas F test dibawah 0.05, dan memiliki R squared mendekati 1 atau 100 persen.

Latihan regresi nonlinear

Data yang digunakan dalam latihan ini adalah data random yang terdiri dari nilai Y dan X. dalam latihan ini, saya hanya menggunakan 1 model saja karena tujuan latihan ini untuk memperkenalkan bagaimana mengolah regresi nonlinear di SPSS (letak menu, dan sebagainya).

Data tersebut sebagai perbandingan saya run menggunakan regresi sederhana terlebih dahulu dan menghasilkan hasil sebagai berikut:

regresi nonlinear

Terilihat F test signifikan karena diatas 0.05, kemudian R squared memiliki 67 persen. Dapatkan persamaan lain memiliki kinerja yang lebih bagus dari ini? Mari kita coba dengan regresi nonlinear.

Selanjutnya kita akan menggunakan regresi nonlinearpada menu analisis-regression di SPSS.

regresi non linear

Kemudian masukkan nilai Y sebagai dependen dan ketik rumus hubungan nonliear antara X dan Y. pada contoh ini saya menggunakan model = a^X (dibaca a pangkat X) koefisien a adalah nilai yang akan kita cari dalam persamaan ini.

regresi tidak linear

Kemudian kita bisa menambahkan minimal 1 keterangan untuk parameter. Klik parameter dan kita buat nilai pembatasnya. Misalnya nilai a harus lebih tinggi dari 0.

persamaan regresi nonlinear

Klik continue

tampilan menu spss regresi nonlinear

Dalam kolom parameter telah ditambahkan nilai a dimulai dari angka 0. Kemudian klik OK. Hasilnya adalah sebagai berikut:

iterasi regresi nonlinear

Pada bagian ini menerangkan tentang iterasi atau pengulangan yang dilakukan oleh SPSS dan keterangan errornya untuk mendapatkan parameter yang terbaik. Biasanya jika modelnya cukup baik, akan ada keterangan tentang konvergen datanya juga.

Kemudian dibawah iterasi ini adalah hasilnya sebagai berikut:

regresi nonlinear

Pertama yang kita lihat adalah nilai estimasi parameternya adalah 5.017 artinya persamaan nonlinear yang kita peroleh adalah :

Y = 5.07 X model ini menghasilkan R squared 99 persen. Sangat tinggi dan akurat karena regresi sederhana diatas hanya 67 persen.

Sayangnya nilai F test dan T test tidak dimunculkan dalam output spss di seri ini, tapi nilai F hitung bisa kita hitung manual dengan rumus : mean square regression / mean square residual menghasilkan nilai f hitung (51718661,57/2032,691) = 25443.44

Untuk mengetahui signifikannya kita bisa menggunakan f tabel atau menggunakan rumus excel =FINV(0.05,df regression, df residual) =FINV(0.05,1,18) = 4.41.


Karena nilai f hitung>f tabel, tentunya ini akan signifikan dibawah 5 persen. Untuk memastikan kita bisa menggunakan excel dengan rumus =FDIST(F hitung,f tabel,df residual) = 8. 10 -30

Untuk t test juga sama, pada tabel parameter estimates yang terdiri dari nilai estimate (nilai koefisien), dan standar errornya. nilai T hitung bisa diperoleh dari pembagian nilai estimate dengan nilai standar error. kemudian pembandingnya adalah t tabel, atau bisa menggunakan rumus di excel = TINV(0.05, (n-k)). 0.05 adalah tingkat kepercayaan yang digunakan, bisa diganti 10 persen atau 15 persen atau angka lainnya sesuai kebutuhan penelitian. nilai n adalah jumlah data yang digunakan. k adalah jumlah variabel yang digunakan baik variabel independen maupun variabel dependen (berapa total variabel yang digunakan)

Demikian pembelajaran tentang regresi nonlinear, jangan lupa istirahat, makan cukup, dan share artikel ini.

Selamat Belajar!

Gambar Gravatar
Data analyst sekaligus researcher. Pernah mendalami production scheduling dalam manufacture. Melalui blog ini menyalurkan hobi menjadi statistical consulting dan menghimpun statistical process control software.

1 komentar

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *