Interpretasi output sarima ataupun arima merupakan tahapan yang penting. Kemampuan membaca hasil output yang baik sama halnya kita bisa berkomunikasi dengan alat analisis, sehingga kita bisa melakukan telaah lebih lanjut. Telaah yang dimaksud dapat berupa revisi model atau perbaikan model.
Pengolahan model arima atau sarima pada umumnya dilakukan dengan mempertimbangkan error terkecil. Model yang dianggap mendekati akan dikumpulkan dan di running yang selanjutnya dibandingkan satu sama lain. maka, kemampuan membaca output menjadi kunci untuk bisa memahami kondisi model terpilih.
Berikut merupakan contoh ouput dari model sarima yang dilakukan menggunakan python. Interpretasi sarima atau arima biasanya terbagi menjadi tiga bagian: Review informasi, evaluasi signifikansi model, dan review asumsi.
Review informasi output sarima atau arima
Gambar output sarima telah saya tandai nomor 1 hingga 5. Nomor 1 hingga 3 merupakan bagian dari review informasi. Nomor 1 merupakan variabel yang digunakan, yakni pada proses pengolahan data ini variabel dinamai dengan βdataβ. model yang digunakan adalah SARIMA {(1,1,1)(0,1,1)10} yang berarti bahwa pada model ARIMA atau trend menggunakan AR dan MA adalah 1, model Sarima menggunakan AR = 0, MA=1. Keduanya (arima dan sarima) menggunakan data yang didefferencing satu kali (nilai satu ditengah). Angka 10 menandakan bahwa model ini menggunakan seasional sebanyak n = 10. Bisa dikatakan bahwa data akan terulang selama musiman setiap n=10 dan kelipatannya. Untuk lebih paham tentang model ini, silahkan membaca artikel tentang Sarima Arima, sikembar dari time series, atau mengunjungi kategori time series di blog ini.
Masih pada bagian no 1, time menandakan waktu saat output ini diambil atau diproses menggunakan python. Sample adalah keterangan data, pada gambar tersebut tertera 0-244 yang berarti data tidak diidentifikasi oleh waktu. Jika analyst data melakukan keterangan waktu, maka akan tertera dalam keterangan ini, misalnya βMaret 2022 hingga maret 2023β. Keterangan sample ini dikuatkan pada no 3 yakni no. observations atau jumalh observasi yang dianalisis, pada contoh terdapat 244 data.
Evaluasi signifikansi model
Evaluasi signifikansi model berisi tentang informasi bagian dari model SARIMA. Sebelum melihat hasilnya kita perlu memahami sepenuhnya tentang model yang sedang diolah.
SARIMA {(1,1,1)(0,1,1)10} berarti:
(1,1,1) AR =1 dan MA=1, berarti AR L1 dan MA L1. L1 menandakan differencing pada lag1.
(0,1,1)10 menandakan AR=0 dan MA=1 berarti hanya MA.S.L10. S adalah seasional, L10 manandakan data seasional didifferencing pada lag 10.
Setelah mengerti bagian bagian model, maka kita bisa melihat output SARIMA pada bagian no 4. Perhatikan pada bagian P>|z|. bagian tersebut akan signifikan atau tolak H0 apabila nilai P>|z| lebih kecil dari 5 persen.
Dapat disimpulkan bahwa kesemua bagian dari model SARIMA {(1,1,1)(0,1,1)10} memiliki signifikan yang tinggi karena kesemuanya (termasuk nilai konstanta dan sigma2) memiliki nilai p value dibawah 5 persen.
Review asumsi pada arima dan sarima python
Setelah melihat nilai signifikansi pada model, selanjutnya kita akan mengevaluasi asumsi pada model tersebut. Asumsi tersebut terdapat di bagian 5 dan sebagian di bagian 3. Pada bagian no 5, dapat kita lihat ada uji Ljung box, heteroskedasticity, Jarque-Bera, Skew dan Kurtosis.
Ljung-box mengindikasikan data sudah stasioner atau belum. Jika probabilitasnya diatas 5 persen, berarti data sudah stasioner (ada juga yang bilang error tidak terjadi white noise). Heteroskedastisitas diperiksa dengan menggunakan heteroskedasticity test. H0 pada hipotesis ini bahwa error homoskedastisitas atau tidak terjadi heteroskedastisitas. Jika p value diatas 5 persen, maka terima H0 bahwa residual pada model ini memiliki variance yang sama/homoskedastisitas. Artinya asumsi arima berhasil dipenuhi karena ARIMA/SARIMA memiliki asumsi homoskedastisitas. Jika terjadi heteroskedastisitas maka alternatif menggunakan ARC dan Garch.
Jarque-Bera merupakan pengujian untuk distribusi error apakah sudah normal atau belum. H0 pada hipotesis ini bahwa error terdistribusi normal, sedangkan H1 adalah error tidak terdistribusi normal. Gambar diatas menunjukkan bahwa probabilitas menunjukkan dibawah 5 persen yang berarti error tidak terdistribusi normal (tolak H0 ). Sebenarnya tujuan pembuktian adalah error erdistribusi normal. Error yang terdistribusi normal mengindikasikan model arima sudah fit (uji F testnya kuat).
Normalitas error juga ditunjukkan dengan nilai skew. Jika nilai skew = 0, maka distribusi error tepat normal karena perfect symmetrical. Untuk lebih jelasnya berikut tanda keterangan skew koefisiennya:
Jika nilai skew lebih kecil -1 atau lebih besar dari 1, maka distribusi tidak normal (highly skewed).
Jika nilai skew antara -1 dan -0.5, atau antara 1 dan 0.5, maka dapat dikatakan moderately skewed.
Jika nilai skew antara -0.5 dan 0.5, maka dapat dikatakan approximately symmetric (mendekati simetrik).
Normalitas juga ditunjukkan dengan nilai kurtosis. Semakin besar nilai kurtosis maka data semakin tidak normal. Batasan nilai kurtosis untuk dapat dikatakan data normal adalah 3. Jika nilai kurtosis diatas tiga maka dapat disimpulkan error tidak terdistribusi normal.
Indikator lainnya untuk menunjukkan model arima ini adalah pada bagian 3 bawah, yakni AIC, BIC dan HQIC. Indikator yang sering digunakan adalah AIC. Jika terdapat dua model ARIMA atau SARIMA yang memenuhi syarat, maka pilih AIC yang terkecil.
Selamat Belajar
selamat siang pak. pak bagaimana misal auto arima hasil diperoleh model ar1 (0.3), ma1( -0.5), ma2 (-0.01), ma3 (0.1) jadi
ππ‘ = (1+0.3ππ‘β1) +( β0.3ππ‘β2 )+ ππ‘ – (-0.5ππ‘β1) – (-0.01ππ‘β2) β 0.1ππ‘β3. bagaimn menentukan nilai et sampai et-n pak?
yt = ypred + e. y aktual adalah y prediksi + error. dalam model yang di tulis adalah yt yang berarti y aktual. Jadi et pada yt dianggap 0. sedangkan et-1 dst ditentukan dari selisih ypred dan y aktualnya. pada saat titik awal peramalan, e semua dianggap nol hingga ada data ke-n yang bisa digunakan sebagai e. semoga paham penjelasan singkat ini.
baik pak, terimakasih.
Pak izin bertanya, terkait hasil output auto arima dengan python. Hasil output menjelaskan bahwa terjadi tidak terdistribusi normal apakah artinya parameter yang diperoleh tidak dapat digunakan/akan menghasilkan prediksi kurang baik?
Artinya model belum fit, kemungkinan ada model lain yang bisa lebih baik.
Jika dipaksakan maka hasil peramalannya tidak reliable, atau kurang meyakinkan. Terima kasih
Selamat malam pak, izin bertanya. Saya melakukan penelitian tentang prediksi menggunakan ARIMA menggunakan python. Ketika saya melakukan trial dan error pada orde yang akan saya gunakan. Saya mendapatkan 2 case, case yang pertama semua parameter pada model tidak signifikan tetapi nilai RMSEnya kecil dan case yang kedua yaitu nilai parameter pada model signifikan tetapi nilai RMSEnya tidak sekecil case yang pertama (RMSE lebih besar daripada model case pertama). Sedangkan prediksi itu untuk mencari nilai yang akurat. Nah model mana yang sebaiknya saya pakai pak, apakah saya harus tetap memperhatikan signifikan parameternya atau boleh mengabaikannya?
Terima Kasih
Selamat malam. Signifikansi adalah syarat utama ya mbak.. baru kemudian kita melihat nilai RMSE nya.
Percuma jika RMSEnya kecil tapi tidak signifikan secara statistik. Karena nanti pada peramalan akan menghasilkan bias yang tinggi. Terima kasih
Baik Pak, terima kasih atas jawaban dan penjelasannya.