SARIMA merupakan salah satu metode time series yang memiliki ciri musiman di dalamnya. Pada artikel ARIMA dan SARIMA : Si Kembar dari Time Series, dijelaskan tentang perbedaan ARIMA dan SARIMA terutama dalam menentukan model yang akan diperoleh. Pengukuran model tersebut dengan melihat dari pola PACF dan ACF yakni dying down atau cut off. Sayangnya, penjelasan tersebut belum mencakup tentang bagaimana menentukan lag musiman yang terdapat di SARIMA.
Auto Correlation
Sebelum melangkah lebih jauh tentang penjelasan pola ACF di SARIMA, perlu dipahami bahwa auto correlation merupakan korelasi antar data di dalam time series tersebut yang dipisahkan dalam lag. Artinya, jika lag =2, maka nilai t akan dikorelasikan dengan t+2 (artinya data pertama akan dikorelasikan dengan data ketiga), jika menggunakan lag=4, maka kemudian t akan dikorelasikan dengan t+4, begitu seterusnya. Hal ini biasanya ditulis dengan rumus korelasi (Xt , Xk+t) dengan k adalah jumlah lag dan t adalah nilainya.
Pada proses identifikasi ACF di minitab, secara default lagnya sama dengan 1. Kemudian pola nilainya akan digunakan untuk memperkirakan model ARIMA atau SARIMA.
Oleh sebab itu, jika data akan mengandung trend, maka hal ini tidak akan berguna. Karena nilai ACF nya akan signifikan atau tinggi di setiap data atau lagnya. Itu lah sebabnya diperlukan differencing untuk menghilangkan trend pada data tersebut hingga menjadi data stationer.
Partial Auto Correlation
Sama halnya auto correlation, PACF juga menghitung korelasi antar data di time series. Perbedaannya adalah jika ACF mencari korelasi antara Xt dan Xt+k ( k = lag), maka PACF juga menghitung korelasi antara Xt dan Xt+k namun sebelumnya menghilangkan data antara Xt dan Xt+k terlebih dahulu. Berarti data yang dihilangkan adalah data Xt+1 sampai dengan Xt+k-1
Jika dilihat di website IBM, dijelaskan bahwa:
“Autocorrelation function (ACF). At lag k, this is the correlation between series values that are k intervals apart. Partial autocorrelation function (PACF). At lag k, this is the correlation between series values that are k intervals apart, accounting for the values of the intervals between”
Masih bingung? Jika saya menggunakan bahasa sendiri, kata kuncinya adalah kata parsial. PACF menghitung korelasi secara parsial antara nilai t dengan nilai t+k tanpa dipengaruhi nilai nilai diantaranya. Sedangkan ACF menghitung yang sama ( t dan t+k) namun masih memperhitungkan nilai nilai yang ada diantaranya secara keseluruhan data.
Bagaimana Identifikasi ACF dan PACF untuk SARIMA?
Agar lebih jelas, berikut adalah contoh dari dua grafik time series yang berbeda:
Grafik 01 dan 02 sama sama memiliki trend kenaikan. Namun pada gambar 01 memiliki musiman yang tidak dimiliki oleh gambar 2. Grafik 01 seolah ada pengulangan di setiap lag 5 atau 4. Sedangkan pola grafik 02 lebih random dan tidak bisa ditentukan.
Kita bisa simpulkan bahwa grafik 01 memiliki musiman, atau kita bisa menggunakan SARIMA, sedangkan grafik 02 tidak memilki musiman, menggunakan ARIMA. Keduanya perlu di differencing terlebih dahulu seperti yang ada di artikel Arima dan Sarima.
Melangkah lebih jauh, kita akan melihat perbedaan ACF dan PACF untuk kedua pola ini. Hasil nya dapat dilihat dibawah ini:
Gambar 03 merupakan ACF dan PACF dari grafik 01. Sedangkan gambar 04 merupakan nilai ACF dan PACF dari grafik 02.
Perhatikan gambar 3. Nilai ACF dan PACF nya signifikan pada lag 1 kemudian lag 2 dan 3 tidak signifikan (nilainya masih di dalam interval/garis mendatar). Namun pada lag 4 terjadi signifikan kembali. Begitupun pada lag 8. Artinya bisa kita simpulkan bahwa terjadi musiman dengan pola perulangan sebanyak 4 lag.
Pada gambar 04 hal tersebut tidak terjadi. Nilai ACF dan PACF signifikan pada lag pertama kemudian tidak signifikan untuk data lainnya. Hal ini menandakan tidak ada perulangan atau musiman di dalamnya.
Kemudian akan muncul pertanyaan “ Data itu kan belum di differencing pak?” masih ada unsur trendnya..
Hasil akan sama diperoleh saat anda melakukan differencing terhadap data tersebut. Berikut hasilnya:
Gambar 05 adalah gambar ACF dan PACF untuk data musiman yang telah di differencing terlebih dahulu, sedangkan gambar 06 adalah gambar ACF dan PACF data trend yang juga sudah di differencing terlebih dahulu.
Terlihat sama pada gambar 05 terlihat nilai ACF dan PACF signifikan pada lag 4 dan 8. Ini menandakan data memiliki musiman atau seasonal, dan anda harus menggunakan SARIMA untuk memproyesikan data selanjutnya.
Jadi, bagaimana model yang tepat untuk melakukan proyeksi terhadap data seasonal pada contoh artikel ini? download data mentahnya disini:
Bahan ACF-PACF
baca artikel ARIMA SARIMA: SI KEMBAR DARI TIME SERIES, dan temukan jawabannya..
Jika berkenan untuk berkomentar, dengan senang hati akan saya tanggapi.
Selamat Belajar ..!
pak, mau nanya. saya kan memiliki data trend yang mana datanya tidak linear trend yang dimaksud data yang memiliki naik dan turun yang signifikan. tapi saya bingun apakah data ini memiliki data musiman atau hanya sekedar trend, ketika dilihat dari bentuk polanya tidak ada yang menggambarkan pola yang berulang. bagaimana caranya untuk melihat suatu data yang memiliki data yang musiman jika dilihat dari pola acf dan pacf.
Artikelnya dibaca
kak kak rumus PACF dari lag ke 1-5 gimna ya kak?
Pak mau menanyakan, jika diketahui model arima (1)(1)(4) bgm cara mencari:
a. Autokovarian
b. ACF dan PACF
c. ACF dan PACF jika psi=0,3 dan psi=0,4
Klo ini lebih enak pakai eviews mbak. Insha allah suatu saat saya akan menuliskannya. Terima kasih atas idenya.
Saya sedang meneliti pola deviasi angin dengan interval data per 30 menit dan durasi total 1 tahun. Jadi total data statistik yg ada sekitar 17600 baris. Secara referensi, saya ada baca jurnal internasional menggunakan SARIMA u kasus dan pola data yg mirip. Tapi saat ini saya masih belum bisa mendapat pola SARIMA yg pas dan prediksinya masih jauh dari data realisasi. Apa ada kaitan dengan interval yang terlalu rapat dan jumlah data yg terlalu banyak. Mohon pencerahannya, terima kasih.
data per 3o menit selama setahun? saya rasa anda perlu menggunakan arch and garch. bukan arima dan sarima. terima kasih
Terima kasih untuk pencerahannya. Tetapi jika saya ingin tetap menggunakan ARIMA dan SARIMA, apakah memungkinkan jika sebelumnya dilakukan cluster time series pada data yang besar tersebut ? Jika bisa, bagaiman menentukan kriteria cluster nya ?
Tolong petunjuk, terima kasih
Cluster tentang angin ya.. bisa cluster berdasarkan waktu atau musim, bisa juga cluster berdasarkan tempat.
Intinya tentukan satu siklus utuhnya dahulu dan apakah siklus itu berulang.
Hanya itu yang ada dibenak saya, karna saya tidak paham tentang angin. Tapi arima sarima sendiri lemah akan hetero karena limit waktu yang terlalu sedikit (misal 30 menit).
Makasih u responsnya. Di artikel jurnal yg lain, ada yg menggunakan SARIMA Multi-Step, jadi dibuat bertahap, contoh: 6 hour ahead, 12 hour ahead, dst. Apa pernah menangani kasus dgn pendekatan yg seperti itu ?
Saya masih bingung menggunakan metoda yg mana. Tdi coba browsing ttg Garch, ternyata masih turunan ARIMA dgn tambahan karakter heteroskedastisitas karena volasitisas yg tinggi. Tapi pendekatan tetap dengan ACF dan PACF juga sepertinya. Apa minitab punya fitur u metoda Garch ?
minitab tidak memiliki fitur garch. garch biasanya memakai E-views. Terima kasih
Pak mau tanya, kalau grafik saya seperti ini (sudah di differencing 1 kali), dimana ACF-nya cutoff setelah lag 1, namun PACFnya signifikan/keluar garis horizontal Lag 1 dan 5, artinya apa ya pak?
Terimakasih sebelumnya
saya tuntun dengan pertanyaan ya.. nanti tuman banyak yang tanya. 1. kira kira dari acf dan pacf tersebut mana yang lebih dying down? 2. signifikan di lag tertentu mengindikasikan kemungkinan ada seasional.terima kasih
Misal kita mau menentukan berapa inputan dengan plot pacf, dilihat dari lag yang melewati batas signifikan sedangkan batas signifikannya itu tidak muncul itu bagaimana ya pak?
Bagaimana bila plot ACF dan PACF memiliki nilai dan grafik plot yang “hampir” sama(setelah stationer) apakah penyebabnya ?
terimakasih pak
itu menandakan Ar dan MA sama sama kuat. bisa menggunakan pola arima dengan nilai AR dan MA yang sama. terima kasih
Bagaimana bila plot ACF dan PACF memiliki nilai yang sama(setelah dilakukan transformasi dan diff agar stationer) dan apa penyebabnya ?
Terimakasih pak
Bagaimana jika di plot ACF, semua lag nya keluar? Apakah itu tidak bisa diambil nilai untuk ordo MA (q)? Padahal data sudah stationer
Terima kasih pak
bisa dicoba dengan differencing sekali lagi datanya.
maaf pak yang dimaksud nilai significant itu bagaimana ya ?
Biasanya setiap grafik acf dan pacf ada garis horizontal sejajar dengan sumbu x baik nilai positif maupun negatif. Bar yang melewati garis trsb dikatakan signifikan. Ada juga yang berpendapat jika ada lompatan nilai dari sebelum atau sesudah sekitar 2 nilai, juga bisa dikatakan signifikan
Apakah arima harus menggunakan data periode bulanan dan tahunan? Apabila tahunan apakah bisa? Memang jadi tidak terlihat pola musiman atau tidak nya
Bisa pakai tahunan bisa juga pakai bulanan. Kelebihan pakai bulanan data lbh banyak,..terima kasih
per pekan bisa, kah ?
bisa
Halo, saya inging bertanya. Untuk gambar 6 itu kan tidak ada lag yang keluar, jadi penentuan orde p dan q nya seperti apa? Atau metode ARIMA tidak bisa digunakan untuk peramalan data ke 2 tsb?
Klo kita perhatikan polanya dying down ya… bisa jadi polanya ar dan ma.
Memang tidak ada yanh melewati garis, karena kita evaluasi pola grafiknya.
Untuk lebih jelas, silahkan baca arima dan sarima sikembar dari time series. Disana dilengkapi video juga. Terima kasih