|

Memahami Pola ACF dan PACF di SARIMA

SARIMA merupakan salah satu metode time series yang memiliki ciri musiman di dalamnya. Pada artikel ARIMA dan SARIMA : Si Kembar dari Time Series, dijelaskan tentang perbedaan ARIMA dan SARIMA terutama dalam menentukan model yang akan diperoleh. Pengukuran model tersebut dengan melihat dari pola PACF dan ACF yakni dying down atau cut off. Sayangnya, penjelasan tersebut belum mencakup tentang bagaimana menentukan lag musiman yang terdapat di SARIMA.

Auto Correlation

Sebelum melangkah lebih jauh tentang penjelasan pola ACF di SARIMA, perlu dipahami bahwa auto correlation merupakan korelasi antar data di dalam time series tersebut yang dipisahkan dalam lag. Artinya, jika lag =2, maka nilai t akan dikorelasikan dengan t+2 (artinya data pertama akan dikorelasikan dengan data ketiga), jika  menggunakan lag=4, maka kemudian t akan dikorelasikan dengan t+4, begitu seterusnya. Hal ini biasanya ditulis dengan rumus korelasi (Xt , Xk+t) dengan k adalah jumlah lag dan t adalah nilainya.

Pada proses identifikasi ACF di minitab, secara default lagnya sama dengan 1. Kemudian pola nilainya akan digunakan untuk memperkirakan model ARIMA atau SARIMA.

Oleh sebab itu, jika data akan mengandung trend, maka hal ini tidak akan berguna. Karena nilai ACF nya akan signifikan atau tinggi di setiap data atau lagnya. Itu lah sebabnya diperlukan differencing untuk menghilangkan trend pada data tersebut hingga menjadi data stationer.

Partial Auto Correlation

Sama halnya auto correlation, PACF juga menghitung korelasi antar data di time series. Perbedaannya adalah jika ACF mencari korelasi antara Xt dan Xt+k ( k = lag), maka PACF juga menghitung korelasi antara Xt dan Xt+k namun sebelumnya menghilangkan data antara Xt dan Xt+k terlebih dahulu. Berarti data yang dihilangkan adalah data  Xt+1 sampai dengan Xt+k-1

Jika dilihat di website IBM, dijelaskan bahwa:

Autocorrelation function (ACF). At lag k, this is the correlation between series values that are k intervals apart. Partial autocorrelation function (PACF). At lag k, this is the correlation between series values that are k intervals apart, accounting for the values of the intervals between

Masih bingung? Jika saya menggunakan bahasa sendiri, kata kuncinya adalah kata parsial. PACF menghitung korelasi secara parsial antara nilai t dengan nilai t+k tanpa dipengaruhi nilai nilai diantaranya. Sedangkan ACF menghitung yang sama ( t dan t+k) namun masih memperhitungkan nilai nilai yang ada diantaranya secara keseluruhan data.

Bagaimana Identifikasi ACF dan PACF untuk SARIMA?

Agar lebih jelas, berikut adalah contoh dari dua grafik time series yang berbeda:

beda acf dan pacf
Grafik 01
Grafik 02

Grafik 01 dan 02 sama sama memiliki trend kenaikan. Namun pada gambar 01 memiliki musiman yang tidak dimiliki oleh gambar 2. Grafik 01 seolah ada pengulangan di setiap lag 5 atau 4. Sedangkan pola grafik 02 lebih random dan tidak bisa ditentukan.

Kita bisa simpulkan bahwa grafik 01 memiliki musiman, atau kita bisa menggunakan SARIMA, sedangkan grafik 02 tidak memilki musiman, menggunakan ARIMA. Keduanya perlu di differencing terlebih dahulu seperti yang ada di artikel Arima dan Sarima.

Melangkah lebih jauh, kita akan melihat perbedaan ACF dan PACF untuk kedua pola ini. Hasil nya dapat dilihat dibawah ini:

Nilai ACF dan PACF untuk Grafik 01.
Nilai ACF dan PACF untuk Grafik 02

Gambar 03 merupakan ACF dan PACF dari grafik 01. Sedangkan gambar 04 merupakan nilai ACF dan PACF dari grafik 02.

Perhatikan gambar 3. Nilai ACF dan PACF nya signifikan pada lag 1 kemudian lag 2 dan 3 tidak signifikan (nilainya masih di dalam interval/garis mendatar). Namun pada lag 4 terjadi signifikan kembali. Begitupun pada lag 8. Artinya bisa kita simpulkan bahwa terjadi musiman dengan pola perulangan sebanyak 4 lag.

Pada gambar 04 hal tersebut tidak terjadi. Nilai ACF dan PACF signifikan pada lag pertama kemudian tidak signifikan untuk data lainnya. Hal ini menandakan tidak ada perulangan atau musiman di dalamnya.

Kemudian akan muncul pertanyaan “ Data itu kan belum di differencing pak?” masih ada unsur trendnya..

Hasil akan sama diperoleh saat anda melakukan differencing terhadap data tersebut. Berikut hasilnya:

Nilai ACF dan PACF Grafik 01 setelah di differencing
Nilai ACF dan PACF Grafik 02 setelah di differencing

Gambar 05 adalah gambar ACF dan PACF untuk data musiman yang telah di differencing terlebih dahulu, sedangkan gambar 06 adalah gambar ACF dan PACF data trend yang juga sudah di differencing terlebih dahulu.

Terlihat sama pada gambar 05 terlihat nilai ACF dan PACF signifikan pada lag 4 dan 8. Ini menandakan data memiliki musiman atau seasonal, dan anda harus menggunakan SARIMA untuk memproyesikan data selanjutnya.

Jadi, bagaimana model yang tepat untuk melakukan proyeksi terhadap data seasonal pada contoh artikel ini? download data mentahnya disini:

baca artikel ARIMA SARIMA: SI KEMBAR DARI TIME SERIES, dan temukan jawabannya..

Jika berkenan untuk berkomentar, dengan senang hati akan saya tanggapi.

Selamat Belajar ..!

Similar Posts

25 Comments

  1. Pak mau menanyakan, jika diketahui model arima (1)(1)(4) bgm cara mencari:
    a. Autokovarian
    b. ACF dan PACF
    c. ACF dan PACF jika psi=0,3 dan psi=0,4

  2. Saya sedang meneliti pola deviasi angin dengan interval data per 30 menit dan durasi total 1 tahun. Jadi total data statistik yg ada sekitar 17600 baris. Secara referensi, saya ada baca jurnal internasional menggunakan SARIMA u kasus dan pola data yg mirip. Tapi saat ini saya masih belum bisa mendapat pola SARIMA yg pas dan prediksinya masih jauh dari data realisasi. Apa ada kaitan dengan interval yang terlalu rapat dan jumlah data yg terlalu banyak. Mohon pencerahannya, terima kasih.

      1. Terima kasih untuk pencerahannya. Tetapi jika saya ingin tetap menggunakan ARIMA dan SARIMA, apakah memungkinkan jika sebelumnya dilakukan cluster time series pada data yang besar tersebut ? Jika bisa, bagaiman menentukan kriteria cluster nya ?
        Tolong petunjuk, terima kasih

        1. Cluster tentang angin ya.. bisa cluster berdasarkan waktu atau musim, bisa juga cluster berdasarkan tempat.

          Intinya tentukan satu siklus utuhnya dahulu dan apakah siklus itu berulang.

          Hanya itu yang ada dibenak saya, karna saya tidak paham tentang angin. Tapi arima sarima sendiri lemah akan hetero karena limit waktu yang terlalu sedikit (misal 30 menit).

          1. Makasih u responsnya. Di artikel jurnal yg lain, ada yg menggunakan SARIMA Multi-Step, jadi dibuat bertahap, contoh: 6 hour ahead, 12 hour ahead, dst. Apa pernah menangani kasus dgn pendekatan yg seperti itu ?
            Saya masih bingung menggunakan metoda yg mana. Tdi coba browsing ttg Garch, ternyata masih turunan ARIMA dgn tambahan karakter heteroskedastisitas karena volasitisas yg tinggi. Tapi pendekatan tetap dengan ACF dan PACF juga sepertinya. Apa minitab punya fitur u metoda Garch ?

  3. Pak mau tanya, kalau grafik saya seperti ini (sudah di differencing 1 kali), dimana ACF-nya cutoff setelah lag 1, namun PACFnya signifikan/keluar garis horizontal Lag 1 dan 5, artinya apa ya pak?

    Terimakasih sebelumnya

    1. saya tuntun dengan pertanyaan ya.. nanti tuman banyak yang tanya. 1. kira kira dari acf dan pacf tersebut mana yang lebih dying down? 2. signifikan di lag tertentu mengindikasikan kemungkinan ada seasional.terima kasih

  4. Misal kita mau menentukan berapa inputan dengan plot pacf, dilihat dari lag yang melewati batas signifikan sedangkan batas signifikannya itu tidak muncul itu bagaimana ya pak?

  5. Bagaimana bila plot ACF dan PACF memiliki nilai dan grafik plot yang “hampir” sama(setelah stationer) apakah penyebabnya ?

    terimakasih pak

  6. Bagaimana bila plot ACF dan PACF memiliki nilai yang sama(setelah dilakukan transformasi dan diff agar stationer) dan apa penyebabnya ?

    Terimakasih pak

  7. Bagaimana jika di plot ACF, semua lag nya keluar? Apakah itu tidak bisa diambil nilai untuk ordo MA (q)? Padahal data sudah stationer

    Terima kasih pak

    1. Biasanya setiap grafik acf dan pacf ada garis horizontal sejajar dengan sumbu x baik nilai positif maupun negatif. Bar yang melewati garis trsb dikatakan signifikan. Ada juga yang berpendapat jika ada lompatan nilai dari sebelum atau sesudah sekitar 2 nilai, juga bisa dikatakan signifikan

  8. Apakah arima harus menggunakan data periode bulanan dan tahunan? Apabila tahunan apakah bisa? Memang jadi tidak terlihat pola musiman atau tidak nya

  9. Halo, saya inging bertanya. Untuk gambar 6 itu kan tidak ada lag yang keluar, jadi penentuan orde p dan q nya seperti apa? Atau metode ARIMA tidak bisa digunakan untuk peramalan data ke 2 tsb?

    1. Klo kita perhatikan polanya dying down ya… bisa jadi polanya ar dan ma.
      Memang tidak ada yanh melewati garis, karena kita evaluasi pola grafiknya.

      Untuk lebih jelas, silahkan baca arima dan sarima sikembar dari time series. Disana dilengkapi video juga. Terima kasih

Tinggalkan Balasan ke Agung Batalkan balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *