Custom Search

ARIMA SARIMA : Si Kembar dari Time Series

Melanjutkan pembahasan time series sebelumnya, disini saya akan membahas salah satu metode analisis time series yang cukup terkenal di era 1990 hingga kini, yakni Arima dan Sarima. Arima sebenarnya singkatan dari Autoregressive integrated Moving Average.  Sedangkan Sarima sama dengan Arima hanya ditambah awalnya dengan kata Seasonal. Berdasarkan asal namanya, Arima sebenarnya merupakan gabungan antara autoregressive dan moving average. Model yang dibangun nantipun berdasarkan kedua kriteria ini. Apakah modelnya autoregressive murni, moving average murni, atau gabungan keduanya. Nanti kita tentukan berdasarkan pola data ACF dan PACFnya.

Arima dan Sarima ini merupakan metode analisis time series, sama seperti analisis tren, moving average, atau naïve yang sudah saya jelaskan sebelumnya. Hal yang penting yang perlu diperhatikan dalam menganalisis data time series adalah ketepatan model. Meskipun Arima dan Sarima tampaknya lebih modern dibandingkan metode lainnya, karena model persamaannya yang njlimet dan terkesan high class, namun persamaan yang diperoleh tetap harus dibandingkan dengan analisis lainnya. Model yang baik adalah model yang memiliki nilai MSE atau MSD yang paling kecil. Jadi, meskipun anda menggunakan Arima dan sarima dalam menganalisis data timeseries, tetapi hasil MSE yang diperoleh masih tidak lebih baik dibandingkan tren dan moving average, maka ibarat anda menggunakan gergaji mesin untuk memotong rumput di halaman rumah anda.

Tidak ada tools yang paling baik, tetapi tools yang tepat! 

Tahapan Analisis

Adapun tahap-tahapan yang harus dilalui dalam analisis Arima dan Sarima ini adalah :

Identifikasi

Identifikasi data yang akan kita proses apakah mengandung tren, atau seasonal. Arima Sarima mensyaratkan data yang diproses harus stasioner. Stasioner dalam istilah saya artinya data berfluktuatif dalam nilai tertentu, tidak menunjukkan tren kenaikan atau penurunan. Jika ternyata data menunjukkan adanya tren, kita lakukan differencing atau pembedaan. Pembedaan pertama atau jika diperlukan pembedaan kedua. Tujuannya? Agar data menjadi stasioner.

Contoh grafik data yang sudah stasioner dan belum.

Estimasi

Setelah data kita pastikan stasioner, kita mulai mengestimasi model Arima atau Sarima. Cara estimasinya dengan cara mengamati ACF dan PACF. Apa itu? ACF merupakan singkatan dari Autocorrelation Function, yang mengindikasikan nilai autoregressive. PACF merupkan singkatan Parcial Autocorrelation Function, yang mengindikasikan nilai Moving Averagenya. Dalam menentukan data mengandung Autoregressive (AR) atau Moving Average (MA) adalah melihat pola atau perilaku ACF dan PACFnya. Hal yang perlu dipahami dalam bagian ini adalah anda harus mengerti mana pola yang dikatakan Cut Off, dan mana pola yang dikatakan dying down.

Pola cut off terjadi apabila data mendekati nilai 0 pada lag – lag awal atau terlihat gambar yang langsung menurun drastis (cut off). Sedangkan dying down biasanya terlihat menurun perlahan-lahan mendekati nilai 0. Belum ada kepastian berapa lag yang termasuk dalam lag awal, ada yang menjelaskan 5 data awal, ada juga yang menjelaskan 10 data awal. Namun biasanya kita melihat pola dari gambar sudah dapat diketahui apakah itu menurun perlahan atau langsung drastis/cut off.

Biasanya pada pola cut off, nilai |T| langsung tidak signifikan pada lag 2 atau 3, sedangkan pola dying down nilai |T| signifikan pada lag-lag awal. Data signifikan apabila nilai |T| > 2 untuk Arima, dan |T| > 1.25 untuk Sarima

Pola ACF dan PACF juga mencerminkan kestasioneran data. Data yang belum stasioner biasanya memiliki pola dying down dengan nilai |T| yang signifikan di hampir semua lag (dominan).  Maka bila menjumpai data keduanya (PACF dan ACF) dying down dengan nilai |T| yang signifikan, sebaiknya melakukan identifikasi ulang dan melakukan tahap pembedaan / differencing.

Contoh pola dying down

Contoh pola cut off

Evaluasi Model

Jika anda sudah mengerti differencing atau differences atau pembedaan, tergantung software mana yang anda gunakan, maka anda sudah mengerti tehnik Arima Sarima ini. Selanjutnya adalah running software dan menentukan model yang selanjutnya tentu kita mengevaluasi model tersebut. Evaluasi model nanti sama dengan tehnik time series lainnya yakni MSE (Mean Square Error) yang dikeluarkan oleh software minitab. Selain itu dalam analisis Arima juga mengevaluasi iteration yang mengharuskan untuk convergence, residual peramalan harus bersifat acak, model harus yang paling sederhana, parameter yang disetimasi berbeda nyata dengan nol, dan kondisi stasioneritas harus terpenuhi.

Bingung? Nanti kita langsung praktekkan untuk menentukan modelnya.

Peramalan

Setelah mengetahui model, maka langkah terahir sesuai tujuan penelitian adalah melakukan peramalan data. Peramalan tidak hanya dilakukan untuk masa mendatang saja, melainkan bisa juga digunakan untuk menentukan berapa nilai seharusnya jika menggunakan model yang kita peroleh. Tujuannya? Untuk menentukan nilai error untuk kasus tertentu, misalnya iklim yang sudah saya gunakan pada tulisan Pengaruh Perubahan Iklim Terhadap Produksi Tanaman Pangan.

Demikianlah tahapan yang mesti anda lalui dalam metode Arima dan Sarima nantinya, terlihat memang belum runut, karena penjelasan sebelumnya merupakan definisi agar saya tidak perlu mengulangnya dan bisa memberi contoh yang runut pada tahapan Arima.

Mari kita langsung saja menuju data dan praktikum…hehehehe 🙂 . Saya menggunakan minitab 17. Oh iya, anda bisa juga mendownload data yang saya gunakan jika mau mengikuti untuk belajar bersama saya di tutorial ini. Silahkan download data mentahnya disini

ARIMA

Arima memiliki model ARIMA = (p, d, q). p merupakan nilai Autoregressive atau ACF. D merupakan nilai differencing. Dan q merupakan nilai moving average atau PACFnya. Saya tidak menjelaskan bagaimana persamaan matematikanya, anda bisa mendownload melalui mesin pencari dan anda bisa gunakan sebagai rujukan. Karena artikel ini berupa tutorial bagimana anda mengolah data menggunakan Arima dan Sarima. Selain itu, saya juga masih bingung bagaimana menulis lambang dan rumus matematika yang cukup njilmet itu disini. 🙂

Data yang saya gunakan adalah seperti ini:

Kita gunakakan plot time series untuk melihat apakah data ini memiliki pola tren atau tidak. Pilih stat – timeseries – time series plot.

Pilih simple, kemudian Kita masukkan variabel X3 di kolom X3 dikolom series. Haislnya adalah sebagai berikut:

Terlihat sekali bahwa variabel X3 ini memiliki unsur tren. Maka kita harus melakukan pembedaan atau differences terhadap data tersebut. Namun sebelumnya, apa sih pembedaan itu? Bagaimana cara manual yang dapat dipahami?

Differencing merupakan tahapan olah data dengan menghitung nilai perbedaan antara Yt dengan Yt-1. Jadi sebenarnya kita menghitung data tersebut dengan data sebelumnya. Karena yang kita olah adalah data selisih, maka dipastikan unsur tren akan hilang. Namun ada beberapa kasus data tren belum hilang setelah dilakukan differencing. Maka yang kita lakukan adalah melakukan differencing pada data yang telah dilakukan differencing sebelumnya. Tahap ini berarti memiliki nilai difference 2, artinya data dilakukan differencing sebanyak dua kali. Bagaimana jika belum juga? Sejauh ini saya belum menjumpai differencing lebih dari dua. Namun jika memang terjadi demikian, bisa saja anda coba.

Kembali ke data. Kita lakukan differencing. Anda bisa melakukan manual atau langsung bantuan minitab. Karena saya sudah membuka minitab, maka saya pun menggunakannya untuk tahap differencing ini. Pilih stat – time series – differences

Masukkkan variabel X3 ke kolom series dengan cara mengklik 2 kali pada variabel, isi C2 pada store differences in:, dan masukkan nilai I pada kolom lag. Nilai ini berarti kita mendifference 1 lag sebelumnya. Kemudian klik OK

Akan muncul nilai difference tersebut pada kolom C2, saya beri nama variabelnya dif_1. Lalu, kita akan melihat pola ACF dan PACF mana yang dying down dan mana yang cut off. Apa itu dying down? Sudah saya jelaskan diatas ya… 🙂

Klik stat – time series – autocorrelation. Masukkan variabel dif_1 ke kolom series, number of lags kita isi 15 (bisa 20 atau 10 yang jelas jangan melebihi jumlah data yang anda miliki), klik OK. Maka akan muncul gambar ACF.

Klik stat – time series – partial autocorrelation. Masukkan variabel dif_1 ke kolom series, number of lags kita isi 15 (bisa 20 atau 10 yang jelas jangan melebihi jumlah data yang anda miliki) jangan memilih default nnumber of lags karena jumlah data yng ditampilkan biasanya hanya sedikit, sekitar 5 dan itu belum mencerminkan pola, klik OK. Maka akan muncul gambar PACF.

Gambar yang dihasilkan adalah sebagai berikut:

Sebelah kiri adalah ACF, sebelah kanan adalah PACF. Tampak pada grafik ACF langsung cut off di lag ketiga, sedangkan PACF terlihat dying down karena baru cut off di lag ke lima. Kita bisa tarik kesimpulan bahwa ACF cut off dan PACF memiliki pola dying down.

Dasar yang digunakan untuk menentukan model adalah sebagai berikut:

Jika ACF menunjukkan pola dying down, dan PACF menunjukkan cut off, maka dapat dikatakan model ARIMA berupa AR murni.
Jika ACF menunjukkan pola cut off, dan PACF menunjukkan dying down, maka dapat dikatakan model ARIMA berupa MA murni.
Jika ACF dan PACF menunjukkan dying down maka  dapat dikatakan model ARIMA berupa gabungan AR dan MA.

 

Model ARIMA (p, d, q). karena model pada tutorial ini adalah MA murni, maka kita bisa beri nilai p = 0, d = 1 (kita melakukan differencing pertama), dan q = 1. Pola ini menunjukkan MA murni.

Bisa saja anda mencoba ARIMA (0, 1, 2), juga merupakan MA murni,  pada model nantinya dan kemudian melihat nilai MSE. Kita sudah berada pada tahap estimasi model. Kita bisa mencoba beberapa model untuk kemudian dibandingkan dengan cara menaikkan nilai AR atau MA dan kemudian dibandingkan nilai MSE dan indikator lainnya. Namun tidak disarankan anda menaikkan atau menurunkan langsung keduanya (AR dan MA).

Kembali pada data, kita akan proses dengan model ARIMA (0,1,1). Klik stat – time series – ARIMA. Kemudian isikan variabel dif_1 pada series, isi 0 pada autoregressive, nilai 1 pada difference, dan 1 pada kolom moving average. Kemudian klik OK.

Hasil yang kita peroleh adalah:
  1. Residual sudah bersifat acak. Hal ini dibuktikan dengan indikator Box-ljung statistik yang memiliki nilai p-value > 0.05
  2. Kondisi invertibilitas dan stasioneritas sudah terpenuhi. Hal ini ditunjukkan dengan koefisien yang diperoleh (dalm hal ini koefisien MA) < 1. Nilai koefisien MA dan AR harus <1
  3. Proses iterasi sudah convergence. Ditunjukkan dengan kalimat “relative change in each estimate less than 0.0010”
  4. MS atau MSE yang diperoleh adalah 7.903. apakah ini merupakan nilai MS yang paling rendah, akan kita buktikan dengan membandingkan model yang lain
  5. Model sudah yang paling sederhana? Kita bisa buktikan dengan memproses ARIMA tanpa difference. Hasilnya tidak bisa dilakukan estimasi karena data tidak konvergence. Artinya model ARIMA dengan differencing 1 ini merupakan model yang paling sederhana, hanya kita perlu estimasi lagi untuk memenuhi point nomor 4.

Untuk memenuhi point no 4, saya running ARIMA (0,1,2) dan ARIMA (1,1,1). Hasil yang diperoleh adalah:

ARIMA (1,1,1)

MS yang dihasilkan lebih rendah yakni 6.066. namun data tidak convergence dan kondisi invertibilitas ataupun stasioneritas tidak terpenuhi karena koefisien MA >1

ARIMA (0,1,2)

MS yang dihasilkan lebih kecil, yakni 7.364. namun data tidak convergence. Sehingga kita bisa menyimpulkan bahwa ARIMA (0,1,1) merupakan model yang paling sederhana yang memenuhi kriteria pada evaluasi model.

Pada tahap terakhir kita akan mengambil nilai peramalan. Lakukan ARIMA0,1,1) sebelum klik OK, klik forecast terlebih dahulu, isikan jumlah peramalan yang akan di minta, bermula dari data keberapa (Origin), dan di tempatkan pada kolom mana saja (Storage forecast, lower limits, dan upper limits)

Dan hasilnya adalah sebagai berikut:

Atau bisa dilihat pada worksheet sudah terisi nilai forecast, batas bawah dan batas atas.

SARIMA

Hal yang membedakan SARIMA dari ARIMA adalah seasonalnya. Untuk itu, kita juga harus tau berapa pola pengulangan dari seasonal yang kita miliki. Apakah tiap 3 bulan? Tiap tahun? Dan sebagainya. Karena ini akan menentukan langkah yang kita gunakan nantinya.

Contoh data musiman:

Terlihat bahwa grafiknya melakukan pengulangan pola dalam kurun 12 lag, atau bisa dikatakan mengalami pengulangan pola tahunan.

Pada prinsipnya model sarima sama dengan model arima, yang membedakannya adalah proses pembedaannya atau difference nantinya dibedakan antara difference regular dan difference musiman taua bahasa lainnya seasonal difference.

saya punya data, bisa di download disini jika anda ingin belajar bersama saya 🙂

Data sebanyak n = 60 yang saya dapatkan dari random dan saya duga mengandung unsur seasonal sehingga cocok untuk latihan ini.

Langkah pertama saya lihat ACF. Number of lagnya saya isikan 35. Saya peroleh sebagai berikut:

Tampak sekali data tidak stasioner. Kemudian saya lakukan difference reguler pertama di kolom C2, saya beri nama difreg_1. Kemudian difreg_1 ini saya lihat pola ACFnya. Saya peroleh sebagai berikut:

 

Jika kita lihat nilai |T| dominasinya sudah < 2, namun pada lag 12, 24 memiliki nilai yang >2. Inilah tandanya kita harus melakukan differencing musiman. Dengan cara nilai lag saat melakukan difference yang tadinya bernilai 1, kini kita masukkan nilai 12. Nilai 12 ini disesuaikan siklus musiman yang terjadi, bisa bernilai triwulan atau sebagainya. Cara menentukannya anda bisa melihat nilai T pada differen reguler ini.

Pada saat melakukan seasonal difference, variabel yang di difference adalah variabel difreg_1 dengan nilai lag 12. Pembedaan ini dinamakan pembedaan reguler pertama dan pembedaan musiman pertama. Saya letakkan di kolom C3 dan saya beri nama difmus_1. Selanjutnya saya kembali lihat pola ACF dari variabel difmus_1 ini. Hasilnya adalah:

Penentuan dying down atau PACF untuk Sarima adalah sebagai berikut:

pola dikatakan cut off apabila :
  1. koefisien korelasi tidak signifikan pada lag 2 atau kurang untuk lag non musiman. Dikatakan tidak signifikan jika |t| < 2 untuk non musiman, dan
  2. tidak signifikan pada lag + 2 atau kurang untuk lag musiman. Dikatakan tidak signifikan jika |t| < 1,25.

Jika dilihat dari ciri ciri yang diperoleh, maka pola ACF adalah dying down. Artinya nilai ada unsur AR pada seasonal.

Kemudian kita lihat nilai PACF pada variabel X (data sebelum dilakukan pembedaan). Kemudian PACF pada nilai difreg_1, dan difmus 1. Hasilnya saya peroleh berturut2 adalah:

arima sarima

Jika dilihat dari pola PACF, maka dapat dikatakan PACF memiliki nilai cut off karena nilai lag +2 atau kurang signifikan < 1.25.

Estimasi modelnya adalah : [ARIMA (0,1,0) (1,1,0)12]

pada kurung pertama adalah nilai non musiman, dan kurung kedua adalah nilai musiman dengan lag 12. Caranya adalah klik stat – time series – ARIMA.

Kemudian isikan beri ceklist pada fit seasonal model dan isikan sebagaimana gambar berikut:

Dan hasilnya adalah sebagai berikut:

Nilai MS atau MSE yang didapat 9.409. kemudian kita coba dengan model pembandingnya [ARIMA (0,1,0) (1,1,1)12] hasil yang diperoleh nilai MS lebih besar dan tidak convergence. Sehingga masih baik model pertama yakni

[ARIMA (0,1,0) (1,1,0)12]

 

Selanjutnya silahkan anda bereksplorasi dengan data yang anda miliki.

Terima kasih sudah berkunjung

Persepsi Petani Terhadap Gapoktan Sebagai Pengelola Dana Bantuan Langsung Masyarakat (BLM) dan Pengembangan Usaha Agribisnis Perdesaan (PUAP) di Pulau Seram

Sebuah karya tulis ilmiah yang dimuat dalam buku “Kemandirian Modal Petani dalam Perspektif Kebijakan Puap”.  Artikel ini bercerita tentang persepsi petani terhadap gapoktan yang ditugaskan untuk mengelola dana Bantuan Langsung Masyarakat (BLM).

Gapoktan (gabungan kelompok tani) merupakan suatu organisasi yang terdiri dari beberapa kelompok tani. Biasanya dalam satu desa hanya terdapat satu gapoktan. Gapoktan terdiri dari ketua, bendahara, sekretaris dan anggota. Syarat menjadi anggota dan pengurus gapoktan adalah harus menjadi petani, baik secara real maupun secara administratif (ditunjukkan dengan bukti KTP).

Pengembangan Usaha Agribisnis Pedesaan (PUAP) merupakan sebuah program pemerintah berupa fasilitas bantuan modal usaha untuk petani anggota, baik petani pemiliki, petani penggarap, buruh tani maupun  rumah tangga tani. PUAP menjadi salah satu kegiatan dari Program Nasional Pemberdayaan Masyarakat Mandiri (PNPM-M) yang dilaksanakan oleh Kementerian Pertanian yang pengelolaannya didampingi oleh tenaga penyuluh pendamping dan Penyelia Mitra Tani (PMT). Adapun tujuan program tersebut adalah untuk mempercepat tumbuh dan berkembangnya usaha agribisnis dengan sasaran mengurangi kemiskinan dan pengangguran di perdesaan.

Penetapan lokasi sebenarnya dibatasi faktor kemampuan jelajah penulis yang tidak bisa mengeksplore keseluruh wilayah di Provinsi Maluku. Maluku merupakan wilayah kepulauan sehingga membutuhkan biaya yang tinggi untuk dapat mengunjungi satu persatu kabupaten. Pemilihan Pulau Seram juga karena Pulau Seram merupakan pulau yang terdiri dari 3 kabupaten di Provinsi Maluku, Yakni Maluku Tengah, Dseram Bagian Timur, dan Seram Bagian Barat, sehingga dapat dikatakan mewakili kabupaten lainnya di Provinsi Maluku.

Alat analisis yang digunakan pada tulisan ini adalah analisis regresi logistik yang mengelompokkan responden menjadi dua, yakni petani yang menilai kinerja gapoktan berkinerja baik dan petai yang menilai gapoktan berkinerja buruk atau kurang baik. Variabel yang signifikan terhadap penilaian kinerja gapoktan dimata petani adalah pendidikan, jumlah tanggungan keluarga, dan lama profesi.

Petani yang memiliki tingkat pendidikan yang tinggi cenderung menilai gapoktan memiliki kinerja yang baik. Hal ini dapat dimengerti karena petani tersebut memahami pentingnya program PUAP untuk membantu petani dalam keterbatasan modal. Jumlah tanggungan dan lama profesi juga signifikan terhadap persepsi gapoktan. Petani yang memiliki jumlah anggota keluarga lebih banyak cenderung berpendapat bahwa program PUAP merupakan program yang tepat untuk mengatasi permasalahan modal di kalangan mereka.

Hal yang menarik yang tersirat dalam tulisan ini adalah bahwa gapoktan merupakan organisasi yang banyak terbentuk setelah program PUAP digulirkan. Banyak kelompok petani yang mengajukan diri untuk membuat gapoktan dengan tujuan menerima dana tersebut. Proses pengajuan instan ini yang banyak dipahami oleh masyarakat sendiri sebagai penyebab gagal uang PUAP bisa kembali ke pengurus gapoktan. Masyarakat menganggap dana tersebut merupakan dana masyarakat yang tidak perlu lagi dikembalikan ke negara. Dari istilahnya saja BLM berarti “ Bantuan langsung Masyarakat” sehingga masyarakat menganggapnya sebagai bagian dari bantuan langsung tunai yang saat itu sedang trend.

Namun contoh tersebut tidak bisa digeneralisasikan ke semua gapoktan di Indonesia. Terdpat beberapa gapoktan yang maju dan berhasil dengan adanya bantuan ini. Sistem norma yang berlaku di masyarakat berpengaruh sangat kuat terhadap proses aliran dana ini. Masyarakat yang memiliki aturan norma dan budaya malu terhadap hutang yang dipinjam, biasanya akan mengembalikan pinjaman usaha tersebut kepada pengurus gapoktan, meskipun pengembalian uang itu dengan cara meminjam uang saudara atau temannya. Kebijakan program di tengah masyarakat tersebut mampu menjadikan gapoktan lebih kuat dalam pendanaan dan memiliki aset tanah, bangunan, dan tabungan di bank. Bahkan, beberapa gapoktan membuat kelembagaan resmi simpan pinjam berupa koperasi yang awalnya hanya berupa Lembaga Keuangan Mikro Agribisnis (LKMA). Salah satu gapoktan yang berhasil dalam mengelola dana PUAP saya tuliskan dalam karya tulis yang berbeda.

Berikut adalah makalah yang berjudul Persepsi Petani Terhadap Gapoktan Sebagai Pengelola Dana Bantuan Langsung Masyarakat (BLM) dan Pengembangan Usaha Agribisnis Perdesaan (PUAP) di Pulau Seram

Beberapa point penting yang ingin ditekankan dalam tulisan ini adalah pentingnya komunikasi internal antara pengurus gapoktan dan anggotanya. Petani menganggap gapoktan memiliki kinerja yang baik apabila gapoktan menyediakan sarana komunikasi dan keputusan yang dibentuk sudah berdasarkan pada prinsip adil dan demokratis. Petani gapoktan yang memiliki ikatan sosial dengan organisasi gapoktan akan menghomati segala keputusan yang disepakati bersama. Begitupun sebaliknya, petani yang berpendapat gapoktan berkinerja buruk adalah mereka yang tidak melaksanakan musyawarah bersama dan tidak melakukan pertemuan rutin untuk membahas masalah yang mereka hadapi. Dana yang mereka terima hanya mereka teruskan kepada anggota gapoktan atau masyarakat desa tanpa pernah mengajak anggota untuk membahas usaha atau sistem aliran uang yang mestinya mereka lakukan untuk menindaklanjuti dana PUAP.

Meski program PUAP saat ini sudah tidak berjalan lagi, semoga saja ini dapat menjadi pelajaran bagi pemerintah yang akan mengeluarkan program yang lain untuk membantu petani dari sisi modal.

Time Series : Data Juga Bisa Meramal

Bagi anda yang suka bola, tentunya tidak asing dengan istilah statistik bola. Isinya tentang pertandingan klub baik klub besar maupun klub kecil. Statistik bola tersebut biasanya digunakan untuk memprediksi kemenangan klub di pertandingan sebelumnya. Misal akan ada pertandingan antara Barcelona melawan Real Sociedad. Statistik atau history menunjukkan bahwa Barcelona selalu menang melawan Real Sociedad baik dalam kandang sendiri atau pun tandang. Tidak heran jika banyak yang menjagokan kemenangan Barcelona dalam pertandingan ini. Berbeda jika terjadi pertandingan antara Barcelona melawan Real Madrid, mungkin peluang penonton sepakbola sudah terbagi sama kuat antara Barcelona dan Real Madrid. Hal ini dikarenakan kedua tim sama sama kuat dan memiliki history yang seimbang.

Cerita diatas merupakan sebuah fenomena sederhana jika history atau data dahulu bisa dijadikan dasar untuk kita menentukan apa yang akan terjadi di pertandingan mendatang atau bisa dikatakan apa yang akan terjadi di masa mendatang. Cerita sederhana namun banyak dirasakan oleh pecinta sepakbola untuk membantu bagaimana data bisa melancarkan kita untuk menentukan sikap dimasa yang akan datang.

Dalam keseharian, ternyata tidak hanya dunia bola yang menggunakan data history atau time series untuk melakukan peramalan. Data BMKG misalnya, menentukan musim hujan pada bulan oktober sampai april. Hal ini selain ditentukan dari arah angin dan iklim permukaan laut, juga didasari oleh data time series 10 atau 20 tahun sebelumnya yang menghasilkan bahwa Bulan Oktober sampai April biasanya turun hujan.

Contoh lain adalah jumlah pengunjung dalam suatu mall. Ada jam jam tertentu dalam satu hari, mall itu selalu ramai, biasanya waktu pulang kantor hingga menjelang malam. Jika di telusuri secara lebih umum, bulan bulan tertentu  seperti menjelang lebaran atau natal biasanya mall sangat ramai dan bahkan sampai out stock atau kehabisan barang.

Lalu, apa masalahnya?

Peramalan yang dihasilkan oleh time series ini biasanya juga mempengaruhi keputusan individu atau lembaga dan instansi. Misalnya pada contoh musim hujan yag terjadi pada bulan oktober – april. Pemerintah DKI jakarta tentu meski harus membenahi sungai sebelum waktu tersebut agar banjir bisa dikurangi atau dihilangkan. Petani juga menentukan kapan waktu tanam saat mulai musim hujan. Kementerian pertanian mengeluarkan aplikasi kalender tanam yang dapat memandu para petani melakukan olah lahan dan komoditas berdasarkan prediksi curah hujan dan iklim serta kondisi lahan.

Contoh kedua tentang mall. Perusahaan produksi harus memperhitungkan berapa yang disupply di bulan sebelum hari raya, berapa yang harus diproduksi menjelang hari raya, dan berapa cadangan barang yang harus disediakan sebelum hari raya tiba. Semua itu berdasarkan angka perkiraan time series yang digunakan oleh perusahaan tersebut agar keuntungan yang diperoleh bisa maksimal atau perusahaan tidak mengalami kehilangan pembelian akibat kekurangan barang di mall tersebut. Jika perusahaan kehilangan pembelian akibat out stock, menjadi fatal akibatnya karena konsumen bisa beralih ke produk kompetitor dan berpeluang akan kehilangan konsumen jika ternyata konsumen tersebut menyukai produk kompetitor.

Saya sangat hapal problem supply chain ini karena pernah bekerja di perusahaan bagian supply chain dan perencanaan produksi.

Mengingat pentingnya perencanaan dan peramalan data di masa mendatang, maka salah satu ilmu kuantitatif ini, peramalan bisnis, menjadi salah satu mata kuliah yang harus dikuasai oleh calon pebisnis dan pengambil keputusan.

Pengertian Time Series

Time series atau data deret waktu adalah data yang dikumpulkan dan diamati atas rentang waktu tertentu. Terdapat empat unsur dalam data deret waktu; yakni trend, musiman, siklus, dan random atau komponen acak. Pola trend biasanya terlihat dari grafik yang naik atau turun dalam waktu yang panjang (10 tahun, 20 tahun, 15 tahun, 5 tahun). Sedangkan musiman biasanya data naik dan turun dalam jangka yang pendek misalnya satu tahun. Hal ini yang membedakan dengan siklus, siklus juga menunjukkan pola yang naik dan turun namun dalam jangka waktu yang lama. Komponen terakhir merupakan random yakni variable lain yang tidak dapat dijelaskan oleh ketiga komponen sebelumnya (acak).

Tehnik Time Series

Tehnik Time series merupakan data history yang digunakan untuk meramalkan data berikutnya. Hampir sama dengan regresi, Y merupakan data history dan X adalah data periode atau time itu sendiri, bisa bernilai 1 untuk data yang paling awal, dan bernilai 2 untuk data berikutnya dan seterusnya. Model yang dihasilkan akan digunakan untuk meramalkan nilai Y berikutnya. Lalu apakah menggunakan r-squared? Jawabnnya bisa, meskipun time series dalam pengukuran akurasinya tidak menggunakan R-squared, namun karena time series juga termasuk model persamaan, seharusnya R-squared juga bisa digunakan untuk menilai apakah persamaan yang dihasilkan baik atau tidak.

Berbagai macam tehnik time series adalah sebagai berikut:

Naïve

Tehnik naïve merupakan tehnik time series yang paling sederhana. Deskripsi singkat tentang tehnik naïve ini adalah kita memprediksi dengan data satu periode sebelumnya. Misalnya penjualan bulan maret adalah 20 unit, maka kita memprediksi penjualan april juga sebesar 20 unit. Atau dalam hitungan tahun, jika penjualan tahun 2010 sebesar 200 unit, maka kita memprediksi penjualan tahun 2011 juga sebanyak 200 unit.

Dalam persamaan dapat ditulis sebagai berikut:

Y prediksi = Y t-1

Moving average

Tehnik moving average (MA) merupakan pengembangan dari tehnik naïve. Jika naïve hanya menggunakan data 1 periode sebelumnya untuk menentukan atau meramalkan data kedepan, maka MA menggunakan beberapa data periode kedepan dan kemudian dirata-ratakan untuk menentukan data berikutnya. Jumlah data yang digunakan biasanya disebut ordo. Dikatakan moving average atau rataan yang bergerak karena average yang digunakan seolah bergerak tergantung data yang ingin diprediksi. Bingung? Perhatikan contoh ilustrasi berikut:

Data       1              = A
                2              = B
                3              = C
                4              = D
                5              = E

Untuk menentukan data ke 6, misal kita menggunakan MA (2), atau disebut MA ordo 2, maka

Ypred4 = average(B,C)
Ypred5 = average(C,D)
Ypred6 = average(D,E)
Ypred7 =average(E,F)

 

Perhatikan bahwa rataannya bergerak mengikuti Y prediksi. Jika ordo yang digunakan 3, maka jumlah data yang dirata-rata adalah 3 data sebelum Y prediksi. Paham?

Tehnik MA selanjutnya dapat dikembangkan menjadi tehnik double MA. Yakni hasil MA dari rataan bergerak nilai aktualnya dilakukan MA kembali atau melakukan rataan bergerak sebanyak dua kali.

Tehnik Trend

Tehnik trend merupakan tehnik yang umum digunakan pada analisis peramalan data kuantitatif. Pada dasarnya kita mencari pola trend pada data yang kita miliki; misalnya linear, kuadratic, S kurve, atau exponential; yang selanjutnya kita gunakan model tersebut untuk memperkirakan data selanjutnya.

Model linear : Ypred = a + bT + e, Model kuadratic: Ypred = a + bT2 + cT + e, Model S kurve : Ypred = L/(1+exp(a+b(T) + e), Model exponential: Ypred = a + eb.T

Anda tidak perlu kuatir dengan banyaknya pilihan yang digunakan untuk melakukan tehnik data peramalan karena dapat menggunakan software untuk membantu pemrosesan data.

Tehnik mana yang paling baik?

Kita bisa mengatakan sebuah model peramalan paling baik jika model tersebut memiliki kriteria error yang paling kecil. Jadi, model mendapatkan Ypred, yang kemudian dibandingkan dengan Yact, kemudian dihitung nilai errornya. Beberapa tehnik perhitungan nilai errornya adalah

Mean Absolut Error (MAE) atau Mean Absolut Deviation (MAD)

Berdasarkan namanya, merupakan nilai rata-rata dari nilai absolut error. Atau dapat ditulis dengan persamaan

14 mae

Mean Squared Error (MSE) atau Mean Squared Deviation (MSD)

Merupakan nilai rata-rata dari kuadrat errornya, atau dapat ditulis dengan persamaan:

15 mse

Mean Percentage error (MAPE)

Merupakan rata-rata dari persentase error terhadap nilai aktual

mape

Langsung saja, kita lanjutkan dengan praktek disoftware. Saya biasa menganalisis trend dengan menggunakan minitab. Bukan promosi, namun saya rasa aplikasi ini lebih ringan untuk menentukan model trend yang ingin kita gunakan.

Saya memiliki data produksi jagung di 11 tahun beruntun

00 time series

Kemudian klik stat – time series – trend analysis

Masukkan variabel jagung kemudian pilih model type. Kali ini saya gunakan linear terlebih dahulu pada model type. Anda bisa mengatur output yang akan keluar di minitab seperti grafik pada tombol graphs. Namun biasanya tidak saya lakukan sebelum saya tau model mana yang paling tepat. Kemudian klik OK

Maka muncullah sebuah grafik dengan informasi garis model linear dan Yact. Berikut data MSD, MAPE dan MAD.

Saya lakukan hal yang serupa diatas untuk mendapatkan model trend quadratic, exponential growth, dan S-curve. Hasil yang saya peroleh berturut-turut adalah sebagai berikut:

04 time series

05 time series

Untuk s-curve ternyata minitab langsung memberitahukan bahwa data diatas tidak cocok untuk model S-kurve

Data MSD MAD dan MAPE kemudian saya satukan dan saya tentukan mana nilai yang paling rendah.

06 time series

Dari model tersebut, terlihat bahwa model quadratic adalah model yang paling baik dari tehnik trend untuk menggambarkan nilai produksi jagung. Lalu bagaimana jika kita coba moving average? Kita bisa lakukan perbandingan kembali.

Masih di minitab, klik stat – time series – moving average

07 time series

Isi variabelnya, MA length merupakan ordo dari MA, kita isikan nilai 3 misalnya. Anda bisa mencoba coba mengisi 2 atau nilai lainnya. Kali ini saya coba langsung dengan nilai 3, karena artikel ini sudah mulai panjang. Minitab juga memberi pilihan moving average dalam bentuk center MA atau tidak. Penjelasan yang saya gunakan di bagian atas adalah tidak menggunakan center MA. Center MA adalah tehnik MA dengan nilai Ypred diperoleh dengan cara merata-ratakan dengan posisi Ypred ditengah. Artinya jika MA (3) berarti rata rata dari Yt-1, Yt, dan Yt+2. Pada latihan ini saya tidak menggunakan Center MA. Klik OK

08 time series

Hasil yang saya peroleh

08 time series

Kemudian nilai errornya saya bandingkan dengan model – model sebelumnya

10 time series

Ternyata masih trend quadratic yang pantas untuk melakukan peramalan data.

Maka kesimpulannya kita akan menggunakan model quadratic untuk meramalkan data. Bagaimana caranya, kita klik stat – time series – trend analisis. Kemudian kita pilih model quadratic. Kitaklik generate forecast. Kita isi number forecastnya 5, mulai dari data ke 11 (ini contoh, anda bisa mengisinya sesuai tujuan penelitian). Kemudian todak lupa kita mau menentukan nilai ypred atau di minitab dikenal istilah Fits dan residualnya untuk nanti menghitung R squared. Klik storage dan centang fits, forecast dan residualnya. Klik ok klik Ok

11 time series

Hasil yang diperoleh adalah seperti ini:

12 time series

Terlihat bahwa peramalan untuk data ke 12 sampai ke 16. Pada kolom C4 atau di session minitab.

R squared

Seperti yang saya janjikan sebelumnya, kita juga bisa mencari R-squared untuk mengetahui seberapa baik model yang kita gunakan seperti kita menilai model regresi.

Rumus R-squared adalah : 1 – (JKS/JKT)

JKS atau jumlah kuadrat sisaan = (Yact – Ypred)2
JKT atau jumlah kuadrat total = (Yact – Ymean)2,
Ymean merupakan nilai rata –rata dari Yact

Saya proses nilai Fits dan residu yang berasal dari minitab tadi, saya pindahkan ke excell dan kita hitung nilai R-squarednya. Saya peroleh hasil sebagai berikut:

13 time series

Hasilnya r-squared adalah 76%, artinya model kuadratic mampu menjelaskan nilai Y sebesar 76%, sedangkan sisanya adalah nilai error. Kategori model ini sudah dapat dikatakan baik untuk digunakan meramalkan data berikutnya.

Masih ada beberapa tehnik peramalan lainnya, pada awalnya saya ingin jelaskan semua dalam satu artikel, namun tampaknya tidak memungkinkan. Semoga saya bisa menulis artikel berikutnya tentang smoothing, dan Arima Sarima, juga masih merupakan tehnik peramalan data kuantitatif

Terima kasih sudah berkunjung

update:

Arima dan Sarima telah saya bahas di : ARIMA SARIMA: Si Kembar dari Time Series

Page 10/23First...5...91011...1520...Last