Time Series : Data Juga Bisa Meramal

Data time series adalah tentang deret waktu. Bagi anda yang suka bola, tentunya tidak asing dengan istilah statistik bola. Isinya tentang pertandingan klub baik klub besar maupun klub kecil. Statistik bola tersebut biasanya digunakan untuk memprediksi kemenangan klub di pertandingan sebelumnya. Misal akan ada pertandingan antara Barcelona melawan Real Sociedad. Statistik atau history menunjukkan bahwa Barcelona selalu menang melawan Real Sociedad baik dalam kandang sendiri atau pun tandang. Tidak heran jika banyak yang menjagokan kemenangan Barcelona dalam pertandingan ini. Berbeda jika terjadi pertandingan antara Barcelona melawan Real Madrid, mungkin peluang penonton sepakbola sudah terbagi sama kuat antara Barcelona dan Real Madrid. Hal ini dikarenakan kedua tim sama sama kuat dan memiliki history yang seimbang.

Cerita diatas merupakan sebuah fenomena sederhana jika history atau data dahulu bisa dijadikan dasar untuk kita menentukan apa yang akan terjadi di pertandingan mendatang atau bisa dikatakan apa yang akan terjadi di masa mendatang. Cerita sederhana namun banyak dirasakan oleh pecinta sepakbola untuk membantu bagaimana data bisa melancarkan kita untuk menentukan sikap dimasa yang akan datang.

Dalam keseharian, ternyata tidak hanya dunia bola yang menggunakan data history atau time series untuk melakukan peramalan. Data BMKG misalnya, menentukan musim hujan pada bulan oktober sampai april. Hal ini selain ditentukan dari arah angin dan iklim permukaan laut, juga didasari oleh data time series 10 atau 20 tahun sebelumnya yang menghasilkan bahwa Bulan Oktober sampai April biasanya turun hujan.

Contoh lain adalah jumlah pengunjung dalam suatu mall. Ada jam jam tertentu dalam satu hari, mall itu selalu ramai, biasanya waktu pulang kantor hingga menjelang malam. Jika di telusuri secara lebih umum, bulan bulan tertentu  seperti menjelang lebaran atau natal biasanya mall sangat ramai dan bahkan sampai out stock atau kehabisan barang.

Lalu, apa masalahnya?

Peramalan yang dihasilkan oleh time series ini biasanya juga mempengaruhi keputusan individu atau lembaga dan instansi. Misalnya pada contoh musim hujan yag terjadi pada bulan oktober – april. Pemerintah DKI jakarta tentu meski harus membenahi sungai sebelum waktu tersebut agar banjir bisa dikurangi atau dihilangkan. Petani juga menentukan kapan waktu tanam saat mulai musim hujan. Kementerian pertanian mengeluarkan aplikasi kalender tanam yang dapat memandu para petani melakukan olah lahan dan komoditas berdasarkan prediksi curah hujan dan iklim serta kondisi lahan.

Contoh kedua tentang mall. Perusahaan produksi harus memperhitungkan berapa yang disupply di bulan sebelum hari raya, berapa yang harus diproduksi menjelang hari raya, dan berapa cadangan barang yang harus disediakan sebelum hari raya tiba. Semua itu berdasarkan angka perkiraan time series yang digunakan oleh perusahaan tersebut agar keuntungan yang diperoleh bisa maksimal atau perusahaan tidak mengalami kehilangan pembelian akibat kekurangan barang di mall tersebut. Jika perusahaan kehilangan pembelian akibat out stock, menjadi fatal akibatnya karena konsumen bisa beralih ke produk kompetitor dan berpeluang akan kehilangan konsumen jika ternyata konsumen tersebut menyukai produk kompetitor.

Saya sangat hapal problem supply chain ini karena pernah bekerja di perusahaan bagian supply chain dan perencanaan produksi.

Mengingat pentingnya perencanaan dan peramalan data di masa mendatang, maka salah satu ilmu kuantitatif ini, peramalan bisnis, menjadi salah satu mata kuliah yang harus dikuasai oleh calon pebisnis dan pengambil keputusan.

Pengertian Time Series

Time series atau data deret waktu adalah data yang dikumpulkan dan diamati atas rentang waktu tertentu. Terdapat empat unsur dalam data deret waktu; yakni trend, musiman, siklus, dan random atau komponen acak. Pola trend biasanya terlihat dari grafik yang naik atau turun dalam waktu yang panjang (10 tahun, 20 tahun, 15 tahun, 5 tahun). Sedangkan musiman biasanya data naik dan turun dalam jangka yang pendek misalnya satu tahun. Hal ini yang membedakan dengan siklus, siklus juga menunjukkan pola yang naik dan turun namun dalam jangka waktu yang lama. Komponen terakhir merupakan random yakni variable lain yang tidak dapat dijelaskan oleh ketiga komponen sebelumnya (acak).

Tehnik Time Series

Tehnik Time series merupakan data history yang digunakan untuk meramalkan data berikutnya. Hampir sama dengan regresi, Y merupakan data history dan X adalah data periode atau time itu sendiri, bisa bernilai 1 untuk data yang paling awal, dan bernilai 2 untuk data berikutnya dan seterusnya. Model yang dihasilkan akan digunakan untuk meramalkan nilai Y berikutnya. Lalu apakah menggunakan r-squared? Jawabnnya bisa, meskipun time series dalam pengukuran akurasinya tidak menggunakan R-squared, namun karena time series juga termasuk model persamaan, seharusnya R-squared juga bisa digunakan untuk menilai apakah persamaan yang dihasilkan baik atau tidak.

Berbagai macam tehnik time series adalah sebagai berikut:

Naïve

Tehnik naïve merupakan tehnik time series yang paling sederhana. Deskripsi singkat tentang tehnik naïve ini adalah kita memprediksi dengan data satu periode sebelumnya. Misalnya penjualan bulan maret adalah 20 unit, maka kita memprediksi penjualan april juga sebesar 20 unit. Atau dalam hitungan tahun, jika penjualan tahun 2010 sebesar 200 unit, maka kita memprediksi penjualan tahun 2011 juga sebanyak 200 unit.

Dalam persamaan dapat ditulis sebagai berikut:

Y prediksi = Y t-1

Moving average

Tehnik moving average (MA) merupakan pengembangan dari tehnik naïve. Jika naïve hanya menggunakan data 1 periode sebelumnya untuk menentukan atau meramalkan data kedepan, maka MA menggunakan beberapa data periode kedepan dan kemudian dirata-ratakan untuk menentukan data berikutnya. Jumlah data yang digunakan biasanya disebut ordo. Dikatakan moving average atau rataan yang bergerak karena average yang digunakan seolah bergerak tergantung data yang ingin diprediksi. Bingung? Perhatikan contoh ilustrasi berikut:

Data:
1              = A
2              = B
3              = C
4              = D
5              = E

Untuk menentukan data ke 6, misal kita menggunakan MA (2), atau disebut MA ordo 2, maka:

Ypred4 = average(B,C)
Ypred5 = average(C,D)
Ypred6 = average(D,E)
Ypred7 =average(E,F)

Perhatikan bahwa rataannya bergerak mengikuti Y prediksi. Jika ordo yang digunakan 3, maka jumlah data yang dirata-rata adalah 3 data sebelum Y prediksi. Paham?

Tehnik MA selanjutnya dapat dikembangkan menjadi tehnik double MA. Yakni hasil MA dari rataan bergerak nilai aktualnya dilakukan MA kembali atau melakukan rataan bergerak sebanyak dua kali.

Tehnik Trend

Tehnik trend merupakan tehnik yang umum digunakan pada analisis peramalan data kuantitatif. Pada dasarnya kita mencari pola trend pada data yang kita miliki; misalnya linear, kuadratic, S kurve, atau exponential; yang selanjutnya kita gunakan model tersebut untuk memperkirakan data selanjutnya.

Model linear : Ypred = a + bT + e, Model kuadratic: Ypred = a + bT2 + cT + e, Model S kurve : Ypred = L/(1+exp(a+b(T) + e), Model exponential: Ypred = a + eb.T

Anda tidak perlu kuatir dengan banyaknya pilihan yang digunakan untuk melakukan tehnik data peramalan karena dapat menggunakan software untuk membantu pemrosesan data.

Tehnik mana yang paling baik?

Kita bisa mengatakan sebuah model peramalan paling baik jika model tersebut memiliki kriteria error yang paling kecil. Jadi, model mendapatkan Ypred, yang kemudian dibandingkan dengan Yact, kemudian dihitung nilai errornya. Beberapa tehnik perhitungan nilai errornya adalah

Mean Absolut Error (MAE) atau Mean Absolut Deviation (MAD)

Berdasarkan namanya, merupakan nilai rata-rata dari nilai absolut error. Atau dapat ditulis dengan persamaan

14 mae

Mean Squared Error (MSE) atau Mean Squared Deviation (MSD)

Merupakan nilai rata-rata dari kuadrat errornya, atau dapat ditulis dengan persamaan:

15 mse

Mean Percentage error (MAPE)

Merupakan rata-rata dari persentase error terhadap nilai aktual

mape

Langsung saja, kita lanjutkan dengan praktek disoftware. Saya biasa menganalisis trend dengan menggunakan minitab. Bukan promosi, namun saya rasa aplikasi ini lebih ringan untuk menentukan model trend yang ingin kita gunakan.

Saya memiliki data produksi jagung di 11 tahun beruntun

00 time series

Kemudian klik stat – time series – trend analysis

Masukkan variabel jagung kemudian pilih model type. Kali ini saya gunakan linear terlebih dahulu pada model type. Anda bisa mengatur output yang akan keluar di minitab seperti grafik pada tombol graphs. Namun biasanya tidak saya lakukan sebelum saya tau model mana yang paling tepat. Kemudian klik OK

Maka muncullah sebuah grafik dengan informasi garis model linear dan Yact. Berikut data MSD, MAPE dan MAD.

Saya lakukan hal yang serupa diatas untuk mendapatkan model trend quadratic, exponential growth, dan S-curve. Hasil yang saya peroleh berturut-turut adalah sebagai berikut:

04 time series
05 time series

Untuk s-curve ternyata minitab langsung memberitahukan bahwa data diatas tidak cocok untuk model S-kurve

Data MSD MAD dan MAPE kemudian saya satukan dan saya tentukan mana nilai yang paling rendah.

06 time series

Dari model tersebut, terlihat bahwa model quadratic adalah model yang paling baik dari tehnik trend untuk menggambarkan nilai produksi jagung. Lalu bagaimana jika kita coba moving average? Kita bisa lakukan perbandingan kembali.

Masih di minitab, klik stat – time series – moving average

07 time series

Isi variabelnya, MA length merupakan ordo dari MA, kita isikan nilai 3 misalnya. Anda bisa mencoba coba mengisi 2 atau nilai lainnya. Kali ini saya coba langsung dengan nilai 3, karena artikel ini sudah mulai panjang. Minitab juga memberi pilihan moving average dalam bentuk center MA atau tidak. Penjelasan yang saya gunakan di bagian atas adalah tidak menggunakan center MA. Center MA adalah tehnik MA dengan nilai Ypred diperoleh dengan cara merata-ratakan dengan posisi Ypred ditengah. Artinya jika MA (3) berarti rata rata dari Yt-1, Yt, dan Yt+2. Pada latihan ini saya tidak menggunakan Center MA. Klik OK

08 time series

Hasil yang saya peroleh

08 time series

Kemudian nilai errornya saya bandingkan dengan model – model sebelumnya

10 time series

Ternyata masih trend quadratic yang pantas untuk melakukan peramalan data.

Maka kesimpulannya kita akan menggunakan model quadratic untuk meramalkan data. Bagaimana caranya, kita klik stat – time series – trend analisis. Kemudian kita pilih model quadratic. Kitaklik generate forecast. Kita isi number forecastnya 5, mulai dari data ke 11 (ini contoh, anda bisa mengisinya sesuai tujuan penelitian). Kemudian todak lupa kita mau menentukan nilai ypred atau di minitab dikenal istilah Fits dan residualnya untuk nanti menghitung R squared. Klik storage dan centang fits, forecast dan residualnya. Klik ok klik Ok

11 time series

Hasil yang diperoleh adalah seperti ini:

12 time series

Terlihat bahwa peramalan untuk data ke 12 sampai ke 16. Pada kolom C4 atau di session minitab.

R squared

Seperti yang saya janjikan sebelumnya, kita juga bisa mencari R-squared untuk mengetahui seberapa baik model yang kita gunakan seperti kita menilai model regresi.

Rumus R-squared adalah : 1 – (JKS/JKT)

JKS atau jumlah kuadrat sisaan = (Yact – Ypred)
JKT atau jumlah kuadrat total = (Yact – Ymean)2,
Ymean merupakan nilai rata –rata dari Yact

Saya proses nilai Fits dan residu yang berasal dari minitab tadi, saya pindahkan ke excell dan kita hitung nilai R-squarednya. Saya peroleh hasil sebagai berikut:

13 time series

Hasilnya r-squared adalah 76%, artinya model kuadratic mampu menjelaskan nilai Y sebesar 76%, sedangkan sisanya adalah nilai error. Kategori model ini sudah dapat dikatakan baik untuk digunakan meramalkan data berikutnya.

Masih ada beberapa tehnik peramalan lainnya, pada awalnya saya ingin jelaskan semua dalam satu artikel, namun tampaknya tidak memungkinkan. Semoga saya bisa menulis artikel berikutnya tentang smoothing, dan Arima Sarima, juga masih merupakan tehnik peramalan data kuantitatif

Terima kasih sudah berkunjung

update:

Arima dan Sarima telah saya bahas di : ARIMA SARIMA: Si Kembar dari Time Series
video dibawah ini merupakan salah satu penggunaan analisis time series yang aplikatif:

90 thoughts on “Time Series : Data Juga Bisa Meramal

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *