Custom Search

Mengenal Dummy Dalam Regresi

Variabel dummy dalam regresi sedikit berbeda dengan variabel lainnya baik dalam pengolahan data ataupun saat membaca hasil regresi. Regresi linear atau regresi berganda merupakan suatu fungsi yang menjelaskan hubungan varaibel independen dengan variabel dependen. Satu variabel dependen (Y) biasanya dipengaruhi oleh beberapa varaibel independen (X). misalnya variabel produksi dipengaruhi oleh luas lahan, pupuk, jumlah tenaga kerja, modal.

Regresi memiliki beberapa persyaratan yang harus dipenuhi. Karena regresi masuk dalam statistik parametrik, tentunya variabel-variabel didalamnya memiliki skala interval atau rasio. Selain itu data-data yang akan digunakan juga harus memenuhi kaidah asumsi klasik. Tetapi, dari beberapa variable yang kita gunakan, bisa saja satu atau dua variabel tersebut berupa variabel dalam skala nominal atau ordinal. Variabel skala nominal atau ordinal di dalam regresi tersebut biasa dikenal sebagai variabel dummy.

Agar lebih gampang dipahami, saya berikan contoh variabel dummy dalam regresi. Misalkan saja kita ingin mengetahui pengaruh jenis kelamin terhadap pendapatan yang dibelanjakan ke mall. Kita buat variabel jenis kelamin dengan nilai 0 untuk laki-laki dan 1 untuk perempuan. Contoh lain, pengaruh keikutsertaan petani dalam keanggotaan kelompok tani terhadap pendapatan. Kita buat variabel keikutsertaan kelompok tani dengan nilai 0 untuk petani yang tidak menjadi anggota, dan 1 untuk petani yang menjadi anggota kelompok tani.

Variabel dummy dalam regresi berbeda dengan regresi logistik. variabel skala nominal di regresi logistik terletak di variabel dependen atau nilai Y. sedangkan dummy yang dimaksud disini adalah variabel skala nominal atau ordinal pada variabel independen (nilai X). bisakah dummy di dalam regresi logistik? jawabannya tentu saja bisa.

Pemberian nilai 0 dan 1 juga memiliki tehnik tersendiri. Agar mudah dalam menginterpretasikan hasil output regresi, sebaiknya nilai 1 diberikan kepada responden yang diharapkan memiliki pengaruh terhadap nilai Y. Misalnya contoh keanggotaan petani diatas, saya memiliki hipotesis bahwa keanggotaan ini memilikipengaruh terhadap pendapatan petani. Sehingga saya memberikan nilai 1 terhadap petani yang menjadi anggota kelompok tani. Karena nanti hasil koefisien pada variabel ini merupakan pembeda antara petani yang tidak menjadi anggota dan petani yang menjadi anggota kelompok tani. Jika anda memberi nilainya terbalik, sebenarnya tidak ada yang salah, namun besar kemungkinan nilai koefisien yang keluar nantinya bernilai negatif. Tidak ada yang salah dengan hasil perhitungan tersebut, hanya saja anda perlu mengerti cara menjelaskan nilai negatif tersebut.

Saya akan langsung praktekkan penggunaan variabel dummy dalam regresi di aplikasi minitab.

Saya memiliki data latihan yang bisa diunduh disini. Data tersebut merupakan data rekayasa yang secara random saya peroleh melalui excell. Terdapat 5 variabel independen, dimana salah satunya yakni variabel X2 merupakan variabel dummy dalam regresi.

Mari kita buka minitabnya. Saya menggunakan minitab 17.

Kita masukkan datanya di sheet minitab

Kemudian klik stat – regression – regression – fit regression model

Responses kita masukkan variabel Y, continous preditors kita masukkan X1, X3, X4, X5. Sedangkan variabel X2 yang merupakan variabel dummy dalam regresi kita masukkan ke categorical predictors

Klik Ok dan tunggu hasilnya..

Terlihat dari model summary, nilai R-sq pada model memiliki nilai 65.09% artinya bahwa 65% data yang diolah mampu dijelaskan oleh model hasil minitab tersebut. Bisa dikatakan bahwa model ini cukup untuk merepresentasikan data yang ada.

Dilihat dari nilai p value, diantara kelima variabel hanya X2 yang memiliki nilai dibawah 0.05. artinya hanya x2 yang signifikan mempengaruhi nilai Y. dilihat dari nilai VIF, variabel X1 dan variabel X4 memiliki nilai diatas 10, artinya kedua variabel tersebut memiliki masalah multikolinear (sudah saya bahas di uji asumsi klasik).

Asumsi saya bahwa output diatas sudah dibenahi sesuai uji asumsi klasik, saya akan menjelaskan output variabel dummy sesuai tema artikel kali ini.

Pada kolom koeffisien nilai 1 pada variabel X2 memiliki nilai 3876. Artinya bahwa responden yang memiliki nilai 1 secara signifikan memiliki 3876 Y yang lebih tinggi daripada responden yang bernilai 0. Hal ini juga bisa diperoleh dari regression equation pada bagian paling bawah, yakni sbb:

Nilai model regresi saat X2 bernilai 0 adalah : 5468 + 2.89X1 – 19.0X3 – 5.74X4 – 1.49X5. sedangkan model regressi saat X2 bernilai 1 adalah : 9344 + 2.89X1 – 19.0X3 – 5.74X4 – 1.49X5. nilai koefisien 3876 diperoleh dari selisih kedua model tersebut dengan asumsi X1, X3 X4 dan X5 memiliki nilai yang sama.

Sehingga dapat disimpulkan variabel X2 yang bernilai 1 memiliki nilai Y 3876 lebih tinggi daripada variabel X2 yang bernilai 0.

Pahami perbedaan pembacaan koefisien regresi lainnya. Karena jika variabel tersebut merupakan variabel continous atau skala interval dan rasio, maka koefisien variabel akan dibaca setiap tambahan satu satuan variabel independen akan meningkatkan variabel dependen sebesar nilai koefisien.

Beda minitab, beda pula SPSS. Saya juga berikan langkah di SPSS karena SPSS juga banyak digunakan. Pada SPSS variabel skala nominal dan ordinal sudah dipisahkan sejak pertama kali diinput, sedangkan prosesnya sama seperti anda melakukan regresi berganda atau linear. SPSS akan mengenali variabel dummy tersebut setelah anda memberi keterangan bahwa variabel tersebut berskala nominal.

Mari kita buka SPSS, kemudian copy data ke sheet spss

Pada tab variabel view, saya menandai keterangan pada X2 bahwa variabel tersebut adalah variabel dummy atau berskala nominal. Erhatikan di tabel measure pada gambar dibawah ini

Kemudian klik analyze – regression –linear. Kemudian masukkan Y pada kolom dependen, dan semua variabel X ke dalam kolom independen dan klik OK

Hasilnya adalah sebagai berikut

Hasil yang diperoleh sama dengan hasil yang dikeluarkan oleh minitab. Nilai koefisien bisa anda lihat di tabel koefisien pada kolom B dengan nilai 3876. Namun, SPSS tidak menyediakan model untuk kedua nilai pada X2 seperti yang dikeluarkan oleh minitab.

Sekian dan terima kasih sudah berkunjung.

Mempelajari Kerangka Statistik

Jangan bingung dulu mendengar kata statistik. Menurut kamus besar bahasa Indonesia, Statistik merupakan kata benda (n) yang berarti (1) catatan angka – angka (bilangan); perangkaan; (2) data yang berupa angka yang dikumpulkan, ditabulasi, digolong-golongkan sehingga dapat memberi informasii yang berarti mengenai suatu masalah atau gejala. Anda akan memahami dan mampu mengerjakan apa yang tergambar dari statistik apabila anda telah mengerti apa itu statistik.

Statistik juga memiliki pengelompokkan, pahami pengelompokkan statistik ini dan akan mempermudah anda untuk menentukan apa yang akan anda kerjakan dan anda berada di posisi mana ketika anda berhadapan dengan sebuah data. Persis ibarat sebuah peta, Anda tidak harus mempelajari semua bagian statistik, anda hanya perlu mengidentifikasi data yang anda miliki dan fokus di bagian tersebut dengan mempelajari metode statistik yang tepat digunakan.

Kerangka Statistik

Statistik terlihat rumit jika anda tidak mencoba melihat secara umum. Mari kita terbang ke atas untuk melihat bagaimana bentuk rupa Pulau Jawa, sehingga jika anda berada di Jawa Barat, anda akan menyadari bahwa laut lebih dekat disebelah barat ketimbang harus berjalan ke arah timur, mungkin begitu istilahnya. 🙂

Rupa statistik secara umum tergambar pada gambar di bawah ini, statistik sendiri secara umum terbagi menjadi 2, yakni Statistik Deskriptif, dan Statistik Inferensia.

kerangka statistik

Statistik Deskriptif

Statistik deskriptif merupakan metode statistik yang digunakan untuk mendeskripsikan sekelompok data dengan tidak bermaksud untuk memberlakukan secara umum pada data tersebut. Misalnya adalah data pengunjung sebuah Mall. Anda bisa menggunakan data tersebut untuk mendeskripsikan bahwa kapan waktu mall memiliki pengunjung yang paling ramai, atau persentase pengunjung tersebut berapa yang masih anak-anak, wanita, setengah baya, remaja, laki-laki, dan sebagainya. Pada data mall tersebut tentu anda tidak bisa mngatakan bahwa data tersebut mewakili seluruh mall di indonesia atau mewakili semua toko atau swalayan. Anda akan fokus terhadap data yang anda miliki dan menjelaskan data tersebut.

Biasanya statistik deskriptif ini digunakan peneliti di dalam bagian hasil dan pembahasan untuk menjelaskan hasil penelitian statistik inferensia. Misal, pada regresi ditemukan hasil bahwa luas lahan mempengaruhi produksi padi. Anda tentu tidak berhenti sampai disitu saja, mengatakan bahwa ternyata luas lahan sangat mempengaruhi produksi. Anda bisa menjabarkan hasil analisis inferensia tersebut dengan analisis deskripsi yakni penjelasan berapa luas lahan saat ini, perkembangan luas lahan dari tahun ke tahun, jika ternyata berkurang apa penyebabnya? Nah, disinilah letak statistik deskriptif ini bermain.

Adapun alat yang digunakan pada statistik deskriptif ini biasanya adalah tabel, diagram, grafik yang berisi tentang statistik dasar, misalnya rata- rata, frekuensi, dan lain – lain.

Statistik Inferensia

Statistik Inferensia merupakan metode statistik yang menganalisis data sample untuk menggambarkan suatu populasi. Data yang kita olah akan kita gunakan untuk menggambarkan data populasi. Disinilah kerumitan itu berasal. Anda harus menentukan secara tepat sample dan metode sample yang digunakan agar data yang akan anda miliki benar-benar mewakili populasi yang ada.  Oleh sebab itu, anda belajar tentang tehnik sampling.

Metode statistik inferensia pun beragam tergantung dari skala data yang anda miliki. Data statistik bisa dibedakan menjadi nominal, ordinal, interval, dan rasio. Kebanyakan orang salah kaprah dengan anggapan data rasio adalah data yang paling baik dibandingkan data lainnya. Jika anda menyetujui pendapat tersebut berarti secara tidak langsung anda mengatakan bahwa penelitian kuantitatif akan lebih baik ketimbang penelitian kualitatif (data rasio biasanya digunakan untuk penelitian kuantitatif), padahal penelitian kualitatif justru lebih banyak digunakan untuk pengelolaan manajemen dan berujung pada perubahan kebijakan. Baik kuantitaif dan kualitatif sama pentingnya.

Argumen yang tepat adalah bahwa data rasio memiliki peluang yang lebih banyak untuk dianalisis, karena memiliki metode analisis yang lebih beragam ketimbang data lainnya. Jika anda memiliki data rasio kemungkinan alat analisis baik dari goodness of fit, interpretasi model, pengujian hipotesis, evaluasi data, semua dapat dilakukan. Ketimbang anda memiliki data nominal.

Data Nominal

Data berjenis nominal membedakan data dalam kelompok yng bersifat kualitatif. Identitas yang diberikan pada kelompok tersebut hanya sebagai pembeda antara kelompok dan tidak memiliki hubungan atau tingkatan. Misal 1 adalah laki – laki, 2 adalah perempuan. Kita tidak bisa mengatakan 2 lebih tinggi dibandingkan 1. Angka 1 dan 2 hanya sebagai identitas dari laki laki atau perempuan.

Jika anda memiliki data nominal, anda bisa menggunakannya untuk hipotesis satu sample, komparatif dua sample atau lebih, ataupun assosiatif/hubungan antar sample. Misalnya apakah dalam satu sample tersebut dapat dikatakan bahwa jumlah laki-laki signifikan lebih besar dibanding jumlah perempuan. Atau misalnya komparasi sample di kota malang dengan sample kota makassar apakah memiliki kesamaan atau signifikan berbeda.

Data Ordinal

Data ordinal hampir sama dengan data nominal, hanya saja data ordinal telah memiliki tingkatan disetiap kelompoknya. Misalnya saja pendidikan, SD (1), SLTP (2), SMU (3) dan PT (4). PT memiliki tingkat yang lebih besar dibandingkan SLTP SMU dan SD. Namun tetap saja kita tidak bisa mngartikan bahwa 4 atau PT merupakan dua kali lipat dari SLTP (2). Tetap angka tersebut merupakan identitas kelompok yang memiliki jenjang dari rendah hingga tertinggi.

Contoh lain yang banyak digunakan adalah sangat tidak setuju (1), tidak setuju (2), ragu – ragu (3), setuju (4), sangat setuju (5)

Data ordinal dan data nominal biasanya dikelompokkan dalam  statistik nonparametrik. Jadi, jika anda mendengar istilah statistik nonparametrik, berarti data yang digunakan dalam penelitian tersebut adalah data ordinal ataupun data nominal. Beberapa alat analisis yang digunakan adalah run tes, wicoxon, Mann Whitney, kolgomorov smirnov, friedman, two way anova, kruskal wallis, rank spearman. Tentu saya tidak akan menjelaskan satu persatu alat analisis tersebut pada artikel ini. Namun biasanya statistik nonparametrik membahas tentang hipotesis satu sample (misalnya apakah kelompok data ini secara nyata lebih besar dengan skor tertentu), atau membandingkan kelompok (apakah kelompok ini lebih sepakat/setuju ketimbang kelompok lain), atau hubungan kelompok (apa hubungan tingkat pendidikan terhadap opini tertentu). Tentunya data yang digunakan dalam skala ordinal atau nominal.

Data Interval dan Rasio

Data interval dan rasio masuk dalam ranah data kuantitatif. Pembeda antara data interval dan rasio adalah angka 0 merupakan angka mutlak pada rasio.

Untuk memahaminya saya berikan contoh sebagai berikut: misalnya data nilai pelajaran bahasa inggris yang diberi nilai 0 sampai 100. Angka 0 pada data tersbeut merupakan simbol nilai terendah, bukan angka yang mutlak. Bisa juga diartikan bahwa siswa yang memiliki nilai 60 bukan berarti memiliki kecerdasan 2 kali lipat dibandingkan dengan siswa yang memiliki nilai 30. Berarti data nilai ini merupakan data interval.

Data rasio, misalnya data saldo di sebuah bank. Nilai 0 pada saldo merupakan nilai yang sebenarnya. Dan seseorang yang memiliki saldo 100 juta dapat diartikan memiliki saldo 2 kali lipat dibanding orang yang hanya memiliki saldo 50 juta. Data saldo merupakan data ratio.

Data interval dan rasio ini dikelompokkan dalam statistik parametrik. Banyak sekali methode yang dapat dipilih untuk mengolah data statistik parametrik karena data ini merupakan data kuantitatif. Mulai dari hipotesis satu kelompok sample, membandingkan dua kelompok atau lebih, korelasi dua kelompok, sampai pada regresi.

Pertanyaannya, time series masuk wilayah statistik apa? Tentu saja masuk pada statistik parametrik. Lho…jika time seriesnya tentang jumlah wanita bagaimana? Data jumlah wanita pun adalah data rasio, karena kata jumlah berarti angka yang sebenarnya, bukan hanya angka simbol. Jelas?

Penutup pada artikel ini bahwa kita harus mengetahui posisi kita berada untuk dapat melakukan methode statistik yang tepat sesuai data yang kita miliki.

Terima kasih telah berkunjung

Mengulas Rapfish dan Multidimensional Scaling di Aplikasi R

Bulan Mei, justru sedang hujan deras sepanjang hari. Sampai bingung  berangkat ke kantor karena tidak cukup peralatan untuk menembus hujan. Termenung di dalam rumah mencoba untuk belajar lagi multidimensional scaling. Kali ini saya belajar melalui rapfish 3.1 yang dijalankan melalui aplikasi R.

Saya memang belum lama mengenal R. R merupakan aplikasi yang free sehingga menjadi alternatif yang baik bagi peneliti atau mahasiswa yang terkendala masalah lisensi. Karena ada sebagian publisher yang menanyakan legalitas kepemilikan software yang digunakan selama penelitian. Terus terang, saya belajar multidimensional scaling di R ini secara otodidak. Sehubungan dengan ada pertanyaan bagaimana running rapfish 3.1 di R, dan berbekal pengetahuan sedikit tentang MDS, saya mencoba untuk belajar MDS di R.

Sebenarnya rapfish sendiri sudah menyertakan petunjuknya saat anda mendownload script Rapfish 3. Namun, petunjuknya saya rasa belum terlalu rinci sehingga bisa membingungkan bagi pemula atau yang baru mengenal aplikasi R. Kali ini saya akan mencoba runut agar lebih mudah dimengerti

Mendownload Rapfish

kita mendownlowd rapfish terlebih dahulu disini, atau di website resminya agar selalu update. Kali ini saya menggunakan rapfis 3.1 for windows. Saya tentu tidak mengupdate secara rutin jika ternyata rapfish mengalami pembaruan. Sebelumnya saya mengasumsikan bahwa anda telah menginstal aplikasi R. aplikasinya gratis, silahkan anda unduh di internet.

Ekstrak hasil download

Hasil download rapfish kita extrak ke folder tertentu. Kali ini saya simpan di D/latihan.

rapfish

Didalam folder tersebut sudah dilengkapi petunjuk pada file yang bernama “guide.doc”. juga ada file berisi contoh dimensi ecology, economics, Ethical, Institutional, Social, dan technologi. Rapfish sendiri sebenarnya pada awalnya digunakan untuk menganalisis sebuah keberlanjutan di bidang perikanan suatu sistem yang memang pada dasarnya terdiri dari beberapa dimensi tersebut. Silahkan anda buka jurnal – jurnal rapfish, pada umumnya pasti membahas keberlanjutan. Namun, konsep MDS-nya bisa kita adopsi dengan cara mengganti dimensi-dimensi tersebut dengan dimensi yang kita inginkan.

Pada latihan ini, saya ingin menggunakan 2 dimensi yakni dimensi pilar 1 dan dimensi pilar 2. Saya menghapus 6 dimensi yang awal dan saya sisakan dua dimensi yakni ecology dan economics untuk nantinya saya ubah sesuai data yang saya miliki sebagai contoh.

Gambar sebagai contoh output rapfish semua saya hapus, kemudian semua file yang berawalan kata “result” juga saya hapus. File ethical.csv, Institutional.csv, Social.csv, dan technologi.csv juga saya hapus. File ecology.csv saya ganti namanya dengan pilar1.csv; economics.csv saya rename/ganti namanya dengan pilar2.csv. hasilnya seperti gambar dibawah ini:

multidimensional scaling

Siap untuk latihan….

Persiapan bahan

Sama seperti MDS, di Rapfish juga data yang digunakan adalah ordinal, dengan skala 1 sampai 10 atau bisa custom sesuai yang anda inginkan (bisa hanya sampai 3, sampai 5, sampai 20 dsb). Namun, Rapfish tidak bisa menerapkan skala terbalik. Jika MDS di excell kita bisa mensetting nilai tertinggi sebagai bad (misal skala 1 – 5 dengan bad = 5 dan good =1). Mengapa skala terbalik, sesuai kondisi seperti variabel jumlah penduduk yang mungkin terdapat asumsi jika semakin banyak maka akan dinilai tidak baik. Lebih lengkap saya sudah jelaskan di artikel Multidimensional Scaling Part2

Hal seperti ini tidak bisa dilakukan di rapfish. Rapfish selalu nilai bad pada nilai minimum dan nilai good selalu berada pada nilai maksimum. Lalu bagaimana jika data kita sebenarnya data skala terbalik? Ya kita balik terlebih dahulu skalanya biar berada pada posisi yang benar. Misal : pada skala 1 – 5, awalnya 1 itu good dan 5 adalah bad, maka kita ubah 5 menjadi 1, 4 menjadi 2, 3 tetap, 2 menjadi 4, dan 5 menjadi 1. Sehingga skalanya sudah sesuai untuk di masukkan kedalam aplikasi R.

Untuk memasukkan nilai variabel, kita bisa membuka dimensi yang sudah kita buat tadi. Saya buka dimensi pilar1. Kemudian saya ganti nama variabel pada baris pertama. Dalam menuliskan variabel tidak boleh ada spasi. Gunakan underline untuk menggantikan spasi. Pada dimensi pilar1 ini saya mengisi variabel: produksi, hama_penyakit, air, tenaga_kerja, modal, peralatan, ternak, hortikultura, pangan.

Kemudian pada kolom 1 berisi fisheries. Saya menyebutnya objek penelitian. Saya hanya menggunakan 3 tempat yakni : sumatra, jawa, dan kalimantan. Tentunya data ini adalah data fiktif untuk latihan saja.

Pada baris 2 sampai 4 (karna hanya ada 3 fisheries) berisi nilai dari variabel-variabel pada objek yang dimaksud. Baris 5 sampai 7 (saya sebut baris bawah) berisi batas bawah/nilai bad dari variabel pada objek yang dimaksud. 3 baris selanjutnya (saya sebut baris atas) berisi batas atas/nilai good dari variabel pada objek yang dimaksud. Skala masing masig variabel boleh sama dan boleh berbeda. Jika skala variabel produksi hanya 1 – 5, namun skala peralatan bisa saja 1 – 10. Bahkan setiap objek juga bisa berbeda-beda skalanya. Misalnya pada variabel ternak, nilai baris bawah jawa berisi 0, nilai baris bawah sumatra berisi 2 (sesuai skala masing-masing). Nilai skoring pun bisa saja desimal. Cara skoring sudah saya jelaskan di artikel Multidimensional Scaling Part2

Lebih jelasnya silahkan lihat hasil saya pada gambar dibawah ini.

rapfish 02

Buatlah seperti yang saya lakukan diatas, namun jangan diberi warna dan jgn diberi keterangan seperti bagian paling bawah. Itu saya tambahkan untuk memudahkan anda memahami penjelasan saya.

Ingat, baris bawah nilainya tidak boleh melebihi nilai variabel, nilai variabel tidak boleh melebihi nilai baris atas. Tahapan ini harus dilakukan sangat hati-hati karena error R kebanyakan berasal dari penentuan nilai variabel. Jika sudah selesai dilakukan, jangan lupa disave dengan format tetap menggunakan .csv

Hal yang sama juga dilakukan pada pilar2 sebagai dimensi kedua dari latihan ini. Anda bisa saja menggunakan 1 dimensi tergantung dari data yang anda miliki. Bisa juga menggunakan 5 dimensi secara lengkap seperti yang di tawarkan Rapfish secara default.

Pada pilar2 saya menggunakan variabel: dukungan_pemerintah, dana_apbd, populasi, dan PDRB_daerah

Hasilnya terlihat pada gambar dibawah ini:

rapfish 03

Jangan lupa di save dengan format tetap menggunakan .csv

Bahan yang akan kita olah sudah siap sekarang kita akan menyetting jumlah fisheries, variabel dan banyaknya nilai ulangan pada montecarlo

Setting jumlah fisheries

Menyetting jumlah fisheries pada file yang bernama “input1_number_fisheries”. Buka file tersebut dan ganti dengan angka 3 sesuai jumlah fisheries pada latihan kali ini. Anda bisa mengganti dengan nilai fisheries sesuai penelitian atau data yang anda miliki. Jangan lupa di save.

Input nama dimensi

Menyetting nama dimensi yang akan di run pada aplikasi R terletak pada file yang bernama “input2_datafile_names”. Formatnya text. Buka dan ganti sesuai nama dimensi yang anda gunakan. Kali ini saya menggantinya dengan nama pilar1.csv dan pilar2.csv. jangan lupa di save.

Ulangan montecarlo

Pada file “input3_MC_simulations” berisi tentang berapa ulangan montecarlo yang anda inginkan. Saya ganti dengan 25. Kemudian save.

Buka aplikasi R

rapfish 05

Kemudian kita ubah directory di file – change dir

rapfish 06

Kemudian pilih folder dimana kita mengekstrak rapfish tadi, yang isinya sudah kita ubah sesuai data yang kita miliki. Saya menggunakan directory D/latihan.

Setelah tekan OK, maka kita membuka script yang disediakan rapfish secara berurutan sebagai berikut:

Rapfish

Klik file – open script

rapfish 07

Lalu pilih rapfish_execution.r

rapfish 08

Klik open, lalu akan muncul script yang akan di run di R. untuk menjalankannya kita klik edit – run all. Biarkan komputer bekerja sampai tertulis “complete” kita lihat folder latihan, disana sudah ada hasil rapfish berupa file “result_pilar1” dan “result pilar2” yang berisi tentang koordinat X dan Y pada masing-masing objek di kuadran MDS atau rapfish. Nilai index yang menunjukkan status keberlanjutan ada pada file “Kite_result” dengan keterangan 0 – 25 kategori buruk (tidak berkelanjutan), 25.01 – 50 kategori kurang berkelanjutan, 50.01 – 75 kategori cukup berkelanjutan, dan 75.01 – 100 kategori baik atau sangat berkelanjutan. Pengertian setiap output sudah saya jelaskan pada artikel Multidimensional Scaling Part 4

Kemudian ada gambar pilar1 dan pilar2 sebagai output rapfish di folder tersebut:

rapfish dimensi

pilar2

Monte carlo

Setelah sukses menjalankan rapfish atau MDS, kita akan menjalankan monte carlo. Kembali ke aplikasi R. open script monte carlo lalu run all di menu edit (sama seperti diatas). Script monte carlo yang di sarankan secara default jalankan terlebih dahulu script “monte_carlo_triangle.r” baru kemudian jalankan “monte_carlo_uniform.r”

Hasilnya kita lihat kembali di folder latihan. Terdapat file baru yakni “MC_Triangle_pilar1”, “MC_Triangle_pilar2”,”MC_uniform_pilar1”, “MC_uniform_pilar2” lengkap dengan gambar-gambarnya

pilar2 triangle

monte carlo uniform

Pada file output monte carlo sendiri sudah mnyediakan output dengan 2 methode montecarlo yang berbeda yakni secara triangle dan uniform. Terus terang saya masih sedikit blum jelas apa perbedaan keduanya. Jika anda mengetahuinya saya sangat senang jika anda mau menambahkan di kolom komentar.

Untuk saat ini, yang saya pahami tentang monte carlo adalah sistem acak untuk mengetahui probabilitas perubahan yang terjadi pada nilai index yang dikeluarkan rapfish. Jika ternyata nilai index tersebut cenderung sering berubah, maka nilai index tidak cukup untuk dikatakan kuat. Namun jika dalam pengacakan tersebut ternyata selisih nilai index dengan nilai hasil acak tidak melebihi 1, maka nilai index dapat dikatakan kuat dan dapat digunakan untuk merepresentasikan hasil penelitian. Pada montecarlo di R ini sudah tersedia nilai index pada pengacakan dengan probablitias, 25%, 75%, 2.5%, dan 97.5%. silahkan anda membandingkan nilai index pada masing –masing probabilitas. Tentu diharapkan nilai index tidak berbeda jauh dari probabilitas yang paling tinggi, 97.5%.

Leverage

Masih ada 1 script lagi yang akan kita run di aplikasi R ini yakni script “leverage.r”. jalankan script tersebut seperti cara diatas, lalu kita akan lihat hasilnya di folder latihan.

Pada output kali ini, muncul file yang bernama “leverage_pilar1” dan “leverage_pilar2”, yang berisi koordinat nilai x dan Y pada chart leverage. Namun, tidak ada gambar ataupun grafik leverage. Mungkin kita diminta untuk membuat sendiri di excell.

Kelebihan dan Kekurangan Rapfish di R

Kelebihan R yang saya rasakan dalam latihan ini adalah kemudahan input dan output. Output sudah tinggal klik dan analisa berjalan sebagaimana seharusnya. Sedangkan jika kita menggunakan excell, kita mesti meraba raba dimana outputnya terutama menentukan monte carlo dan leverage. Inputnya juga susah jika menggunakan excell terutama dalam membuat anchor. Masih ingat yang berwarna kuning merah dan putih? Seperti membuat tangga? J

Kekurangan rapfish di R, tidak  ada output nilai stress dan RSQ. Nilai tersebut tentunya penting sebagai goodness of fit dari hasil rapfish. R juga tidak menyertakan leverage dalam bentuk Root mean square yang langsung dikonversi dalam skala 0- 100, yang berguna untuk mengetahui variabel pengungkit dari hasil output MDS.

Demikian ulasan saya tentang Rapfish, MDS di R

Terima kasih sudah berkunjung

 

Page 5/22First...456...1015...Last