Regresi adalah sebuah alat analisis statistik yang menggambarkan pengaruh variabel independen terhadap variabel dependen dalam sebuah persamaan. Dikatakan alat statistik karena pada regresi menguji beberapa hipotesis. Hipotesis pertama terjadi pada saat tahap uji F dimana
H0 : tidak ada pengaruh antara variabel independen terhadap variabel dependen
H1 : ada pengaruh antara variabel independen dan variabel dependen
Pengujian statistik tidak hanya sampai disini saja, melainkan di tambah dengan uji T yang menyatakan adanya pengaruh variabel independen secara parsial, satu persatu. Dalam uji T lebih detil mana variabel yang mempengaruhi variabel dependen mana yang tidak.
Bagi yang belum memahami variabel independen dan variabel dependen, perhatikan persamaan matematika sebagai berikut:
Y = b0 + b1X1 + b2X2 + b3X3 …
Biasanya persamaan matematika terdiri dari dua sisi, sisi kiri dengan variabel Y dikatakan sebagai variabel dependen, atau variabel terikat, dimana nilai Y dipengaruhi oleh nilai X1 X2 X3. Sedangkan pada sisi kanan terdapat variabel X1 X2 dan X3 yang disebut sebagai variabel bebas atau variabel independen, variabel inilah yang mempengaruhi nilai Y.
Regresi sangat populer dalam penelitian
Saat tulisan ini diketik, saya coba searching di google dengan kata kunci “mempengaruhi”, “pengaruh”, dan “regresi” sebagai kata kunci yang umum digunakan untuk menandakan karya tulis menggunakan regresi di Indonesia. Hasilnya untuk tahun 2021 pada bulan Juli tercatat sudah ada 15.300 hasil di scholar google. Ini menandakan bahwa alat analisis ini populer karena banyak yang menggunakan regresi sebagai alat analisis.
Beberapa penyebab mengapa regresi sangat populer adalah : (1) regresi merupakan suatu alat analisis kuantitatif yang memiliki standar yang baku untuk menentukan suatu hubungan atau pengaruh. Hal ini memudahkan peneliti atau mahasiswa untuk menentukan hasil apakah ada pengaruh atau tidak antara variabel independen dengan variabel dependen. Hal yang berbeda jika peneliti menggunakan metode kualitatif yang metodenya bisa sangat berkembang berkantung pada fenomena yang sedang dihadapi. (2) memiliki ukuran yang mudah diukur, masih mirip dengan alasan pertama karena bersifat kuantitatif, regresi mengandalkan jenis data yang parametrik yang dapat dengan mudah menyatakan tingkat tertinggi ataupun terendah. (3) memiliki batasan satu arah. Regresi menyatakan hubungan X terhadap Y dengan asumsi tidak terjadi kebalikannya (satu arah) hal ini membuat peneliti dengan mudah membuat ruang lingkup sehingga meminimalkan gangguan data yang terjadi akibat pengaruh sebaliknya atau pengaruh variabel diluar selain model. (4) regresi menjangkau semua bidang kajian baik sosial maupun eksakta karena bersifat matematis (penjelasan persamaan).
Buat kamu yang tertarik dengan alat analisis regresi, perlu beberapa dasar yang harus diketahui terutama mengenai faktor-faktor yang bisa menyebabkan terjadinya jenis regresi. Karena ternyata regresi itu ada berbagai macam tergantung dari beberapa faktor seperti dibawah ini:
Skala Pengukuran
Skala pengukuran adalah bagaimana variabel disajikan dalam bentuk angka atau kuantitas. Skala pengukuran terdiri dari berbagai tingkat dari Nominal, Ordinal, Interval, dan Rasio. Skala nominal menyajikan data yang hanya membedakan suatu kelompok namun tidak menunjukkan pemeringkatan. Misalnya laki laki disajikan dalam angka 1, sedangkan perempuan disajikan dalam angka 0. Angka 1 bukan berarti lebih besar dibanding angka 0 melainkan keduanya dalam posisi yang sama. Nilai 1 dan 0 sebagai pembeda kelompok.
Skala Ordinal memiliki tingkatan yang lebih tinggi dibandingkan nominal, selain menyajikan pembeda kelompok, skala ordinal juga sudah menyatakan peringkat. Misalnya nilai 1 sampai dengan 5 diartikan sebagai sangat tidak puas, tidak puas, cukup puas, puas , dan sangat puas. Hal; ini menandakan nilai 5 lebih tinggi dibandingkan dengan nilai 4 sampai 1. Namun, skala ordinal ini belum menyatakan jarak antara nilai satu dengan yang lain. Dalam artian, kita tidak bisa mengatakan sangat puas itu 5 kali lebih tinggi dibandingkan nilai 1.
Skala ordinal dan nominal ini biasanya disebut sebagai skala non parametrik dalam dunia statistik.
Pada skala selanjutnya, skala interval sudah menunjukkan pembedaan kelompok, tingkatan dan jarak. Misalnya pada variabel tinggi badan atau berat badan. Kita bisa menetapkan bahwa orang yang tingginya 100 cm tentu lebih tinggi 20 cm dibandingkan orang yang tingginya 80 cm. jadi jarak antara data sudah dapat digunakan. Biasanya dalam skala ini, dilakukan kelas kelas dalam range tertentu seperti tinggi badan 100 – 110 cm, 111 – 120 cm dan seterusnya. Namun, dalam skala interval tidak ada nilai 0 mutlak. Artinya nilai 0 dalam variabel tinggi seseorang tentu tidak ada dalam dunia nyata. Begitu juga berat, tidak ada di dunia ini yang memiliki berat 0 kg. variabel yang tidak memiliki nilai 0 mutlak belum dapat dikatakan memiliki perbandingan. Data dari tinggi badan belum dapat dikali atau dibagi. Bagaimana data tinggi badan dibagi atau dikali?
Skala tertinggi adalah rasio yang memiliki ciri kesemua diatas ditambah dengan skala ini memiliki nilai 0 mutlak, sehingga datanya bisa dibandingkan, dikali atau dibagi. Contoh paling gampang adalah berat yang memang memiliki nilai 0 dalam dunia nyata. Karena skala rasio, kita bisa mengatakan bahwa data 10 kg itu 2 kali lebih berat dibandingkan data 5 kg.
Skala interval dan skala rasio ini biasa disebut sebagai skala parametrik dalam dunia statistik
Jenis Regresi menurut Jumlah variabel bebas
Jumlah variabel bebas bisa menentukan jenis regresi apa yang akan digunakan. Variabel bebas yang dimaksud adalah variabel independen yang sudah dijelaskan di awal artikel ini. Berapa maksimal jumlah variabel bebas yang bisa dilakukan pengolahan? Sebagai informasi semakin banyak jumlah variabel bebas maka akan memiliki nilai r squared yang semakin besar. Hal ini sudah dijelaskan dalam artikel yang berjudul : perbedaan r square dan r square adjusted.
sebelum membahas pada poin selanjutnya, perlu juga diketahui jenis data yang sebaiknya dihindari dalam mengolah dengan menggunakan regresi pada video berikut ini:
Data menurut waktu pengumpulannya
Data yang digunakan juga dapat diidentifikasikan berdasarkan waktu pengumpulannya. Jika data dikumpulkan berdasarkan waktu yang berbeda, misalkan tahun 2010 hingga tahun 2020, maka data tersebut dikatakan sebagai data time series atau deret waktu. Jika data dikumpulkan berdasarkan berbedaan tempat/objek penelitian tapi dalam satu waktu maka data tersebut dikatakan sebagai data cross section. Jika data tersebut merupakan penggabungan keduanya, dikumpulkan berdasarkan perbedaan waktu dan perbedaan tempat/objek penelitian, maka dapat dikatakan sebagai data panel.
Ketiga faktor diatas, skala pengukuran, jumlah variabel bebas, dan data menurut waktu pengumpulannya yang bisa membedakan penggunaan regresi. Adapun jenis jenis regresi diantara lain adalah sebagai berikut:
Regresi sederhana
Regresi ini terdiri dari satu variabel independen dan satu variabel dependen. Jika dibuat persamaan akan terlihat sebagai persamaan sederhana yakni sebagai berikut:
Y = a + bX
Dimana Y adalah varaiebl dependen, a adalah konstanta, b adalah koefisien X dan X adalah variabel independen.
Regresi berganda
Regresi ini terdiri dari satu variabel dependen dan beberapa variabel independen. Skala variabel independen bisa nonparametrik atrau parametrik, sedangkan skala variabel dependen adalah parametrik. Data yang digunakan dpaat berupa time series atau cross section.
Y = a + b1X1 + b2X2 + b3X3 + …
Jika X merupakan skala nominal, biasanya disebut sebagai variabel dummy.
Regresi panel
Regresi hampir sama dengan regreis berganda, perbedaan trerletak pada jenis data yang dikumpulkan. Regresi data panel terdiri dari data panel di variabel independen. Penggunaan regresi data panel karena adanya pengaruh heteroskedastisitas yang tinggi akibat penggunaan data panel di regresi berganda. Heteroskedastisitas ini akan membentuk error yang berpola sehingga akan menghasilkan model yang bias jika dipaksa menggunakan regresi berganda.
Regresi Logistik
Regresi logistik memiliki ciri pada variabel dependen atau Y nya. Skala pengukuran pada regresi logistik berskala nominal atau dummy, biasanay biner 0 atau 1. Perhitungannya menggunakan logit dengan memasukkan peluang di dalamnya. Sedangkan variabel independen sama dengan regresi berganda atau regresi panel.
Regresi Poison
Regresi ini memiliki nilai Y yang bersifat diskrit, atau ya dan tidak dengan persentase yang kecil. Namun nilai Y bukan nilai dummy melainkan kejadian yang muncul dalam frekuensi yang diambil. Mneski sama sama peluang, tapi range pada regresi diskrit lebih kecil. Contoh yang paling gampang untuk memahami regresi diskrit ini adalah peluang produk cacat pada sebuah produksi. Karena produk cacat diharapkan memiliki persentase yang kecil sehingga kemunculannya sangat minim dari semua percobaan produksi yang dilakukan.
Regresi Tobit
Regresi ini memiliki ciri nilai Y yang memiliki range atau wilayah yang tidak diketahui nilainya atau biasa dikenal sebagai variabel tersensor. Misalnya data tingkat upah perjam yang tentu tersensor oleh data upah minimum regional perjam yang tidak akan tersedia karena memang tidak ada, artinya tidak linear karena terpotong. Misalnya lagi data persentase dari 0 hingga 100 persen, tidak akan ada data 101 persen keatas.
Demikian tadi macam macam jenis regresi, diharapkan kamu tidak salah jenis regresi setelah membaca artikel ini. Terima kasih telah berkunjung.