Perbedaan Nilai R Square dan Adjusted R Square
Perbedaan Nilai R Square dan Adjusted R Square : R-Square mengukur seberapa besar simpangan dalam model, semakin besar R-Square berarti simpangan dalam model semakin sedikit yang menunjukkan model semakin baik. Dalam Regresi Linier Berganda, semakin banyak variabel bebas dimasukkan dalam model, nilai R-Square akan semakin naik meskipun ada variabel bebas yang tidak signifikan.
Adjusted R-Square hanya mengukur R-Square dengan variabel bebas yang signifikan saja. Oleh karena itu, nilai Adjusted R-Square pasti lebih rendah dari R-Square, kecuali variabel bebasnya cuma ada satu maka nilai Adjusted R-Square = R-Square. Jadi dalam Regresi Linier Berganda, kita harus menggunakan nilai Adjusted R-Square.
R Square
R squared merupakan angka yang berkisar antara 0 sampai 1 yang mengindikasikan besarnya kombinasi variabel independen secara bersama – sama mempengaruhi nilai variabel dependen. Semakin mendekati angka satu, model yang dikeluarkan oleh regresi tersebut akan semakin baik.
Secara manual, R squared merupakan rumus pembagian antara Sum Squared Regression dengan Sum Squared Total.
SSR : Kuadrat dari selisih nilai Y prediksi dengan nilai rata-rata Y = ∑ (Ypred – Yrata-rata)2
SST : Kuadrat dari selisih nilai Y aktual dengan nilai rata-rata Y = ∑ (Yaktual – Yrata-rata)2
Jika melihat rumus tersebut, sebenarnya R squared tidak hanya bisa digunakan pada regresi saja, melainan kita dapat menggunakan rumus tersebut di semua model untuk menentukan kebaik atau tidaknya model tersebut. Misalnya model pada rumus time series, jika anda ingin menggunakan indikator lain selain MSE, SSE pada time series, anda bisa menggunakan R squared ini sebagai tambahan untuk memperkuat dari model yang sudah anda dapatkan.
Kembali lagi pada topik regresi, jika kita perhatikan rumus R squared diatas sangat dipengaruhi oleh nilai Y prediksi atau nilai Y dari hasil rumus dengan nilai Y aktual. Kenyataan yang sering muncul adalah nilai R squared akan semakin membaik (nilainya akan terus mendekati nilai 1) jika kita menambah variabel. Semakin banyak jumlah variabel yang menentukan nilai Y prediksi, maka nilai SSR akan semakin besar yang berakibat pada besarnya nilai R squared.
Sifat R-squared yang akan semakin baik jika menambah variabel inilah yang menjadi kelemahan dari R squared itu sendiri. Semakin banyak variabel independen yang digunakan maka akan semakin banyak “noise” dalam model tersebut dan ini tidak dapat dijelaskan oleh R squared
Adjusted R square
Guna melengkapi kelemahan R squared tersebut, kita bisa menggunakan R squared adjusted. Pada R squared adjusted ini sudah mempertimbangkan jumlah sample data dan jumlah variabel yang digunakan.
Keterangan:
n : jumlah observasi
p : jumlah variabel
MSE : Mean Squared Error
SST : Sum Squared Total
SSE : Sum Squared Error
Menurut informasi yang saya peroleh dari website minitab dan membaca dari manual booknya, R squared adjusted akan menghitung setiap penambahan variabel dan mengestimasi nilai R squared dari penambahan variabel tersebut. Apabila penambahan pola baru tersebut ternyata memperbaiki model hasil regresi lebih baik dari pada estimasi, maka penambahan variabel tersebut akan meningkatkan nilai R-squared adjusted.
Namun, jika pola baru dari penambahan varaibel tersebut menunjukkan hasil yang kurang dari estimasinya, maka R Squared adjusted akan berkurang nilainya.
Sehingga nilai R squared adjusted tidak selalu bertambah apabila dilakukan penambahan variabel. Tidak heran banyak dosen dan akademisi lainnya yang lebih memilih r squared adjusted dari pada R squared.
Jika melihat dari rumus diatas, nilai R squared adjusted memungkinkan untuk bernilai negatif. Artinya MSEnya lebih besar dibandingkan (SST/p-1). Artinya apa jika Errornya lebih besar? Benar, model tidak baik.
Masih jika kita melihat rumus diatas, nilai R Squared adjusted pasti lebih kecil dibandingkan nilai R squared.