Apakah Estimasi dengan OLS Membutuhkan Asumsi Normalitas

Dalam kondisi yang sangat ideal, estimasi dengan Ordinary Least Squares (OLS) akan memberikan estimasi koefisien regresi yang tidak bias dan memiliki kesalahan (error) paling minimum di antara semua penduga yang dibangun berdasarkan asumsi bahwa variabel tak bebas merupakan fungsi linear dari parameter regresi. Di dalam buku-buku teks, penduga OLS yang memiliki fitur ini disebut Best LInear and Unbiased Estimator (BLUE).
Konsep BLUE ini tentu saja didasarkan pada sejumlah asumsi yang harus dipenuhi. Pertanyaannya, apakah asumsi normalitas merupakan salah satu asumsi yang harus dipenuhi? Jawabannya ternyata tidak. Mengapa?
OLS pada dasarnya merupakan estimasi non-parametrik yang tidak mensyaratkan asumsi distribusi tertentu. Ide utama dari OLS adalah menemukan penduga parameter regresi yang menghasilkan error paling minimum. Secara teknis, hal ini cukup dilakukan dengan teknik kalkulus (turunan) yang diterapkan pada model atau persamaan regresi. Dengan kata lain, kita sama sekali tidak membutuhkan bentuk fungsional tertentu terkait distribusi komponen error yang merupakan variabel acak.
Deskripsi berikut akan sedikit membantu. Dalam notasi matriks, model regresi linear dapat dinyatakan sebagai berikut:
y = X'B + e atau e = y-X'B                                       (1)
dengan demikian
e^2 = [y-X'B]^2 atau sum(e^2) = sum([y-X'B]^2)     (2)
Penduga OLS selanjutnya dapat diperoleh dengan menemukan vector B yang meminimumkan (minimize) persamaan (2).
Satu-satunya asumsi yang dibutuhkan terkait komponen error (e) pada persamaan (1) agar OLS menghasilkan penduga titik yang BLUE adalah komponen error memiliki rataan nol serta homokedastik dan bebas autokorelasi. Komponen error yang memenuhi asumsi ini biasa disebut "white noise".
Namun, cerita bakal berbeda jika kita ingin melakukan inferensi atau penarikan kesimpulan tentang parameter regresi. Pada kondisi ini, asumsi normalitas pada komponen error juga diperlukan. Dengan kata lain, asumsi white noise saja tidak cukup. Komponen error juga harus berdistribusi normal. Mengapa demikian?
Dalam analisis regresi, inferensia statistik mencakup estimasi selang kepercayaan dan pengujian hipotesis koefisien regresi. Asumsi normalitas dibutuhkan untuk mengkuantifikasi unsur ketidakpastian (uncertainty) dalam estimasi. Asumsi ini memungkinkan kita menghitung kesalahan baku (standard error) estimasi koefisien regresi yang merupakan komponen inti dalam konstruksi selang kepercayaan dan pengujian hipotesis dengan uji-t dan uji-F. Semoga berguna. (*)

Komentar

Postingan Populer