Mengenal Penyebab Munculnya Masalah Heteroskedastisitas pada Model Regresi

Salah satu asumsi krusial dalam estimasi koefisien regresi dengan OLS agar hasil estimasi memiliki minimum standard error (best) adalah residual memiliki varians konstant (homoskedastis). Sayangnya dalam banyak kasus, khususnya ketika kita menganalisis data cross-section, kondisi ini serangkali tidak terpenuhi. Alih-alih memiliki varians konstant, residual justru memiliki varians yang berbeda untuk setiap observasi (heteroskedastis). Peluang terjadinya heteroskedastisitas semakin besar ketika jumlah observasi semakin besar.

Pertanyaannya kemudian, apa saja sebetulnya yang menjadi penyebab munculnya masalah heteroskedastisitas? Dengan demikian, kemungkinan munculnya masalah ini dapat diantisipasi sedari awal sebelum membangun model regresi.

Berikut adalah sejumlah penyebab munculnya masalah heteroskedastisitas pada model regresi.
1)      Data cross-section: seperti disebutkan sebelumnya, masalah heteroskedastisitas lazim dijumpai pada kasus data cross-section, yakni data individual atau data mikro yang diamati pada satu titik waktu. Misalnya, ketika data tingkat  konsumsi dan pendapatan yang dikumpulkan dari sejumlah rumah tangga pada 2016 digunakan untuk mengestimasi fungsi konsumsi rumah tangga. Dalam kasus ini, masalah heteroskedastisitas sangat mungkin muncul karena variasi tingkat konsumsi pada rumah tangga berpendapatan rendah cenderung lebih rendah dibanding rumah tangga berpendapatan tinggi. Contoh aplikasi terkait masalah ini bisa dilihat di artikel berikut.

2)     Pencilan: kehadiran pencilan atau outlier juga berpotensi memunculkan persoalan heteroskedastisitas. Pencilan adalah observasi yang nilainya relatif sangat jauh berbeda (lebih tinggi atau rendah) di banding observasi lainnya. Ketika ukuran sampel sangat kecil, peluang munculnya masalah heteroskedastisitas akibat kehadiran outlier menjadi semakin besar.

3)      ‌Omitted variable: masalah heteroskedastisitas juga bisa muncul ketika variable yang relevan dalam model regresi tidak dimasukan ke dalam spesifikasi model (omitted). Dengan kata lain, spesifikasi model yang digunakan kurang tepat. Misalnya, ketika mengestimasi fungsi permintaan terhadap suatu komoditas kita tidak memasukkan variable harga komoditas lain yang merupakan produk komplement atau sibtitusi dari komoditas tersebut sebagai variable penjelas.

4)      ‌Distribusi variabel tak bebas: jika variabel yang memiliki distribusi tidak simetris yakni berdistribusi menceng (skewed) seperti lazim dijumpai pada data pendapatan, pengeluaran, upah, dll dimasukan sebagai variabel penjelas, persoalan heteroskedastisitas juga bisa muncul.

5)      ‌Transformasi data dan fungsional form: masalah heteroskedastisitas juga bisa muncul karena transformasi data yang tidak tepat (rasio, first differencing, dll) dan penggunaan bentuk fungsional dalam memodelkan data yang tidak tepat, misalnya penggunaan model linear ketimbang log-linear model.

Itulah sejumlah hal yang berpotensi menjadi sumber hadirnya persoalan heteroskedastisitas pada model regresi. Dengan mengetahuinya, kita dapat mengantisipasi sedari awal kemungkinan terjadinya masalah heteroskedastisitas sebelum membangun model regresi.

Semoga bermanfaat.

Referensi: Sankar Kumar (2015). Principles of Econometrics: A Modern Approach Using Eviews. Oxford University Press

Komentar

Posting Komentar

Postingan Populer