Mengenal Penyebab Munculnya Masalah Heteroskedastisitas pada Model Regresi
Salah satu asumsi krusial dalam estimasi koefisien regresi
dengan OLS agar hasil estimasi memiliki minimum standard error (best) adalah
residual memiliki varians konstant (homoskedastis). Sayangnya dalam banyak
kasus, khususnya ketika kita menganalisis data cross-section, kondisi ini
serangkali tidak terpenuhi. Alih-alih memiliki varians konstant, residual
justru memiliki varians yang berbeda untuk setiap observasi (heteroskedastis).
Peluang terjadinya heteroskedastisitas semakin besar ketika jumlah observasi semakin
besar.
Pertanyaannya kemudian, apa saja sebetulnya yang menjadi
penyebab munculnya masalah heteroskedastisitas? Dengan demikian, kemungkinan
munculnya masalah ini dapat diantisipasi sedari awal sebelum membangun model
regresi.
Berikut adalah sejumlah penyebab munculnya masalah heteroskedastisitas
pada model regresi.
1)
Data
cross-section: seperti disebutkan sebelumnya, masalah heteroskedastisitas
lazim dijumpai pada kasus data cross-section, yakni data individual atau data
mikro yang diamati pada satu titik waktu. Misalnya, ketika data tingkat konsumsi dan pendapatan yang dikumpulkan dari
sejumlah rumah tangga pada 2016 digunakan untuk mengestimasi fungsi konsumsi
rumah tangga. Dalam kasus ini, masalah heteroskedastisitas sangat mungkin
muncul karena variasi tingkat konsumsi pada rumah tangga berpendapatan rendah
cenderung lebih rendah dibanding rumah tangga berpendapatan tinggi. Contoh
aplikasi terkait masalah ini bisa dilihat di artikel berikut.
2) Pencilan:
kehadiran pencilan atau outlier juga berpotensi memunculkan persoalan heteroskedastisitas.
Pencilan adalah observasi yang nilainya relatif sangat jauh berbeda (lebih
tinggi atau rendah) di banding observasi lainnya. Ketika ukuran sampel sangat
kecil, peluang munculnya masalah heteroskedastisitas akibat kehadiran
outlier menjadi semakin besar.
3)
Omitted
variable: masalah heteroskedastisitas juga bisa muncul ketika variable yang
relevan dalam model regresi tidak dimasukan ke dalam spesifikasi model (omitted). Dengan
kata lain, spesifikasi model yang digunakan kurang tepat. Misalnya, ketika
mengestimasi fungsi permintaan terhadap suatu komoditas kita tidak memasukkan
variable harga komoditas lain yang merupakan produk komplement atau sibtitusi
dari komoditas tersebut sebagai variable penjelas.
4)
Distribusi
variabel tak bebas: jika variabel yang memiliki distribusi tidak simetris yakni
berdistribusi menceng (skewed) seperti lazim dijumpai pada data pendapatan,
pengeluaran, upah, dll dimasukan sebagai variabel penjelas, persoalan
heteroskedastisitas juga bisa muncul.
5)
Transformasi
data dan fungsional form: masalah heteroskedastisitas juga bisa muncul
karena transformasi data yang tidak tepat (rasio, first differencing, dll) dan
penggunaan bentuk fungsional dalam memodelkan data yang tidak tepat, misalnya penggunaan model
linear ketimbang log-linear model.
Itulah sejumlah hal yang berpotensi menjadi sumber hadirnya
persoalan heteroskedastisitas pada model regresi. Dengan mengetahuinya, kita
dapat mengantisipasi sedari awal kemungkinan terjadinya masalah
heteroskedastisitas sebelum membangun model regresi.
Semoga bermanfaat.
Referensi: Sankar Kumar (2015). Principles of Econometrics: A
Modern Approach Using Eviews. Oxford University Press
Pak ini halaman berapa ya kalo di sumbernya?
BalasHapus