Bajeso informacijos kriterijus

Bayeso informacijos kriterijus arba Schwarzo kriterijus yra metodas, kuris sutelkia dėmesį į likutinių kvadratų sumą, kad surastų vėluojančių laikotarpių skaičių p kad šis modelis būtų kuo mažesnis.

Kitaip tariant, norime rasti mažiausią vėluojančių laikotarpių skaičių, kurį įtraukiame į autoregresiją, kad galėtume numatyti priklausomą kintamąjį.

Tokiu būdu mes galėsime kontroliuoti vėluojančių laikotarpių skaičių p kad mes įtraukiame į regresiją. Kai viršysime šį optimalų lygį, „Schwarz“ modelis nustos mažėti, todėl pasieksime minimumą. Tai yra, mes pasieksime atsilikusių laikotarpių skaičių p kad sumažintų Schwarzo modelį.

Jis taip pat vadinamas Bayes informacijos kriterijumi (BIC).

Rekomenduojami straipsniai: autoregresija, liekanų kvadratų suma (SCE).

Bajeso informacijos kriterijaus formulė

Nors iš pirmo žvilgsnio atrodo, kad tai sudėtinga formulė, mes ją apžvelgsime dalimis, kad ją suprastume. Visų pirma, mes turime:

  • Abiejų formulės veiksnių logaritmai atspindi ribinį poveikį įtraukiant vėluojantį laikotarpį p labiau saviregresijoje.
  • N yra bendras stebėjimų skaičius.
  • Formulę galime suskirstyti į dvi dalis: kairę ir dešinę.

Kairėje dalis:

Pateikia autoregresijos likutinių kvadratų (SCE) sumąp atsilikę laikotarpiai, padalyti iš bendro stebėjimų skaičiaus (N).

Norėdami įvertinti koeficientus, naudojame įprastus mažiausius kvadratus (OLS). Taigi, įtraukus naujus vėluojančius laikotarpius, SCE (p) galima tik išlaikyti arba sumažinti.

Tada vėluojančio laikotarpio padidėjimas autoregresijoje sukelia:

  • SCE (p): mažėja arba išlieka pastovus.
  • Nustatymo koeficientas: didėja.
  • VISAS POVEIKIS: padidėjus vėluojančiam laikotarpiui, sumažėja kairė formulės dalis.

Dabar tinkama dalis:

(p + 1) rodo bendrą autoregresijos koeficientų skaičių, ty regresorius su jų vėluojančiais periodais (p) ir perėmimas (1).

Tada vėluojančio laikotarpio padidėjimas autoregresijoje sukelia:

  • (p + 1): didėja, nes mes įtraukiame vėluojantį laikotarpį.
  • VISAS POVEIKIS: padidėjus vėluojančiam laikotarpiui, padidėja dešinioji formulės dalis.

Praktinis pavyzdys

Mes manome, kad norime numatyti „Euro“ kainasslidinėjimo abonementai kitam 2020 metų sezonui su 5 metų imtimi, bet mes nežinome, kiek vėlavimo laikotarpių naudoti: AR (2) ar AR (3)?

  • Atsisiunčiame duomenis ir apskaičiuojame natūralius „Windows“ kainų logaritmus slidinėjimo abonementai.

1. Įvertiname koeficientus naudojant OLS ir gauname:

Likučių kvadratų (SCE) suma AR (2) = 0,0111753112

AR nustatymo koeficientas (2) = 0,085

2. Pridedame dar 1 vėluojantį laikotarpį, kad pamatytume, kaip keičiasi SCE:

AR (3) liekanų kvadratų suma = 0,006805295

AR nustatymo koeficientas (3) = 0,47

Matome, kad pridėjus vėluojamą periodą autoregresijoje, nustatymo koeficientas padidėja, o SCE tokiu atveju sumažėja.

  • Apskaičiuojame Bajeso informacijos kriterijų:

Kuo mažesnis BIC modelis, tuo labiau pirmenybė teikiama modeliui. Tada AR (3) būtų tinkamiausias modelis AR (2) atžvilgiu, turint omenyje, kad jo nustatymo koeficientas yra didesnis, SCE yra mažesnis ir Schwarz modelio arba Bayeso informacijos kriterijus taip pat yra mažesnis.