Hoe los ik dit logaritmisch probleem op?

filippo, 21 jaar
3 januari 2012

Als ik logaritmisch transformeer in een enkelvoudige regressie omwille van niet lineariteit, en ik wil deze variabele in een tweede fase in een meervoudig model plaatsen. Dan moet ik toch de logaritmische transformatie in het model inbrengen niet de oorspronkelijke, of vergis ik mij?

Antwoord

Beste Filippo,

Typisch wanneer de ruis i.p.v. een additief karakter een multiplicatief karakter heeft, wordt de logaritmische transformatie uitgevoerd om de Centrale Limietstelling van kracht te laten gaan. De zuivere log-transformatie is een van de Box-Cox transformaties met Box-Cox parameter λ=0.

De theoretische filosofie van de log-transformatie is als volgt:

Onderstel een toevalsveranderlijke Yn geïndexeerd met n (dit kan bijvoorbeeld tijd zijn). Laat Y0=S en Y1=Y0(1+ε1) met ε1 een toevalsveranderlijke met een eindig gemiddelde en variantie maar niet noodzakelijk normaal verdeeld. In het algemeen geldt: Yn=Yn-1(1+εn)=S(1+ε1)...(1+εn). Indien we nu de logaritme nemen van Yn bekomen we: log(Yn)=log(S)+log(1+ε1)+log(ε2)+...log(1+εn)≈log(S)+η waarbij η een normale verdeling volgt met een bepaald gemiddelde en variantie. (Een typisch voorbeeld is de prijs van een aandeel dat dagelijks met een bepaald percentage of basispunten stijgt of daalt. Aangezien dit percentage toevallig is, is een multiplicatief model meer van toepassing.)

Stel nu dat je Y wil verklaren aan de hand van een regressiemodel m.b.v. gemeten variabelen X1,...,Xp die zowel nominaal, ordinaal als continue variabelen kunnen zijn. (Vergeet niet voor nominale variableen om dummy Bernouille variabelen in te voeren). Je hebt nu twee mogelijkheden voor je multi-lineair regressiemodel:

(1) log(Y)=∑pi=1θiXi In dit model stellen we η normaal verdeeld en kunnen de regressieparameters θi met een kleinste kwadratenschatter bepaald worden. (enkelvoudig model is voor p=1)

(2) log(Y)=∑pi=1θ'ilog(Xi)+η' In dit model stellen we ook η' normaal verdeeld en kunnen de regressieparameters θ'i met een kleinste kwadratenschatter bepaald worden. (enkelvoudig model is voor p=1)

Het verschil tussen beide modellen zit hem in de interpretatie van de de parameters. In model (1) zal een toename van 1 voor de variable Xi een procentuele toename opleveren in Y (oorspronkelijke toevalsveranderlijke) van 100θi%. In model (2) zal een procentuele toename van 1% voor variabele Xi een procentuele toename opleveren in Y  van θi%. Je mag ook beide modellen mengen zodat je voor sommige regressors log(Xi) gebruikt en voor andere gewoon Xi. Je moet je de vraag stellen of een procentuele toenamen interessanter/natuurlijker is om te bestuderen dan een absolute toename. Bijvoorbeeld voor nominale of ordinale regressors worden procentuele toenames meestal niet gebruikt.

Als bijlage vind je de wiki-links naar de Box Cox transformaties en een algemene uitleg over data transformaties waarbij de log-transformatie een speciaal geval is.

Hopelijk verduidelijkt dit je vraag.

Groeten,

Kurt.

Reacties op dit antwoord

Er zijn nog geen reacties op deze vraag.

Enkel de vraagsteller en de wetenschapper kunnen reageren op een antwoord.

Beantwoord door

Prof. Dr. Kurt BarbĂ©

Wiskunde, Statistiek, kansrekening, wetenschappelijk rekenen

Vrije Universiteit Brussel
Pleinlaan 2 1050 Elsene
http://www.vub.ac.be/

Zoek andere vragen

© 2008-2019
Ik heb een vraag wordt gecoördineerd door het
Koninklijk Belgisch Instituut voor Natuurwetenschappen