Artikkel

Strukturell analyse etter Frisch og Haavelmo^{#Takk til Tom Kornstad, Terje Skjerpen, Anders Rygh Swensen, Steinar Strøm og Thor Olav Thoresen for nyttige kommentarer.}

Økonometrisk analyse skiller seg fra statistisk analyse ved at a priori teori spiller en fundamental rolle. Med utgangspunkt i økonomisk teori har pionerer som Frisch, Haavelmo og Marschak klargjort hva som menes med kausale og simultane relasjoner. Videre har Haavelmo analysert hvordan simultane lineære ligningssystemer kan identifiseres og estimeres, og han har diskutert hvor sentral sannsynlighetsteorien er i denne sammenhengen.

I denne artikkelen oppsummeres først sentrale poenger hos Frisch og Haavelmo knyttet til kausal analyse. Inspirert av Frischs aksiomatiske metode diskuteres dernest utfordringer og økonometrisk spesifikasjon ved spesifikasjon av modeller for binær valgatferd. Blant annet vises det, ved å benytte en variant av den aksiomatiske metode, at en kan oppnå en fullstendig karakterisering av teoretisk og økonometrisk modell.

I de senere årene har det foregått en merkelig og uheldig utvikling der det hevdes at en ikke trenger avanserte økonometriske metoder til å utføre empiriske analyser. Spesielt har Angrist og Pischke argumentert med at lineær regresjon, eventuelt kombinert med instrumentvariabler og «difference-in-difference» metoden, i hovedsak er alt metodisk verktøy som trengs. I denne artikkelen drøftes problematiske sider ved strategien til Angrist og Pischke i situasjoner der den avhengige variabelen er binær.

John K. Dagsvik

Seniorforsker, Forskningsavdelingen, Statistisk sentralbyrå

Innledning

Økonometrisk analyse er ideelt sett basert på (a priori) økonomisk teori, hvor hensikten er å etablere årsakssammenhenger innenfor et eksplisitt formulert teoretisk rammeverk, slik som for eksempel modeller for forbrukeratferd. En statistiker derimot, analyserer typisk statistiske sammenhenger i data, der a priori teori om årsakssammenhenger som regel er fraværende. Blant statistikere betraktes a priori teori å være et anliggende for andre (ikke statistiske) fag.^{#Det er riktignok unntak, slik som for eksempel modeller innen operasjonsanalyse og køteori, der a priori teori spiller en rolle.} Dette kommer av at faget matematisk statistikk i hovedsak avgrenser seg til å være en ren «verktøykasse» som skal kunne anvendes på mange ulike fenomener, og hvor en ikke har noen ambisjon om å bidra med teorier for disse fenomenene.

Denne artikkelen diskuterer strukturell analyse i økonomisk teori og økonometri som forstått av Frisch og Haavelmo, med spesiell referanse til binære valg når noen av forklarings-variablene er endogene. Selv om jeg her har valgt å diskutere kun situasjoner der den avhengige variabelen er binær, gjelder lignende utfordringer i mer generelle settinger med diskrete valg. Ellers viser jeg til Heckman (2007, 2008) samt Heckman og Pinto (2015, 2022) som har drøftet kausal analyse slik dette ble forstått av Haavelmo og Frisch.

Økonometribegrepet slik det ble forstått av Frisch var noe bredere i omfang enn den mer begrensede betydningen den har i dag. Den innbefatter en rekonstruksjon av økonomifaget etter prinsipper som ligner de som brukes i naturvitenskapene.^{#Det som er slående i fysikk, for eksempel, er at bortsett fra noen få konstanter, følger den matematiske formen til en rekke fysiske lover fra teori.} Som eksempel på en slik strategi diskuterte Frisch (1926) en aksiomatisk tilnærming for modellering av forbrukeratferd. Hensikten hans var å etablere et rigorøst teoretisk rammeverk for denne typen atferdsmodeller.

Spørsmålet om kausalitet har opptatt forskere og filosofer i hvert fall siden Aristoteles tid. Grunnleggeren av psykofysikk, Gustav T. Fechner (1801–1887), betraktet kausale relasjoner som en undergruppe av det han kalte «funksjonelle relasjoner».^{#Psykofysikk omhandler teori og eksperimentale studier av relasjonen mellom mentale og fysiske prosesser. Heidelberger (2004, s. 101–102) gir en oversikt over Fechners tanker om kausalitet og funksjonelle relasjoner.} En funksjonell relasjon representerer en lov om sameksistens. Et eksempel på en funksjonell relasjon er kombinasjonen av pedaler, kjede og bakhjul i en sykkel. Når vi sykler er det en kausal virkning som går fra pedalene til bakhjulet og medfører framdrift. Men kausaliteten kan også gå andre veien: I forbindelse med reparasjon eller vedlikehold kan det være ønskelig å snu sykkelen opp ned for å kunne dreie på bakhjulet og dermed få pedalene til å gå rundt. Følgelig, er det altså en kausal virkning i motsatt retning i dette tilfellet.

Frisch (1930, 1938) hadde en meget klar forståelse av hvordan begrepet kausal politikk-analyse skulle presiseres.

“Causality is in the Mind”: “...we think of a cause as something imperative which exists in the exterior world. In my opinion this is fundamentally wrong. If we strip the word cause of its animistic mystery, and leave only the part that science can accept, nothing is left except a certain way of thinking. [T]he scientific ...problem of causality is essentially a problem regarding our way of thinking, not a problem regarding the nature of the exterior world.”

Frisch (1930, s. 36).

Hva Frisch forsto med dette er at kausalitet er et teoretisk begrep i den forstand at det er knyttet til visse ideer (teorier) vi har om årsakssammenhenger i verden. For å illustrere Frischs poeng, betrakt for eksempel to tilnærminger til modellering av etterspørsel etter transport i byer, nemlig henholdsvis gravitasjonsmodellen og modeller basert på mikroøkonomisk teori for diskrete valg (McFadden, 2001). I gravitasjonsmodellen er den underliggende ideen analog til Newtons gravitasjonsteori i den forstand at trafikkstrømmer mellom nærmere definerte soner forutsettes å være proporsjonale med størrelsene på sonene (målt ved antall personer eller antall jobber de inneholder) og omvendt proporsjonal med reisetiden mellom sonene. Reisetid blir ofte erstattet av generaliserte mål på reisekostnader, slik som forholdet mellom kostnader (billettpris) og verdien av tid. I denne teorien spiller ikke preferansebegrepet noen eksplisitt rolle. En årsaksvirkning oppstår når for eksempel størrelsen på en sone øker, ceteris paribus, hvilket medfører at antall reiser inn i sonen vil øke på grunn av endring av «gravitasjonskraften». Se McFadden (2002) for ytterligere beskrivelse og kritikk av gravitasjonsmodellen.

I den mikroøkonomiske tilnærmingen basert på teorien for diskrete valg er derimot preferansebegrepet helt sentralt, representert ved individuelle nyttefunksjoner. Her forutsettes det at individer velger det mest foretrukne reisealternativet under spesifiserte restriksjoner. Valgrestriksjonene er bestemt ved mengden av tilgjengelige transportalternativer (valgmengden), spesifisert ved alternativ-spesifikke attributter, slik som priser og reisetider. (Se f.eks. McFadden, 2001, samt en norsk analyse: Gabrielsen og Strøm, 1999). I typiske politikk eksperimenter antas det at preferansene forblir invariante under de aktuelle reformene (Marshalls ceteris paribus-klausul, jf. Marshall, 1890). I motsetning til gravitasjonsmodellen, er representasjon av individuelle preferanser helt sentralt i den mikroøkonomiske tilnærmingen. Den kausale effekten er altså styrt av valgrestriksjoner og gitte preferanser i stedet for av «gravitasjonskraften», og styrer tilpasningen til hvert enkelt individ gitt rammebetingelsene (valgrestriksjonene). Følgelig illustrerer disse to ulike angrepsmåtene hvordan kausalitetsbegrepet avhenger av vår måte å tenke på.

En statistiker som insisterer på en a-teoretisk tilnærming vil få alvorlige vanskeligheter med å tolke data for observerte valg fordi koblingen mellom de underliggende faktorene som styrer valgatferden og de realiserte valgene er komplisert. For eksempel, ved empirisk analyse av tilbud, etterspørsel, priser og omsatt kvantum i en konkurranseutsatt økonomi, er det blant annet nødvendig å ta hensyn til at tilbud, etterspørsel og omsatt kvantum bestemmes simultant.

Haavelmo (1943, 1944) har klargjort hvordan linære kausale modeller (linære simultane likningssystemer) kan identifiseres og estimeres. Før Haavelmos fundamentale bidrag hadde ikke økonomer en systematisk måte å anvende sannsynlighetsteori på i forbindelse med analyse av økonomiske relasjoner. Sammen med størrelser som Koopmans, Marschak og Hurwicz i Cowles Commission, ble tilnærmingen kjent som «strukturell», eller «simultane ligningssystem» utarbeidet. Medlemmene av Cowles Commission var ambisiøse og tok mål av seg til å etablere et generelt forskningsprogram med henblikk på å produsere modeller som var egnet til å predikere effekten av avanserte og kontrafaktiske politikkintervensjoner (Koopmans og Hood, 1953; Marschak, 1953; Hurwicz, 1962).

I Haavelmos tilnærming er det et vesentlig poeng å skille mellom formulering av den teoretiske modellen og dens egenskaper (slik som identifikasjon), og den korresponderende empiriske modellen som ligger til grunn for estimering av ukjente parametre, samt testing av hypoteser. Eksemplet ovenfor om analyse av etterspørsel illustrerer dette, nemlig at prisene kan være endogene fordi de er bestemt simultant med tilbud, etterspørsel og omsatt kvantum i et marked. Dette kan i utgangspunktet synes som et trivielt poeng, men som vi skal belyse i denne artikkelen gir en slik oppdeling mer innsikt enn en kanskje skulle tro. I den empiriske modellen må forskeren blant annet ta hensyn til at noen variabler som inngår i den teoretiske modellen ikke er observerbare (i det minste ikke i foreliggende data) for forskeren. Her spiller sannsynlighetsteorien en meget viktig rolle.

I neste avsnitt diskuteres kort rollen som sannsynlighetsteori har i formulering av økonometriske modeller. Deretter oppsummeres noen prinsipielle poenger i forbindelse med strukturell modellering, og i det påfølgende avsnitt diskuteres modellering der den avhengige variabelen er binær.

I de senere årene har Angrist og Pischke (2009, 2017) hevdet at lineære modeller er i hovedsak alt de metodiske verktøy som trengs, selv i situasjoner der den avhengige variabel er diskret. I siste avsnitt drøfter vi nærmere problematiske sider ved å følge strategien til Angrist og Pischke i situasjoner der den avhengige variabelen er binær.

Hvorfor sannsynlighetsmodeller?

I økonometrisk analyse er sannsynlighetsmodeller helt sentrale. Dette gjelder spesielt i situasjoner der responsvariablene er diskrete, eller begrenset. I dette avsnittet diskuteres motivasjonen for bruk av sannsynlighetsmodeller.

Som nevnt ovenfor var det Haavelmo (1943, 1944) som først utarbeidet en systematisk teori for bruk av sannsynlighetsmodeller i økonometrisk analyse. Hans analyse var i hovedsak basert på lineære simultane ligningssystemer. Det er imidlertid særlig i forbindelse med ikke-lineære modeller der responsvariablene er diskrete (eller såkalt begrenset avhengig) at en innser nytten av å formulere modellen ved hjelp av sannsynlighetsteori.

Betrakt følgende eksempel: Vi er interessert i å analysere hvordan valget av å være sysselsatt eller ikke, avhenger av variabler slik som lønn, arbeidsfri inntekt, alder, utdanning, etc. La $Y_{i}$ være lik 1 dersom person i observeres å være sysselsatt, og 0 ellers. Fra forskerens ståsted synes det tilfeldig hvem som er sysselsatt eller ikke, innen hver celle, dvs. persongrupper med samme observerbare (relevante) kjennetegn. Grunnen til dette er at forskeren ikke observerer en rekke faktorer som individet tar hensyn til i sitt valg. Det betyr at $Y_{i}, i = 1,2, . . .,$ kan betraktes som uavhengige realisasjoner av en tilfeldig (stokastisk) variabel. I det følgende er det hensiktsmessig å innføre begrepet superpopulasjon. En superpopulasjon er «svært stor» (uendelig) slik at alle celler inneholder et «stort» antall personer. Den faktiske populasjonen (eller utvalg) som analyseres betraktes som et tilfeldig trukket utvalg fra superpopulasjonen. La $x_{i}$ være en vektor av observerte forklaringsvariabler for person i og la $Q (x_{i})$ være andelen sysselsatte med kjennetegn $x_{i}$ i superpopulasjonen. Siden superpopulasjonen er svært stor, vil det alltid være mange individer med samme kjennetegn. Det er dette en normalt mener med at $Q (x_{i})$ er sannsynligheten for at et tilfeldig trukket individ med kjennetegn $x_{i}$ i superpopulasjonen skal være sysselsatt. Tilsvarende er forventningsoperatoren å tolke som den operatoren som produserer gjennomsnitt i superpopulasjonen. Siden $Y_{i}$ kun antar verdiene 0 og 1 har vi at

$E (Y_{i} | x_{i}) = 1 \cdot Q (x_{i}) + 0 \cdot (1 - Q (x_{i}) = Q (x_{i}) .$

Vi kan derfor skrive

$Q (x_{i}) = E (Y_{i} | x_{i}) = P (Y_{i} = 1 | x_{i}) .$

La meg illustrere bruk av sannsynlighetsteori i teorien for individers yrkesdeltaking. Fra standard mikroøkonomisk teori følger det at en person ønsker å være sysselsatt dersom timelønna overstiger reservasjonslønna. La w og $w_{i}^{*}$ betegne henholdsvis en gitt timelønn w og reservasjonslønna for person i. I motsetning til den spesifiserte timelønna er reservasjonslønna kun en teoretisk størrelse og derfor ikke observerbar. Anta at $w_{i}^{*} = g ({\tilde{x}}_{i}, θ_{i})$ der g er en nærmere spesifisert funksjon på et sett av ukjente koeffisienter nær, ${\tilde{x}}_{i}$ en vektor av hypotetisk observerbare forklaringsvariabler (som blant annet inkluderer arbeidsfri inntekt) som påvirker reservasjonslønna og $θ_{i}$ en stokastisk variabel som representere effekten av uobserverbare faktorer som påvirker reservasjonslønna. Den hypotetiske variabelen   ${\tilde{x}}_{i}$ kan være lik den observerte variabelen $x_{i}$ for et individ i som er i datamaterialet som analyseres, men kan også være forskjellig fra $x_{i} .$ Fra denne teorien følger det at den observerbare variabelen $Y_{i}$ som representerer sysselsettingsstatus er lik 1 dersom $w > w_{i}^{*}$ og lik null ellers. Ved hjelp av denne teorien forklarer vi derfor variasjonen i $Y_{i}$ ved den stokastiske variasjonen i de uobserverbare komponentene i preferansene representert ved $θ_{i}$ i reservasjonslønns-funksjonen. Dermed følger det at sannsynligheten for å være i arbeidsstyrken kan uttrykkes som

$P (w, {\tilde{x}}_{i}) = : P (w > g ({\tilde{x}}_{i}, θ_{i})) = E 1 {w > g ({\tilde{x}}_{i}, θ_{i})}$ (1)

der 1{A} er indikatorfunksjonen som er lik 1 dersom begivenheten A inntreffer og null ellers. Jeg minner om at $P (w > g ({\tilde{x}}_{i}, θ_{i}))$ betyr andelen i superpopulasjonen med kjennetegn   ${\tilde{x}}_{i}$ som har reservasjonslønn mindre enn w. Dersom sannsynlighetsfordelingen til $θ_{i}$ og funksjonen g er spesifisert kan det siste uttrykket beregnes. Dermed følger en sannsynlighetsmodell for valget mellom å være sysselsatt eller ikke. Det empiriske motstykke til $P (w, x_{i})$ er den observerte andelen personer med kjennetegn $x_{i}$ i det observerte utvalget som er sysselsatt til timelønn w.

Økonometrisk analyse som en fire-trinns prosedyre

Lærebøker og undervisning i økonometri legger i hovedsak vekt på ulike metoder for inferens (estimering og testing) når den empiriske modellen er spesifisert. Det er videre typisk at det ikke skilles klart mellom den modellen som skal benyttes til kontrafaktisk politikkanalyse og den empiriske modellen som skal konfronteres med data. Bortsett fra teorien for diskrete valg, diskuteres det sjelden hvordan en skal oppnå en empirisk modell som er en tilfredsstillende representasjon av den underliggende teorien. I filosofien til Frisch og Haavelmo er det imidlertid essensielt å skille mellom følgende fire stadier:

(i) Klargjøring av de teoretiske problemstillingene som ønskes adressert.
(ii) Spesifikasjon av den teoretiske modellen som skal benyttes til prediksjoner av effekten av kontrafaktiske reformer, samt avklaring av identifikasjonsproblemet.
(iii) Spesifisering av den korresponderende empiriske modellen som skal estimeres og testes ved hjelp av de data som er tilgjengelig. Dette stadium inkluderer også empirisk identifikasjon.
(iv) Kontrafaktisk analyse for å besvare (i), samt påfølgende implikasjoner for fordeling, ulikhet og velferd i den aktuelle populasjonen.

I avsnittene ovenfor har jeg allerede antydet en slik oppdeling i henholdsvis a priori teoretisk modell og empirisk modell.

Anta nå at på ethvert gitt tidspunkt er aktørene i stand til å rangere foreliggende valgalternativer i en endelig mengde av alternativer. Under antakelsen om at aktørene på hvert tidspunkt oppfyller rimelige krav til rasjonalitet^{#Det kan vises at nødvendig og tilstrekkelige betingelser for eksistensen av en nyttefunksjon er at preferansene er asymmetrisk og negativ transitive. Se Kreps (1990) for nærmere forklaring og detaljer.} kan det vises at dette er ekvivalent med eksistensen av en nyttefunksjon (ordinal) $U_{i j}$ hvilket er nytten av alternativ j for individ i. Generelt, kan vi uttrykke nyttefunksjonen på følgende måte; $U_{i j} = f ({\tilde{x}}_{i j}, {\tilde{ε}}_{i j}),$ der ${\tilde{x}}_{i j}$ er en vektor av hypotetiske forklaringsvariabler, og kan inneholde personkjennetegn og attributter knyttet til alternativ j, slik som priser og reisetider i transportanalyser, ${{\tilde{ε}}_{i j}}$ er stokastiske variabler som representerer effekten av latente variabler på preferansene i den hypotetiske situasjonen, mens $f$ er en deterministisk (ukjent) funksjon. Variablene ${{\tilde{ε}}_{i j}}$ kan også være stokastiske for aktøren (dvs. variere på en usystematisk måte) i den forstand at dersom aktøren blir stilt overfor samme valgsituasjon på nytt så kan hun eller han rangere alternativene ulikt fra tidligere. Tolkingen er at i mange situasjoner så vil aktøren ha vanskeligheter med å fastlegge verdien av de ulike alternativene en gang for alle. Aktøren kan derfor skifte mening selv om karakteristika ved alternativene ikke har endret seg.

I det følgende vil punktene (i) til (iv) bli belyst nærmere for situasjoner der den avhengige variabel er binær, slik som for eksempel valg mellom to transportalternativer for reise til og fra jobb, eller valg mellom yrkesdeltaking eller ikke.

Analyse av binære valg

Jeg skal nå drøfte nærmere situasjoner der aktørene foretar valg mellom to alternativer som er inneholdt i en mengde S som inneholder minst 3 alternativer. Forskeren står overfor følgende utfordring: (i) valg av variabler som skal inngå i vektorene ${{\tilde{x}}_{i} (j)}$ av hypotetiske forklaringsvariabler, (ii) begrunnet valg av funksjonsformen til $f,$ (iii) begrunnet valg av fordelingen til restleddene ${{\tilde{ε}}_{i j}},$ (iv) hvordan håndtere eventuelle endogenitetsproblemer, dvs. at forklaringsvariablene i den empiriske analysen kan være korrelert med de stokastiske restleddene. Her vil vi spesielt fokusere på hvordan estimeringsproblemet kan håndteres når en av forklaringsvariablene er endogen.

Dersom sannsynligheten for å velge de ulike alternativene ikke er nær null eller 1 har valg av fordeling til ${{\tilde{ε}}_{i j}}$ mindre betydning, men i motsatt fall kan valg av fordeling være av vesentlig betydning.

Den vanlige tilnærmingen som benyttes er å adressere utfordringene (ii) og (iii) ved hjelp av statistisk inferens. Men som diskutert i Dagsvik (2016) kan disse utfordringene ikke løses fullt ut tilfredsstillende uten et teoretisk grunnlag. Det er flere grunner til dette. For det første er det et problem at typiske datasett sjelden inneholder mange observasjoner av hver enkelt aktørs tilpasning. Dermed er forskeren tvunget til å gjøre forutsetninger i modellen om observerbar og uobserverbar heterogenitet i populasjonen. For det andre kan forskeren være interessert i kontrafaktisk prediksjon for hypotetiske situasjoner der data er mangelfulle, eller ikke finnes i det hele tatt. En pioner som Frisch innså tidlig dette og mente at den aksiomatiske metode kombinert med «Stated Preference» (SP) intervjudata i tillegg til tradisjonelle data var nødvendig for etablering av vitenskapelig funderte kvantitative atferdsrelasjoner (Bjerkholt, 2012). Det er et sentralt poeng at en ved hjelp av SP eksperimenter kan oppnå flere observasjoner per individ for en rekke valgsituasjoner en ellers har mangelfulle data for.

Som diskutert i Dagsvik (2016), er den såkalte produktregelen (Luce og Suppes, 1965, s. 341 og s. 350) en måte å rettferdiggjøre strukturen til nyttefunksjonen og fordelingen av de stokastiske komponentene ${{\tilde{ε}}_{i j}},$ som representerer uobserverbare variabler. Produktregelen kan tolkes som en antakelse om gjennomsnittlig rasjonalitet i følgende forstand: La ${j, k, r}$ betegne et sett av 3 alternativer i S. I mange situasjoner er det velkjent at observerte valg kan synes å være i strid med forutsetningen om transitivitet. Med andre ord kan (i) en og samme aktør observeres å velge ulikt i valgsituasjoner som tilsynelatende er like (sett fra forskerens ståsted), og videre (ii) at aktører som synes like (sett fra forskerens ståsted) kan observeres å velge ulikt. Forklaringen av tilfelle (i) er, som nevnt ovenfor, at aktøren kan endre smak, eller har vanskeligheter med å evaluere presist verdien av de ulike valgalternativene. Tilfelle (ii) kan skyldes uobserverte faktorer som er kjent for aktøren og varierer på en usystematisk måte mellom aktørene. La $≻$ betegne «foretrukket foran», og la oss kalle $j ≻ k ≻ r ≻ j,$ en intransitive kjede. Produktregelen sier, gitt forklaringsvariablene ${{\tilde{x}}_{i} (j)},$ at realisering av en intransitiv kjede i én retning, dvs., $j ≻ k ≻ r ≻ j,$ er like sannsynlig som en intransitiv kjede i motsatt retning, dvs. $j ≻ r ≻ k ≻ j .$ Eller sagt på en annen måte, så uttrykker produktregelen at gjennomsnittlig avvik fra transitivitet er usystematisk. Implikasjonene fra produktregelen er at $f ({\tilde{x}}_{i} (j), {\tilde{ε}}_{i j}) = v ({\tilde{x}}_{i} (j)) + {\tilde{ε}}_{i j},$ der $v (\cdot)$ er en deterministisk (ukjent) funksjon, og at   ${\tilde{ε}}_{i} = {\tilde{ε}}_{i 2} - {\tilde{ε}}_{i 1}$ har en logistisk kumulativ fordelingsfunksjon, gitt ved $L (x) = : 1 / (1 + e^{- x}) .$ Dermed blir sannsynligheten for at aktør i skal foretrekke alternativ 2 fremfor alternative 1, gitt   ${\tilde{x}}_{i},$ lik

$P_{2} ({\tilde{x}}_{i}) = : P (U_{i 2} - U_{i 1} > 0) = L (v ({\tilde{x}}_{i} (2)) - v ({\tilde{x}}_{i} (1))),$ (2)

der   ${\tilde{x}}_{i} = ({\tilde{x}}_{i} (1), {\tilde{x}}_{i} (2)) .$ Relasjonen i (2) er den (a priori) teoretiske modellen. Det gjenstår nå kun å bestemme variabler som skal inngå i ${{\tilde{x}}_{i} (j)}$ samt hvilken funksjonsform $v$ skal ha. I denne artikkelen vil det imidlertid føre for langt å gå inn i en nærmere detaljert drøfting av spesifikasjon av $v .$ Jeg viser til Dagsvik (2016, 2018) for nærmere drøfting av denne utfordringen.

Dersom produktregelen ikke holder, gitt   ${\tilde{x}}_{i},$ trenger ikke det å bety at logit modellen ikke holder på individnivå. Det kan like gjerne skyldes at forklaringsvariablene ikke fanger opp tilstrekkelig heterogenitet i populasjonen.

La oss dernest betrakte den empiriske modellen der vi minner om at ${x_{i} (j)}$ er de observerte vektorene av forklaringsvariabler. Vi antar nå at komponenten $x_{i 1} (1)$ kan være korrelert med restleddet $ε_{i},$ mens de resterende variablene er eksogene. Vi antar videre at det observeres en instrumentvariabel $z_{i}$ som er uavhengig av $ε_{i}$ men korrelert med $x_{i 1} (1)$ slik at

$x_{i} (1) = h (z_{i}) + η_{i},$ (3)

der $h$ er en nærmere spesifisert lineær eller ikke-lineær funksjon som er kjent på et sett parametre nær og $η_{i}$ er et restledd som er uavhengig av $z_{i} .$ Anta videre at når en betinger med hensyn på $(x_{i}, z_{i})$ (som er ekvivalent med å betinge på $(x_{i}, η_{i}))$ så gjelder fortsatt produktregelen. I Dagsvik (2023) vises det hvordan disse forutsetningene leder til en empirisk logitmodell som funksjon av $x_{i}$ og en spesifikk transformasjon av $η_{i} .$ Det vil imidlertid føre for langt å gå inn på detaljene i utledningen av denne modellen. Her skal vi i stedet nøye oss med å vise hvordan en kan oppnå tilsvarende resultat under antagelsen om at både   ${\tilde{ε}}_{i}$ og $ε_{i}$ er standard normalfordelte (probitmodell). For sannsynligheter som ikke er nær 0 eller 1 så vil probitmodellen være tilnæmet lik logitmodellen. La $Φ$ betegne den kumulative standard normalfordelingsfunksjonen og la $G$ være den kumulative fordelingsfunksjonen til $η_{i} .$ I vedlegget vises det at sannsynligheten for at alternativ 2 er foretrukket fremfor alternativ 1 i det observerte utvalget blir lik

  ${\tilde{P}}_{2} (x_{i}, η_{i}) = : Φ (\frac{v (x_{i} (2)) - v (x_{i} (1)) + ρ t_{i}}{\sqrt{1 - ρ^{2}}}),$ (4)

der $t_{i} = Φ^{- 1} (G (η_{i}))$ og $ρ = K o r r (t_{i}, ε_{i}) .$ Altså kan modellen i (4) estimeres ved sannsynlighetsmaksimeringsmetoden ved å benytte $t_{i}$ som en ekstra forklaringsvariabel. Vi har ovenfor benyttet en variant av den såkalte kontrollfunksjonmetoden (se Rivers og Vuong, 1988). Legg merke til at her trenger en ikke å forutsette at restleddet i instrumentrelasjonen er normalfordelt.^{#Derimot trenger en å forutsette at (t_i, ε_i) er binormalt fordelt.} Så vidt meg bekjent har denne versjonen av kontrolfunksjonmetoden ikke vært benyttet tidligere. I praksis kan en tilnærme $G$ med den korresponderende empiriske fordelingen. Når $η_{i}$ er normalfordelt blir $t_{i} = η_{i} / σ,$ der $σ^{2} = V a r η_{i} .$

Anta nå for eksempel at v er lineær slik at vi kan skrive $v (x_{i} (2)) - v (x_{i} (1)) = a + x_{i} b .$ I så fall kan modellen i (4) skrives som

${\tilde{P}}_{2} (x_{i}, η_{i}) = Φ (a^{'} + x_{i} b^{'} + ρ^{'} t_{i}),$ (5)

der $a^{'} = a / (1 - ρ^{2})^{0.5},$ $b^{'} = b / (1 - ρ^{2})^{0.5},$ $ρ^{'} = ρ / (1 - ρ^{2})^{0.5} .$ Relasjonen i (5) viser at en kan estimere modellen ved å benytte standard estimeringsprogram for probitmodellen. Fra estimatene for $a^{'},$ $b^{'}$   og $ρ^{'}$   kan en nemlig finne estimater for a og $b,$ slik at en dermed har bestemt den teoretiske modellen $P_{2} ({\tilde{x}}_{i}) = Φ (a + {\tilde{x}}_{i} b)$ som kan benyttes til kontrafaktisk prediksjon.

Dong og Lewbel (2015) har utviklet en metode for konsistent estimering av semiparametriske modeller for binære valg når noen forklaringsvariabler er korrelert med restleddet $ε_{i} .$ Fordelen med denne metoden er at den ikke avhenger av forutsetninger om fordelingen til det stokastiske restleddet $ε_{i} .$ ^{#Metoden forutsetter at minst en forklaringsvariabel er eksogen og er kontinuerlig fordelt over et «stort» intervall.} Men, som nevnt ovenfor, så er det et sentralt poeng å etablere en teoretisk begrunnelse for fordelingen til restleddet. Dette er vesentlig fordi strukturelle sannsynlighetsmodeller har som ambisjon å kunne benyttes til kontrafaktisk prediksjon av $P_{2} ({\tilde{x}}_{i})$ i situasjoner der data er mangelfulle eller ikke finnes i det hele tatt.

Angrist, Pischke og harmløs økonometri

I de senere årene har det vært populært å hevde at en ikke trenger avanserte økonometriske metoder til å utføre empiriske analyser. Spesielt har Angrist og Pischke (AP), i læreboka «Mostly harmless econometrics» (2009), og i en kampanjepreget artikkel (Angrist og Pischke, 2017) nærmest argumentert for at lineær regresjon (eventuelt kombinert med instrumentvariabler og difference-in-difference metoden) i hovedsak er et tilstrekkelig modellverktøy. Det er videre symptomatisk for AP at de ikke skiller klart mellom den teoretiske modellen og den korresponderende økonometriske (empiriske) spesifikasjonen.

I dette avsnittet vil jeg drøfte nærmere problemer som oppstår ved APs tilnærming til analyse av situasjoner der den avhengige variabelen $Y_{i}$ er binær, lik 0 eller 1. Som nevnt foreslår altså AP at en kan nøye seg med å bruke lineær regresjon. I dette tilfellet blir det det samme som den lineære sannsynlighetsmodellen (LSM), dvs. at den teoretiske modellen har formen $P_{2} ({\tilde{x}}_{i}) = a + {\tilde{x}}_{i} b$ og den korresponderende empiriske modellen blir

$Y_{i} = a + x_{i} b + u_{i},$

der $x_{i}$ kan være endogen, dvs. korrelert med restleddet $u_{i} .$ Hvorfor en i utgangspunktet skulle velge LSM er, som diskutert i Lewbel mfl. (2012) og Dagsvik (2015), kontraintuitivt fordi en skulle forvente at $E (Y_{i} | {\tilde{x}}_{i}),$ som funksjon av   ${\tilde{x}}_{i},$ flater ut i nærheten av 0 og 1. Dersom forklaringsvariabelen $x_{i}$ er normalfordelt kan det vises at marginaleffekten i populasjonen av en endring av $E x_{i}$ er lik forventningen av regresjonskoeffisienten i LSM estimert ved minste kvadraters metode. Dette gjelder selv om den (sanne) binære valgmodellen ikke er lineær i $a + x_{i} b,$ se f. eks. Li mfl. (2022). Kun i denne situasjonen har estimatet for regresjonskoeffisienten i LSM (basert på minste kvadraters metode) en klar og presis tolkning. En stor del av økonomimiljøet ser ut til å ha akseptert at bruk av LSM er akseptabel. Overflatisk betraktet blir unektelig økonometrisk analyse mye enklere i dette tilfellet fordi en da tilsynelatende kan bruke standard inferensmetoder for lineære ligningssystemer med kontinuerlige avhengige variabler, og det er i så fall ikke nødvendig at forskeren har kompetanse i avanserte metoder. Imidlertid finnes det mange eksempler på hvor galt det kan gå i noen situasjoner ved bruk av LSM, se f.eks. Lewbel mfl. (2012, s. 4–5).

I det følgende skal vi se nærmere på et annet problem ved bruk av LSM og instrumentvariabelmetoden når én av høyresidevariablene er endogen. Vi antar videre at passende instrumentvariabler er tilgjengelige. Som Li mfl. (2022) har vist så følger det da at to-trinns minste kvadraters metode gir estimater for ka og kb der k er en ukjent faktor som kan være betydelig forskjellig fra 1. For fullstendighets skyld viser vi dette også i et vedlegg. Videre blir variansene til koeffisientestimatene også estimert feil. Dette er, som nevnt ovenfor, blant annet vist av Li mfl. (2022). Dersom $x_{i}$ er endogen og normalfordelt kan det vises at estimatet av regresjonskoeffisienten i LSM oppnådd ved minste kvadraters metode likevel kan benyttes til å teste om regresjonskoeffisienten er ulik null (Li mfl., 2022).

I tilfellet hvor den sanne modellen er en probitmodell så vi i forrige avsnitt at bruk av instrumentvariabelmetoden i kombinasjon med den lineære sannsynlighetsmodellen kan gi skjeve estimater der størrelsen på denne skjevheten avhenger av faktoren $1 / \sqrt{1 - ρ^{2}} .$ Dersom for eksempel $ρ = 0.4$ blir denne faktoren lik ca. 1.09. Dersom derimot $ρ = 0.6$ så blir faktoren lik 1.25. Dette viser at selv om anvendelse av LSM gir estimater som gjør at den predikerte sannsynligheten ligger mellom 0 og 1, så vil likevel estimatene være skjeve pga. den nevnte skalaeffekten.

Svært mange empiriske analyser de senere årene er basert på LSM og totrinns minste kvadraters metode. Følgelig er det grunn til å frykte at en rekke av disse analysene kan være misvisende.

Når det gjelder det mer grunnleggende spørsmålet om vitenskapelig fundament for atferdsmodeller, er den empiriske forskningsstrategien foreslått av AP temmelig langt fra idealet til Frisch og Haavelmo, slik jeg har tolket dette i denne artikkelen. På den andre siden kan en innvende at idealet til Frisch og Haavelmo vil være svært krevende å gjennomføre i mange tilfeller (om i det hele tatt mulig).

Oppsummering

Diskusjonen ovenfor illustrerer et generelt poeng, nemlig at det å etablere strukturmodeller som kan benyttes til kontrafaktisk prediksjon er en meget krevende utfordring fordi standard økonomisk teori og konvensjonelle data for observert atferd bare i begrenset grad kan benyttes til å avgrense mulige spesifikasjoner og validere atferdsrelasjoner (Dagsvik, 2016). I praksis er det kun mulig å skaffe data for aktørers tilpasning under et meget begrenset antall kombinasjoner av priser, inntekter samt populasjonskarakteristika. Det vil derfor ikke være mulig å benytte data til å sjekke direkte (teste) hvor godt modellen vil predikere i en rekke ønskelige kontrafaktiske situasjoner. Som påpekt av Hausman (1992, s. 166–169) er det derfor nødvendig å etablere ytterligere a priori teori og eventuelt data fra SP undersøkelser for å kunne stole på modellprediksjoner av effekten av kontrafaktiske reformer der data er mangelfulle eller ikke finnes i det hele tatt (Bjerkholt og Dupont, 2009).

Som nevnt forestilte Frisch seg et vitenskapelig ideal der økonomiske relasjoner er avledet ved hjelp av den aksiomatiske metode og «first principles» (Bjerkholt, 2012). Det er vel neppe å overdrive at de fleste eksisterende økonometriske modeller er svært langt fra dette idealet. Empiriske atferdsrelasjoner er typisk basert på stilisert teori og ad hoc spesifikasjoner av funksjonsform og egenskaper til uobserverte variabler. Det er overlatt til økonometrikeren å fylle dette gapet mellom teori og empiriske spesifikasjoner ved hjelp av statistisk inferens og konvensjonelle data.

Det er betydelig diskusjon og uenighet blant økonomer om hva som er den beste måten å utføre empirisk forskning på. Som et resultat av dette eksisterer det fundamentalt forskjellige forskningsstrategier i økonomifaget. Blant tilhengerne av strukturelle tilnærminger er det uenighet om hva som er akseptable teoretiske rammeverk. Andre er tilhengere av tilnærmingen til Angrist og Pischke, mens andre igjen mener randomiserte kontrollerte eksperimenter er det eneste en kan stole på. Se Deaton (2010) samt Todd og Wolpin (2022), som er interessante bidrag til diskusjonen om randomiserte kontrollerte eksperimenter versus strukturell tilnærming. I likhet med SP data kan data fra randomiserte kontrollerte eksperimenter også benyttes til å teste strukturelle spesifikasjoner.

Jeg har tidligere hevdet (Dagsvik, 2016) at det blant strukturelle økonomer tas for lett på utfordringene knyttet til etablering av økonometriske atferdsrelasjoner. Blant økonomer er det tydeligvis en utbredt skepsis til at det i det hele tatt er mulig å etablere strukturelle økonometriske modeller i rigorøs forstand.

Følgende sitat fra konklusjonen til Haavelmo (1944, s. 115) er interessant fordi den viser klart at han forsto hvilken massiv og koordinert innsats som kreves for å oppnå framgang i vitenskapelig forstand på dette feltet:

“In other quantitative sciences the discovery of “laws,” even in highly specialized fields, has moved from the private study into huge scientific laboratories where scores of experts are engaged, not only in carrying out actual measurements, but also in working out, with painstaking precision, the formulae to be tested and the plans for the crucial experiments to be made. Should we expect less in economic research, if its results are to be the basis for economic policy upon which might depend billions of dollars of national income and the general welfare of millions of people?”

Vedlegg

Probitmodelen med endogen forklaringsvariabel

Anta at den teoretiske modellen kan skrives som

$U_{i 2} - U_{i 1} = v ({\tilde{x}}_{i} (2)) - v ({\tilde{x}}_{i} (1)) + {\tilde{ε}}_{i},$ (A.1)

der   ${\tilde{ε}}_{i}$ antas å være standard normalfordelt. Den observerbare avhengige variabelen $Y_{i}$ er lik 1 dersom $U_{i 2} > U_{i 1}$ er positiv og 0 ellers. Fra (A.1) følger det at

$P (U_{i 2} - U_{i 1} > 0) ({\tilde{x}}_{i}) = P (v ({\tilde{x}}_{i} (2)) - v ({\tilde{x}}_{i} (1)) > - {\tilde{ε}}_{i}) ({\tilde{x}}_{i}) = Φ (v ({\tilde{x}}_{i} (2)) - v ({\tilde{x}}_{i} (1))),$ (A.2)

der vi husker at $Φ$ betegner den kumulative normalfordelingsfunksjonen med forventning null og varians lik 1.

Betrakt den korresponderende empiriske modellen der det nå tillates at den observerte komponenten $x_{i 1} (1)$ for person i i utvalget kan være korrelert med restleddet $ε_{i} .$ Anta at (3) fortsatt gjelder og husk at $G$ er den kumulative fordelingsfunksjonen for $η_{i} .$ La $t_{i} = Φ^{- 1} (G (η_{i})),$ hvilket medfører at $t_{i}$ blir standard normalfordelt. Anta videre at $(ε_{i}, t_{i})$ er binormalt fordelt med forventninger lik null og $K o r r (ε_{i}, t_{i}) = ρ .$ På grunn av normalitetsantakelsen er det velkjent at en kan skrive $ε_{i} = ρ t_{i} + ω_{i}$ der $ω_{i}$ er normalfordelt og uavhengig av $η_{i} .$ Det følger av dette at $V a r ω_{i} = (1 - ρ^{2}) .$ Vi har dermed at

$U_{i 2} - U_{i 1} = v (x_{i} (2)) - v (x_{i} (1)) + ε_{i} = v (x_{i} (2)) - v (x_{i} (1)) + ρ t_{i} + ω_{i} .$ (A.3)

Den korresponderende empiriske modellen som følger fra (A.3) blir derfor slik som i (4).

Den lineære sannsynlighetsmodellen med endogen forklaringsvariabel

La funksjonen $ψ$ være definert ved $ψ (x) = x$ når $x \in [0,1],$ lik 0 når x < 0 og lik 1 når $x > 1 .$ Anta at den teoretiske modellen har formen

$P_{2} ({\tilde{x}}_{i}) = ψ (a + {\tilde{x}}_{i} b)$

hvilket er en veldefinert sannsynlighetsmodell. Her skal vi for enkelhets skyld anta at forklaringsvariabelen   ${\tilde{x}}_{i}$ er en skalar. Vi merker oss at denne modellen er lineær i   ${\tilde{x}}_{i}$ når $a + b {\tilde{x}}_{i}$ ligger mellom 0 og 1. Den korresponderende empiriske modellen har formen

$Y_{i} = ψ (a + b x_{i}) + u_{i},$ (A.4)

der $Y_{i}$ er den avhengige variabelen som antar verdiene 0 eller 1, og $u_{i}$ er et restledd med forventning lik null som kan være korrelert med $x_{i} .$ Vi antar videre at en kan tilnærme modellen i (A.4) med den lineære modellen

$Y_{i} = a + b x_{i} + u_{i}$ (A.5)

og at en instrumentvariabel $z_{i}$ er observert slik at følgende gjelder

$x_{i} = α + z_{i} β + η_{i},$ (A.6)

der $η_{i}$ er ukorrelert med $z_{i}$ og har forventning null. La videre

$p (z_{i}) = P (a + α b + β b z_{i} + b η_{i} \in [0,1] | z_{i})$

$q (z_{i}) = E (b η_{i} 1 {a + α b + β b z_{i} + b η_{i} \in [0,1]} | z_{i}) + P (a + α b + β b z_{i} + b η_{i} > 1 | z_{i}) .$

Ved innsetting av (A.6) inn i (A.4) får vi at

$P (Y_{i} = 1 | z_{i}) = E (ψ (a + b x_{i}) | z_{i}) = E (ψ (α a + β b z_{i} + b η_{i}) | z_{i})$ (A.7)

$= (a + α b + β b z_{i}) p (z_{i}) + q (z_{i}) .$

Fra (A.7) ser vi at kun når regresjonslinja pluss restleddet etter innsetting av instrument-variabelligningen ligger i intervallet (0, 1) med sannsynlighet nær 1 så blir forventningen, gitt $(z_{i}),$ lineær, dvs. kun dersom

$p (z_{i}) ≅ 1$ (A.8)

(hvilket medfører at $q (z_{i}) ≅ 0)$ får vi at

$E (Y_{i} | z_{i}) = P (Y_{i} = 1 | z_{i}) ≅ a + α b + β b z_{i} .$

Dersom (A.6) settes inn i (A.5) får vi en likning av typen

$Y_{i} = a + α b + β b z_{i} + b η_{i} = : e + f z_{i} + δ_{i},$

der e, og f er ukjente koeffisienter og $δ_{i}$ er et stokastisk restledd med forventning null. Her gjelder det ikke nødvendigvis at $e = a + α b$ og $f = β b .$ Det er heller ikke noen måte å teste om (A.8) gjelder fordi selv om $α$ og $β$ er konsistent estimert så forblir a og b ukjente.

Referanser

Angrist, J. og Pischke, J.- S. (2009). Mostly harmless econometrics. Princeton University Press.

Angrist, J. og Pischke, J.- S. (2017). Undergraduate economics instruction: Through our classes, darkly. Journal of Economic Perspective 31 (2), 125–144.

Bjerkholt, O. (2012). Ragnar Frisch’s axiomatic approach to econometrics. Memorandum 21/2012, Økonomisk institutt, Universitetet i Oslo.

Bjerkholt, O. og A. Dupont (2009). Problems and methods of econometrics. The Poincaré lectures of Ragnar Frisch 1933. Routledge.

Dagsvik, J. K. (2015). Lineær regresjon med binær eller begrenset avhengig variabel: En utdatert metode med fallgruber. Samfunnsøkonomen 129 (4), 28–36.

Dagsvik, J. K. (2016). Er ambisjonen om et rigorøst vitenskapelig fundament for kvantitative strukturrelasjoner for krevende? Samfunnsøkonomen 130 (6), 58–67.

Dagsvik, J. K. (2018). Invariance axioms and functional form restrictions in structural models. Mathematical Social Sciences 91, 85–95.

Dagsvik, J. K. (2019). Sviktende ambisjoner og ensretting i empirisk mikroøkonomi? Samfunnsøkonomen 133 (3), 26–31.

Dagsvik, J. K. (2023). Structural modeling in the spirit of Frisch and Haavelmo. The case of binary choice. Kommer som Discussion Paper, SSB.

Deaton, A. (2010). Instruments, randomization, and learning about development. Journal of Economic Literature 48 (2), 424–455.

Dong, Y. og A. Lewbel (2015). A simple estimator for binary choice models with endogenous regressors. Econometric Reviews 34 (1–2), 82–105.

Frisch, R. (1930). General considerations in statics and dynamics in economics, i Bjerkholt, O. og D. Qin (red.), A dynamic approach to economic theory: The Yale Lectures of Ragnar Frisch, 1930. Routledge, 2010, s. 29–81.

Frisch, R. (1938). Autonomy of economic relations. Statistical versus theoretical relations in econonomic macrodynamics. Foredrag presentert for Folkeforbundet. Også utgitt i Hendry, D. F. og M. S. Morgan, The foundations of econometric analysis. Cambridge University Press, 1995.

Gabrielsen, T. og S. Strøm (1999). Tilbringertjenesten til Oslo Lufthavn, Gardermoen. Sosialøkonomen 53 (7), 10–24.

Haavelmo, T. (1943). The statistical implication of a system of simultaneous equations. Econometrica 11 (1), 1–12.

Haavelmo, T. (1944). The probability approach in econometrics. Econometrica 12 (Supplement), iii-vi og 1–115.

Hausman, D. M. (1992). The inexact and separate science of economics. Cambridge University Press.

Heckman, J. J. (2007). Haavelmo’s legacy. Foredrag i anledning 75-årsjubileet til økonomisk institutt, UiO.

Heckman, J. J. (2008). Econometric causality. International Statistical Review 76 (1), 1–27.

Heckman, J. J. og R. Pinto (2015). Causal analysis after Haavelmo. Econometric Theory 31 (1), 115–151.

Heckman, J. J. og R. Pinto (2022). The econometric model for causal policy analysis. Manuskript, University of Chicago.

Heidelberger, M. (2004). Nature from within. Gustav Theodor Fechner and his psychophysical world view. University of Pittsburg Press, Pittsburg PA.

Hurwicz, L. (1962). On the structural form of interdependent systems, i Nagel, E., P. Suppes og A. Tarski (red.), Logic, methodology and philosophy of science. Stanford University Press, s. 232–239.

Koopmans, T. og W. C. Hood (1953). The estimation of simultaneous linear economic relationships. I Hood, W. C. og T. C. Koopmans (red.), Studies in econometric method. Cowles Foundations Monograph no. 14, Wiley.

Kreps, D. M. (1990). A course in microeconomic theory. Harvester Wheatsheaf, New York.

Lewbel, A., Y. Dong og T. T. Yang (2012). Comparing features of convenient estimators for binary choice models with endogenous regressors. Canadian Journal of Economics 45 (3), 809–829.

Li, C., D. S. Poskitt, F. Windmeijer og X. Zhao (2022). Binary outcomes, OLS, 2SLS and IV probit. Econometric Reviews 41 (8), 859–876.

Luce, R. D. og P. Suppes (1965). Preference, utility, and subjective probability, i Luce, R. D., R. R. Bush og E. Galanter (red.), Handbook of Mathematical Psychology, vol. III. Wiley, New York, s. 249–410.

Marschak, J. (1953). Economic measurements for policy and prediction, i Hood, W. C. og T. C. Koopmans (red.), Studies in econometric method. Cowles Foundations Monograph no. 14, Wiley.

Marshall, A. (1890). Principles of economics. Macmillan and Company.

McFadden, D. (2001). Economic choices. American Economic Review 91 (3), 351–378.

McFadden, D. (2002). The path to discrete-choice models. Access Journal 20 (1), 2–7.

Rivers, D. og Q. H. Vuong (1988). Limited information estimators and exogeneity tests for simultaneous probit models. Journal of Econometrics 39 (3), 347–366.

Todd, P. og K. I. Wolpin (2023). The best of both worlds: combining randomized controlled trials with structural modeling. Journal of Economic Literature 61 (1), 41–85.

Strukturell analyse etter Frisch og Haavelmo#Takk til Tom Kornstad, Terje Skjerpen, Anders Rygh Swensen, Steinar Strøm og Thor Olav Thoresen for nyttige kommentarer.