Indlæg i kategorien 'Generel samfundsvidenskab' ↓

Tandlæger er mere højreorienterede end børsmæglere (i USA)

Dette er en spændende analyse.

I USA er der mere kontrol med politiske donationer end i Danmark - og alle oplysninger er offentligt tilgængelige. Det gør det muligt at undersøge bl.a. hvilke brancher der giver penge til hvilke politikere. Og således ovenstående graf, der har tre interessante indsigter (synes jeg).

For det første er den blå “bølge” mere flad end den røde. Det kan tolkes sådan at demokraterne er en mere divers gruppe end republikanerne (rød bølge). Dette understreges af at en betragtelig del af demokraterne faktisk har værdier større end 0 på den ideologiske skala (0 er sat til uafhængig, negative værdier er venstreorienteret og positive værdier er højreorienterede).

For det andet overlapper de to bølger lidt, hvilket giver en indikation af hvor store/små mulighederne for samarbejde mellem de to partier er.

For det tredje er en masse forskellige brancher plottet ind. Kun fire brancher er klar republikanske (Olie, bil, bygge og energi). Blandt de resterende er der dog store forskelle. Film branchen er mest vestreorienteret, mens hedge funde og andre finansfolk, tilsyneladende “hedger” deres donationer (dvs. de spiller på begge heste). Tandlæger og forsikringsfolk ligger ret langt til højre.

Overraskende?

Bare man kunne lave noget tilsvarende i Danmark.

Sygehusvæsenet der kunne være bedre

Jeg elsker når folk deler deres arbejde: Fornyligt diskuterede Gelman en graf af sammenhængen mellem et lands udgifter til sygehusvæsenet1. Det fik så en vis Frank Hansen til at lægge sin egen lille analyse frem. Jeg har så pudset grafen lidt af, og fremhævet danmark:

Det gik lidt hurtigt med at lave grafen, så jeg fik ikke ekspliciteret at udgifterne er pr. person pr. år i købekrafts justeret USD.

Konklusion: Vi kan godt gøre det bedre.

  1. ”Helthcare” []

BNP prognoser - kan de bruges?

I mangel af bedre kan BNP prognoser helt sikkert bruges til et eller andet. Men jeg er alligevel overrasket over hvor store ueninghederne kan være. For sjov sammenlignede jeg IMF’s prognose over for CIA’s prognoser. Resultatet ses nedenfor1.

Hvis IMF og CIA havde været enige - skulle punkterne (som hver repræsentere et land) være fordelt langs den blå linje. I stedet ser vi at CIA generelt er langt mere optimistisk - særligt for lande som IMF vurdere vil have en negativ vækst2.

Herudover er det dog slående hvor store forskelle der er mellem enkeltlande. Nederst til højre er fx en prik (Zimbabwe). IMF vurdere realvæksten til ca 4% - CIA vurdere væksten til ca. -14%. Midt øverst er en anden prik. IMF vurdere real-væksten til ca. 0,5%, mens CIA vurdere realvæksten til ca. 14%. Og så videre.

Fremover er jeg mere forsigtig med at tillægge BNP prognoser nogen som helst værdi.

(ps. kilderne er angivet i figuren: IMF: http://2.ly/QR og CIA: http://2.ly/QS)

  1. grafen har engelsk følgetekst - jeg lavede den til tweeter, og har smidt scriptet væk. Så istedet for at lave den igen - må I klarer jer med denne []
  2. Den røde linje er regressionslinien mellem de to prognoser, og den kan tolkes sådan at CIA er langt mere forsigtige, hvertfald diskriminere mindre mellem landende []

Indkomst og donation

I Danmark forestår den progressive beskatning en, sammenlignet med andre lande, stor omfordeling af indkomsten. Giver de velbeslåede derudover selv lidt ekstra?

Kræftens Bekæmpelse har lagt indsamlingsresultater ud på internettet. Kombineret med data fra de kommunale nøgletal, kan man undersøge samenhængen mellem indsamlingsresultater og forhold som andel af beboer i bymæssig beboelse, befolkningstæthed, region, skattegrundlag m.m. Stort set alt er dog insignifikant. Kort sagt: Folk giver det de giver - sikkert en tyver som ligger lommen.

Klik for større udgave

Klik for større udgave

For de nysgrerrige: Billedet er det samme (inkl. øboernes generøsitet) i 2008. Data stammer fra kræftens bekæmpelses hjemmeside, og de kommunale nøgletal.

Søjlediagram eller ‘hop-plot’ (og lidt om de fattige)

Hvordan viser vi bedst udviklingen i befolkningsandele der lever i ekstrem fattigdom?

Jeg er figurfetichist: Jeg kan bruge timer på at diskutere fordele og ulemper ved selv de simpleste figurer. Jeg følger trofast med i mine forbilleders gøren og laden - tufte, Few, Kaiser m.fl.

Jeg mener fx at simple søjlediagrammer i mange tilfælde er den bedste løsning for simple data. Derfor valgte jeg også denne figurtype til at illustrere udviklingen i andelen af mennesker der lever for mindre end een US dollar om dagen.

Søjlediagrammer med mere end fire tal kan desværre nemt blive svære at overskue. Det hjælper tit at sortere søjlerne (i dette tilfælde efter procent fattige i 2004) - men det er ikke altid nok. Et alternativ i sådanne situationer kunne være et ‘hop-plot’1 - en variant af et parrallel koordinatplot.

I nedenstående figur er det måske mere intuitivt end i et søjlediagram, at nogle lande har oplevet en meget kraftig ændring i andelen af ekstrem fattige indbygger. Samtidig er det nemt at udlede relative rangpladser for begge år.

Hopgrafen bruges sjældent - sandsynligvis fordi man er bange for at linjerne opfattes som lineære udviklinger. De fleste implementeringer (også denne) er således ikke andet end almindelige linjegrafer med blot to tidspunkter. Når man bruger et hop-plot er det derfor vigtigt at kommunikere at der ikke kan aflæses værdier mellem de to undersøgte tidspunkter. Ligesom i det parallelle koordinat plot er det ‘hoppet’ der er interessant (dvs. Kina og Østasien)- og det kan være en fordel at vise det.

Uanset figurtype er det nemt at se at andelen af ekstremt fattige er faldet fra 1990 til 2004. Det kunne således se ud til at det er rigtigt at verdens tilstand faktisk forbedres2

Hvilken figurtype synes du er bedst?

  1. Tufte: “Bumps chart” []
  2. Men selvfølgelig bør vi også kigge på andelen af absolut fattige… Der er jo immervæk kommet en del flere mennesker på jorden siden 1990 []

Er udlændinge mere kriminelle end ‘indlændinge’?

180grader har en artikel om at “Hvert tredje bandemedlem i Danmark er udlænding”. Artiklen omhandler nogle få forbrydere som beviseligt har gjort sig skyldig i fx ulovlig våbenbesidelse. Artiklen rejser spørgsmålet om lovovertrædelser af denne type bør være tilstrækkeligt til at udvise ikke-danske statsborgere. Personligt mener jeg nej, fordi selv ikke-statsborgere har ret til et minimum af retsikkerhed og lighed for loven - uanset af de er medlemmer af rockerbander.

Hertil kommer at jeg frygter en tilfældig fortolkning (læs glidebane) af hvilke lovovertrædelser der er tilstrækkelig til en udvisning. Butikstyveri? at cykle uden lygter?

Anyways: Artiklens skarptvinklede overskrift fik mig til at undersøge om der statistisk kan findes en sammenhæng mellem voldsforbrydelser og andelen af af indvandrere fra 3. verdenslande. Den slags data er ikke nemme at finde på individniveau; men de kommunale nøgletal kan levere varen på kommunalt niveau.

Jeg kiggede på følgende variable:

  • Anmeldte voldsforbrydelser per 1000 indbygger
  • Socioøkonomisk indeks for kommunen1
  • Befolkningsandel i bymæssig beboelse.
  • Andel af almennyttige boliger i kommunen
  • Grundværdier pr. indbygger
  • Statsborger fra 3. lande per 10.000 indbygger2

Først3 undersøgte jeg de bivariate sammenhænge (plot), og siden lavede jeg en simpel mulitpel linær regressionsanalyse for de ovenfor nævnte variable.

De binære plots viser at andelen af indbyggere fra 3. verdenslande faktisk er større i kommuner hvor der anmeldes et stort antal voldsforbrydelser. Men denne sammenhæng forsvinder i den multiple analyse når der kontrolleres for andre variable. Faktisk er der kun een variabel som har signifikant betydning for niveauet af anmeldte voldsforbrydelser i kommunerne: nemlig det sociale indeks for kommune.

Andelen af indvandrere har IKKE betydning. Hvert fald ikke i 2006 som er det seneste år de nævnte nøgletal var opdaterede. UPDATE: Figur 2 nedenfor viser således sammenhængen mellem andelen af indvandrere og antallet af anmeldte voldsforbrydelser, bør før og efter effekten er korrigeret for kommunens sociale indeks.

Sammenhængen mellem vold og andel af indvandrere, før og efter kontrol for socioøkonomisk indeks.

Sammenhængen mellem vold og andel af indvandrere, før og efter kontrol for socioøkonomisk indeks.

Og jeg er selvfølgelig helt på det rene med at dette ikke er en udtømmende analyse. Det er blot en sjov lille øvelse.

  1. se forklaring []
  2. Nøgletallet vedrører samtlige personer, der har opholdstilladelse i Danmark med statsborgerskab fra 3. lande, det vil sige lande udenfor EU, Norden og Nordamerika. Statsborgere fra 3. lande omfatter personer, der har opholdstilladelse i Danmark med flygtningestatus, med baggrund i familiesammenføring, studieophold, beskæftigelses- og erhvervsmæssige grunde og lignende. Nøgletallet omfatter ikke personer, der 1. januar havde opnået dansk statsborgerskab samt asylansøgere. kilde: http://noegletal.dk/nwInfo08A-022.html []
  3. Hvis du er interesseret har jeg lagt R script ud her []

Miljø-økonomi og klimaforandringer

Hvem tør slå koldt vand i blodet?

FN’s klimapanel udkom idag med endnu en foruroligende rapport. I dag er der mere fokus end nogensinde på klimatopmøder, reduktion af co2 udledning, grønne regnskaber med mere. Lomborg holder stadig foredrag og skriver stadig bøger - men man fornemmer en større og større skepsis omkring hans arbejde. Hvilket er en skam… For der er behov for nogen der kigger skeptisk på klimapanelet og ‘grøn forskning’ i øvrigt.

Ethvert introduktionskursus i politologi bruger tid på strukturelle interessekonflikter, rationelle præferencer og virkningen af incitamentstrukturer. Derfor er der efterhånden altid en kritisk røst der spørger om lægerne altid har ret, når de siger: “send flere penge”. Som samfund tror vi der er andre løsninger på kriminalitet end politiet som siger: “send flere penge”. Det samme gælder pædagoger, lærere og videnskabsfolk generelt. Videnskaben er endda god til at kritiserer hinanden, hvilket DTU og Børsens seneste rangliste viser med al tydelighed.

Richard Lindzen fra MIT er naturvidenskabsmand af den gamle skole, skeptisk over for dokumentationen af klimaforandringer og tidligere medlem af FN’s klimapane. I denne artikel1 forsøger han at beksrive hvordan miljø-agendaen, har skabt nogle uheldige incitamentstrukturere for videnskabsfolk. Han viser ved hjælp af tidligere forskning, hvordan de usikkerheder der altid er i videnskab, systematisk er korrigeret i retning af et bestemt udsagn, og hvordan modellernes interne modsætninger er blevet bevist ignoreret med henblik på at få den næste bevilling hjem2

Mere generelt er Lindzen’s pointe, at store forskningsprogrammer, sjældent føre til stor videnskab. Ofte føre det derimod til forkert videnskab, fordi programmerne ikke tager fat i de mest spændende problemstillinger, men istedet kun berøre de felter som kan udløse en bevilling.

Derfor: Læs lomborg igen - og tro ikke ukritisk på alt hvad du læser.

Tak til the physics arXiv blog

  1. Climate Science: Is it Currently Designed to Answer Questions? []
  2. Artiklen minder meget om samfundsvidenskab, og er som sådan vil en samfundsvidenskabelig skolet person, nok finde vise form-problemer. Og det er jo på sin vis rart nok… Der er stadig brug for os :-) []

Obama er sort! - Men han vinder alligevel.

Obama førere stort i meningsmålingerne, hvilket har fået flere kommentatorer til at advare i mod den såkaldte “Bradley effekt”. Senest blev spørgsmålet antydet1 i dagens information. Bradley effekten er opkaldt efter en sort guvenør som fik utroligt gode meningsmålinger, men som på valgdagen måtte sande at hans hudfarve tilsyneladende havde fået folk til at ryste på hænderne i stemmeboksen.

Det er hvertfald den almindelige fortolkning. Imidlertid er det jo ikke første gang at en politiker har oplevet et skuffende valgresultat ovenpå gode meningsmålinger. Men alligevel - kunne det samme ske for Obama?

Forhåbentlig ikke.

For det første har en af de centralt placerede ‘pollsters’ skrevet om Bradley effekten, og om hvordan den er blevet overvurderet. Citatet sætter i øvrigt fokus på vigtigheden af at have et vågent øje på meningsmålingernes usikkerhedsinterval:

The other reason I reject the Bradley Effect in 2008 is because there was not a Bradley Effect in the 1982 California Governor’s race, either. Even though Tom Bradley had been slightly ahead in the polls in 1982, due to sampling error, it was statistically too close to call.

For det andet er den effekt som tidligere fandes i 80′erne senere forsvundet. Dette interessante paper fra august skriver i abstractet (wilder effekten er den samme som Bradley effekten, blot opkladt efter en anden politiker):

this paper presents the first large-sample test of the Wilder e ffect. It demonstrates a significant Wilder e ffect only through the early 1990s, when Wilder himself was Governor of Virginia. Although the same mechanisms could aff ect female candidates, this paper finds no such eff ect at any point in time. It also shows how polls’ over-estimation of front-runners’ support can exaggerate estimates of the Wilder eff ect.

Som antydet er paperet interessant fordi det i sin undersøgelse af wilder efekten kommer vidt rundt i survey-statistikkens kringelkroge, bl.a. viser studiet altså at farvoritten næsten altid får bedre meningsmålinger end valg. I det hele taget er forskningen fra Harvards Institut for kvantitativ samfundsvidenskab altid meget læsværdig og lødig.

For det tredje har de hidtidige Obama primær valg, faktisk vist en omvendt bradley effekt i stater med mange sorte vælgere, mens der ikke har været nogen negativ effekt, eller positiv effekt i stater med mange hvide.

Obama skal nok vinde :-)

USA og resten af verden er dog sikkert stadig præget af ubevist racisme. Fx. jvf. min tidligere post om implicit associatins test - en testtype som har ‘afsløret at hvide amerikanere stadig har negative underbevidst opfattelse af sorte. At Bradley effekten tilsyneladende er forsvundet kan derfor måske ses som et udtryk for at amerikanerne er blevet bedre til at tage et rationelt valg - til at høre på Barack Obamas argumenter - istedet for kun at fokusere på hans hudfarve.  Dette ville i givet fald stemme fint overens med at uddannelsesniveauet er steget…

En anden fortolkning er at Obamas folk tydeligvist har nærstuderet psykolog Drew Westens2 bog, The Political Brain, som allerede sidste år ved udgivelsen fik opmærksomhed. Det er en virkelig god bog, hvis råd - bl.a. at en demokraternes præsidentkandidat bør have håb og forandring som nøgleord - virker spot-on på Obamas kampagne.

  1. dog uden reference til hverken Bradley eller Wilder []
  2. Drew Westen har jeg i øvrigt støt på i forbindelse med Q-methodology vs. faktoranalyse debatten - som kunne være et interessant emne for en anden blogpost []

Det er dødeligt at stemme til præsidentvalg

I statskundskab og økonomi findes en teoriretning, rational choice, som advokerer for - ja -  rationel adfærd. Nogle fortaler hæfter sig ved at en model baseret på rationelle valg, er god og simpel1 til at forudsige alle mulige former for adfærd - det være sig politikeres, organisationer og individer i supermarkedet. Andre mener at en rationel adfærd er særligt ønskeligt og tillægger altså teorien en særlig normativ drejning.

Over for rationel choice står andre adfærdsmodeller som lægger vægt på forskellige former for socialisering og biologi2. Disse modeller angriber rationel choices faktiske evne til at forudsige handling. Det mest klassiske eksempel er at rationelle modeller kun meget vanskeligt kan forklare hvorfor folk faktisk gider at stemme ved politiske valg3 - for en enkelt stemme er jo ikke udslagsgivende, og derfor vil et rationelt menneske ikke gide at bruge tid og kræfter på det.

En ting er dog at ens forventede nytte ved stemmehandling kan være lille eller negativ. Men man kan altså også dø af at det. Således viser en lille undersøgelse at for hver time det er muligt at stemme ved et amerikansk præsidentvalg, er der to ekstra dødsulykker i trafikken. Forskellen er signifikant.

Så hermed endnu en pind i kisten for rationel teori (som jo i øvrigt antager at individerne har fuld information - også om risikoen ved at bevæge sig ud i trafikken).

  1. se evt. engelsk wikipedia om Orcams barberkniv []
  2. Herbert Simons’ Bounded rationality og Bryan D. Jones m.fl. forskellige udlægninger heraf, tager ikke udgangspunkt i normer - men snare individets kognitive begrænsninger. Dette kommer mere rendyrket frem i behavioral economics, med folk som Daniel Kahneman og Amos Tversky. I en dansk sammenhæng har Jørgen Poulsens doktorafhandling “Political Woman” været særligt interessant []
  3. et emne også punditokraterne har behandlet :-) []

Kunsten at lave meningsmålinger og politiske prognoser

Mange ting kan man sige om amerikanerne. Forkærligheden for statistik er blot en af disse ting. Det opleves tydeligt til NFL og NBA - og selvfølgelig også ved præsidentvalg. USA har i kraft af sine mange delstater, og mange demokratiske niveauer, et enestående grundlag til at forfine den ædle kunst at lave meningsmålinger.

Politiken er begyndt at rapportere pollster.com prognoser. Pollster har i mange år været ganske gode til at aggregere forskellige surveyinstitutters prognoser, og lave gennemsnit heraf. Metodologien er ligefrem - men ikke perfekt. Derfor trådte Nate Silver på banen. Han er manden som nogen mener revolutionlerede amerikansk baseball ved at vise hvordan avanceret statistik kunne outperforme dyre talentspejder når det galt om at finde frem til morgendagens sportstjerne.

På hjemmesiden www.fivethirtyeight.com kan man derfor nu - takket være Hr. Silver -finde langt mere præcis information end hos pollster og politiken. Nates metode indebære blandt andet at hvert surveybureaus resultater vægtes alt efter hvor gode de tidligere har været til at ramme præcist. Logikken er, at en survey har 3 fejlkilder: Den ene er såkaldt sampling error. Denne fejl er nem at beregne og afhænger af stikprøvestørrelsen. Det er den fejl der normalt rapporteres som usikkerhedsmargen. Fejlkilde nummer 2 skyldes tidsforskydning mellem  meningsmålingen og selve valghandlingen. I Nate’s beregninger ignoreres denne fejlkilde, fordi der kun indgår meningsmålinger foretaget umiddelbart op til valget. Den tredje fejlkilde kaldes poetisk for PIE: Pollster Introduces Error. Det er den fejl der kan tilskrives den metode meningsmålingerne bruger. Nogle bruger internet, andre bruger automatiske telefonrobotter, og andre bruger personlige interview. Nogle gange er intervieweren højreorienteret, andre gange er chefen liberal. Nogle gange er intervieweren måske provisionlønnet og skynder sig at lave mange, men ikke særligt gode, interview. Der er et utal af små menneskelige fejlkilder1 .

FiveThirtyEights rangliste viser at der faktisk er store forskelle i det enkelte surveyfirmas troværdighed. Der er kort sagt rigtig god grund til at vægte de forskellige resultater:

Meningsmålinger fra forskellige firmaer, sorteret efter kvalitet.

Meningsmålinger fra forskellige firmaer, sorteret efter kvalitet.

Ranglisten skal fortolkes således at scoren angiver hvor mange procentpoints fejl man kan forvente at hvert firma introducere i deres målinger. Mens Gallup altså rammer næsten 2,5 point ved siden af, er selzer og co. faktisk 3 gange mere præcise og introducere kun en PIE på ca. 0,7 procentpoint.

I den lidt sjovere afdeling bruger Nate silver også simulationer på baggrund til at forudsige forskellige udfald:

Forskellige udfald og deres sandsynligheder (pr. 6/10)

Forskellige udfald og deres sandsynligheder (pr. 6/10)

Google guruen Peter Norvig side kan i øvrigt også anbefales - som en generelt introduktion til præsidentvalget som set fra en lidt alternativ vinkel.

  1. Det er derfor det ikke er ligegyldigt hvem man hyrer til at lave sine undersøgelser []