Jorge spørger om ikke grafer m.m. i nogle tilfælde bør appellere til følelserne, i stedet for kun at repræsentere de nøgne tal. Det er et svært spørgsmål - for selv om figurerne måske kan gøres mere spektakulære, er der også en reel fare for at de bliver svære at forstå - særligt fordi følelser og visuelle referencerammer sjældent vil være ens for forskellige mennesker. Derfor er rådet normalt: Brug det der virker - velkendte graftyper, designet til at vise data på en måde som mennesket kognitivt har nemt ved at afkode. Det er af denne grund at man normalt skal holde sig fra boble-grafer m.m.
I Jared Dimonds “Den tredje Chimpanse” faldt jeg dog over en mulig undtagelse. Bryster og Penisser er jo noget vi alle har et forhold til, så derfor finder jeg faktisk følgende sammenligning af forskelle mellem hunner og hanner rigtig god - og meget sjov.
Hvordan viser vi bedst udviklingen i befolkningsandele der lever i ekstrem fattigdom?
Jeg er figurfetichist: Jeg kan bruge timer på at diskutere fordele og ulemper ved selv de simpleste figurer. Jeg følger trofast med i mine forbilleders gøren og laden - tufte, Few, Kaiser m.fl.
Jeg mener fx at simple søjlediagrammer i mange tilfælde er den bedste løsning for simple data. Derfor valgte jeg også denne figurtype til at illustrere udviklingen i andelen af mennesker der lever for mindre end een US dollar om dagen.
Søjlediagrammer med mere end fire tal kan desværre nemt blive svære at overskue. Det hjælper tit at sortere søjlerne (i dette tilfælde efter procent fattige i 2004) - men det er ikke altid nok. Et alternativ i sådanne situationer kunne være et ‘hop-plot’1 - en variant af et parrallel koordinatplot.
I nedenstående figur er det måske mere intuitivt end i et søjlediagram, at nogle lande har oplevet en meget kraftig ændring i andelen af ekstrem fattige indbygger. Samtidig er det nemt at udlede relative rangpladser for begge år.
Hopgrafen bruges sjældent - sandsynligvis fordi man er bange for at linjerne opfattes som lineære udviklinger. De fleste implementeringer (også denne) er således ikke andet end almindelige linjegrafer med blot to tidspunkter. Når man bruger et hop-plot er det derfor vigtigt at kommunikere at der ikke kan aflæses værdier mellem de to undersøgte tidspunkter. Ligesom i det parallelle koordinat plot er det ‘hoppet’ der er interessant (dvs. Kina og Østasien)- og det kan være en fordel at vise det.
Uanset figurtype er det nemt at se at andelen af ekstremt fattige er faldet fra 1990 til 2004. Det kunne således se ud til at det er rigtigt at verdens tilstand faktisk forbedres2
Folk der som jeg er optaget af fænomenet positive organisationsstudier (POS1 ) vil ofte kende til studier der viser en sammenhæng mellem økonomiske bedrifter og forskellige mål for menneskelig trivsel. Via The Economist er jeg nu gjort opmærksom på at sammenhængen tilsyneladende kan bruges som invisterings guideline. Se figur 1:
Figur reproduceret fra the economist. Kilde: "Does the stockmarket fully value intangibles? Employee satisfaction and Equity prices", by Alex Edmans, Dec. 2008 Wharton
Figuren viser at fra 1998 til i dag, er de firmaer som er på Fortune magasines liste over de 100 bedste arbejdspladser, i gennemsnit har givet et 4,1 procent større afkast pr år, end CRSP aktierne2 . Over flere år kan det blive til en pæn sjat
Den meget omtalte film, “Dagbog fra midten” blev i går sendt på DR2. EFterfølgende var der interview med Naser Khader i Deadline. Her du ikke set filmen endnu - kan du nå det på DR.dk - her.
Mest for sjov har jeg lavet et lille spørgeskema omkring filmen. Du kan bl.a. svare på hvordan henholdsvis, Ulla ØStergaard, Rasmus Jønsson, Gitte Seeberg, Naser Khader og Anders Samuelsen fremstår i filmen. Jeg burde nok også havde inkluderet andre personer, så som Jørgen Poulsen og ikke mindst Christoffer Guldbrandsen selv. Men det glemte jeg altså i farten.
Side 1: Viser hvor mange der har svaret (61) og hvor mange som angav de så filmen (58).
Slide 2: Viser fordeling på partier (”Hvis der var folketingsvalg i morgen”): Socialdemokratiet, De radikale og SF er de store partier, og understreger dermed at surveyet ikke er repræsentativt - hvis nogen skulle være i tvivl.
Slide 3: Viser et korrelationsplot af spørgsmålet om et udvalg af nøglepersoner fremstod positivt i filmen (samt om filmen fortalte en god historie, samt om filmen forøgede sandsynligheden for at stemme på liberal alliance): Figuren viser at der er overoverdnet ikke er nogle tilfredsstillende korrelationspar. Hermed antydes at resondenterne har forhold sig partikulært til hver enkelt nøgleperson. Det spørgsmålspar der viser den højeste grad er sammenhæng er vurderingen af om filmen fortalte en god historie og sandsynligheden for at stemme på liberal alliance. Denne sammenhæng er negativ.
Slide 4: Viser gennemsnitslig vurdering af om nøglepersonerne fremstod positivt. Det ses tydeligt at respondenterne vurdere at filmen fortæller en god historie, og at Gitte Seeberg og Rasmus Jønsson fremstod positivt. Ulla Østergaard er filmens skurk.
Slide 5- 13 viser boxplots for svarfordelingen for vurdering af ovennævnte personer/variable, krydset med parti. Da næsten alle respondenter er Socialdemokrater, Radikale eller SF er der stor usikkerhed forbundet med de øvrige boxplot. I en rapport ville de aldrig blive medtaget. (når jeg får tid vil jeg lave et lille program som kun laver figurere som inkludere grupper med fx min. 10 respondenter).
Slide 14: Viser et plot af de forskellige “idoler” som respondenterne kunne rangordne. Det var muligt at rangordne 10 forskellige personligheder. På den baggrund kan en teknik kaldet “multi-dimensionel skalering” tegne et billede af hvor ens de forskellige personligheder bliver opfattet. I dette tilfælde er personerne tegnet ind i et to dimensionelt plot. Det vil sige at vi forsøger at beskrive hvorledes personerne adskiller fra hinanden ved hjælp af kun 2 variable. Analysen kan ikke sige hvilke dimensioner der findes - det kræver en humanistisk tolkning. Prøv at se hvordan du vil tolke dimensionerne.
180grader har en artikel om at “Hvert tredje bandemedlem i Danmark er udlænding”. Artiklen omhandler nogle få forbrydere som beviseligt har gjort sig skyldig i fx ulovlig våbenbesidelse. Artiklen rejser spørgsmålet om lovovertrædelser af denne type bør være tilstrækkeligt til at udvise ikke-danske statsborgere. Personligt mener jeg nej, fordi selv ikke-statsborgere har ret til et minimum af retsikkerhed og lighed for loven - uanset af de er medlemmer af rockerbander.
Hertil kommer at jeg frygter en tilfældig fortolkning (læs glidebane) af hvilke lovovertrædelser der er tilstrækkelig til en udvisning. Butikstyveri? at cykle uden lygter?
Anyways: Artiklens skarptvinklede overskrift fik mig til at undersøge om der statistisk kan findes en sammenhæng mellem voldsforbrydelser og andelen af af indvandrere fra 3. verdenslande. Den slags data er ikke nemme at finde på individniveau; men de kommunale nøgletal kan levere varen på kommunalt niveau.
Først3 undersøgte jeg de bivariate sammenhænge (plot), og siden lavede jeg en simpel mulitpel linær regressionsanalyse for de ovenfor nævnte variable.
De binære plots viser at andelen af indbyggere fra 3. verdenslande faktisk er større i kommuner hvor der anmeldes et stort antal voldsforbrydelser. Men denne sammenhæng forsvinder i den multiple analyse når der kontrolleres for andre variable. Faktisk er der kun een variabel som har signifikant betydning for niveauet af anmeldte voldsforbrydelser i kommunerne: nemlig det sociale indeks for kommune.
Andelen af indvandrere har IKKE betydning. Hvert fald ikke i 2006 som er det seneste år de nævnte nøgletal var opdaterede. UPDATE: Figur 2 nedenfor viser således sammenhængen mellem andelen af indvandrere og antallet af anmeldte voldsforbrydelser, bør før og efter effekten er korrigeret for kommunens sociale indeks.
Sammenhængen mellem vold og andel af indvandrere, før og efter kontrol for socioøkonomisk indeks.
Og jeg er selvfølgelig helt på det rene med at dette ikke er en udtømmende analyse. Det er blot en sjov lille øvelse.
Nøgletallet vedrører samtlige personer, der har opholdstilladelse i Danmark med statsborgerskab fra 3. lande, det vil sige lande udenfor EU, Norden og Nordamerika. Statsborgere fra 3. lande omfatter personer, der har opholdstilladelse i Danmark med flygtningestatus, med baggrund i familiesammenføring, studieophold, beskæftigelses- og erhvervsmæssige grunde og lignende. Nøgletallet omfatter ikke personer, der 1. januar havde opnået dansk statsborgerskab samt asylansøgere. kilde: http://noegletal.dk/nwInfo08A-022.html [↩]
Hvis du er interesseret har jeg lagt R script ud her [↩]
Kalenderen har været meget tæt presset, og det er længe siden wana er blevet opdateret. Forhåbentlig får jeg i juleferien tid til at opdatere lidt, mellem julehygge og alpine forhindringsløb.
Ledere der sender medarbejdere på kursus såvel som kursister vil næppe være helt overrakset over dette. I kursus verden er det hvertfald velkendt - og udnyttet - at en god middag kan løfte tilfredsheden markant. De fleste ledere og repræsentanter for lederorganisationer, er også meget bevidste om at kurser er honning ned af medarbejdernes forsmåede ryg - mere end egentlig kompetenceudvikling.
Hertil kommer at AKF artiklen ikke referere undersøgelsen i detaljer. Blot ved vi at læring måles som forskellen på en før/efter test, og at tilfredshed måles som - ja tilfredshed. Jeg kunne forestille mig at der måske var en sammenhæng mellem tilfredshed for fx den tredjedel som scorede lavest ved før-testen. Det er denne gruppe som ret beset har mest at lære og for hvem læring derfor forventes at være det egetlige formål med testen. På den anden side har de kursister som allerede forud for kurset ved en masse, måske andre formål - fx kollegial sparring, gratis middag etc.
Generelt er artiklen et godt eksempel på at man skal være sig meget bevidst hvad man måler. Men paradoksalt nok også at en kvantitativ tilgang ofte er rigtigt god til at vise sammenhænge, som intuitivt måske forekommer at være oplagt kvalitative (læring, tilfredshed). Artiklen mener jeg også illustrere hvorfor det er vigtigt at bruge statistiske test og robusthedsanalyser i formbindelse med medarbejdertilfredshedundersøgelser og interne klimamålinger. Ellers er der simpelthen for stor risiko for at tallene måler noget andet end man tror.
Hvad skal man tænke: Skal vi holde op med at måle tilfredshed? Næppe. Hvis der er tale om en stort kursusudbud som en virksomhed investerer store summer i bør evalueringen i stedet finde sted af to omgange, fx umiddelbart efter kurset og tre måneder efter kurset. I det første spørgeskema bør tilfredshed spørgsmålet primes1i retning af læring. Dvs først stilles to- tre forskellige spørgsmål om læring, og så stilles spørgsmål om tilfredshed. Desuden bør der stilles et spørgsmål om værdi af kurset, adspurgt er de færreste medarbejdere faktisk villige til at betale for kursusprisen. Efter tre måneder bør der spørges til konkrete situationer hvor kurset har været værdiskabende.
Ved mindre kurser med få deltagere bør man droppe den kvantitative opfølgning og istedet fokusere på spørgsmål fra den anerkendende evaluering: Hvad fungerede bedst, Hvad vil vi gerne have mere af, Hvad kunne man have mindre af etc.
Måske er der spændende inspiration i denne bog? Har du læst den - jeg har ikke.
Priming er meget vigtigt i spørgeskemaer - og bruges ofte til at manipulere med resultaterne. Et kendt eksempel drejer sig om tilfredshed med livet og frekvensen af dating. Hvis det første spørgsmål er, om man er glad for sit liv, og det næste spørgsmål er hvor ofte man dater, er der ingen sammenhæng mellem de to spørgsmål. Stilles spørgsmålene i omvendt rækkefølge, primes respondenterne til at tænke på dating først - og så relatere de efterfølgende til livskvalitet. I dette tilfælde skabes en stærk sammenhæng mellem frekvens af dating og tilfredshed med livet [↩]
FN’s klimapanel udkom idag med endnu en foruroligende rapport. I dag er der mere fokus end nogensinde på klimatopmøder, reduktion af co2 udledning, grønne regnskaber med mere. Lomborg holder stadig foredrag og skriver stadig bøger - men man fornemmer en større og større skepsis omkring hans arbejde. Hvilket er en skam… For der er behov for nogen der kigger skeptisk på klimapanelet og ‘grøn forskning’ i øvrigt.
Ethvert introduktionskursus i politologi bruger tid på strukturelle interessekonflikter, rationelle præferencer og virkningen af incitamentstrukturer. Derfor er der efterhånden altid en kritisk røst der spørger om lægerne altid har ret, når de siger: “send flere penge”. Som samfund tror vi der er andre løsninger på kriminalitet end politiet som siger: “send flere penge”. Det samme gælder pædagoger, lærere og videnskabsfolk generelt. Videnskaben er endda god til at kritiserer hinanden, hvilket DTU og Børsens seneste rangliste viser med al tydelighed.
Richard Lindzen fra MIT er naturvidenskabsmand af den gamle skole, skeptisk over for dokumentationen af klimaforandringer og tidligere medlem af FN’s klimapane. I denne artikel1 forsøger han at beksrive hvordan miljø-agendaen, har skabt nogle uheldige incitamentstrukturere for videnskabsfolk. Han viser ved hjælp af tidligere forskning, hvordan de usikkerheder der altid er i videnskab, systematisk er korrigeret i retning af et bestemt udsagn, og hvordan modellernes interne modsætninger er blevet bevist ignoreret med henblik på at få den næste bevilling hjem2
Mere generelt er Lindzen’s pointe, at store forskningsprogrammer, sjældent føre til stor videnskab. Ofte føre det derimod til forkert videnskab, fordi programmerne ikke tager fat i de mest spændende problemstillinger, men istedet kun berøre de felter som kan udløse en bevilling.
Derfor: Læs lomborg igen - og tro ikke ukritisk på alt hvad du læser.
Climate Science: Is it Currently Designed to Answer Questions? [↩]
Artiklen minder meget om samfundsvidenskab, og er som sådan vil en samfundsvidenskabelig skolet person, nok finde vise form-problemer. Og det er jo på sin vis rart nok… Der er stadig brug for os [↩]
Den indforstået tegneserie xkcd, bringer et lille perspektiv på livet efter d. 4/11 2008. Er du i tvivl om hvem Nate Silver, nævnt i tegneseriens hjælpetekst, er - så se denne tidligere post
Someday I'll be rich enough to hire Nate Silver to help make all my life decisions. 'Should I sleep with her?' 'Well, I'm showing a 35% chance it will end badly.'
Der er mange grunde til at man kan / bør overveje at bruge R til seriøst statistisk arbejde. For og imod er beskrevet til hudløshed forskelligesteder på nettet. Imidlertid anskueligegør en ny SPSS bog hvorfor open source - også inden for hard core statistik - er vejen frem:
Jeg har ikke læst bogen, og jeg forlod SPSS omkring version 12, så dette er på ingen måde en anmeldelse eller en evaluering af hverken bog eller SPSS. Men lur mig om ikke disse fejl kun havde fået lov til at stå urettet i et par dage, i open source R?
Marianne Borritz & Tage Søndergård Kristensen, begge fra NFA1, udviklede i 2004 tre forskellige mål for udbrændthed (personligt, arbejdsrelateret og såkaldt klient-relateret). De forskellige mål er udemærket valide jvf. NFA’s egen undersøgelse (pdf). Også i New Zeland har de tre skalaer vist sig at fungere godt:
The findings indicate that this burnout questionnaire is a valid instrument to use with New Zealand secondary teachers, and also highlight the potential impact of burnout on the health and wellbeing of teachers.
Skalerne, særligt den såkaldt klient-relaterede, er udviklet til brug blandt de varme hænder på arbejdsmarkedet. Men måske er en eller alle tre skaler også interessant for dig? Det kan du nemt finde ud af, for jeg har overført spørgeskemaet til et websurvey.
Skriv meget gerne ideer til at gøre skemaet mere brugervenligt i kommentar feltet nedenfor. Det er planenen at udrulle en række forskellige spørgeskemaer over den næste tid, og alle input vil blive modtaget med kyshånd. Specifikt finder jeg det oplagt at arbejde med fx “arbejds-relateret udbrændthed” i forbindelse med en APV eller anden trivselsundersøgelse.