Super Crunchers af Ian Ayres - Boganmeldelse
Posted in: Bøger
Super Crunchers: How Anything Can be Predicted
samlede jeg op i lufthavnen i forrige måned. Der er tale om en let læst og vel argumenteret forfægtelse af statitistisk metode. Uheldigvis afsløres bogens egentlige motivation først til sidst i bogen nemlig
behovet for at indprente lægmand en grundlæggende statistisk forståelse (min oversættelse)
endda på en sådan måde at fordomme om at kvantitativ metode som ondskabens ‘højreorienteret’ træl (”tænk på: løgn, forbandet løgn og statistik”) gøres til skamme:
Man kan knuse tal og stadig have en passioneret og omsorgsfuld sjæl. Man kan være kreativ (min oversættelse).
Jeg vil dog tro at folk der tænder på titlen og særligt undertitlen “How anything can be predicted” er overbevidst før titelbladet vendes. Hvilket er en skam. For “Super Crunchers” er en overbevisende bog der på indholdssiden klart har potentiale til at skabe interesse for statistisk metode i selv meget kvalitativt orienterede kredse.
På formidlingssiden er forfatterens prosa tydeligt mærket af passion for data generelt og datamining i særdeleshed. I den forstand er sproget måske ikke egnet til at overbevise/omvende de skeptiske. På den anden side har Ian Ayres som forfatteren hedder også en omsorgsfuld sjæl. Indeholdt er hvertfald søde bemærkninger om kollegaer, et enkelt lille hævntogt1, betragtninger om sin datter, om hvordan statistik skyder ekspertvældet ned og lader lægmand ser kejserens sande klæder, hjælper arbejdsløse med at få arbejde, narkomaner med at forblive ‘clean’, singler med at finde kærligheden og gravide med at vurdere risikoen for at få handikappade børn. Det er således ærværdige sager som Ayres forfølger.
Der er kun to figurer i bogen (begge af normalfordelingskurver) og ingen ligninger. Der er altså tale om en deskriptiv bog med en masse gode eksempler på super-crunching. Det er ikke en lærerbog eller en introduktion til de teknisk orienteredet2. Der er tre storer temaer:
For det første viser Ayres at vores liv idag leves digitalt. Næsten ingen ting er længere privat. Det betyder at dataminingindustrien3 (oh yes - den findes i allerhøjestegrad, fx Acxiom og danske Geomatic) er bedre til at forudsige om du bliver skilt i det næste år, end du selv er. På den baggrund skrædersyes tilbud og produkter til lige præcis dit kundesegment4 hvilket kan være en fordel for forbrugeren, men med det aberdabei at virksomheder vha. af statistik i dag kan prisdiskrimere og altså tilbyde forskellige kunder det samme produkt til forskellige priser. Som Ayres skriver er der grund til bekymring hvis man modtager noget gratis fra sin leverandør af dette eller hint. Det betyder nemlig at man betaler for meget for sine vare. Mens virksomheder kan kværne store datasæt har den almindelige forbruger jo ikke råd til den slags, hvilket altså umiddelbart stiller menigmand relativt svagere vis a vis erhvervslivet. Heldigvis stiller dataminingfirmaer sig også i forbrugernes tjeneste og hjælper de forbrugere der gider (hvilket jo langt fra er alle) med at finde de bedste tilbud. Farecast.com kværner eksempelvis data for forbrugere og hjælper os med at forudsige om flypriserne vil falde eller stige i fremtiden. De er endda så sikre at de (for nogle afgange) tilbyde at forsikrer deres forudsigelser for 10$. Stiger prisen mod forventning refundere farecast beløbbet. Så datamining er altså slet ikke kun dårligt.
Ayres foreslår i øvrigt at man lovgivningsmæssigt kan tvinge virksomheder til at offentligegøre data - eller som han siger “educate consumers about themselves”. Særligt interessant er overvejelsen om ikke kære told∘skat offensivt kunne bruge sine mange oplysninger om borgeren som en service, der fortalte om man som virksomhed bruger for mange penge på reklame, giver mindre end gennemsnittet til godgørende formål, har et fornuftigt afkast på sine investeringer og så videre.
Det andet tema i bogen er brugen af simpel eksperimentel metode. Det er tankevækkende at eksperimentel metode med randomiseret forsøg i nogle sammenhænge beskrives som rabiat, mens Ayres langt hen ad vejen lykkedes at fremstille det som noget af det mest simple og mest overbevisende (og jeg er helt klart enig med Ayres). Eksempler dækker hvordan hospitaler reddede 100.000 menneskeliv, fattige hjælpes i mexico, kriminalitet sænkes i amerikanskebyer og hvorvidt fængselsstraffe forhærdiger de kriminelle og meget andet.
Det tredje tema - som afslutter bogen - drejer sig om mere basal statistik: Reglen om næsten alle gennemsnit er normaltfordelt og at 95% vil ligge inde for +/- to standardafvigelser, og brugen af bayesteorem til at opdatere sandsynligheder (Ayres bruger det samme eksempel som jeg beskrev fornylig). Der argumenteres for at intuition sagtens kan være statistisk intuition og de statistik kan bruges til at undersøge og opdatere sine fingerspidsfornemmelser.
Jeg var - som jeg formoder de fleste andre der finder titlen interessant - solgt i forvejen. Det var paradoksalt nok derfor jeg købte bogen: For at blive endnu mere overbevidst. Og her, i mit eget lille mikro univers, ligger forfatterens akilleshæl. For bogens titel blev tilsyneladende fundet ved hjælp af eksperimentel metode: Et par google annoncer blev lanceret på internettet med forskellige bud på hvilken titel bogen skulle have. SuperChrunchers vandt klart - dvs. supercrhunchers reklamen genererede langt flere klik end de øvrige titler. Mit gæt er som nævnt, at de folk der finder bogens titel incitterende allerede i forvejen er gejlet af tal… Men folk der kender til simple statistik, den digitale web2.0. mining virkelighed og bare har hørt om bayes vil ikke få meget nyt med sig.
På den måde er bogen uforvarende et eksempel på at eksperimentel metode ikke kan stå allene. Der er således en modsigelse mellem bogens formål (at omvende og overbevise) og bogens salgstaktik (at henvende sig til de allerede overbevidste). Den gode titel skal således være i overensstemmelse med bogens indhold. Og det kunne statistik ikke hjælpe med5 .
Køb bogen - enten fordi du gerne vil have en masse eksempler du kan bruge til at overbevise ikke tal-venlige folk (giv den i gave)6, eller fordi du selv ønsker at få en nem og letlæst introduktion til hvorledes statistik kan anvendes.
- Det er John Lott Ayres er ude efter - og noteapperatet antyder at Ayres og med-hævner Steven Levitt har fat i den lange ende [↩]
- til gengæld er noterne meget værdifulde og detaljerede med gode “further readings” forslag [↩]
- eller såkaldt CDI - “consumer data integration [↩]
- som for Acxioms vedkommende består af mere end 70 forskellige livsstile. Man er altså kommet langt siden Henrik Dahls minervamodels fire segmenter [↩]
- Dog: Supercrunchers indeholder faktisk omtale af Atai Winkler som har haft relativt stort held med at forudsige hvilken bog på New York Times bestseller liste som ville få førstepladsen, allene på baggrund af analyse af titlen - man kan endda selv prøve sin egen titel her [↩]
- noteapperattet er dog også værd at læse for de indviede [↩]
Return to: Super Crunchers af Ian Ayres - Boganmeldelse
Social Web