Netflix - en lektie i samarbejde og innovation

Takeaway: Innovation sker når nye folk inddrages og udfordre ‘de gamle’ med nye metoder. Innovation er ikke betinget af at medarbejderne sidder lårerne af hinanden i et storrumskontor.

Så er Netflix konkurrencen slut. To lige gode hold var med i slutløbet og afleverede lige gode resultater. Men der er kun plads til et hold på toppen af skamlen. Så prisen og førstepræmien gik til det hold som efter 3 år’s konkurrence var ti minutter hurtigere end konkurrencens nr. 2. 10 minutter som betød 1 mio. us$.

Hvad er Netflix? Nefflix er en online videofilm udlejler, der ligesom alle andre online sites forsøger at udnytte det store potentiale i at kende deres kunder bedre end kunderne kender sig selv. Amazon er måske bedst kendt for at gøre deres kunder opmærksom på interessante bøger - baseret på tidligere købsmønstre. Netflix gør det samme -blot for film.

Kort fortalt gik konkurrencen ud på at forbedre Netflix’ egen metode til at forudsige brugernes vurdering af film med mindst 10%. Til syneladende en svær opgave. Imidlertid ved jeg intet om maskinlæring, så præcis hvor svær opgaven var, skal jeg ikke kunne sige.

Men jeg finder det interessant at de fleste deltager i konkurrencens sidste fase, alle var sammensmeltede hold, med deltagere fra forskellige discipliner og verdensdele. Og jeg finder det interessant at vinderholdet selv fusionerede og bragte nye folk på banen:

“When we were approaching the first progress prize as the BellKor team, there were several other teams that joined together to make a real run at us, and that was surprising to us,” said Netflix Prize-winner Chris Volinsky, originally of team BellKor. “The success of that collaboration told us that this was a real, powerful way to improve our scores. When you’re banging heads together in an office trying to come up with new ideas, you sometimes run out of ideas, and you need to bring new people into the team, and that turned out to have a great benefit in terms of the predictive power of the models.”

Som sådan forekommer Netflix konkurrencen at være en god case for frugten af tværfagligt samarbejde. Samtidig med at det måske er en pointe at vinderholdet først har mødt hinanden fysisk efter konkurrencen. De har således ikke haft mulighed for at skændes om faglige uenige på kontoret - men allene bidraget hvor de kunne hjemme fra hver deres verdensdel.
Anyways: Tillykke til BellKor’s Pragmatic Chaos.

Kilde: Wired

Update: Her er kortfattet beskrevet hvordan filmratings bliver forudset.

Spørgeskema resultater

På bl.a. Harvard har bl.a. Gary King - som altid er værd at holde øje med - forsket en del i spørgeskemakonstruktion. King har bl.a. undersøgt hvordan vignetter kan bruges til at validerer rspondenters svar vedrørende vanskelige vurderingsspørgsmål. Herhjemme har Henning Olsen blandt vist hvordan spørgsmålsformulering har markant indflydelse på de svar som indsamles. Nu viser det sig at denne indsigt også er opdaget i England:

youtube: Yes minister og spørgeskemaer

Det går op og ned

Wulff-Morganthaler fra 8/6 2009 observerer:

Det minder jo lidt om denne video fra 2007 - som antydede at der snart ville ske noget drastisk.

Hvilket igen så får mig til at tænke på random walks - som nogle gange ligner alt andet end random.

Google viser aktuelle biograftider

Det er første gang jeg ser denne funktion i den dansk sammenhæng. Og jeg bruger endda google.com - så hurra for IP identifikation. Avancerede søgeresultater baseret på kendskab til brugeren er fremtiden. Og google bliver måske snart presset af microsofts bing.com

Det ser ud til google bruger kultunaut.dk

Det ser ud til google bruger kultunaut.dk

Google charts + R + udviklingstal.dk

Det er nemt at få lidt mere kød på danidas udviklingstal. Hvis man fx gerne vil have et fint lille kort over befolkningstæthed i EU landene (basseret på disse data), kan man fx bruge R og Andy Eggers smarte googlemap funktion. Det kunne fx give sådan et billede:

Data fra 2006, Malta eksklusive, Kilde: http://udviklingstal.dk/eu0.htm

Data fra 2006, Malta eksklusive, Kilde: http://udviklingstal.dk/eu0.htm

Nedenfor kode til R

 Læs videre →

Danmarks CO2 udslip

Det er ikke nogen nyhed - men når nu udviklingstal.dk lægger rigets CO2 udslip ud til offentlig skue - ja så kan vi lige så godt kigge på det. Og det går vist ikke så godt

Kilde: www.dst.dk 5/2009. Udarbejdet for Danida af Geografforlaget/ Karsten Duus.

Kilde: Udviklingstal.dk - egen tilvirkning.

Se fx også: http://www.altinget.dk/artikel.aspx?id=94408

Test om du er lykkelig

De sidst knap tyve år er interessen for positiv psykologi eksploderet. Flere forskere har udviklet og valideret forskellige skalaer der måler forskellige elementer af “subjektiv lykke” og “psykologisk velbefindende”. Det er interessant at der dermed er begyndt at komme videnskabeligt belæg for lykkestrategier.

Det er et interessant emne, og der er meget at sige om de forskellige grene inden for denne tradition. Foreløbig vil jeg opfordrer dig til at tage denne lille test, som kan give dig en fornemmelse af dit eget lykke niveau. Når testen er blevet taget et ca. 150 gange vil jeg vende tilbage med lidt causeren over resultaterne - og sætte dem ind i en større sammenhæng.

Testen giver dig en umiddelbar indikation af hvor lykkelig du er i forhold til gennemsnittet. Det tager mindre end fem minutter.

Endnu bedre hop-plot

Med hjælp fra den kære R mail-liste har jeg opdateret hop-plottet (bumps chart) fra min tidligere post:

Den nye figur bruger linjetykkelse til at angive hvor stor forandringen har været i perioden. Røde streger angiver at andelen er faldet, mens blå streger angiver at andelen er steget. Denne figur syntes jeg er meget nemt at få et overblik over.

Som det ses er der kun en enkelt blå linje. Tallene bag denne figur er tilfældigt generert, hvilket skaber et mere kaotisk billede. Men igen giver farvemarkering og linjetykkelse overblik. Den sort streg angiver at der ikke har været nogen ændring.

Det er ren lagkage

De fleste vil vide at jeg ikke bryder mig om lagkagediagrammer, piecharts og tærtegrafer etc. (hadet barn har mange øgenavne). Men for alle de stakler der ikke kender mig, bringer wana.dk nu en lille illustration af hvorfor lagkagegrafer er så dårlige.

Nedenstående, og mange lignende, faldt jeg i dag. Læg mærke til at det grønne, gule og grå stykke lagkage næsten har samme størrelse. Sådan ser det hvertfald ud. Læs procentsatserne…

Det er nærmest umuligt a se i lagkage diagrammet at det grønne stykke er 50 % større end det gule!

Og sammenlign så med et helt almindelig søjlediagram.

Jeg kan ikke lade være med at tænke på en hvis ingeniørs oplevelse:

God tærteløs weekend :-)

Forskelle i mentalitet

Danmark:

– De offentlige forskningsbevillinger vil næste år udgøre 0,94 procent af Danmarks bruttonationalprodukt, siger videnskabsminister Helge Sander i en kommentar til offentliggørelsen af regeringens forslag til finanslov for 2009.

– Budgettet for 2010 viser, at vi året efter opfylder regeringens målsætning om at anvende én procent til forskning og udvikling. De mange ekstra penge til forskning og udvikling er en vigtig og nødvendig investering i Danmarks fremtid, siger Helge Sander.

USA:

I believe it is not in our American character to follow – but to lead. And it is time for us to lead once again. I am here today to set this goal: we will devote more than three percent of our GDP to research and development. We will not just meet, but we will exceed the level achieved at the height of the Space Race, through policies that invest in basic and applied research, create new incentives for private innovation, promote breakthroughs in energy and medicine, and improve education in math and science. This represents the largest commitment to scientific research and innovation in American history.

p.s. Det er selvfølgelig ikke ligegyldigt at Obama’s tale er fra april 2009 og Sanders pressemeddelelse er fra august 2008. Det bliver næppe heller i 2010 at USA kommer til at bruge 3 % af bnp på forskning - men allerede nu er niveauet oppe på 2,6 % (jvf. reuters).