# Først skal data renses. Jeg bruger Open Office calc til at åbne og gøre den downloadede csv fil klar til R # Filen gemmes i mit working directory som "2006_vold.csv" d <- read.csv2("2006_vold.csv") # fordi danmark bruger komma "," istedet for punktum "." kan vi ikke bruge den almindelige csv funktion i R. Istedet bruger vi csv2 :-) library(psych) # skal bruges til at lave pairs. panels() - Hvis ikke pakken er installeret skal du gøre det først. pairs.panels(d[,4:9]) # Inspicere datasæt første gang. Det ser ud til at en log transformation af grundværdier kan betale sig loggrundv <- log(d$grundv) d$loggrundv <- loggrundv # tilføjer de nye data til d pairs.panels(d[,4:10]) # inspicere anden gang- det ser lidt bedre ud, men loggrundværdier vil næppe fungere attach(d) # tilføjer d til hukommelsen model <- lm(vold~by_befolkn+alm_bolig+udl_3+socio_indx+loggrundv) # definere den linære model summary(model) # socioindex er det eneste signifikante. Går nu igang med at fjerne led # viser ikke her de forskellige modeller # Kun socioindx er signifikant model <- lm(vold~socio_indx) # Den endelige model summary(model) # r2=.22 og p=0.000 png("vold_plot.png") # Opretter et png device der gemmes med navnet vold_plot.png plot(vold~socio_indx, xlab="Socialt indeks for kommunen", ylab="Antal politianmeldte voldsforbrydelser") abline(model) p.værdi <- paste("p = ",signif(summary(model)$coef[2,4],2),sep="") # henter p værdien fra summary$coef anden række og 4 kolonne text(min(socio_indx),max(vold),labels=p.værdi,adj=0) # så værdien kan printes direkte i grafen r2.værdi <- paste("R2 = ",signif(summary(model)$r.squared,3)) # Noget lignende for r2 text(min(socio_indx),max(vold)-0.2,labels=r2.værdi,adj=0) dev.off() # Det første plot er nu gemt som png png("panel.png") # oprette et andet plot viser blot de binære sammenhænge som vi undersøge først pairs.panels(d[,4:10]) dev.off() # Det andet plot er nu gemt.