R
Fra Harald Grovens wiki
Nyttige R-kommandoer
Dette er min notatblokk underveis mens jeg finner ut av R. Neppe nyttig for andre enn meg selv, men kan bli utgangspunkt for kursing engang.
# laste inn fil navdata <- read.csv("~/Downloads/NAV arbeidsmarkedsstatistikk.csv") # liste opp hele datasettet navdata # liste opp en kolonne navdata["aa_reg2008"] # vise navn på kolonner names(navdata) # liste opp fire kolonner fra datasettet # SQL: SELECT code_styrk, label_styrk, s_troms, tm_troms FROM ... navdata[c("code_styrk", "label_styrk", "s_troms", "tm_troms")] # Liste opp ti første rader # SQL: LIMIT 10 # please note the argument before the comma (in the square brackets) refers to the rows, while an argument after the comma refers to columns. navdata[1:10, c("code_styrk", "label_styrk", "s_troms", "tm_troms")] # SELECT code_styrk, label_styrk, s_troms, tm_troms FROM navdata LIMIT 10 navdata[1:10,c("code_styrk", "label_styrk", "s_troms", "tm_troms")] # sortere etter etter hyppigste i kolonna tm_troms # SELECT code_styrk, label_styrk, s_troms, tm_troms FROM navdata ORDER BY tm_troms DESC navdata[order(-navdata$tm_troms), (c("code_styrk", "label_styrk", "s_troms", "tm_troms"))]
[rediger] Reshape-pakken
Reshape aggregerer og konverterer mellom matriseoppsett Dokumentasjon av pakken http://www.jstatsoft.org/v21/i12/paper
# installere pakke install.packages("reshape2") library("reshape2") # hente datasett fra Mysql-base SELECT styrk_code7, styrk_label_orig, nus_code, nus_label_orig, ant FROM ssb.yrke_utdanning WHERE styrk_label_orig <> "" AND nus_label_orig <> "" ORDER BY nus_label_orig ASC, styrk_label_orig ASC install.packages("RMySQL") library(RMySQL) con <- dbConnect(MySQL(), user="r", password="", host="127.0.0.1", client.flag=CLIENT_MULTI_RESULTS) sql <- "SELECT styrk_code7, styrk_label_orig AS yrke, nus_code, nus_label6_orig AS nus, antall_personer AS antall FROM ssb.yrke_utdanning WHERE styrk_label_orig <> '' AND nus_label6_orig <> '' ORDER BY nus_label6_orig ASC, styrk_label_orig ASC" rows <- dbGetQuery(con, sql) # se på importerte data View(rows) # TODO sørge for visning av norske tegn ÆØÅ # lage vektor med bare koder og en variabel: utdanning_yrke <- rows[c("styrk_code7", "nus_code", "antall")] # samme som over, men med variabelnavn også utdanning_yrke <- rows[c("styrk_code7", "yrke", "nus_code", "nus", "antall")] # "smelte" med reshape-pakken utdanning_yrke_melted <- melt(utdanning_yrke, id = c("styrk_code7","nus_code"), measured = c("antall")) View(utdanning_yrke_melted) # Gjør om rader til kolonner. Delilig! # reshape2 må du velge mellom å lage en 2D-ramme (dcast) eller et N-dimensjonalt array/matrise (acast) utdanning_yrke_recast <- dcast(utdanning_yrke_melted, nus_code ~ styrk_code7) View(utdanning_yrke_recast)
[rediger] Hjelp-funksjoner
> help(package="packagename") > RSiteSearch("key phrase") > # liste opp innlasta moduler > library() > # tilleggsinfo om innlasta moduler > installed.packages()
[rediger] Enkel kalkulator
> sqrt(2)

