R

Fra Harald Grovens wiki

Gå til: navigasjon, søk

Nyttige R-kommandoer

Dette er min notatblokk underveis mens jeg finner ut av R. Neppe nyttig for andre enn meg selv, men kan bli utgangspunkt for kursing engang.

# laste inn fil 
navdata <- read.csv("~/Downloads/NAV arbeidsmarkedsstatistikk.csv")
 
# liste opp hele datasettet 
navdata
 
# liste opp en kolonne 
navdata["aa_reg2008"]
 
# vise navn på kolonner 
names(navdata)
 
# liste opp fire kolonner fra datasettet 
# SQL: SELECT code_styrk, label_styrk, s_troms, tm_troms FROM ... 
navdata[c("code_styrk", "label_styrk", "s_troms", "tm_troms")]
 
# Liste opp ti første rader
# SQL: LIMIT 10
# please note the argument before the comma (in the square brackets) refers to the rows, while an argument after the comma refers to columns. 
navdata[1:10, c("code_styrk", "label_styrk", "s_troms", "tm_troms")] 
 
# SELECT code_styrk, label_styrk, s_troms, tm_troms FROM navdata LIMIT 10 
navdata[1:10,c("code_styrk", "label_styrk", "s_troms", "tm_troms")]
 
 
# sortere etter etter hyppigste i kolonna tm_troms
# SELECT code_styrk, label_styrk, s_troms, tm_troms FROM navdata ORDER BY tm_troms DESC 
navdata[order(-navdata$tm_troms), (c("code_styrk", "label_styrk", "s_troms", "tm_troms"))]

[rediger] Reshape-pakken

Reshape aggregerer og konverterer mellom matriseoppsett Dokumentasjon av pakken http://www.jstatsoft.org/v21/i12/paper

# installere pakke 
install.packages("reshape2")
library("reshape2")
 
# hente datasett fra Mysql-base 
SELECT styrk_code7, styrk_label_orig, nus_code, nus_label_orig, ant FROM ssb.yrke_utdanning WHERE styrk_label_orig <> "" AND nus_label_orig <> "" ORDER BY nus_label_orig ASC, styrk_label_orig ASC
 
install.packages("RMySQL")
library(RMySQL) 
con <- dbConnect(MySQL(), user="r", password="", host="127.0.0.1", client.flag=CLIENT_MULTI_RESULTS) 
sql <- "SELECT styrk_code7, styrk_label_orig AS yrke, nus_code, nus_label6_orig AS nus, antall_personer AS antall
FROM ssb.yrke_utdanning WHERE styrk_label_orig <> '' AND nus_label6_orig <> '' 
ORDER BY nus_label6_orig ASC, styrk_label_orig ASC" 
rows <- dbGetQuery(con, sql)
 
# se på importerte data 
View(rows)
 
# TODO sørge for visning av norske tegn ÆØÅ
 
# lage vektor med bare koder og en variabel: 
utdanning_yrke <- rows[c("styrk_code7", "nus_code", "antall")]
# samme som over, men med variabelnavn også 
utdanning_yrke <- rows[c("styrk_code7", "yrke", "nus_code", "nus", "antall")]
 
 
# "smelte" med reshape-pakken 
utdanning_yrke_melted <- melt(utdanning_yrke, id = c("styrk_code7","nus_code"), measured = c("antall"))
View(utdanning_yrke_melted)
 
# Gjør om rader til kolonner. Delilig! 
# reshape2 må du velge mellom å lage en 2D-ramme (dcast) eller et N-dimensjonalt array/matrise (acast) 
utdanning_yrke_recast <- dcast(utdanning_yrke_melted, nus_code ~ styrk_code7)
View(utdanning_yrke_recast)

[rediger] Hjelp-funksjoner

> help(package="packagename")
> RSiteSearch("key phrase")
 
> # liste opp innlasta moduler 
> library()
> # tilleggsinfo om innlasta moduler 
> installed.packages()

[rediger] Enkel kalkulator

> sqrt(2)
Hentet fra «http://www.groven.no/harald/R»