Materiały przygotowane przez dr Jakuba Nowosada
Książki online
Strony internetowe
Inne
Zawsze rozpocznij pracę od ustawienia ścieżki do folder roboczego.
#ustawienie ścieżki do katalogu roboczego
setwd("/home/anna/DYDAKTYKA/STATYSTYKA/MATERIALY_CWICZENIA/cwiczenie_1")
#sprawdzanie ścieżki do katalogu
getwd()
#Otwieranie danych z pliku csv
<- read.csv('dane/dane.csv')
dane
#otwieranie danych z pliku txt - wymaga określenia separatora
<- read.table('dane/dane.txt', sep = " ") dane2
Dane w pliku dostępnym tylko w R
<- readRDS("dane/dane.rds") austrialia
Otwieranie środowiska pracy (przydatne, gdy chcemy wczytać kilka obiektów do R)
load("dane/cw1.rda")
data("gapminder", package = "gapminder")
str(gapminder)
#wyświetlanie początkowych wierszy, argument n definiuje ile wierszy ma być wyświetlonych (domyślnie 5)
head(gapminder)
head(gapminder, n = 2)
#wyświetlanie n ostatnich wierszy, argument n definiuje ile wierszy ma być wyświetlonych (domyślnie 5)
tail(gapminder)
#wyświetlanie nazw zmiennych, nazw kolumn oraz nazw wierszy
names(gapminder)
colnames(gapminder)
rownames(gapminder)
#liczba kolumn
ncol(gapminder)
#liczba wierszy
nrow(gapminder)
#wyświetlanie unikalnych wartości
unique(gapminder$continent)
#typ/klasa zmiennej
class(gapminder$continent)
#Liczność poszczególnych kategorii
table(gapminder$continent)
#Podstawowe statystyki zbioru danych
summary(gapminder)
#Podstawowe statystyki zmiennej lifeExp (oczekiwana długość życia)
summary(gapminder$lifeExp)
Uwaga! W ten sposób zaznaczane będą w tekście zadania do wykonania odnoszące się do omówionego powyżej fragmentu materiału.
Wyświetl 4 ostatnie wiersze zbioru danych
dane
.
Używając zbioru danych
dane
, wyświetl unikalne wartości dla kolumnycountry
Wyświetl podstawowe statystyki zbioru danych
dane
.
1,]
gapminder[1] gapminder[,
$year == 1952, ]
gapminder[gapminder$year == 1952 & gapminder$continent == 'Asia',]
gapminder[gapminder$year == 1952, c(5)]
gapminder[gapminder$pop > 10000000, ] gapminder[gapminder
subset()
<- subset(gapminder, continent == "Europe" & year == 1952, select = c(country, pop))
dane_sel <- subset(gapminder, continent == "Europe" & year == 1952, select = c(country:pop)) dane_selection
Ze zbioru danych
dane
wybierz dane dla państwa Australia.
W jakich latach w Australii długość trwania życia wynosiła powyżej 75 lat?
<- gapminder[gapminder$year == 1952, ] dane1952
$pop_mln <- gapminder$pop / 1000000
gapminderhead(gapminder, 3)
<- gapminder[order(gapminder$year), ]
dane_2
#sortowanie względemm dwóch zmiennych
<- gapminder[order(gapminder$continent, gapminder$country), ]
dane_2 head(dane_2)
#sortowanie według kraju (rosnąco) oraz roku (malejąco)
<- gapminder[order(gapminder$country, -gapminder$year),]
dane_2 head(dane_2)
Ze zbioru danych
dane
wyselekcjonować dane dla Nowej Zelandii (New Zealand) oraz posortować je według długości trwania życia (od największej do najmniejszej)
W którym roku liczba ludności Nowej Zelandii przekroczyła 3 miliony?
Plik tekstowy może być otworzony w dowolnym oprogramowaniu
write.csv(australia, "out/australia.csv")
Pojedyńczy obiekt
saveRDS(dane, "out/dane.rds")
Zapisywanie wybranych obiektów ze środowiska pracy R
save(dane, australia, file = "out/cw1a.rda")
Zapisywanie wszystkich obiektów znajdujących się w środowisku pracy R
save.image("out/cw1b.RData")
?nazwaFunkcjihelp(nazwaFunkcji)
example(nazwaFunkcji)
args(nazwaFunkcji)
kod umieszczamy w oknie edytora RStudio
wykonanie kodu (Ctrl + Enter) - wykonanie kodu oznacza przeniesienie kodu do konsoli.
poszczególne linie kodu muszą być skomentowane (opisany sposób działania kodu). Komentarz poprzedzamy znakiem #.
każdy operator matematyczny powinien mieć spację z obu stron
cudzysłowia nie potrzebują spacji
należy starać się, aby linie kodu nie przekraczały 80 znaków
przydatne skróty klawiaturowe:
Podstawowe informacje: https://rmarkdown.rstudio.com/lesson-8.html
RStudio: Help - Cheatsheets - RMarkdown Reference Guide
R Notebooks: https://rmarkdown.rstudio.com/lesson-10.html
Otwórz nowy dokument R Notebook (File - New File - R Notebook). Nazwij dokument - Raport1 i zapisz dokument w swoim folderze roboczym. Uwaga! Folder roboczy automatycznie zostanie utworzony w miejscu, w którym zapisano dokument RNotebook.
Dodaj tytuł, imię i nazwisko (uzupełnij zmienne title oraz author).
Wstaw nowy blok kodu, który wczyta dane z pliku dane.csv.
Dodaj opis objaśniający co robi dany fragment kodu.
Wygenreuj raport (opcja Knit)
Utwórz nowy dokument RNotebook i zapisz go jako cw1_zad2_nazwisko. Dokument ma zawierać rozwiązanie poniższego zadania.
Wczytaj dane gapminder
znajdujące się w pakiecie gapminder()
.