Dane przestrzenne w R. Eksploracyjna analiza danych
Zadanie samodzielne
Jako rozwiązanie poniższych zadań należy przedstawić:
- plik .qmd zawierający kod z rozwiązaniem zadań
- plik html zawierający rozwiązanie zadań wraz z mapami, wykresami, rycinami.
- utworzone geopaczki
- utworzone pliki png zawierające mapy.
Zadanie 1: Dane przestrzenne w R
Dane
miasta_xy.csv
zawiera współrzędne x, y, identyfikator oraz nazwy miast na prawach powiatu.miasta_pop.csv
zawiera informacje o liczbie ludności w miastach na prawach powiatu.
Zadanie
Wczytaj dane z pliku
miasta_xy.csv
i przetwórz je do postaci obiektu przestrzennegomiasta_sf
. Wybierz PUWG 1992 (EPSG: 2180).Plik
miasta_pop.csv
zawiera kod miasta powiatowego oraz informacje o liczbie ludności w latach 1995 - 2023. Stwórz obiektmiasta_sf_pop
poprzez dołączenie informacji z plikumiasta_pop.csv
do obiektu przestrzennegomiasta_sf
.Zapisz obiekt
miasta_sf_pop
do formatu ESRI Shapefile oraz do formatu GeoPackage (geopaczkę nazwijmiasta_powiatowe.gpkg
, a zapisywaną warstwęmiasta_pop
).Utwórz obiekt zawierający obwiednię (bounding box) na podstawie danych w obiekcie
miasta_sf
. Zapisz obwiednię w utworzonej wcześniej geopaczcemiasta_powiatowe.gpkg
, nazwij warstwęmiasta_bb
.Z pliku
wojewodztwa.gpkg
wczytaj warstwę zawierającą granice województw (utwórz obiektwojewodztwa
). Przejrzyj ten obiekt. Jaki typ geometrii on przechowuje? Ile obiektów on zawiera? Ile ma on atrybutów (zmiennych)? Jaki ma on układ współrzędnych?Wybierz z warstwy województwo wielkopolskie (TERYT = 30) i zapisz je do obiektu
wlkp
.Wyselekcjonuj wszystkie miasta powiatowe położone w województwie wielkopolskim i przypisz je do obiektu
miasta_wlkp
. Zapisz obiekt w utworzonej wcześniej geopaczcemiasta_powiatowe.gpkg
, nazwij warstwęmiasta_wlkp
.Używając pakietu
tmap
zwizualizuj liczbę ludności w 2023 roku w miastach powiatowych. Do wizualizacji zmiennej określającej liczbę ludności użyj koloru. Uwzględnij na mapie także granice województw. Mapę zapisz do pliku w formacie png.Używając pakietu
tmap
zwizualizuj liczbę ludności w 1995 roku w miastach powiatowych. Do wizualizacji zmiennej określającej liczbę ludności użyj wielkości symbolu. Uwzględnij na mapie także granice województw. Mapę zapisz do pliku w formacie png.
Zadanie 2: Eksploracyjna analiza danych
Dane
W ćwiczeniu zostaną wykorzystane dane dotyczące stopy bezrobocia w powiatach w Polsce w 2023 roku. Dane zostały pobrane Z Banku Danych Lokalnych.
- Plik
bezrobocie_pl.csv
zawiera identyfikator powiatu, nazwę powiatu oraz dane dotyczące stopy bezrobocia dla lat 2004, 2010, 2021, 2023 (odpowiednio SB2004, SB2010, SB2021, SB2023). - Plik
powiaty_klasyfikacje.csv
zawiera informacje o przynależności powiatów do regionów NUTS3, makroregionów wg klasyfikacji NUTS1 oraz typologi miejsko-wiejskiej. W przypadku typologii miejsko-wiejskiej kod 1 to regiony regiony przeważająco miejskie (80% ludności mieszka w klastrach miejskich), 2 oznacza regiony pośrednie (od 50 % do 80 % ludności mieszka w „klastrach miejskich”), a 3 oznacza regiony przeważająco wiejskie (co najmniej 50 % ludności mieszka w „komórkach siatki obszarów wiejskich”). - Plik
powiaty_pl.gpkg
zawiera granice powiatów w Polsce. - Plik
wojewodztwa.gpkg
zawiera granice województw.
Przygotowanie danych
- Utworzyć obiekt
bezrobocie
na podstawie plikubezrobocie_pl.csv
- Utwórz obiekt
klasyfikacje
na podstawie plikupowiaty_klasyfikacje.csv
. Zmodyfikuj pole TERYT poprzez dodanie ‘000’ na końcu. - Utwórz obiekt
powiaty_attr
poprzez połączenie informacji znajdujących się w obiektachbezrobocie
orazklasyfikacje
. - Utworzyć obiekt
powiaty_granica
na podstawie plikupowiaty_pl.gpkg
. - Utworzyć obiekt
woj_granica
na podstawie plikuwojewodztwa.gpkg
. - Utwórz obiekt
powiaty
poprzez dołączenie danych z obiektupowiaty_attr
do obiektupowiaty_granica
. - Zapisz obiekt
powiaty
do geopaczkipowiaty_attr.gpkg
Eksploracyjna nieprzestrzenna analiza danych
Przygotuj raport składający się z uzyksanych wykresów, map oraz krótkiego (pół strony) opisu oraz podsumowania wyników. Raport zapisz w pliku bezrobocie_eksploracja.html
Oblicz podstawowe statystyki dla zmiennej SB2023. Scharakteryzuj na ich podstawie wartość stopy bezrobocia w 2023 roku.
Jaki jest rozkład zmiennej SB2023? Czy w zbiorze danych istnieją wartości globalnie odstające. Jeśli tak - zidentyfikuj nazwy powiatów, dla których takie wartości występują.
Czy stopa bezrobocia różni się między makroregionami NUTS1 (zmienna MAKROREGION).
- Oblicz statystyki opisowe zmiennej SB2023 dla makroregionów.
- Wykonaj wykres pudełkowy.
- Wykonaj odpowiedni test określający czy istnieją statystycznie istotne różnice wartości stopy bezrobocia w 2023 roku między makroregionami.
- Czy stopa bezrobocia różni się między obszarami sklasyfikownami jako regiony przeważająco miejskie, pośrednie, przeważająco wiejskie (zmienna URBN_TYPE)?
- Oblicz statystyki opisowe zmiennej SB2023 dla poszczególnych typów regionów
- Wykonaj wykres pudełkowy.
- Wykonaj odpowiedni test określający czy istnieją statystycznie istotne różnice wartości stopy bezrobocia w 2023 roku między różnymi typami regionów.
Stwórz mapę pokazującą rozkład przestrzenny zmiennej SB2023 w powiatach w Polsce. Zapisz mapę do pliku png.
Stwórz mapę zmian pokazująca jak zmieniła się stopa bezrobocia między 2004 a 2023 rokiem. Jaką paletę wybierzesz do przedstawienia zmian? Zapisz mapę do pliku png.
Zadanie domowe
Jako rozwiązanie poniższych zadań należy przedstawić:
- plik .qmd zawierający kod z rozwiązaniem zadań
- plik html zawierający rozwiązanie zadań wraz z mapami, wykresami, rycinami.
- utworzone geopaczki
- utworzone pliki png zawierające mapy.
Zadanie 1: Dane przestrzenne w R
Wykorzystując aplikację Google Maps zczytaj współrzędne swojego miejsca zamieszkania (zaokrąglij je do 6 miejsc po przecinku).
Na podstawie współrzędnych utwórz obiekt wektorowy punktowy i nadaj mu układ współrzędnych WGS84 (EPSG: 4326).
Utwórz w R obiekt
p2
poprzez przekształcenie utworzonego punktu do PUWG1992 (EPSG: 2180).Wyznacz 1km strefę bufforową wokół wyznaczonego punktu
p2
.Zwizualizuj punkt oraz strefę bufforową używając pakietu
tmap
. Zapisz mapę do pliku png.
Zadanie 2. Dane przestrzenne w R
Wczytaj dane z pliku
punkty.csv
oraz wyselekcjonuj tylko punkty z temperaturą powyżej 20C (obiektpunkty_sel
).Przetwórz obiekt
punkty_sel
do postaci obiektu przestrzennegopunkty20
.Wyznacz obwiednię (bounding box) dla obiektu
punkty20
i przypisz ją do obiektupunkty20_bb
.Wczytaj dane z pliku
clc.tif
do R jako obiektclc
.Utwórz obiekt
clc20
poprzez przycięcie obiektuclc
do granic obiektupunkty20_bb
. Zapisz obiektclc20
do pliku. Jakiego rodzaju jest wynikowy obiekt? Jaki typ danych on przechowuje? Jakie ma wymiary? Ile ma on atrybutów (zmiennych)? Jaki ma on układ współrzędnych? Stwórz prostą mapę z nowo utworzonego obiektu.Stwórz mapę pokazującą punkty z obiektu
punkty20
. W tle tej mapy przedstaw obiektclc20
. Zapisz mapę w pliku png.