Dane przestrzenne w R. Eksploracyjna analiza danych

Zadanie samodzielne

Author

Anna Dmowska, Jakub Nowosad

Jako rozwiązanie poniższych zadań należy przedstawić:

Zadanie 1: Dane przestrzenne w R

Dane

  • miasta_xy.csv zawiera współrzędne x, y, identyfikator oraz nazwy miast na prawach powiatu.
  • miasta_pop.csv zawiera informacje o liczbie ludności w miastach na prawach powiatu.

Zadanie

  1. Wczytaj dane z pliku miasta_xy.csv i przetwórz je do postaci obiektu przestrzennego miasta_sf. Wybierz PUWG 1992 (EPSG: 2180).

  2. Plik miasta_pop.csv zawiera kod miasta powiatowego oraz informacje o liczbie ludności w latach 1995 - 2023. Stwórz obiekt miasta_sf_pop poprzez dołączenie informacji z pliku miasta_pop.csv do obiektu przestrzennego miasta_sf.

  3. Zapisz obiekt miasta_sf_pop do formatu ESRI Shapefile oraz do formatu GeoPackage (geopaczkę nazwij miasta_powiatowe.gpkg, a zapisywaną warstwę miasta_pop).

  4. Utwórz obiekt zawierający obwiednię (bounding box) na podstawie danych w obiekcie miasta_sf. Zapisz obwiednię w utworzonej wcześniej geopaczce miasta_powiatowe.gpkg, nazwij warstwę miasta_bb.

  5. Z pliku wojewodztwa.gpkg wczytaj warstwę zawierającą granice województw (utwórz obiekt wojewodztwa). Przejrzyj ten obiekt. Jaki typ geometrii on przechowuje? Ile obiektów on zawiera? Ile ma on atrybutów (zmiennych)? Jaki ma on układ współrzędnych?

  6. Wybierz z warstwy województwo wielkopolskie (TERYT = 30) i zapisz je do obiektu wlkp.

  7. Wyselekcjonuj wszystkie miasta powiatowe położone w województwie wielkopolskim i przypisz je do obiektu miasta_wlkp. Zapisz obiekt w utworzonej wcześniej geopaczce miasta_powiatowe.gpkg, nazwij warstwę miasta_wlkp.

  8. Używając pakietu tmap zwizualizuj liczbę ludności w 2023 roku w miastach powiatowych. Do wizualizacji zmiennej określającej liczbę ludności użyj koloru. Uwzględnij na mapie także granice województw. Mapę zapisz do pliku w formacie png.

  9. Używając pakietu tmap zwizualizuj liczbę ludności w 1995 roku w miastach powiatowych. Do wizualizacji zmiennej określającej liczbę ludności użyj wielkości symbolu. Uwzględnij na mapie także granice województw. Mapę zapisz do pliku w formacie png.

Zadanie 2: Eksploracyjna analiza danych

Dane

W ćwiczeniu zostaną wykorzystane dane dotyczące stopy bezrobocia w powiatach w Polsce w 2023 roku. Dane zostały pobrane Z Banku Danych Lokalnych.

  • Plik bezrobocie_pl.csv zawiera identyfikator powiatu, nazwę powiatu oraz dane dotyczące stopy bezrobocia dla lat 2004, 2010, 2021, 2023 (odpowiednio SB2004, SB2010, SB2021, SB2023).
  • Plik powiaty_klasyfikacje.csv zawiera informacje o przynależności powiatów do regionów NUTS3, makroregionów wg klasyfikacji NUTS1 oraz typologi miejsko-wiejskiej. W przypadku typologii miejsko-wiejskiej kod 1 to regiony regiony przeważająco miejskie (80% ludności mieszka w klastrach miejskich), 2 oznacza regiony pośrednie (od 50 % do 80 % ludności mieszka w „klastrach miejskich”), a 3 oznacza regiony przeważająco wiejskie (co najmniej 50 % ludności mieszka w „komórkach siatki obszarów wiejskich”).
  • Plik powiaty_pl.gpkg zawiera granice powiatów w Polsce.
  • Plik wojewodztwa.gpkg zawiera granice województw.

Przygotowanie danych

  1. Utworzyć obiekt bezrobocie na podstawie pliku bezrobocie_pl.csv
  2. Utwórz obiekt klasyfikacje na podstawie pliku powiaty_klasyfikacje.csv. Zmodyfikuj pole TERYT poprzez dodanie ‘000’ na końcu.
  3. Utwórz obiekt powiaty_attr poprzez połączenie informacji znajdujących się w obiektach bezrobocie oraz klasyfikacje.
  4. Utworzyć obiekt powiaty_granica na podstawie pliku powiaty_pl.gpkg.
  5. Utworzyć obiekt woj_granica na podstawie pliku wojewodztwa.gpkg.
  6. Utwórz obiekt powiaty poprzez dołączenie danych z obiektu powiaty_attr do obiektu powiaty_granica.
  7. Zapisz obiekt powiaty do geopaczki powiaty_attr.gpkg

Eksploracyjna nieprzestrzenna analiza danych

Przygotuj raport składający się z uzyksanych wykresów, map oraz krótkiego (pół strony) opisu oraz podsumowania wyników. Raport zapisz w pliku bezrobocie_eksploracja.html

  1. Oblicz podstawowe statystyki dla zmiennej SB2023. Scharakteryzuj na ich podstawie wartość stopy bezrobocia w 2023 roku.

  2. Jaki jest rozkład zmiennej SB2023? Czy w zbiorze danych istnieją wartości globalnie odstające. Jeśli tak - zidentyfikuj nazwy powiatów, dla których takie wartości występują.

  3. Czy stopa bezrobocia różni się między makroregionami NUTS1 (zmienna MAKROREGION).

  • Oblicz statystyki opisowe zmiennej SB2023 dla makroregionów.
  • Wykonaj wykres pudełkowy.
  • Wykonaj odpowiedni test określający czy istnieją statystycznie istotne różnice wartości stopy bezrobocia w 2023 roku między makroregionami.
  1. Czy stopa bezrobocia różni się między obszarami sklasyfikownami jako regiony przeważająco miejskie, pośrednie, przeważająco wiejskie (zmienna URBN_TYPE)?
  • Oblicz statystyki opisowe zmiennej SB2023 dla poszczególnych typów regionów
  • Wykonaj wykres pudełkowy.
  • Wykonaj odpowiedni test określający czy istnieją statystycznie istotne różnice wartości stopy bezrobocia w 2023 roku między różnymi typami regionów.
  1. Stwórz mapę pokazującą rozkład przestrzenny zmiennej SB2023 w powiatach w Polsce. Zapisz mapę do pliku png.

  2. Stwórz mapę zmian pokazująca jak zmieniła się stopa bezrobocia między 2004 a 2023 rokiem. Jaką paletę wybierzesz do przedstawienia zmian? Zapisz mapę do pliku png.

Zadanie domowe

Jako rozwiązanie poniższych zadań należy przedstawić:

  • plik .qmd zawierający kod z rozwiązaniem zadań
  • plik html zawierający rozwiązanie zadań wraz z mapami, wykresami, rycinami.
  • utworzone geopaczki
  • utworzone pliki png zawierające mapy.

Zadanie 1: Dane przestrzenne w R

  1. Wykorzystując aplikację Google Maps zczytaj współrzędne swojego miejsca zamieszkania (zaokrąglij je do 6 miejsc po przecinku).

  2. Na podstawie współrzędnych utwórz obiekt wektorowy punktowy i nadaj mu układ współrzędnych WGS84 (EPSG: 4326).

  3. Utwórz w R obiekt p2 poprzez przekształcenie utworzonego punktu do PUWG1992 (EPSG: 2180).

  4. Wyznacz 1km strefę bufforową wokół wyznaczonego punktu p2.

  5. Zwizualizuj punkt oraz strefę bufforową używając pakietu tmap. Zapisz mapę do pliku png.

Zadanie 2. Dane przestrzenne w R

  1. Wczytaj dane z pliku punkty.csv oraz wyselekcjonuj tylko punkty z temperaturą powyżej 20C (obiekt punkty_sel).

  2. Przetwórz obiekt punkty_sel do postaci obiektu przestrzennego punkty20.

  3. Wyznacz obwiednię (bounding box) dla obiektu punkty20 i przypisz ją do obiektu punkty20_bb.

  4. Wczytaj dane z pliku clc.tif do R jako obiekt clc.

  5. Utwórz obiekt clc20 poprzez przycięcie obiektu clc do granic obiektu punkty20_bb. Zapisz obiekt clc20 do pliku. Jakiego rodzaju jest wynikowy obiekt? Jaki typ danych on przechowuje? Jakie ma wymiary? Ile ma on atrybutów (zmiennych)? Jaki ma on układ współrzędnych? Stwórz prostą mapę z nowo utworzonego obiektu.

  6. Stwórz mapę pokazującą punkty z obiektu punkty20. W tle tej mapy przedstaw obiekt clc20. Zapisz mapę w pliku png.