Projekt zaliczeniowy 2

  • Projekt wykonywany w grupach 2-3 osobowych.

  • Analiza ma być przedstawiona w formie raportu zawierającego:

    • tekst (zgodny ze strukturą raportu: Wprowadzenie, Dane i metody, Wyniki, Wnioski i podsumowanie)
    • ryciny, wykresy, tabele, mapy.
    • proszę zastosować opcję ukrycia kodu w raporcie (Dodaj opcję code_folding: hide do nagłówka pliku rmd)
  • Każda grupa opracowuje raport zawierający rozwiązania poniższych zadań (Część 1 - 3).

  • Długość raportu - ok. 10 stron.

  • Proszę pamiętać o podpisach tabel oraz rycin.

    • Tabele podpisujemy Tabela 1, Tabela 2, a podpis umieszczamy nad tabelą.
    • Ryciny (wykresy, mapy) podpisujemy Rycina 1, Rycina 2, …, a podpis umieszczamy pod ryciną.
    • Do zamieszczonych tabel i rycin należy odwoływać się w tekście (Tabela 1, Rycina lub Ryc. 1).

Część 1. Wykorzystanie analizy regresji do określenia zależności między ogólną liczbą ludności a punktami adresowymi.

Proszę wykonać zadanie, wykorzystując wyniki otrzymane w części 1 ćwiczenia

  1. Proszę wczytać plik out_model_punkty_adresowe.shp do oprogramowania QGIS oraz wykonać 4 mapy:
  • mapę pokazująca oryginalne wartości liczby ludności (TOT),
  • mapę pokazującą estymowaną liczbę ludności (EST_POP),
  • mapę reszt (różnic między wartością obserwowaną TOT oraz EST_POP),
  • mapę reszt przeklasyfikowaną do 3 klas (błędy ujemne - tj. EST_POP > TOT (model przeszacował wartości), brak błędu (różnica 0), błędy dodatnie EST_POP < TOT (model niedoszacował wartości))

Uwaga! Mapy pokazujące estymowaną (EST_POP) oraz oryginalna liczbę ludności (TOT) muszą mieć przypisaną tą samą skalę barw, tak aby były porównywalne.

  1. Na podstawie wykonanych map oraz wyników modelu proszę przeprowadzić statystyczną (nieprzestrzenną) oraz przestrzenną analizę rozkładu błędów modelu regresji.
  • Na ile dokładny jest otrzymany model?
  • Czy zalezność między liczbą ludności a liczbą punktów adresowych można wykorzystać do przygotowania bardziej szczegołówej mapy rozmieszczenia ludności?

Część 2. Wykorzystanie analizy regresji do określenia zależności między ogólną liczbą ludności a liczbą mieszkań.

Celem analizy jest sprawdzenie czy istnieje zależność między liczbą ludności oraz liczbą mieszkań.

  1. Etap pobrania i przygotowania danych do analizy został opisany w dokumencie “Czesc2…”.
  2. Wykorzystując przygotowane dane proszę zbudować liniowy model zależności między liczbą ludności a liczbą mieszkań w siatce 1km.
  • W jakim stopniu liczba ludności (TOT) jest wyjaśniana przez liczbę punktów adresowych?
  • Jakie są statystyki reszt?
  1. Proszę przeprowadzić ocenę dopasowania modelu (wykresy diagnostyczne, identyfikacja wartości odstających).
  • Czego dowiadujemy się z wykresów diagnostycznych?
  • Czy model jest dobrze dopasowany?
  • Czy spełnione są założenia regresji liniowej?
  1. Jak zmieni się model po wyeliminowaniu wartości odstających i wpływowych?
  • Proszę zbudować model regresji po wyeliminowaniu wartości odstających.
  • Proszę przeprowadzić ocenę dopasowania dla tego modelu.
  1. Wizualizacja wyników modelu na mapie.

Proszę wykonać 4 mapy:

  • mapę pokazująca oryginalne wartości liczby ludności (TOT),
  • mapę pokazującą estymowaną liczbę ludności (EST_POP),
  • mapę reszt (różnic między wartością obserwowaną TOT oraz EST_POP),
  • mapę reszt przeklasyfikowaną do 3 klas (błędy ujemne - tj. EST_POP > TOT (model przeszacował wartości), brak błędu (różnica 0), błędy dodatnie EST_POP < TOT (model niedoszacował wartości))
  1. Na podstawie wykonanych map oraz wyników modelu proszę przeprowadzić statystyczną (nieprzestrzenną) oraz przestrzenną analizę rozkładu błędów modelu regresji.
  • Na ile dokładny jest otrzymany model?
  • Czy zalezność między liczbą ludności a liczbą punktów adresowych można wykorzystać do przygotowania bardziej szczegołówej mapy rozmieszczenia ludności?
  1. Proszę opracować mapę rozmieszczenia ludności w siatce 100m, wykorzystując jako dane pomocnicze liczbę mieszkań.

Część 3. Porównanie wyników.

Proszę porównać wyniki obu modeli.

  • Która ze zmiennych pomocniczych (liczba punktów adresowych, liczba mieszkań) daje mniejsze błędy?
  • Jak różnią się między sobą opracowane mapy 100m?