Projekt zaliczeniowy 2
Projekt wykonywany w grupach 2-3 osobowych.
Analiza ma być przedstawiona w formie raportu zawierającego:
- tekst (zgodny ze strukturą raportu: Wprowadzenie, Dane i metody, Wyniki, Wnioski i podsumowanie)
- ryciny, wykresy, tabele, mapy.
- proszę zastosować opcję ukrycia kodu w raporcie (Dodaj opcję code_folding: hide do nagłówka pliku rmd)
Każda grupa opracowuje raport zawierający rozwiązania poniższych zadań (Część 1 - 3).
Długość raportu - ok. 10 stron.
Proszę pamiętać o podpisach tabel oraz rycin.
- Tabele podpisujemy Tabela 1, Tabela 2, a podpis umieszczamy nad tabelą.
- Ryciny (wykresy, mapy) podpisujemy Rycina 1, Rycina 2, …, a podpis umieszczamy pod ryciną.
- Do zamieszczonych tabel i rycin należy odwoływać się w tekście (Tabela 1, Rycina lub Ryc. 1).
Część 1. Wykorzystanie analizy regresji do określenia zależności między ogólną liczbą ludności a punktami adresowymi.
Proszę wykonać zadanie, wykorzystując wyniki otrzymane w części 1 ćwiczenia
- Proszę wczytać plik out_model_punkty_adresowe.shp do oprogramowania QGIS oraz wykonać 4 mapy:
- mapę pokazująca oryginalne wartości liczby ludności (TOT),
- mapę pokazującą estymowaną liczbę ludności (EST_POP),
- mapę reszt (różnic między wartością obserwowaną TOT oraz EST_POP),
- mapę reszt przeklasyfikowaną do 3 klas (błędy ujemne - tj. EST_POP > TOT (model przeszacował wartości), brak błędu (różnica 0), błędy dodatnie EST_POP < TOT (model niedoszacował wartości))
Uwaga! Mapy pokazujące estymowaną (EST_POP) oraz oryginalna liczbę ludności (TOT) muszą mieć przypisaną tą samą skalę barw, tak aby były porównywalne.
- Na podstawie wykonanych map oraz wyników modelu proszę przeprowadzić statystyczną (nieprzestrzenną) oraz przestrzenną analizę rozkładu błędów modelu regresji.
- Na ile dokładny jest otrzymany model?
- Czy zalezność między liczbą ludności a liczbą punktów adresowych można wykorzystać do przygotowania bardziej szczegołówej mapy rozmieszczenia ludności?
Część 2. Wykorzystanie analizy regresji do określenia zależności między ogólną liczbą ludności a liczbą mieszkań.
Celem analizy jest sprawdzenie czy istnieje zależność między liczbą ludności oraz liczbą mieszkań.
- Etap pobrania i przygotowania danych do analizy został opisany w dokumencie “Czesc2…”.
- Wykorzystując przygotowane dane proszę zbudować liniowy model zależności między liczbą ludności a liczbą mieszkań w siatce 1km.
- W jakim stopniu liczba ludności (TOT) jest wyjaśniana przez liczbę punktów adresowych?
- Jakie są statystyki reszt?
- Proszę przeprowadzić ocenę dopasowania modelu (wykresy diagnostyczne, identyfikacja wartości odstających).
- Czego dowiadujemy się z wykresów diagnostycznych?
- Czy model jest dobrze dopasowany?
- Czy spełnione są założenia regresji liniowej?
- Jak zmieni się model po wyeliminowaniu wartości odstających i wpływowych?
- Proszę zbudować model regresji po wyeliminowaniu wartości odstających.
- Proszę przeprowadzić ocenę dopasowania dla tego modelu.
- Wizualizacja wyników modelu na mapie.
Proszę wykonać 4 mapy:
- mapę pokazująca oryginalne wartości liczby ludności (TOT),
- mapę pokazującą estymowaną liczbę ludności (EST_POP),
- mapę reszt (różnic między wartością obserwowaną TOT oraz EST_POP),
- mapę reszt przeklasyfikowaną do 3 klas (błędy ujemne - tj. EST_POP > TOT (model przeszacował wartości), brak błędu (różnica 0), błędy dodatnie EST_POP < TOT (model niedoszacował wartości))
- Na podstawie wykonanych map oraz wyników modelu proszę przeprowadzić statystyczną (nieprzestrzenną) oraz przestrzenną analizę rozkładu błędów modelu regresji.
- Na ile dokładny jest otrzymany model?
- Czy zalezność między liczbą ludności a liczbą punktów adresowych można wykorzystać do przygotowania bardziej szczegołówej mapy rozmieszczenia ludności?
- Proszę opracować mapę rozmieszczenia ludności w siatce 100m, wykorzystując jako dane pomocnicze liczbę mieszkań.
Część 3. Porównanie wyników.
Proszę porównać wyniki obu modeli.
- Która ze zmiennych pomocniczych (liczba punktów adresowych, liczba mieszkań) daje mniejsze błędy?
- Jak różnią się między sobą opracowane mapy 100m?