Ćwiczenie 5 i 6: Zadanie samodzielne: Zastosowanie regresji wielokrotnej do modelowania cen nieruchomości w wybranym obszarze w Stanach Zjednoczonych
Author
Anna Dmowska
Poniższe zadanie wykonywane jest w grupach dwuosobowych. Każda grupa wybiera jedno hrabstwo oraz przedstawia jeden raport z wykonanej analizy. Otrzymane wyniki będą prezentowane przez każdą grupę na kolejnych zajęciach.
1 Zadanie
Wykorzystując pobrane dane dla wybranego hrabstwa w Stanach Zjednoczonych (lista hrabstw do wyboru znajduje się poniżej) proszę:
przeprowadzić eksploracyjną analizę danych obejmującą:
obliczenie statystyk opisowych
analizę korelacji (jakie zmienne niezależne są między sobą najbardziej skorelowane?, które zmienne niezależne najbardziej korelują ze zmienną zależną?)
przeanalizować rozkład cen nieruchomości
histogram cen nieruchomości (median value)
mapę rozkładu przestrzennego cen nieruchomości
zwizualizować zmienne niezależne, które będą użyte w modelu
zbudować model regresji wielokrotnej przedstawiający zależność między wartością domów w danym obszarze, a pozostałymi zmiennymi społeczno-ekonomicznymi.
Jeśli zmienna zależna (ceny nieruchomości) ma rozkład asymetryczny, przed budową modelu należy dokonać transformacji danych używając logarytmu.
Zestaw zmiennych społeczno-ekonomicznych można także rozszerzyć o inne zmienne.
zinterpretować wyniki modelu
które zmienne były istotne statystycznie?
jakie są statystyki reszt?
jaki jest rozkład przestrzenny reszt?
w jakim stopniu zmienne niezależne wyjaśniają wartość cen domów?
2 Raport końcowy
Tytuł: Modelowanie cen nieruchomości w hrabstwie X w roku 2020.
Rozdziały:
Wprowadzenie zawierające także cen analizy
Dane i metody: zawiera mapy pokazujące przestrzenny rozkład cen nieruchomości oraz zmiennych zależnych użytych do budowy modelu
Eksploracyjna analiza danych - zawiera wyniki obejmujące zestawienie statystyk opisowych, wyniki analizy korelacji
Modelowanie cen nieruchomości - zawiera wyniki analizy regresji
Podsumowanie
Proszę wykorzystać dokument Quarto do wykonania raportu,
Wynikowy raport należy zapisać w pliku html.
Proszę w wynikowym dokumencie zastosować opcję ukrycia kodu
W nagłówku dokumentu proszę podać:
title: "Tytuł raportu"
author: "Autor"
format:
html:
code-fold: true # ta opcja spowoduje, że kod będzie domyślnie ukryty z możliwością odkrycia bloku kodu.
`
2.1 Lista hrabstw
Poniższa tabela zawiera zestawienie nazw hrabstw (COUNTY) wraz z informacją w jakim stanie (STATE) hrabstwo się znajduje. Te informacje lub kody (COUNTY_CODE, STATE_CODE) są wykorzystywane do pobrania danych społeczno-ekonomicznych. Dodatkowo w kolumnie CITY znajduje się informacja dotycząca miasta, które obejmuje dane hrabstwo.