1 Dane

Plik dane2007.rds zawiera dane hydrometeorologiczne pochodzące ze Stacji Bazowej ZMŚP w Storkowie z 2007 roku:

  • date - data
  • mce - miesiąc
  • tps - temperatura powietrza
  • tmin - temepratura minimalna powietrza
  • tmax - temperatura maksymalna powietrza
  • tg5cm, tg10cm, tg20cm, tg50cm, tg100cm - temperatury gruntu na 5,10, 20, 50 i 100 cm
  • TwP - temperatura wody w Parsęcie
  • TwMP - temperatura wody w Młyńskim Potoku.
dane <- readRDS("dane/dane2007.rds")
names(dane)
##  [1] "data"    "mce"     "tps"     "tmin"    "tmax"    "tg5cm"   "tg10cm" 
##  [8] "tg20cm"  "tg50cm"  "tg100cm" "TwP"     "TwMP"

1.1 Przygotowanie danych do analizy

  • Przed wykonaniem analizy proszę usunąć ze zbioru danych zmienne date, mce oraz TwMP. Zmienne te nie będą uwzględniane przy budowie modelu.
  • Budowa modelu wymaga zbioru danych bez wartości NA. Taki zbiór danych można przygotować używając polecenia dane[complete.cases(dane),].

2 Prezentacja wyników

Rozwiązania poniższych zadań proszę przedstawić w postaci krórtkiego raportu - do 5 stron wraz z rycinami. Raport powinien składać się z następujących sekcji:

  • Wprowadzenie - co jest celem analizy
  • Dane i metody
  • Wyniki
  • Wnioski

Zadanie 1.

  1. Proszę zilustrować zależność między temperaturą wody w Parsęcie (TwP) a temperaturą powietrza (tps).

  2. Proszę zbudować model zależności temperatury wody w Parsęcie (TwP) od temperatury powietrza (tps).

  3. Dla zbudowanego modelu proszę:

    • wyznaczyć współczynniki modelu i zapisać równanie modelu regresji liniowej.
    • proszę przedstawić słowną interpretację równania modelu regresji liniowej.
    • oszacować tempearutę wody w Parsęcie przy temperaturze powietrza równej 5.3, 2.1, 21 C.
  4. Proszę dodać równanie regresji liniowej do wykresu ilustrującego zależność między temperaturą wody w Parsęcie a temperaturą powietrza.

  5. Proszę wykreślić wykres rozrzutu (x - wartości obserwowane, y - wartości dopasowane - wyliczone z modelu).

  6. Proszę wykonać ocenę dopasowania modelu obejmującą:

  • określenie współczynnika determinacji.

  • identyfikację wartości odstających

  • analizę reszt:

    • statystyki reszt
    • wykresy diagnostyczne

Zadanie 2.

  1. Wykorzystując regresję z krokową eliminacją zmiennych proszę zbudować optymalny model prognozujący temperaturę wody w Parsęcie.

    • Uwaga! Proszę nie uwzględniać w modelu zmiennych date, mce oraz TwMP.
    • Budowa modelu wymaga zbioru danych bez wartości NA. Taki zbiór danych można przygotować używając polecenia dane[complete.cases(dane),].
  2. Czy model otrzymany za pomocą regresji z krokową eliminacją zmiennych można jeszcze uprościć, przy zachowaniu podobnego poziomu wyjaśnienia zmienności TwP?

  3. W jakim stopniu utworzony model wyjaśnia temperaturę wody w Parsęcie?

  4. Dla zbudowanego modelu proszę wyznaczyć współczynniki modelu i zapisać równanie modelu regresji liniowej.

  5. Proszę wykonać ocenę dopasowania modelu obejmującą:

  • określenie współczynnika determinacji.

  • identyfikację wartości odstających

  • analizę reszt:

    • statystyki reszt
    • wykresy diagnostyczne

Zadanie 3.

Proszę porównać oba zbudowane modele:

  1. Który model w większym stopniu wyjaśnia temperaturę wody w Parsęcie?

  2. Proszę przeprowadzić analizę reszt dla obu modeli. Który z modeli daje mniejsze błędy?

    • Funkcja resid_compare z pakietu ggResidpanel pozwala na porównanie wykresów diagnostycznych dla kilku modeli