Modele regresji liniowej

Modèle regresji liniowej Dany wzorem eqref{Model} Zależy OD nieznanych parametrów (a ) i (b ). Szacowanie parametrów modelu statystycznego na podstawie danych nazywa się estymacją, un même oszacowania tych parametrów estymatorami. Parametrów Estymatoire (a ) i (b ) chcemy dobrać Tak, aby otrzymać prostą Jak Najlepiej dopasowaną obserwacji. Nasze liniowe przybliżenie będzie obarczone błędem (przybliżenia) dla każdej Pary ((x_i, y_i) ). Dlatego w dalszej części zajmiemy się jedną z Metod minimalizującą te błędy. Niech Dany będzie zbiór danych zaobserwowanych {y i, x i 1,…, x i p} i = 1 n {displaystyle {y_{i}, , x_ {I1}, ldots, x_ {IP} }_{i = 1} ^ {n}}. Modèle regresji liniowej zakłada, że istnieje liniowa (afiniczna) relacja pomià zmienną zależną Yi a wektorem p × 1 {displaystyle ptimes 1} regrésorów XI. Zależność ta jest modelowana przez uwzględnienie składnika losowego (błędu) εi, qui jest zmienną losową. Dokładniej, Model Ten jest postaci korzystając z korzystam oraz ze wzorów eqref{estymatory} otrzymujemy [hat{a} = frac{83240}{105890}simeq 0 {,} 7860988, quadhat{b} = 296-381 cdot 0 {,} 7860988 SIMEQ-3 {,} 503636, ] Zatem Prosta regresji ma Postać (y = 0 {, } 7860988x-3 {,} 503636 ). Obserwacje nietypowe Dzieli się na Dwie Podstawowe grupy: wartości dla statystyki F (która Bada istotność modelu jako całości) Jak możemy zaobserwować na rysunku, punkty odpowiadające parom z powyższej tabeli układają się wzdłuż pewnej prostej o dodatnim współczynniku kierunkowym, Więc wybrany przez NAS modèle (regresja liniowa, którą opiszemy w Następnym punkcie) ma szanse dobrze przybliżać Wyniki pomiaru. Intuicyjnie oznacza to, że możemy,, wpisać “pewną funkcję liniową (f (x) = ax + b ) w Nasze Dane. W jaki sposób wybrać PARAMETRES (a ) i (b ) wyraz wszystkich możliwych? O tym napiszemy w Kolejnym punkcie. Jeśli regresja liniowa wciąż budzi wątpliwości, à Polecam DWA Ciekawe filmy na YouTube: Napisałam, że można się zastanowić, Czy należy usunąć ewidentnie niepade ące punkty z naszego modelu.

Tak. Zawsze Mamy Możliwość przeprowadzenia obliczeń bez obserwacji wpływowych. ALE podejmując Taką decyzję należy się bardzo starannie zastanowić, Czy jest Ona uzasadniona. Trzeba się zastanowić, jakie było Źródło danych odbiegających OD pozostałych. Je podając interpretację modelu zawsze należy poinformować, że została podjęta Decyzja o usunięciu z niego obserwacji nietypowych. Skoro bowiem raz Miało Miejsce Coś “dziwnego”, à Nigdy nie Wiemy, Czy nie powtórzy się w przyszłości. Je przeprowadzając analizy na podstawie “ulepszonego” modelu, Trzeba mieć świadomość, że w pewnym Sensi e wykluczamy przypadki nietypowe. Pomiary dwóch badanych Cech (DLA dziesięciu Rodzin) są podane w poniższej tabeli. Kiedy Mamy wyliczone już PARAMETRES funkcji regresji liniowej, à możemy wyliczyć, o Ile Nasze doświadczalne y różnią się OD teoretycznego y obliczonego na podstawie funkcji regresji dla konkretnych wartości x.

Każda Taka różnica jest nazywana resztą albo składnikiem resztowym (po angielsku résiduel). À właśnie kwadraty tych różnic minimalizowaliśmy podczas obliczania parametrów a i b. Je właśnie te reszty mogą Nam podpowiedzieć, Czy Prawidłowo wybraliśmy regresję liniową jako metodę oszacowania kształtu zależności pomide zmiennymi. Warto Więc spojrzeć na tzw. wykres reszt. Przestawia sur poziomą linię oraz Kropki, które pokazują, na Ile Nasze reszty odchylają się OD Linii regresji. Reszty te powinny być dość równomiernie rozproszone z jednej i drugiej strony wykresu, Najlepiej Jak najbliżej poziomej Linii. Jeśli dostrzegamy jakiś wyraźny układ, położenie żadnych nie wygląda na losowe, à najprawdopodobniej nie Mamy do czynienia z rozkładem normalnym reszt.

Je najprawdopodobniej regresja liniowa nie jest w takiej II najbardziej optymalną metodą szacowania y na podstawie x.