Analiza logitowa – regresja logistyczna

5/5 - (2 votes)

Jest to metoda statystyczna, która ma na celu znalezienie funkcyjnej zależności pomiędzy transformowaną objaśnianą zmienną jakościową, która nazywana jest logitem, a pewnymi zmiennymi, które mogą być zmiennymi jakościowymi lub ilościowymi. Tak więc, za pomocą regresji logistycznej, skalowana jest funkcja prawdopodobieństwa (przynależności obiektów do populacji), przy założeniu że ma ona postać funkcji logistycznej.[1] [2] [3] Zmienne objaśniane są w przypadku modeli logitowych zmiennymi jakościowymi, a więc analizowana funkcja jest funkcją dychotomiczną. W przypadku naszej analizy, jest to albo zagrożenie bankructwem, albo brak takiego zagrożenia.

Funkcja prawdopodobieństwa – w przypadku modelu logitowego – przyjmuje następującą postać:

Wyrażenie X:Tp jest wykorzystywane do aproksymacji prawdopodobieństwa Pi wystąpienia danego zdarzenia, czyli np. zaistnienia kryzysu finansowego lub też bankructwa. Wyrażenie to można zapisać w następującej postaci:

XiTP = p0 + P1X1 +… + PpXp.

Zmienne oraz parametry stojące przy nich są liczbami rzeczywistymi, tak więc wartości całego wyrażenia są również rzeczywiste. Jednak prawdopodobieństwo jest liczbą z przedziału [0,1].

W celu pozbycia się potrzeby stawiania dodatkowych warunków przy szacowaniu parametrów, należy dokonać transformacji prawdopodobieństwa Pi. Wykorzystać w tym celu można przekształcenie prawdopodobieństwa: Pi / 1- Pi. „Jest to tak zwany iloraz szans (odds), wielkość dodatnia, rosnąca nieograniczenie dla Pi dążącego do jedności.”[4] W ten sposób dokonujemy eliminacji ograniczenia „z góry”, tj. prawej strony przedziału [0,1]. Ograniczenie z dołu usuwa się logarytmując iloraz szans i otrzymując w ten sposób wyrażenie nazywane logitem. Ma ono następującą postać:

D

Li = ln—i— = X:T p.                                            (2.2)

1 – p 1 H

Po przekształceniu tego równania, otrzymujemy funkcję prawdopodobieństwa uzależnionego od XiTp. Ta funkcja została przedstawiona na początku tego punktu. Ma ono następującą postać:

Taka funkcja przekształca przedział możliwych do zaakceptowania wyników próby z zamkniętego [0,1] na otwarty przedział liczb rzeczywistych. Jest to bardzo wygodne ze względu na mniejszą liczbę założeń (w porównaniu na przykład z analizą dyskryminacyjną), potrzebnych przy szacowaniu parametrów równania (2.1).

Interpretacja wyników przebiega w następujący sposób:

  • prawdopodobieństwo będzie dążyło do 1, gdy wartości L będą dążyły do + ~,
  • prawdopodobieństwo będzie równe 0,5, gdy wartość Li będzie równa 0,
  • prawdopodobieństwo będzie dążyło do 0, gdy wartości Li będą dążyły do – ~.

[1]    Bartosiewicz S. „Estymacja modeli ekonometrycznych” Polskie Wydawnictwo Ekonomiczne, Warszawa 1990, str. 218 i nast.

[2]    Por. Bartosiewicz S. „Estymacja modeli ekonometrycznych” Polskie Wydawnictwo Ekonomiczne, Warszawa 1990, str. 219

[3]    Regresja logistyczna jest określeniem z zakresu analizy logitowej.

[4]    Gruszczyński M., Modele i prognozy zmiennych jakościowych w finansach i bankowości, Wydawnictwo SGH 2001, str. 58.