Regresie liniară vs logistică
În analiza statistică, este important să se identifice relațiile dintre variabilele în cauză la studiu. Uneori poate fi singurul scop al analizei în sine. Un instrument puternic utilizat pentru a stabili existența relației și a identifica relația este analiza de regresie.
Cea mai simplă formă de analiză de regresie este regresia liniară, în care relația dintre variabile este o relație liniară. În termeni statistici, scoate în evidență relația dintre variabila explicativă și variabila de răspuns. De exemplu, folosind regresia putem stabili relația dintre prețul mărfii și consum pe baza datelor colectate dintr-un eșantion aleatoriu. Analiza de regresie va produce o funcție de regresie a setului de date, care este un model matematic care se potrivește cel mai bine cu datele disponibile. Acest lucru poate fi ușor reprezentat printr-un grafic scatter. Regresia grafică este echivalentă cu găsirea celei mai bune curbe de potrivire pentru setul de date date. Funcția curbei este funcția de regresie. Folosind modelul matematic, utilizarea unei mărfuri poate fi prevăzută pentru un preț dat.
Prin urmare, analiza de regresie este utilizată pe scară largă în prezicere și prognoză. Este, de asemenea, utilizat pentru a stabili relațiile în datele experimentale, în domeniile fizicii, chimiei și în multe discipline de științe naturale și inginerie. Dacă relația sau funcția de regresie este o funcție liniară, atunci procesul este cunoscut sub numele de regresie liniară. În graficul scatter, poate fi reprezentat ca o linie dreaptă. Dacă funcția nu este o combinație liniară a parametrilor, atunci regresia este neliniară.
Regresia logistică este comparabilă cu regresia multivariată și creează un model pentru a explica impactul predictorilor multipli asupra unei variabile de răspuns. Cu toate acestea, în regresia logistică, variabila rezultatului final ar trebui să fie categorică (de obicei divizată; adică, o pereche de rezultate realizabile, cum ar fi moartea sau supraviețuirea, deși tehnicile speciale permit modelarea informațiilor mai categorizate). O variabilă de rezultat continuă poate fi transformată într-o variabilă categorică, pentru a fi utilizată pentru regresia logistică; totuși, prăbușirea variabilelor continue în acest mod este în mare parte descurajată, deoarece reduce precizia.
Spre deosebire de regresia liniară, spre medie, variabilele predictive în regresia logistică nu trebuie obligate să fie conectate liniar, distribuite în mod obișnuit sau să aibă varianță egală în fiecare cluster. Ca urmare, relația dintre predictor și variabilele de rezultat nu este probabil să fie o funcție liniară.
Care este diferența dintre regresia logistică și liniară?
• În regresia liniară, se presupune o relație liniară între variabila explicativă și variabila de răspuns și parametrii care satisfac modelul sunt găsiți prin analiză, pentru a da relația exactă.
• Regresia liniară este efectuată pentru variabilele cantitative, iar funcția rezultată este cantitativă.
• În regresia logistică, datele utilizate pot fi fie categorice, fie cantitative, dar rezultatul este întotdeauna categoric.