Diferența cheie dintre clasificare și arborele de regresie este că în clasificare variabilele dependente sunt categorice și neordonate, în timp ce în regresie variabilele dependente sunt continue sau valori întregi ordonate.
Clasificarea și regresia sunt tehnici de învățare pentru a crea modele de predicție din datele adunate. Ambele tehnici sunt prezentate grafic ca arbori de clasificare și regresie, sau mai degrabă diagrame de flux cu diviziuni de date după fiecare pas, sau mai degrabă, „ramură” în arbore. Acest proces se numește partiționare recursivă. Domenii precum minerit utilizează aceste tehnici de învățare de clasificare și regresie. Acest articol se concentrează pe arborele de clasificare și arborele de regresie.
Ce este clasificarea?
Clasificarea este o tehnică folosită pentru a ajunge la o schemă care arată organizarea datelor începând cu o variabilă precursoare. Variabilele dependente sunt cele care clasifică datele.
Figura 01: Exploatarea datelor
Arborele de clasificare începe cu variabila independentă, care se ramifică în două grupuri, după cum este determinat de variabilele dependente existente. Este menit să elucideze răspunsurile sub formă de categorizare determinată de variabilele dependente.
Ce este regresia
Regresia este o metodă de predicție care se bazează pe o valoare de ieșire numerică presupusă sau cunoscută. Această valoare de ieșire este rezultatul unei serii de partiționări recursive, fiecare pas având o valoare numerică și un alt grup de variabile dependente care se ramifică într-o altă pereche ca aceasta.
Arborele de regresie începe cu una sau mai multe variabile precursoare și se termină cu o variabilă finală de ieșire. Variabilele dependente sunt variabile numerice continue sau discrete.
Care este diferența dintre clasificare și regresie?
Clasificare vs regresie |
|
Un model arborescent în care variabila țintă poate lua un set discret de valori. | Un model arborescent în care variabila țintă poate lua valori continue, de obicei numere reale. |
variabilă dependentă | |
Pentru arborele de clasificare, variabilele dependente sunt categorice. | Pentru arborele de regresie, variabilele dependente sunt numerice. |
Valori | |
Are o cantitate stabilită de valori neordonate. | Are valori discrete, dar ordonate, fie valori indiscrete. |
Scopul construcției | |
Scopul construcției arborelui de regresie este de a potrivi un sistem de regresie la fiecare ramură determinantă, astfel încât valoarea de ieșire așteptată să apară. | Un arbore de clasificare se ramifică așa cum este determinat de o variabilă dependentă derivată din nodul anterior. |
Rezumat – Clasificare vs regresie
Arborii de regresie și clasificare sunt tehnici utile pentru a mapa procesul care indică un rezultat studiat, fie în clasificare, fie într-o singură valoare numerică. Diferența dintre arborele de clasificare și arborele de regresie este variabila dependentă a acestora. Arborii de clasificare au variabile dependente care sunt categorice și neordonate. Arborii de regresie au variabile dependente care sunt valori continue sau valori întregi ordonate.