Diferența dintre extragerea datelor și depozitarea datelor

Diferența dintre extragerea datelor și depozitarea datelor
Diferența dintre extragerea datelor și depozitarea datelor

Video: Diferența dintre extragerea datelor și depozitarea datelor

Video: Diferența dintre extragerea datelor și depozitarea datelor
Video: Huawei nova 11i vs. HTC Wildfire E2 play: A Comparison of Specifications 2024, Noiembrie
Anonim

Data mining vs Data Warehousing

Data Mining și Data Warehousing sunt ambele tehnici foarte puternice și populare pentru analiza datelor. Utilizatorii care sunt înclinați către statistici folosesc Data Mining. Ei folosesc modele statistice pentru a căuta modele ascunse în date. Minerii de date sunt interesați să găsească relații utile între diferite elemente de date, ceea ce este în cele din urmă profitabil pentru afaceri. Dar, pe de altă parte, experții în date care pot analiza direct dimensiunile afacerii tind să folosească depozitele de date.

Data mining este cunoscut și sub numele de Knowledge Discovery in data (KDD). După cum am menționat mai sus, este un domeniu al informaticii, care se ocupă cu extragerea informațiilor necunoscute și interesante din date brute. Datorită creșterii exponențiale a datelor, în special în domenii precum business, data mining a devenit un instrument foarte important pentru a converti această mare bogăție de date în business intelligence, deoarece extragerea manuală a modelelor a devenit aparent imposibilă în ultimele decenii. De exemplu, este utilizat în prezent pentru diverse aplicații, cum ar fi analiza rețelelor sociale, detectarea fraudelor și marketing. Exploatarea datelor se ocupă de obicei cu următoarele patru sarcini: grupare, clasificare, regresie și asociere. Clustering înseamnă identificarea unor grupuri similare din date nestructurate. Clasificarea reprezintă reguli de învățare care pot fi aplicate datelor noi și vor include de obicei următorii pași: preprocesarea datelor, proiectarea modelării, învățarea/selectarea caracteristicilor și evaluarea/validarea. Regresia este găsirea de funcții cu o eroare minimă în modelarea datelor. Și asocierea caută relații între variabile. Exploatarea datelor este de obicei folosită pentru a răspunde la întrebări precum care sunt principalele produse care ar putea ajuta la obținerea unui profit mare anul viitor în Wal-Mart?

După cum sa menționat mai sus, depozitarea datelor este folosită și pentru analiza datelor, dar de către seturi diferite de utilizatori și un obiectiv ușor diferit în minte. De exemplu, când vine vorba de sectorul retail, utilizatorii de depozitare de date sunt mai preocupați de ce tipuri de achiziții sunt populare în rândul clienților, astfel încât rezultatele analizei pot ajuta clientul prin îmbunătățirea experienței clienților. Dar minerii de date mai întâi conjectează o ipoteză, cum ar fi care clienții cumpără un anumit tip de produs și analizează datele pentru a testa ipoteza. Depozitarea datelor ar putea fi efectuată de un mare retailer care își stochează inițial magazinele cu aceleași dimensiuni de produse pentru a afla ulterior că magazinele din New York vând stocuri de dimensiuni mai mici mult mai repede decât în magazinele din Chicago. Prin urmare, analizând acest rezultat, comerciantul poate stoca magazinul din New York cu dimensiuni mai mici în comparație cu magazinele din Chicago.

Deci, după cum puteți vedea clar, aceste două tipuri de analize par a fi de aceeași natură cu ochiul liber. Ambele se preocupă de creșterea profiturilor pe baza datelor istorice. Dar, desigur, există diferențe cheie. În termeni simpli, Data Mining și Data Warehousing sunt dedicate furnizării diferitelor tipuri de analize, dar cu siguranță pentru diferite tipuri de utilizatori. Cu alte cuvinte, Data Mining caută corelații, modele care să susțină o ipoteză statistică. Dar, Data Warehousing răspunde la o întrebare comparativ mai amplă și fragmentează datele de acolo încolo pentru a recunoaște modalități de îmbunătățire în viitor.

Recomandat: