Data Mining vs OLAP
Atât extragerea datelor, cât și OLAP sunt două dintre tehnologiile obișnuite de Business Intelligence (BI). Business intelligence se referă la metode bazate pe computer pentru identificarea și extragerea informațiilor utile din datele de afaceri. Exploatarea datelor este domeniul informaticii care se ocupă cu extragerea tiparelor interesante din seturi mari de date. Combină multe metode de la inteligență artificială, statistici și gestionarea bazelor de date. OLAP (procesare analitică online), așa cum sugerează și numele, este o compilație de modalități de interogare a bazelor de date multi-dimensionale.
Exploatarea datelor este, de asemenea, cunoscută sub numele de Discovery Knowledge in Data (KDD). Așa cum s-a menționat mai sus, este un domeniu al informaticii, care se ocupă cu extragerea de informații necunoscute anterior și interesante din date brute. Datorită creșterii exponențiale a datelor, în special în domenii precum afaceri, exploatarea datelor a devenit un instrument foarte important pentru a converti această bogăție mare de date în business intelligence, deoarece extragerea manuală a modelelor a devenit aparent imposibilă în ultimele decenii. De exemplu, este utilizat în prezent pentru diverse aplicații, cum ar fi analiza rețelelor sociale, detectarea fraudei și marketing. Exploatarea datelor se ocupă de obicei de următoarele patru sarcini: grupare, clasificare, regresie și asociere. Clusterizarea este identificarea grupurilor similare din datele nestructurate. Clasificarea reprezintă reguli de învățare care pot fi aplicate noilor date și vor include de obicei următorii pași: preprocesarea datelor, proiectarea modelării, învățarea / selectarea caracteristicilor și evaluarea / validarea. Regresia constă în găsirea funcțiilor cu erori minime la modelarea datelor. Și asocierea caută relații între variabile. Exploatarea datelor este de obicei folosită pentru a răspunde la întrebări precum care sunt principalele produse care ar putea ajuta la obținerea unui profit ridicat anul viitor în Wal-Mart. Exploatarea datelor este de obicei folosită pentru a răspunde la întrebări precum care sunt principalele produse care ar putea ajuta la obținerea de profituri mari anul viitor în Wal-Mart. Exploatarea datelor este de obicei folosită pentru a răspunde la întrebări precum care sunt principalele produse care ar putea ajuta la obținerea unui profit ridicat anul viitor în Wal-Mart.
OLAP este o clasă de sisteme, care oferă răspunsuri la interogări multidimensionale. De obicei OLAP este utilizat pentru marketing, bugetare, prognoză și aplicații similare. Este de la sine înțeles că bazele de date utilizate pentru OLAP sunt configurate pentru interogări complexe și ad-hoc cu o performanță rapidă în minte. De obicei, o matrice este utilizată pentru a afișa ieșirea unui OLAP. Rândurile și coloanele sunt formate din dimensiunile interogării. Ei folosesc adesea metode de agregare pe mai multe tabele pentru a obține rezumate. De exemplu, poate fi folosit pentru a afla despre vânzările din acest an în Wal-Mart comparativ cu anul trecut? Care este previziunea vânzărilor în trimestrul următor? Ce se poate spune despre tendință uitându-ne la schimbarea procentuală?
Deși este evident că Data mining și OLAP sunt similare, deoarece operează pe date pentru a câștiga inteligență, diferența principală provine din modul în care operează pe date. Instrumentele OLAP oferă analize multidimensionale ale datelor și oferă rezumate ale datelor, dar, în contrast, extragerea datelor se concentrează pe rapoarte, tipare și influențe în setul de date. Acesta este un acord OLAP cu agregare, care se reduce la operarea datelor prin „adăugare”, dar exploatarea datelor corespunde „divizării”. O altă diferență notabilă este că, în timp ce instrumentele de extragere a datelor modelează date și returnează reguli acționabile, OLAP va efectua tehnici de comparare și contrast de-a lungul dimensiunii afacerii în timp real.