Ce se întâmplă dacă organizațiile își procesează toate datele în sprijinul deciziei? Ce s-ar întâmpla dacă ar folosi software specializat care a servit pentru prezentarea informațiilor și analiza acestora? Vom da câteva Exemple de Data Warehouse pentru a răspunde la aceste întrebări.

Exemple de depozite de date
În primul rând, este important să facem diferența între doi termeni care, datorită abrevierii lor, ne pot confunda cu ușurință, iar de la început intenția este ca utilizatorul să știe la ce să se aștepte și să cunoască câteva concepte de bază pe care le urmează a înfrunta. Aici vom arăta exemple infinite care servesc astfel încât individul să aibă instrumentele pentru a distinge aceste elemente.
Definiție
Având în vedere diferența dintre cei doi termeni, vom proceda la definirea lor formală, deoarece este un proces care extrage, transformă, consolidează și integrează datele unei organizații, atât interne, cât și externe, pentru a le face accesibile și utile în luarea deciziilor. -facere.
În același mod, depozitul de date poate fi definit și ca o bază cu informații despre sistemul de fișiere electronice, care stochează datele necesare pentru analiza informațiilor și luarea deciziilor. Diferența sa este că este orientată spre afaceri, integrată, variabilă în timp și non-volatilă.
Practic, Data Warehousing (DWH) este un proces, iar Data Warehouse (DW) este o bază de date.
caracteristici
Există mai multe aspecte care caracterizează depozitul de date care furnizează instrumentele necesare pentru utilizarea sa optimă, respectând astfel liniile directoare programate care generează instrumentele pentru utilizarea sa în cel mai bun mod posibil. Vom detalia caracteristicile unui Data Warehouse:
Orientat către afaceri
Numai datele relevante sunt introduse în Depozitul de date pentru analiză și luarea deciziilor. Adică, datele care nu au valoare analitică, cum ar fi adresele camerei, codurile poștale, adresele de e-mail, printre altele, nu sunt luate în considerare. Dar acestea prezintă un interes variabil, cum ar fi tipul de client, locația geografică, vârsta etc.
Sunt gestionate entități la nivel înalt, cum ar fi clienți, produse, articole, zone și altele. Datele sunt stocate într-un mod multidimensional, adică tabele de fapt și de dimensiuni.
Integrat
Toate datele din surse eterogene sunt consolidate pentru a garanta calitatea și curățenia acestora. Principalele surse de date sunt:
În funcție de tipul de utilizator.
-
- Operațional: produce o cantitate mare de date în fiecare zi, dar, în sine, are o relevanță redusă pentru analiza necesară. De exemplu, vânzările de produse.
- Mediu: generează date cu implicații pe termen scurt și mediu, pe baza datelor operaționale. Un bun exemplu al acestui concept este generarea de inventar.
- Managerial: folosește datele rezultate din procesul de integrare și transformare. La rândul său, generează informații noi. Practic se referă la utilizatorul Data Warehouse.
În funcție de zona sau departamentul organizației
-
- Domenii: Fiecare are responsabilități bine definite. Ei produc propriile date care sunt partajate cu celelalte zone.
- Subdiviziuni: De obicei sunt geografice. Acestea oferă date de localizare, care trebuie încorporate împreună cu celelalte.
Potrivit sursei
-
- Interne: își generează propriile date, provenind din activitățile zilnice ale companiei.
- Externe: completează datele interne, de exemplu recensămintele și statisticile.
Varianta în timp
Permite accesul la diferite versiuni ale aceleiași situații, deoarece datele actuale sunt stocate împreună cu datele istorice, în exemplele de depozit de date.

Nu volatil
Garantează stabilitatea informațiilor, deoarece odată ce datele intră, acestea nu se modifică. Adică datele sunt manipulate numai atunci când sunt introduse și când sunt consultate.
În rezumat, principalele calități ale Data Warehouse sunt:
Calități
Manipulează datele în volum, o consecință a acumulării de date istorice, actuale și agregate, din diverse surse.
Plasează întregul volum de date într-o singură bază de date centralizată. Structurați datele într-un mod multidimensional.
beneficii
Datorită caracteristicilor și calităților sale, Data Warehouse prezintă următoarele avantaje:
- Reduce timpul minim necesar pentru colectarea tuturor datelor relevante pe un anumit subiect.
- Oferă instrumente de analiză.
- Multe rapoarte și analize sunt definite de utilizator.
- Permite accesul direct, analiza și monitorizarea indicatorilor organizației.
- Ajută la identificarea factorilor care afectează funcționarea companiei.
- Permite avansarea și determinarea comportamentului viitor al instituției.
- Utilizatorii pot interoga date rapid și ușor.
Pe scurt, Data Warehouse ajută organizația să răspundă la întrebări esențiale pentru luarea deciziilor. Acest lucru obține beneficii competitive care își optimizează poziția pe piața pe care activează. Unele dintre aceste întrebări sunt:
- Care este profilul clienților?
- Cum este comportamentul lor?
- Care este profitabilitatea afacerii?
- Care este riscul pentru organizație?
- Ce servicii și produse folosiți și cum le puteți crește?
Domeniul de aplicare
Un Data Warehouse poate fi adaptat oricărei organizații, indiferent de dimensiunea și complexitatea acesteia. Aceasta este o consecință a agendei oricărei instituții, companii sau organizații atunci când iau decizii pertinente cu privire la datele pe care le produce.
Riscuri de aplicare
Necesită o investiție mare din partea organizației. Beneficiile implementării sale nu se văd pe termen scurt, ci pe termen mediu și lung.
Manipularea datelor amenință manipularea datelor sensibile.
Aspecte de luat în calcul
După cum sa menționat la început, există mai multe aspecte care trebuie luate în considerare pentru aplicarea acestor elemente pentru utilizarea unui server. Printre acestea putem menționa următoarele:
Costuri de aplicare
Un depozit de date suportă costurile de construcție, exploatare și asistență. Costul de construcție implică costurile resurselor umane, timpului și tehnologiei, în timp ce cel al funcționării și întreținerii include costurile de evoluție, creștere și cele produse de schimbările în originea datelor.
Impactul asupra oamenilor
Aplicarea unui Data Warehouse generează întotdeauna așteptări în utilizatori, care vor trebui neapărat să dobândească noi abilități. Succesul acestui tip de date depinde de utilizarea activă și de feedbackul utilizatorilor.
Impactul asupra proceselor de afaceri și de luare a deciziilor
Odată cu aplicarea unui Data Warehouse, pot fi expuse anumite deficiențe în procesele de afaceri, dar în același timp crește încrederea în deciziile luate pe baza rezultatelor obținute de acesta.
Arhitectură
Arhitectura generală a unui exemplu de depozit de date este prezentată în figura de mai sus. După cum se poate observa, acest sistem implică o serie de interacțiuni între componentele sale. În acest sens și ca rezumat, funcționarea sa poate fi descrisă după cum urmează:
- Datele sunt preluate din diverse surse, cum ar fi servicii web, fișiere și alte baze de date, atât interne, cât și externe.
- Odată ce datele sunt extrase, acestea sunt integrate, transformate și curățate, pentru a fi ulterior încărcate în Data Warehouse.
- Pentru a genera informații tactice și strategice, rapoarte și analize sunt obținute din încărcarea datelor.
- În cele din urmă, utilizatorii pot consulta și explora rapoartele și analizele generate.
Element
Acum vom descrie câteva dintre elementele care pot fi evaluate în Data Warehouse care ar trebui luate în considerare.
Surse de depozit de date
În general, acestea sunt rezultatul activității zilnice a companiei, caz în care sunt denumite surse interne. Când datele sunt preluate, de exemplu, de pe servere web, acestea sunt considerate surse externe. Sunt diferite între ele, deoarece depind de originea, formatul, funcția etc.
Extracție, transformare și încărcare
Cunoscut sub numele de ETL, este procesul care include toate sarcinile care sunt efectuate de la obținerea datelor până când sunt încărcate în Data Warehouse. Acestea sunt: extragerea, manipularea, controlul, integrarea, curățarea datelor, încărcarea și actualizarea.
Extracţie
Include tehnici axate pe obținerea, din diverse surse, numai a datelor relevante și păstrarea acestora în stocarea internă. Acest tip de stocare permite manipularea datelor fără a interveni sau modifica sursele sau Depozitul de date cu mai multe date, creând un strat de extracție între citire și încărcare, stocarea și gestionarea metadatelor generate în proces și facilitarea integrării.
Extracția se bazează pe nevoile utilizatorilor și cerințele definite pentru soluție.
Transformare
Acestea sunt tehnicile însărcinate cu compatibilizarea diferitelor formate, precum și cu filtrarea și clasificarea datelor, precum și cu relatarea surselor.
Această funcție este responsabilă pentru aplicarea tuturor comenzilor adecvate în legătură cu datele, pentru a le promova într-un mod puternic și rezonabil, care este compatibil și coerent cu Data Warehouse. În plus, este responsabil pentru curățenia și calitatea datelor.

sarcină
În ceea ce privește tehnicile de încărcare inițială a datelor și actualizarea periodică a Depozitului de date.
- Încărcarea inițială se referă la prima încărcare de date pe care o primește Data Warehouse. În general, consumă foarte mult timp datorită numărului mare de înregistrări aparținând perioadelor lungi de timp.
- Actualizarea periodică se referă la inserarea unor volume mici de date. Obiectivul dvs. este să adăugați la eșantionele de depozite de date numai acele date generate de ultima actualizare. Depinde de nevoile și cerințele utilizatorului.
Pe scurt, prin procesul de încărcare a datelor, întreținerea Data Warehouse este garantată.
Pe scurt, se poate spune că procesul ETL se desfășoară după cum urmează:
- Datele, odată extrase din sursele relevante, sunt depozitate în stocarea internă.
- În timp ce datele sunt păstrate în stocarea internă, acestea sunt integrate și transformate.
- Când datele sunt curățate, după pasul anterior, acestea sunt transmise la Data Warehouse.
rapoarte
Rapoartele sunt instrumente grafice care permit utilizatorului să obțină rapoarte detaliate despre informațiile companiei dvs. Modul de interacțiune cu aceste rapoarte este destul de simplu pentru utilizator, deoarece acestea sunt instrucțiuni ușor de urmat. Practic, trebuie să selectați opțiuni dintr-un meniu, referindu-vă la condițiile și specificațiile subiectului prezentat.
OLAP
Este cea mai puternică componentă a Data Warehouse, deoarece conține motorul de interogare multidimensional specializat al sistemului.
Permite analiza organizației din diferite scenarii istorice. Acesta își proiectează comportamentul și evoluția dintr-o viziune multidimensională, adică prin combinarea diferitelor perspective, subiecte de interes sau dimensiuni. Acest lucru permite deducerea tendințelor descoperind relații între perspective care ar fi greu de găsit la prima vedere.
Data Mining
Este în primul rând un instrument statistic, prin care se pot face predicții. Este vorba despre deducerea comportamentelor, fără a exista reguli prestabilite. Acesta generează rapoarte sub formă de tabele și grafice, printre altele, care promovează luarea deciziilor într-un mod proactiv. Funcționează pe baza informațiilor care au fost deja procesate complet.
Diferența dintre OLAP și Data Mining
Odată ce au fost luate în considerare principalele aspecte ale OLAP și Data Minig, se poate stabili o diferență de bază între ele.
- Folosind OLAP, situația actuală a companiei este interpretată, oferind răspunsuri rapide care facilitează luarea deciziilor.
- Data Minig prezice situații, bazate pe studiul cunoștințelor ascunse care provoacă anumite tipuri de comportamente.
În consecință, ambele sisteme se ocupă de rezolvarea diferitelor tipuri de situații analitice.
Data Minig și relația sa cu Data Warehouse
Un sistem Data Minig este o tehnologie de suport pentru utilizatorul final, al cărui obiectiv este de a extrage informații utile din informațiile conținute în baza de date a companiilor. Cu alte cuvinte, originea informațiilor utilizate de algoritmii Data Minig este de obicei datele istorice conținute într-un Data Warehouse.
Trebuie să existe o integrare între tehnicile Data Minig și procesele implicate în Data Warehouse. Adică, pentru a putea efectua analiza de afaceri, trebuie să existe un acord între Data Minig, Data Warehouse și serverul OLAP.
De fiecare dată când Data Warehouse oferă noi rezultate, compania poate aplica din nou Data Minig pentru a optimiza luarea deciziilor.
Pe scurt, Data Minig și Data Warehouse sunt instrumente complet compatibile. Data Warehouse oferă memorie și informația Data Minig.
Baze de date tradiționale vs Data Warehouse
Analiza aspectelor expuse până acum ne face să înțelegem că un Data Warehouse diferă de bazele de date care susțin tranzacțiile zilnice ale organizațiilor. Aici diferențele de bază
- În bazele de date tradiționale, informațiile sunt organizate astfel încât să poată fi recuperate și actualizate cu ușurință. Un Data Warehouse este organizat și orientat către utilizatorul final, care poate face doar întrebări.
- Bazele de date tranzacționale se ocupă de procesarea zilnică a datelor. Data Warehouse funcționează cu date istorice, adică corespunzătoare unor perioade lungi de timp.
- Bazele de date tradiționale sunt accesate de mai multe ori pe parcursul unei zile lucrătoare. Într-un depozit de date, citirile și interogările sunt minime, deoarece este accesat sporadic.
- Volumul de date gestionat de un Data Warehouse este mult mai mare decât cel gestionat în bazele de date tradiționale.
- Structura bazelor tranzacționale este stabilă. Structura unui Data Warehouse variază în funcție de propria evoluție și utilizare.
În continuare, vom stabili câteva Exemple de Data Warehouse.
Exemple de depozite de date
O companie la nivel național, dedicată vânzării produselor de curățare către comerțul cu ridicata și cu amănuntul, considerată, de asemenea, de dimensiuni medii pentru volumul său de vânzări, are ca obiectiv principal să-și maximizeze profiturile. În mod similar, pentru a obține mai mulți clienți, doriți să vă extindeți la un nou nivel de piață și, mai târziu, să vă extindeți linia de produse. Una dintre politicile sale principale este îmbunătățirea continuă pentru a obține o poziție mai bună față de concurenții săi din eșantioanele de depozite de date.
Aplicarea unui Data Warehouse oferă următoarele avantaje organizației.
- Permite utilizatorilor să aibă o imagine de ansamblu asupra afacerii.
- Transformați datele operaționale în informații analitice, axate pe luarea deciziilor.
- Generați rapoarte dinamice care vă facilitează analiza.
- Facilitează formarea de strategii pentru îndeplinirea obiectivelor organizației.
- Beneficiază de stabilitatea structurii companiei.
Un alt exemplu de depozit de date zilnic se referă la gestionarea unei instituții de învățământ, care are deficiențe în ceea ce privește comunicarea cu studenții săi. În mod similar, îi lipsește un centru de informații unificat care să aibă toate informațiile lor. Obiectivul instituției este de a însoți studenții pe parcursul carierei și după absolvire, de a oferi noi propuneri care să îmbunătățească performanța organizației și dezvoltarea studenților.
Cu aplicarea unui Data Warehouse, încercăm să răspundem nevoilor universității. În principiu, eliminarea duplicării informațiilor și prezența detaliilor eronate despre elevi, precum și a tuturor informațiilor care, în general, sunt considerate de calitate slabă și care nu sunt relevante. În plus, toate informațiile sunt integrate, formând o evidență unificată a studenților care servește ca bază pentru dezvoltarea corectă a proiectului instituției.
În cele din urmă, activitățile de marketing sunt promovate, oferind universității beneficii mai mari și contribuind la creșterea acesteia prin gestionarea corectă a informațiilor.
În concluzie, în exemplele de depozit de date oferă posibilitatea de a ști ce se întâmplă în organizație, ce s-a întâmplat, ce se poate întâmpla și de ce. Puteți vedea articolul tipuri de viruși informatici.



