|
Data WareHouse
La possibilità di utilizzare un
magazzino dei dati come supporto automatico alle decisioni aziendali rappresenta la
soluzione reale di quello che può essere considerato il sogno nel cassetto del manager.
Questo magazzino dei dati, che definiamo Data WareHouse, deve essere in grado di combinare
e sintetizzare i contenuti di estese, eterogenee e variegate mole di dati. Il Data
WareHouse fa parte dellinsieme più ampio rappresentato dai sistemi informativi
direzionali.
Come già menzionato durante
lintroduzione, le nuove strategie di mercato, linternazionalizzazione e la
crescita esponenziale delle informazioni connesse allosservazione a monte dei
fenomeni esterni e interni allimpresa, hanno favorito una complicazione
dinterpretazione a valle, di quei processi legati a eventi in grado di influenzare
il buon andamento dellimpresa. Il mercato, di conseguenza, privilegia le imprese in
grado di reagire in tempi brevi alle proprie richieste. Le imprese si trovano quindi
obbligate a migliorare i processi collegati al time-to-market, allimmagine aziendale
ed alla soddisfazione delle esigenze dei clienti.
In questo contesto il ruolo
dellInformation Tecnology è notevolmente cambiato. Se da un lato cerca ancora di
fare le cose al minimo costo compatibile con la qualità richiesta, dallaltro
diventa strumento essenziale per offrire un migliore servizio alla clientela e promuovere
lo sviluppo (inventarsi nuovi prodotti, nuovi servizi e più in generale nuove attività
di business).
Ruolo IT nel
passato |
Ruolo IT nel
futuro |
Migliorare
lefficienza dei processi |
Migliorare il
processo decisionale |
Acquisire e
distribuire i dati aziendali |
Creare una
conoscenza diffusa in azienda |
Elaborare le
transazioni del cliente |
Creare un legame
di intimità col cliente |
Supporto agli
operativi |
Trasformare i
dipendenti in "operatori della conoscenza" |
Diffondere le
informazioni tra i diversi livelli decisionali |
Diffondere le
informazioni abbattendo i livelli gerarchici |
Ridurre i costi |
Incrementare i
profitti |
Tabella 7 - I ruoli dell'IT
nel passato e nel futuro
Il tentativo di rifiutare ladeguamento
organizzativo per mancanza di volontà o per paura del cambiamento crea dei gravi ritardi
nei confronti dei principali concorrenti del settore. Trovarsi con un sistema informativo
non adeguato o comunque tecnologicamente obsoleto comporta, nel peggiore dei casi, il
fallimento di qualsiasi azione competitiva e successivamente la crisi dellimpresa.
Prendendo in considerazione le modalità
operative delle migliori organizzazioni imprenditoriali, è facile riscontrare in molti
casi che, tra le variabili di successo, spicca la maggiore sensibilità verso la
conoscenza estesa e approfondita delle informazioni possedute. In altre parole è
possibile riscontrare, allinterno delle aziende di maggiore successo, una cultura
imprenditoriale di fondamentale importanza per la promozione di tecnologie avanzate volte
a valorizzare tutte le informazioni che vengono prodotte, elaborate e gestite
allinterno dellazienda. Lobiettivo è quello di "analizzare le
informazioni per ricavare altre informazioni" che costituiscano una base di
conoscenze utile per le decisioni strategiche ed operative.
Le informazioni aziendali
hanno lo stesso valore dei soldi contanti
In questa direzione fanno ben sperare le
stime di crescita e le proiezioni recentemente rilevate. Infatti risulta che il fatturato
di questo mercato tende ad avere previsioni con un tasso incrementale intorno al 30%
annuo. Combinando questi dati con altri che mostrano una forte riduzione dei costi di
progetto è possibile ottenere un segnale che pone in risalto la consapevolezza mostrata
dalle imprese nei confronti di un utilizzo più esteso di questi sistemi.
Con questi presupposti è chiaro che la
realizzazione di progetti di data warehouse potrebbe interessare svariati settori
aziendali, primi fra tutti quelli legati alla definizione e alla misurazione di nuove
iniziative di marketing verso la clientela, seguiti dal controllo delle vendite, economico
e finanziario, della produzione e della distribuzione e della gestione dellimpresa.
Oltre allutilizzo tipicamente commerciale degli strumenti di data warehousing
risulterà molto importante valutare soluzioni analoghe nel settore della pubblica
amministrazione e del no profit.
Più in generale, un efficace utilizzo del
"magazzino dei dati" può dare significativi risultati, nei casi in cui si renda
necessario fare del "datamining", ossia analisi più spinte rispetto a
quelle rese disponibili dai normali database. In pratica, la "escavazione dei
dati" può consentire di ottenere preziose indicazioni, che risultano
dallestrazione delle caratteristiche salienti delle informazioni e della
correlazione di queste con altre importanti variabili, per mezzo di tools software ad hoc
presenti in commercio.
In questa direzione è possibile adottare
essenzialmente due strategie:
- lintroduzione di pacchetti gestionali integrati o
Enterprise Resource Planning (ERP)
- la realizzazione di sistemi informativi di supporto alle
decisioni.
Le applicazioni ERP sostituiscono i vecchi
sistemi transazionali e si caratterizzano per il loro supporto ai processi rispetto alle
funzioni di business. In altre parole lazienda viene vista come un insieme di
processi integrati e trasversali, contrapposta al modello classico di azienda per
funzioni. Lorientamento a comprare allesterno questi sistemi piuttosto che
costruirli in case è uno degli elementi tipici di queste soluzioni. Lacquisto si
basa soprattutto sul valore aggiunto apportato al business in termini principalmente di
riduzione dei costi legati alla loro introduzione.
I sistemi informativi direzionali coprono le
esigenze di controllo interne ed esterne ad unazienda e hanno lo scopo di assistere
chi decide. Un sistema informativo direzionale è un sistema complesso caratterizzato d
diverse componenti: persone, dati, principi, mezzi tecnici e procedure.

Figura 13 - Componenti
del sistema informativo
Questi sistemi non possono essere acquistati
allesterno, perché si identificano troppo col modo di porsi sul mercato e di
competere della singola azienda.
I vantaggi del DWH si possono riassumere
facilmente utilizzando le seguenti relazioni:
- VANTAGGI AUTOMAZIONE = RIDUZIONE
COSTI
- VANTAGGI INFORMAZIONI =
| RIDUZIONE COSTI + |
| CRESCITA FATTURATO
(nuovi
prodotti e nuovi mercati) + |
| RIDUZIONE DEI RISCHI
(maggiore
controllo e flessibilità) |
In altre parole i sistemi informativi
direzionali ed in particolare il Data Warehouseing hanno lo scopo di superare i limiti dei
sistemi tradizionali (mancanza del supporto alle interrogazioni estemporanee e complesse,
al lancio dei nuovi prodotti, al controllo qualità ed alle nuove opportunità) e dare un
reale supporto a chi in azienda decide o contribuisce a decidere le strategie, le verifica
nel tempo e le adegua ai cambiamenti sempre più repentini dellambiente esterno ed
interno allazienda.
Ricordando la visione di Galbraith, che
teorizzò la necessità di maggiori informazioni in ambiente incerto e turbolento, è
possibile dire che questi nuovi strumenti tecnologici soddisfano al meglio la necessità
di aumentare la capacità elaborativa delle informazioni.
Concetti fondamentali
Il Data Warehouse rappresenta un nuovo
approccio per fornire accesso alle informazioni dellimpresa con lo scopo di trovare
risposta alle richieste degli utenti di maggiore livello. Lapproccio tradizionale di
analisi dei dati si fonda sulluso di strumenti semplici, basati su un linguaggio
naturale o formale come SQL, per effettuare interrogazioni (query). Questo approccio
tuttavia diventa inefficiente su grandi quantità di dati. Un approccio più moderno è
quello denominato On Line Analytical Processing (OLAP), che si basa sulla predisposizione
di una vasta gamma di query che sintetizzano i dati in base alle regole aziendali. Olap è
più rapido perché si basa su dati precedentemente sommati e pertanto più vicini alle
richieste degli utenti. Il rischio è quello di scartare dati di dettaglio di eventuale
interesse. Per evitare questo rischio è possibile utilizzare appostiti tool di Data
Mining, che consentono analisi più approfondite sfruttando tecniche sviluppate nei campi
della statistica e delle macchine learning, per esempio le reti neurali.
Tutti questi moderni approcci
allanalisi e modellazione si basano sullesistenza di un magazzino dati
capiente e ben fornito, il Data Warehouse. Per sfruttare a pieno il valore dei dati in
possesso delle aziende è necessario che questi siano modellati nel modo più semplice
possibile per lutilizzo da parte dellutente. Come è note la maggior parte
delle informazioni entrano in azienda attraverso procedure operative, che raramente sono
state concepite per organizzare i dati come base di conoscenza e supporto decisionale. Per
questo motivo i principi alla base dei sistemi di Data Warehouse sono rivolti alla forte
interazione col dato da parte dellutente sia in sintesi che in dettaglio, la
disponibilità di serie storiche dei dati, elevate prestazioni per ogni tipo di
interrogazioni estemporanea e una visione univoca del significato dei dati presenti nel
Data Warehouse.
I concetti
chiave del DWH possono essere sintetizzati in:
Fornire una visione consistente
delle informazioni dellimpresa
Lattuale situazione delle imprese:
- ambienti informativi eterogeni (hardware e sistemi operativi
diversi, database non compatibili, ecc.)
- differenti interpretazioni dei dati allinterno
dellimpresa
- impossibilità di accedere alle sorgenti informative esterne
allimpresa
- analisi statistiche effettuate su dati limitati
Fornire risposte agli utenti di
alto livello senza lassistenza dei tecnici.
Lattuale situazione delle imprese:
- utilizzo di rigidi report cartecei per la gestione strategica
- gli utenti hanno necessità di accedere alle informazioni
tempestivamente
- la crescita degli investimenti in IT non ha fornito risposta
ai punti precedenti
Come funziona
Una delle ragioni per cui i concetti del DWH
sono diventati molto importanti consiste nella grande diffusione di strumenti
client/server e dalla disponibilità di macchine per lelaborazione parallela.
DWH è in effetti una soluzione basata su
computer funzionanti in rete, i dati operativi sono immagazzinati su uno o più computer
server e il data warehouse è gestito da un database server molto potente a cui gli utenti
accedono via rete.
I singoli componenti hanno raggiunto una
maturità tecnologica nel corso degli ultimi dieci anni e i responsabili dei sistemi
informativi hanno già acquisito tutte le conoscenze necessarie per utilizzare
singolarmente questi strumenti.
Vediamo in dettaglio i componenti necessari
per adottare una soluzione di Data Warehouse.
I componenti del DWH
Nella Figura 14 sono stati evidenziati i
componenti utilizzati in una soluzione di DWH e le interazioni esistenti.
Allinterno dellazienda esistono
molti "depositi di informazione" eterogenei, inconsistenti, ridondanti e
talvolta incompleti. Le analisi che possono essere condotte su questi tipi di dati
risultano essere incomplete e circostanziate a singoli micro-obiettivi.
Le principali fonti informative da cui è
possibile prelevare informazioni utili per il DWH sono i sistemi legacy, i dati delle
applicazioni desktop di office automation (database desktop, fogli elettronici, documenti,
presentazioni, oggetti multimediali, ecc.) e potenzialmente tutti i documenti che vengono
prodotti allinterno dellazienda o vengono ricevuti dallesterno (fax,
offerte, comunicati stampa, posta elettronica semistruttura e strutturata, ecc.).
Una volta individuato linsieme di
questi sistemi informativi è possibile utilizzare dei tools di estrazione e/o pulizia dei
dati per renderli omogenei ed introdurli nel database di destinazione. Nei primi progetti
di DWH questa operazione di conversione e "pulizia" dei dati veniva eseguita
una-tantum. La conseguenza era quella di poter effettuare le analisi su dati che non
sempre erano aggiornati. Attualmente i prodotti software di estrazione consentono di
effettuare estrazioni on-line, consentendo di eseguire interrogazioni basate su
informazioni sempre aggiornate.
Una volta realizzata la struttura del DWH e
creata linfrastruttura per alimentarne i contenuti è possibile sviluppare
linterfaccia, detta anche Front End, utilizzata per accedere a questo
"magazzino di dati". Il fattore critico principale di questultimo
componente è costituito dalla semplicità di utilizzo. I dirigenti e gli impiegati di
maggior livello aziendale sono infatti i principali utilizzatori di questi strumenti, ma
solitamente non amano "perdere tempo" con strumenti software complicati da
utilizzare.

Figura 14 - I componenti
del DWH
Database sorgenti
- informazioni gestite da tutti i sistemi di supporto operativo
- informazioni provenienti da sorgenti di dati esterne
- vari database relazionali o flat files (come i fogli
elettronici di Microsoft Excel)
- le basi dati delle applicazioni OLTP (on line transaction
processing)
Tools per lestrazione e trasformazione
dei dati
- utility per estrarre, pulire, unificare e trasformare i dati
provenienti dalle sorgenti di dati
- sistemi di replicazione dei dati
- driver per la connettività alle diverse sorgenti di dati
- sistemi di modellazione dei dati per gestire il modello dei
dati presenti nei database sorgenti e destinazione
- repository dei metadati (dove vengono memorizzate le
descrizioni dei dati, le sorgenti e le regole di trasformazione)
Database di destinazione: DataWareHouse
- alta capacità di memorizzazione
- supporto per le stored procedure (sono programmi immagazzinati
sul database server pre compilati e composti da una serie di comandi SQL. In molti casi
possono incrementare la velocità delle interrogazioni del 100%. Le stored procedures
possono essere utilizzate per bilanciare la logica applicativa tra il client e il server
nella programmazione client/server. Questo viene effettuato programmando complessi
aggiornamenti ed interrogazioni direttamente sul server, permettendo al client di
effettuare semplicemente una chiamata)
- speciali sistemi di indicizzazione
- tecniche di ottimizzazione delle query (interrogazioni)
- monitor dei dati per valutare la crescita, la frequenza delle
cancellazioni ecc.
Tools di accesso alle informazioni (front
end)
- facili da usare e con interfaccia grafica
- flessibilità nellanalisi dei dati
- supporto agli standard più diffusi (OLE Object Linking and
Embedding, ODBC Open DataBase Connectivity e SQL)
- architettura client/server
- sistemi di sviluppo rapido (RAD rapid application development)
Estrazione dei dati
Per lestrazione dei dati è possibile
utilizzare strumenti già presenti in commercio e aperti agli standard come i database
relazionali di Oracle, Ingres, Informix, Sybase, Microsoft o IBM. I vantaggi di scegliere
una soluzione commerciale aperta agli standard sono:
- la possibilità di utilizzare le potenti funzioni di
replicazione dei dati comprese in questi prodotti
- il costo relativamente contenuto delle licenze software di
prodotti commerciali
- le performance elevate dei prodotti RDBMS (Relational DataBase
Management System)
Questa soluzione aperta agli standard è poco
funzionale in ambienti eterogenei, in cui convivono software e hardware differenti e
formati di dati con logiche profondamente variabili.
In queste realtà è possibile valutare la
scelta di prodotti specifici per lestrazione dei dati come Info Pump. I vantaggi di
questa soluzione sono:
- avanzate funzioni di estrazione con molti parametri
personalizzabili
- ottimizzazione per ambienti eterogenei
- interfacce costruite per accedere a database diversi
contemporaneamente
I problemi connessi con questa soluzione
sorgono dai costi elevati di acquisizione e dalla complessità di questi prodotti
software, per i quali è necessario prevedere adeguati percorsi formativi.
Database di destinazione
Anche in questo caso è possibile adottare
una soluzione conforme agli standard. La scelta di un database commerciale è in questi
casi fondamentale. I vantaggi connessi alla scelta di un RDBMS sono:
- alta capacità di memorizzazione
- know how già presente in azienda nei confronti di questi
strumenti
- supporto per le stored procedure
- supporto per lelaborazione parallela, specialmente per
lelaborazione degli indici
Il principale svantaggio di scegliere un
database commerciale è rappresentato dalla complessa modalità di interrogazione. Infatti
per interrogare un database server standard è necessario utilizzare lSQL. Sarà
quindi necessario sviluppare applicazioni personalizzate che astraggano la logica del
database per consentire un accesso più naturale per gli utenti di alto livello.
I database server moderni hanno sviluppato
alcune funzionalità per supportare soluzioni in questa direzione. Sono nati in questo
senso due nuovi operatori del linguaggio SQL (Structure Query Language): Cube e RollUp.
Questi comandi consentono laggregazione dei dati per realizzare report e analisi su
base multidimensionale. Insieme a questi operatori vengono supportate le funzioni di
"data piping" che permettono di recuperare dati da più fonti e di consolidarli
in un Data Warehouse. Grazie ha questi strumenti di gestione dei dati è possibile attuare
una corretta e rivoluzionaria gestione del patrimonio informativo presente (spesso
passivamente) nel sistema informativo aziendale, consentendo di aumentare le capacità
decisionali e operative allo scopo di migliorare la qualità dei beni e dei servizi
offerti dallimpresa.
Tra i database server commerciali è
indispensabile ricordare Oracle, Informix, Gupta, IMB DB2, Microsoft SQL, Sybase, Adabas
quali leader del mercato.
Una soluzione alternativa ai database
standard sono i database proprietari, mirati alla gestione dei data warehouse, come Pilot
Analysis Server o ComShare. Queste soluzioni software dispongono di funzionalità avanzate
per ottimizzare le interrogazioni e per supportare le decisioni strategiche. I vantaggi di
questa soluzione sono i seguenti:
- sofisticato engine per lottimizzazione delle
interrogazioni complesse
- gestione di strutture gerarchiche dei dati
- stretta integrazione con i tool di interrogazione e reporting
Gli svantaggi di questa soluzione
proprietaria sono i costi elevati e la mancanza di funzionalità tipiche dei database
standard, come le repliche ed il supporto per i Very Large DataBase (VLDB).
Front End
A fronte delle diverse esigenze
dellutente il mercato ha risposto fornendo vari tipi di soluzione, che coprono in
modo più o meno ampio le potenziali richieste. Talli soluzioni vengono classificate, in
base alle funzioni coperte, come tool di query & reporting, di On Line Analytical
Processing (Olap) e di Data Mining. Nel loro complesso vengono normalmente indicate come
soluzioni di Business Intelligence (BI). Purtroppo quando si descrive un prodotto è più
facile che si tenti di associarlo a una di queste categorie piuttosto che comprendere
quali necessità effettivamente soddisfa. E importante invece sottolineare che la
scelta di uno strumento non può derivare che da una approfondita analisi delle esigenze
informative di chi lo utilizza. Non esiste lo strumento migliore, ma il più adeguato, in
funzione alle tematiche di interesse, alla funzioni disponibili, al grado di
personalizzazione ed ai costi di acquisto.
Nel passato (anni 70 e 80) le
richieste degli utenti erano strettamente legate ad un accesso diretto e semplificato ai
dati attraverso strumenti che permettessero lespressione di richieste strutturate ed
esplicite. Levoluzione verso sistemi dedicati come i PC e le Workstation con
interfaccia grafica, lintroduzione ed il potenziamento dei fogli elettronici
(estremamente dotati per fare simulazioni, ma anche per costruire modelli matematici di
media complessità), la loro programmabilità e la loro integrazione con prodotti di
gestione dati DBMS ha sicuramente complicato la vita a chi intendeva classificare
rigidamente i prodotti di analisi e supporto decisionale rispetto alle funzioni coperte.
Non vi è dubbio infatti che in questa categoria possano rientrare anche prodotti come
Lotus 1-2-3 e Microsoft Excel.
I tool per sviluppare il front end di accesso
al data warehouse sono suddivisi essenzialmente in tre categorie a seconda del grado di
personalizzazione che si intende raggiungere nella soluzione informatica.
- Tool di sviluppo C/S
(PowerBuilder, Visual Basic, Delphi,
Visual FoxPro, ecc.), raccomandati per sviluppare soluzioni altamente personalizzate, in
breve tempo ma con requisiti di conoscenza molto elevati.
- Tool di interrogazione per utenti finali
(Forest &
Trees, Business Objects, ...). Questi tool supportano interrogazioni molto flessibili e
potenti funzioni di report. Consentono agli utenti di accedere ai database senza
lintervento di tecnici specializzati. Solitamente vengono utilizzati per semplici
interrogazioni su dati atomici senza concedere la possibilità di ulteriori aggregazioni e
analisi dei dati.
- EIS/DSS
(Decision Support System) come Pilot Desktop,
Designer e ComShare. Vedi anche Sistemi di supporto alle decisioni a pagina *. Questi tool sono molto costosi ma consentono di effettuare
complesse analisi multidimensionali sulle informazioni presenti nel DWH. Consentono di
effettuare laggregazione multidimensionale, la riorganizzazione e il consolidamento
dei dati. Questi strumenti vengono utilizzati per produrre sofisticate analisi finanziarie
e di business in genere. In alcuni casi consentono lelaborazione on-fly sui dati e
lo sviluppo di piccole applicazioni personalizzate.
- Tool per il Data Mining
come Pilot Discovery Server.
Questi tool sono molto particolari in quanto consentono di identificare informazioni
basandosi su ipotesi e domande iniziali. Questi prodotti generano in output lanalisi
di tutti i dati significativi. Anche in questo caso però le applicazioni sono molto
complesse da imparare e molto costose.
OLAP
Una semplice definizione di OLAP potrebbe
essere quella di unao strumento per lanalisi rapida di informazioni distribuite e in
forma multidimensionale.
In particolare una soluzione Olap deve
integrare tre funzioni: interrogazione (querying), generazione di prospetti (reporting) e
analisi. Con riferimento alle anlisi quelle comunemente impiegate sono di due tipi: slice
and dice e drill down. Il primo tipo permette di segmentare i dati e quindi di
esaminarli per gruppi omogenei. Il secondo permette di navigare nei dati ed esaminarli a
diversi livelli di dettaglio. Ovviamente le fasi di querying e analisi sono normalmente
iterative, nel senso che si procede a individuare un primo insieme di dati di interesse,
su cui si produce unanalisi che porterà a una ulteriore interrogazione e così fino
a quando un certo argomento non è stato completamente compreso. Quel punto è probabile
che venga generato un prospetto in cui si descrive (con tavole, grafici e commenti) il
percorso mentale intrapreso e linterpretazione per quel fenomeno. Uno strumento Olap
apparirebbe come tipicamente induttivo (cerco, esplorando i dati, una risposta ai miei
perché e quindi una spiegazione ai fatti che sto studiando), in realtà esso prevede, per
poter essere utilizzato con semplicità, lesistenza di una o più viste dei dati
aziendali che racchiudono buona parte delle regole interpretative. Questa attività
preliminare è però normalmente a carico dellamministratore dei dati (Data
Administrator) che ha appunto lonere di delineare il modello di riferimento (approccio
deduttivo) allinterno del quale lutente finale compie le sue esplorazioni
(approccio induttivo). Seppure esistono similitudini con ciò che abbiamo definito
come Data Mining, in realtà gli strumenti di analisi messi a disposizione nella ricerca
di correlazioni e regole nei dati è profondamente diverso nei due casi. Nel Data Minign
si utilizzano metodologie specifiche che richiedono (almeno nella fasi di impostazione
dellanalisi) la presenza di specialisti, ma ovviamente permettono un approccio più
scientifico e robusto nellindividuazione di modelli. Viceversa una soluzione Olap
permette un modo di operare semplice e intuitivo, ma meno strutturato e più dispersivo.
Inoltre va ricordato che la quantità di dati su cui effettuare lesplorazione deve
essere contenuta, imponendo così sintesi preliminari che presumono lesistenza di un
modello almeno parzialmente esplicativo dei dati.

Figura 15 - Attori di
un sistema decisionale
Progetto di un Data
WareHouse
Come in precedenza analizzato per i progetti
di groupware, progettare un sistema di data warehouse significa dare vita a un processo
che coinvolge a tutto campo limpresa in una visione progettuale dinsieme atta
a determinare gli obiettivi che si intendono raggiungere con lutilizzo di questi
potenti strumenti. Durante lo studio di fattibilità è opportuno mettere in bilancio un
impegno di almeno due o tre anni di lavoro ed un congruo investimento che può raggiungere
anche lordine di spesa di un miliardo. Va ricordato poi che esiste una possibilità
iniziale di rischio che è in grado di attenuare gli obiettivi iniziali. Il rischio
principale consiste nelladottare le tecniche utilizzate per lo sviluppo dei
tradizionali sistemi informativi senza adeguarsi alle necessità organizzative richieste
dai progetti di data warehouse.
I parametri di valutazione della criticità
di questi sistemi sono molteplici. Ad esempio, le prestazioni dei sistemi, potrebbero
rappresentare un elemento determinante nella risoluzione di complesse query che
trasversalmente arrivano ad interessare anche tutte le tipologie di dati aziendali. In
questo senso, una decisione potrebbe essere quella di orientare la scelta
dellhardware, verso piattaforme di tipo MMP (Massive Parallel Processing),
architetture di tipo parallelo.
Un altro importante capitolo del discorso sul
data warehouse riguarda le risorse umane. Per le ragioni finora esposte, potrebbe
risultare insufficiente uno livello di conoscenze basato sulla formazione di tipo ITC
quale gestore di un simile progetto. Quindi, la linea di tendenza determinante per
lassegnazione delle responsabilità di progetto, può privilegiare una nuova figura
aziendale che potremmo chiamare "data warehouse administrator", un esperto in
grado di associare ad una buona conoscenza del funzionamento dei sistemi informativi,
delle competenze manageriali e una buona conoscenza della nuova normativa riguardante la
tutela e la riservatezza dei dati personali (specialmente da quando è stata approvata la
legge sulla privacy 196/03) che, in particolare nel caso delle analisi di marketing può
costituire un problema.
Associando le competenze informatiche a
quelle più propriamente legate alla gestione dellimpresa, possono essere
individuati quegli indicatori di sintesi o "metadati", che rappresentano
lessenza delle informazioni aziendali distribuite, ritenute di fondamentale
importanza per operare rapide decisioni di tipo strategico.
Appare evidente che le vaste conoscenze
intersettoriali, la flessibilità e la capacità di governare grossi progetti sono i
requisiti indispensabili richiesti a tutti i componenti del gruppo di lavoro.
La corretta conduzione di un progetto di DWH
è fondamentale per evitare situazioni di parziale blocco, scostamenti tra le funzionalita
sviluppate e le esigenze degli utenti, inconsistenze nei dati e conseguenti problemi di
gestione delle informazioni.
Uno dei consigli principali da considerare
durante la progettazione di questi sistemi, è quello di utilizzare degli strumenti di
modellizzazione dei dati, che consentano di verificare il grado di coerenza tra gli
obiettivi che intendono essere raggiunti e le informazioni presenti in azienda. In altre
parole, questo può significare disporre di strumenti CASE tali da consentire di
individuare con esattezza i dati aziendali, assegnando loro un significato e una precisa
caratteristica del contenuto, una autorizzazione daccesso e un collegamento
relazionale con altri dati.
Linsieme di tutte le informazioni che
riguardano i dati e la loro composizione nei raggruppamenti, i cosiddetti metadati,
trovano domicilio nel repository, un grande contenitore in cui è possibile trovare
ogni genere di informazione relativa ai dati aziendali presenti nella banca dati
centralizzata. A fronte di un dato, il formato, la locazione e il tipo di accesso
richiesto rappresentano solo alcune delle informazioni presenti nel repository.
Il progetto di un data warehouse richiede
quindi molta attenzione nellanalisi del business al fine di identificare esattamente
tutte le informazioni richieste. Inoltre va ricordato che limplementazione di un
sistema di DWH può richiedere ingenti investimenti di tempo e denaro. Per questo motivo
è importante valutare anche il ritorno dellinvestimento.
I fattori critici
di successo di un progetto di data warehouse sono:
- chiara definizione dei requisiti informativi,
dei piano dei costi e analisi del ritorno dellinvestimento. Questi fattori
semplificano il controllo del piano di budget del progetto. Tutti devono essere
consapevoli che il progetto di DWH apporta un valore aggiunto allesistente sistema
informativo. Questo è determinante per trovare gli stimoli necessari per il successo del
progetto.
- forte orientamento alla soluzione di data
warehouse da parte di tutti gli utenti finali del progetto. E importante che il team
del progetto mantenga alta la partecipazione degli utenti, rendendoli partecipi
dellimplementazione del progetto. E determinante anche fornire gli skills
adeguati a tutti gli utenti.
- DWH non è un prodotto ma un progetto. Questo
significa che è necessario ricercare la "soluzione" migliore. Tale soluzione
deve incontrare perfettamente le esigente informative degli utenti finali. E
importante considerare che un sistema di DWH è un sistema dinamico in quanto dinamiche
sono le necessità informative degli utenti. Il business aziendale cambia in continuazione
e il DWH dovrà adeguarsi a questi cambiamenti nel modo più veloce possibile.
- implementare un progetto pilota. In un
progetto di DWH è opportuno sviluppare un sistema ridotto in cui alcuni utenti (quelli
notoriamente più preparati) possano valutare la corrispondenza con le esigenze
informative e le performance complessive del sistema. Una volta effettuate tutti i
collaudi necessari ed apportate tutte le modifiche e migliorie richieste dagli utenti del
gruppo pilota è possibile estendere facilmente il progetto allintera impresa.
- valutare attentamente la scelta della tecnologia e dei
partner. La scelta delle tecnologie più idonee al particolare progetto può far
risparmiare molto tempo, riducendo sostanzialmente i costi da sostenere. Lattuale
mercato offre molte possibilità nella scelta dei prodotti software e hardware.
Nelleffettuare la scelta è opportuno valutare i seguenti fattori: minimizzare
lattività di svilupo software per ridurre i tempi e gli errori; ridurre i costi;
massimizzare la flessibilità e le performance della soluzione; valutare attentamente la
facilità di utilizzo degli strumenti.
La complessità delle soluzioni di DWH
richiede le competenze di molti professionisti del mercato dellIT. E
attualmente impossibile disporre di persone che dispongano di tutte le conoscenze
necessarie per sviluppare soluzioni a livello dimpresa. Le scelte di partnership
strategica, dei professionisti IT e dei system integrator possono influenzare molto il
successo di un progetto di DWH.
Entrando nella fase più operativa del
progetto, sarebbe bello poter già disporre di una condizione di partenza per così dire
ideale, in cui i dati presenti nei vari sistemi informativi risultassero allineati al
livello qualitativo richiesto. Purtroppo, lesperienza insegna che molto spesso la
crescita indisciplinata dei sistemi informativi ha contribuito a lasciare degli scheletri
nellarmadio dei dati aziendali. Per questo motivo e probabile che prima di
iniziare a popolare il sistema di data warehouse, si renda necessaria unopera tale
di bonifica dei dati presenti nel database aziendale, da permettere di disporre di dati
consistenti ottenuti tramite successive operazioni di pulizia e aggiustamento, finalizzate
al caricamento di questi ultimi nel sistema di data warehouse stesso. In alcuni casi, una
destrutturazione e una semplificazione dei dati, può favorire le elaborazioni
multidimensionali che di solito caratterizzano elaborazioni su sistemi di data warehouse.
Non sempre queste attività di bonifica sono così specificatamente separate, può
capitare che la pulizia e laggiustamento dei dati avvenga nelle fasi di caricamento
dei dati sul sistema, grazie a funzioni ausiliarie di servizio che possono essere svolte
dagli appositi tools di caricamento. Un altro argomento che potrebbe essere affrontato nel
corso del progetto, può riguardare la correlazione esistente tra le informazioni presenti
su più banche dati. Questa possibilità richiede una particolare attenzione alla scelta
di prodotti di middleware tali da consentire il prelievo su più piattaforme, di diverse
tipologie di dati.
Quanto finora espresso, può rappresentare
solo una parte delle azioni che dovrebbero essere svolte per predisporre il set di
informazioni necessarie a far funzionare un sistema di data warehouse. Andando avanti,
unaltra delicata fase del progetto, contempla la scelta dei tools di accesso per
lutenza. Infatti, è questo il caso in cui, la fragilità del discorso, è legata al
modo in cui i tools di accesso scelti, possono influenzare il lavoro di creazione del data
warehouse. Questo significa che il lavoro svolto, del quale è ormai chiara la dimensione
e limpegno, potrebbe anche essere messo in seria discussione da una scelta non
propriamente calzante dei tools di acceso ai dati utilizzati dallutenza finale per
estrarre i metadati. Dal momento che il taglio delle informazioni che vengono prodotte è
sicuramente collocabile in una fascia di interesse aziendale medio-alta, è facile
individuare quali potrebbero essere i potenziali utenti finali e soprattutto quale
potrebbe essere la loro tipologia. Elementi con una cultura di tipo manageriale,
indipendenti, molto orientati agli obiettivi e con scarsissima disponibilità di tempo.
Perciò, è facile comprendere quanto la scelta di tools di accesso ai dati possa
risultare determinante, nel momento in cui risulti orientata verso quei prodotti che
lasciano intendere una interpretazione onnicomprensiva delle esigenze dellutenza, in
termini di query e report, fissate sul comun denominatore della semplicità duso. In
sintesi, potenza e facilità potrebbero essere le caratteristiche primarie incluse nella
offerta di soluzioni software proposte dai diversi fornitori di sistemi di data warehouse
per lutenza finale, per acquisire maggiori quote di mercato.
A questo punto, può risultare ancor più
chiaro quante e quali siano le variabili che possono condizionare il buon esito di un
progetto di data warehouse, tanto che è possibile comprendere i motivi per cui molte
organizzazioni intraprendono questa strada, procedendo secondo la teoria dei piccoli
passi, diluendo il problema con lavvio di realizzazioni che interessino un settore
aziendale alla volta. Nel comparto bancario , è possibile incontrare delle applicazioni
di data warehouse significative come quella realizzata da un importante istituto di
credito che, per approfondire ancor meglio la conoscenza della propria clientela, si è
dotato di un sistema data warehouse che permette di conoscere in tempo reale, i
cambiamenti nelle abitudini dei propri clienti e di modellare di conseguenza su queste i
propri prodotti e servizi. Di diversa applicazione, ma sempre basata sullutilizzo di
un sistema di data warehouse, è lapplicazione sviluppata da una nota banca per
effettuare il controllo di gestione in modo proficuo, cioè utilizzando i benefici che
può offrire una manipolazione elettronica dei dati anziché su supporto cartaceo.
Riassumendo è possibile affermare che il data warehouse rappresenta uno strumento di
avanzato livello tecnologico che esprime pienamente il passaggio dalla fase adolescenziale
a quella delletà adulta delle tecnologie informatiche e di telecomunicazione.
Le moderne imprese e organizzazioni non
possono non prendere atto del ruolo strategico delle informazioni, le tecnologie
informatiche e di comunicazione non possono rimanere fuori dai processi di business, le
trasformazioni socio economiche si rendono irrinunciabili, il cambiamento richiede una
gestione basata sullapplicazione del buon senso che è antitetica alla teoria del
"tutto e subito" propugnata da schieramenti opposti a quelli attuali negli anni
passati, ma comunque, clamorosamente fallita. In questo contesto, il data warehouse per
limpresa potrebbe risultare un salvagente per non affogare in profondi
"warehouse di guai".
Evoluzioni del Data WareHouse
I responsabili delle tecnologie
dellinformazione cercano da tempo di integrare le applicazioni dei sistemi legacy e
di ottimizzare le risorse su queste piattaforme. Diversi sono stati gli approcci, dal data
modelling allinformation engineering, con percorsi che forse sono stati più lenti
del previsto a rilasciare benefici e risultati tangibili. Un nuovo approccio è oggi
rappresentato dal data warehouse, che si sta rivelando un eccellente modo per spostere il
confine dellelaborazione operazionale negli ambienti transazionali. Uno scenario di
evoluzione del data warehouse propone infatti architetture conosciute come Operational
data Store, in grado di integrare i dati interni allambiente operazionale per
produrre decisioni sul breve termine, rispetto a quelle di un data warehouse tradizionale,
utile per decisioni meno immediate.
In sistemi data warehouse, lanalisi di
eventi di business può anche fornire meccanismi per lintegrazione con applicazioni
esistenti , che utilizzano informazioni su processi ripetitivi e codificati di analisi e
decisione. Un data warehouse può così trasformarsi in una nuova applicazione, in grado
di attivare componenti elaborativi che realizzano un processo di workflow o routine
generalizzato per la risoluzione dei problemi. Lautomazione della gestione di questi
eventi può far guadagnare in termini di efficienza o di ridotte operazioni manuali, come
nel caso di integrazione con i sistemi transazionali. Ladozione, in futuro, di
pacchetti decisionali in aree come la finanza, i servizi, i sistemi di distribuzione e
così via, richiederanno sempre più queste caratteristiche di integrazione con agenti di
distribuzione e di gestione delle eccezioni a fronte di eventi intercettati dal sistema
informazionale. Le soluzioni più adatte a supportare a basso costo questa interazione
sono le architetture di Decision Support System dinamiche: sistemi D.S.S. che consentono
interazioni personalizzate con i sistemi operazionali in seguito a un controllo avvenuto
sulle regole di business di un particolare processo.
Sistemi di
supporto alle decisioni
I processi elaborativi supportano
decisioni che possono essere di tipo strutturato o non strutturato. Le prime si
riferiscono a problemi ripetitivi, già incontrati e quindi è esistente una soluzione
preconfezionata o routine di risoluzione già definite. Le seconde invece si riferiscono a
problemi complessi in cui non esistono soluzioni pre-definite, occorre una gestione
"su misura" (custom solutions). In un problema strutturato sono ben note le
procedure per lottimizzazione e quindi decidere strategie di investimento ad esempio
richiede la massimizzazione dei margini o la focalizzazione in unarea di mercato. Un
altro esempio è costituito dalla pianificazione dei canali di distribuzione, dove
luso di una data warehouse serve a definire il valore relativo di differenti
strategie di distribuzione per prodotti. La gestione del rischio di mercato nelle
istituzioni finanziarie è strettamente legata agli sviluppi che potrebbero influenzare il
rischio , con scenari "what if" basati su dati storici. Decisioni non
strutturate si trovano nella pianificazione di nuovi servizi, nella scelta fra una serie
di progetti, nello sviluppo di nuovi prodotti o di responsabilità sociali. Le decisioni
strutturate comportano la trasformazione del mondo reale in strutture e modelli standard;
laddove questo non sia possibile, come nel caso del controllo manageriale e della
pianificazione strategica, è necessario realizzare un sistema DSS completo , in grado di
garantire il controllo operazionale e il controllo decisionale.
Caratteristiche dei sistemi
DSS
I sistemi DSS nella maggior parte dei casi
hanno le seguenti caratteristiche comuni:
- danno supporto e controllo in situazioni non strutturate o
semistrutturate, che richiedono giudizio umano per completare il ciclo operazionale;
- offrono supporto a decisioni interdipendenti e/o sequenziali;
- supportano tutte le fasi del processo (disegno, sviluppo,
realizzazione della decisione);
- sono adattativi, per consentire il confronto di condizioni
variabili e dinamiche;
- utilizzano modelli che consentono sperimentazione con
differenti configurazioni;
- quelli avanzati sono equipaggiati con componenti di conoscenza
che abilitano leffettiva soluzione.
I sistemi a supporto delle decisioni
interdipendenti e con iterazione diretta con i sistemi transazionali esistenti, sono
quelli che in termini di accuratezza delle informazioni, facilità di costruzione con
tecnologie esistenti e sistematicità di processo trovano già applicazione presso gli
utenti.
I sistemi DSS dinamici
Per sistemi DSS dinamici sintendono
ambienti dove lanalisi dei dati segue unazione di propagazione (feedback). La
situazione potrebbe essere quella rappresentata in figura. Lagente attivo può
essere un componente di workflow, una tecnologia di alert e, in alcuni casi, un semplice
algoritmo di "publish & describe". Il componente di workflow essenzialmente
ha il compito di propagare, oltre il sistema di data warehouse, informazioni
"importanti" o semplicemente "da rilevare".

Figura 16 - DSS dinamico: valore informazione
e feedback
Tale componente deve accedere a una serie di
regole e conoscenze per innestare questa azione; queste entità/conoscenze possono già
essere supportate direttamente nei metadati in forma di regole appartenenti al
dizionario aziendale e possono riguardare eventi come la marginalità di un prodotto, una
percentuale di turnover, uno scostamento del budget e così via. In futuro queste entità
potranno diventare anche dei meta-oggetti allinterno delle tecnologie di gestione di
oggetti distribuiti. Le integrazioni con le aree applicative aziendali sono diverse,
basate essenzialmente su :
- segnalazione che un evento è accaduto;
- notifica di un evento ad applicazioni dipendenti;
- comunicazione di informazioni o messaggi su eventi ad
applicazioni dipendenti.
Esempi di questo tipo si trovano
nellarea dei servizi finanziari, per integrare dati di mercato con applicazioni
commerciali. Sebbene molte organizzazioni siano state a lungo tempo gerarchiche, il
processo di decisione può essere un processo condiviso. I GDSS, sistemi
decisionali di gruppo, hanno solide basi architetturali; lattività può essere sia
un processo decisionale vero e proprio che un lavoro collegato a unazione, come
creare una lista di possibili alternative o decidere su criteri per accettare
unalternativa. I sistemi DSS dinamici presentano una o più di queste
caratteristiche:
- possono essere utilizzati per supportare lattività dei
gruppi di decisione;
- accomodano utenti con vari livelli di conoscenza;
- sono progettati per un tipo di problema (standard) o per una
varietà di decisioni (custom made);
- sono progettati per sviluppare soluzioni di conflitti;
- sono configurati su componenti di sistema esistenti.
Le differenze sulluso di un componente
tecnologico di workflow o di un software di gestione di eventi/alert si basano sulle
caratteristiche dellazione.
Nel primo caso in genere lazione da
intraprendere o la diffusione dellinformazione è di bassa priorità; nel secondo,
la distribuzione dellevento può avere elevate priorità e richiedere quindi un
trattamento veloce. Il sistema deve inoltre garantire la consegna dellinformazione e
non dare luogo ad anomalie o isolamenti, altrimenti tollerabili. Le differenze fra sistemi
DSS tradizionali e quelli dinamici (entrambi basati su data warehouse) sintetizzate in
Tabella 8 - Tipi di DSS a pagina *, si trovano nel ruolo dei
componenti di esecuzione dellaccesso al data warehouse.
Nei primi ogni applicazione è un agente
statico entro la singola area tematica, che reagisce a richieste dellutente finale;
nei secondi lapplicazione ha un componente "attivo" che contiene la
risoluzione del processo decisionale.
Due tipi di DSS |
Dss |
Dss dinamici |
Dati intra-aziendali |
Dati extra-aziendali |
Sicurezza solo sui dati |
Sicurezza su procedure e oggetti di business |
Agenti
di esecuzione |
Agenti
dinamici |
Esecuzione
su richiesta |
Esecuzione
attiva |
Tabella 8 - Tipi di DSS
Uno sviluppo di queste
applicazioni sarà legato alla diffusione di tecnologie di alert più ampie,
legate non solo al contenuto dei dati, ma anche delle procedure e regole di business. In
maniera più immediata e usando tecnologie, esistenti, si assisterà a uno sviluppo di una
specie di "DSS groupware" che dovrà includere workflow, nuovi media e oggetti
distribuiti, che a valle dei sistemi decisionali collegheranno dinamicamente gli utenti al
sistema decisionale. Il supporto di metadati direttamente in architetture di oggetti
distribuiti favorirà questo sviluppo.
Integrare DSS con
lO.L.T.P.
Lintegrazione tra i componenti di
workflow e lambiente di data warehouse è suggerita dalla possibilità di avere un
feedback sul sistema generale. Le parole chiave sono integrazione e automazione.
Ad esempio, in un sistema di supporto alle decisioni fortemente focalizzato, si può
creare una personalizzazione stretta con il sistema operazionale, realizzando il feedback
attraverso aggiornamenti propagati dal data warehouse. Qui esistono due aspetti del
problema.
Il primo, strettamente tecnologico, di
connessione stretta con il sistema centralizzato, di sicurezza e di riconoscimento
dellutente che origina la propagazione allinterno del sistema operazionale.
Il secondo è più correlato al processo di
business, dove le regole che devono essere rispettate sono implementate attraverso
interfacce dinamiche che devono consentire una piena definizione del controllo, delle
attività di monitoring e delle regole di business stesse.
Ad esempio, se lanalisi
dellandamento delle vendite di un dato prodotto in un punto di vendita mostra una
bassa tendenza di acquisto e la decisione è quella di cancellare la disponibilità di
quel prodotto, il sistema di esecuzione della decisione deve avere la regola di
riconoscimento di ciò che costituisce una situazione di eccezione o unanomalia. Lo
stesso nel caso di aggiornamento automatico dei prezzi di listino di un determinato
prodotto che sta realizzando trend di vendita particolari (Figura 17 - Esempio di
transazione su Data Warehouse).

Figura 17 - Esempio di
transazione su Data Warehouse
- modalità strettamente sincronizzata;
- store and forward su intervalli di tempo su base oraria o
giornaliera;
- store and forward su intervalli di tempo più ampi.
Il primo caso è il meno comune, sia per
applicabilità del caso di business sia per costi di tecnologia e infrastruttura; i
rimanenti due casi sono più praticabili, sia per aree di business ormai identificate che
per paradigmi di comunicazione consolidati (servizi di messaging e integrità della
transazione). Luso di queste procedure si trova, ad esempio,
nellindividuazione di particolari comportamenti di acquisto e lancio di campagne di
vendita mirate, come nellanalisi dellMTBF (mean time between failure) di un
impianto e laggiornamento dei programmi di manutenzione. Un fattore che influenza le
caratteristiche di questa integrazione è anche levento analizzato sul sistema
decisionale che può innescare limplementazione della decisione da parte del
sistema. A seconda del componente di analisi e interrogazione del DWH, il risultato
dellaccesso può essere una lista di valori, o una variabile confrontata con valori
standard o ancora un insieme che va interpretato. I prodotti di alert che sono apparsi
durante il 1997 hanno migliorato gli aspetti di sincronizzazione, controllo e sicurezza.
Facendo un confronto con il sistema DSS dinamico prima illustrato, in questo caso il
componente che innesta la decisione è di natura diversa dallagente visto in
precedenza; questultimo abilitava un feedback attraverso propagazione di
informazioni, il componente di integrazione propaga il contenuto stesso
dellaggiornamento.
Ad un livello più alto, quello
organizzativo, il problema sta nel fatto che utenti diversi devono riconoscere modelli e
disegni applicativi che definiscono un particolare processo e anche gli eventi di business
che li integrano, con entità trasversali alle organizzazioni di gruppo di persone che non
hanno mai cooperato strettamente. Inoltre la definizione di eventi e le specifiche delle
informazioni che vanno inviate richiedono interfacce tra le applicazioni compatibili con
tutte le applicazioni coinvolte.
Nella maggior parte delle applicazioni le
tecniche di feedback saranno nuove. Informazioni che erano innestate sincronicamente
arriveranno ora in modalità anche asincrona. Test e debugging, in questi nuovi scenari,
saranno notevolmente più complessi.
Re-engineering e ri-uso dei
componenti
Negli esempi visti, gli ambienti di DWH
rappresentano una parte del processo decisionale allinterno di un sistema di
realizzazione di decisioni su processi fortemente focalizzati. Diverse opportunità
possono nascere da questa integrazione attraverso il "ri-uso" di oggetti
tecnologici. Si possono adattare componenti di interfaccia utente per mascherare le
differenze tra il sistema DSS e lambiente Oltp. Software di Middleware multilivello
e Object Requesitor Brokers possono fornire un ambiente virtuale sulla rete. Servizi di
monitor distribuiti possono offrire la qualificazione dei messaggi e linstradamento
dal DWH al sistema Oltp. Componenti di workflow management possono consentire la
sequenzializzazione e interdipendenza di decisioni. Adattatori software forniscono un
integrazione degli ambienti desktop e tools di sviluppo. I ruoli sono chiari:
- i componenti di workflow integrato renderanno più facile lo
sviluppo di nuove applicazioni
- le tecnologie a evento saranno utili per rendere riconoscibili
stati di business contenuti nei DWH
- framework di gestione ad oggetti avranno il compito di
identificare meta-oggetti direttamente dai meta-data.
Potrebbe essere questa un evoluzione spinta
del DWH da soluzioni focalizzate ad applicazioni integrate nel processo applicativo
aziendale.
|