SISECO Soluzioni Informatiche : CRM, IP Contact Center, Telemarketing, Soluzioni Gestionali

CRM, CIM & IP Contact Management Advanced Solutions

Accedi alle aree riservate

SISECO Anniversario 20 anni

Su ] Introduzione SIA ] Groupware ] [ Data warehouse ]
Data WareHouse

La possibilità di utilizzare un magazzino dei dati come supporto automatico alle decisioni aziendali rappresenta la soluzione reale di quello che può essere considerato il sogno nel cassetto del manager. Questo magazzino dei dati, che definiamo Data WareHouse, deve essere in grado di combinare e sintetizzare i contenuti di estese, eterogenee e variegate mole di dati. Il Data WareHouse fa parte dell’insieme più ampio rappresentato dai sistemi informativi direzionali.

Come già menzionato durante l’introduzione, le nuove strategie di mercato, l’internazionalizzazione e la crescita esponenziale delle informazioni connesse all’osservazione a monte dei fenomeni esterni e interni all’impresa, hanno favorito una complicazione d’interpretazione a valle, di quei processi legati a eventi in grado di influenzare il buon andamento dell’impresa. Il mercato, di conseguenza, privilegia le imprese in grado di reagire in tempi brevi alle proprie richieste. Le imprese si trovano quindi obbligate a migliorare i processi collegati al time-to-market, all’immagine aziendale ed alla soddisfazione delle esigenze dei clienti.

In questo contesto il ruolo dell’Information Tecnology è notevolmente cambiato. Se da un lato cerca ancora di fare le cose al minimo costo compatibile con la qualità richiesta, dall’altro diventa strumento essenziale per offrire un migliore servizio alla clientela e promuovere lo sviluppo (inventarsi nuovi prodotti, nuovi servizi e più in generale nuove attività di business).

Ruolo IT nel passato

Ruolo IT nel futuro

Migliorare l’efficienza dei processi

Migliorare il processo decisionale

Acquisire e distribuire i dati aziendali

Creare una conoscenza diffusa in azienda

Elaborare le transazioni del cliente

Creare un legame di intimità col cliente

Supporto agli operativi

Trasformare i dipendenti in "operatori della conoscenza"

Diffondere le informazioni tra i diversi livelli decisionali

Diffondere le informazioni abbattendo i livelli gerarchici

Ridurre i costi

Incrementare i profitti

Tabella 7 - I ruoli dell'IT nel passato e nel futuro

Il tentativo di rifiutare l’adeguamento organizzativo per mancanza di volontà o per paura del cambiamento crea dei gravi ritardi nei confronti dei principali concorrenti del settore. Trovarsi con un sistema informativo non adeguato o comunque tecnologicamente obsoleto comporta, nel peggiore dei casi, il fallimento di qualsiasi azione competitiva e successivamente la crisi dell’impresa.

Prendendo in considerazione le modalità operative delle migliori organizzazioni imprenditoriali, è facile riscontrare in molti casi che, tra le variabili di successo, spicca la maggiore sensibilità verso la conoscenza estesa e approfondita delle informazioni possedute. In altre parole è possibile riscontrare, all’interno delle aziende di maggiore successo, una cultura imprenditoriale di fondamentale importanza per la promozione di tecnologie avanzate volte a valorizzare tutte le informazioni che vengono prodotte, elaborate e gestite all’interno dell’azienda. L’obiettivo è quello di "analizzare le informazioni per ricavare altre informazioni" che costituiscano una base di conoscenze utile per le decisioni strategiche ed operative.

Le informazioni aziendali hanno lo stesso valore dei soldi contanti

In questa direzione fanno ben sperare le stime di crescita e le proiezioni recentemente rilevate. Infatti risulta che il fatturato di questo mercato tende ad avere previsioni con un tasso incrementale intorno al 30% annuo. Combinando questi dati con altri che mostrano una forte riduzione dei costi di progetto è possibile ottenere un segnale che pone in risalto la consapevolezza mostrata dalle imprese nei confronti di un utilizzo più esteso di questi sistemi.

Con questi presupposti è chiaro che la realizzazione di progetti di data warehouse potrebbe interessare svariati settori aziendali, primi fra tutti quelli legati alla definizione e alla misurazione di nuove iniziative di marketing verso la clientela, seguiti dal controllo delle vendite, economico e finanziario, della produzione e della distribuzione e della gestione dell’impresa. Oltre all’utilizzo tipicamente commerciale degli strumenti di data warehousing risulterà molto importante valutare soluzioni analoghe nel settore della pubblica amministrazione e del no profit.

Più in generale, un efficace utilizzo del "magazzino dei dati" può dare significativi risultati, nei casi in cui si renda necessario fare del "datamining", ossia analisi più spinte rispetto a quelle rese disponibili dai normali database. In pratica, la "escavazione dei dati" può consentire di ottenere preziose indicazioni, che risultano dall’estrazione delle caratteristiche salienti delle informazioni e della correlazione di queste con altre importanti variabili, per mezzo di tools software ad hoc presenti in commercio.

In questa direzione è possibile adottare essenzialmente due strategie:

  1. l’introduzione di pacchetti gestionali integrati o Enterprise Resource Planning (ERP)
  2. la realizzazione di sistemi informativi di supporto alle decisioni.

Le applicazioni ERP sostituiscono i vecchi sistemi transazionali e si caratterizzano per il loro supporto ai processi rispetto alle funzioni di business. In altre parole l’azienda viene vista come un insieme di processi integrati e trasversali, contrapposta al modello classico di azienda per funzioni. L’orientamento a comprare all’esterno questi sistemi piuttosto che costruirli in case è uno degli elementi tipici di queste soluzioni. L’acquisto si basa soprattutto sul valore aggiunto apportato al business in termini principalmente di riduzione dei costi legati alla loro introduzione.

I sistemi informativi direzionali coprono le esigenze di controllo interne ed esterne ad un’azienda e hanno lo scopo di assistere chi decide. Un sistema informativo direzionale è un sistema complesso caratterizzato d diverse componenti: persone, dati, principi, mezzi tecnici e procedure.

Componenti DW (10239 byte)

Figura 13 - Componenti del sistema informativo

Questi sistemi non possono essere acquistati all’esterno, perché si identificano troppo col modo di porsi sul mercato e di competere della singola azienda.

I vantaggi del DWH si possono riassumere facilmente utilizzando le seguenti relazioni:

  • VANTAGGI AUTOMAZIONE = RIDUZIONE COSTI
  • VANTAGGI INFORMAZIONI =
    RIDUZIONE COSTI +
    CRESCITA FATTURATO (nuovi prodotti e nuovi mercati) +
    RIDUZIONE DEI RISCHI (maggiore controllo e flessibilità)

In altre parole i sistemi informativi direzionali ed in particolare il Data Warehouseing hanno lo scopo di superare i limiti dei sistemi tradizionali (mancanza del supporto alle interrogazioni estemporanee e complesse, al lancio dei nuovi prodotti, al controllo qualità ed alle nuove opportunità) e dare un reale supporto a chi in azienda decide o contribuisce a decidere le strategie, le verifica nel tempo e le adegua ai cambiamenti sempre più repentini dell’ambiente esterno ed interno all’azienda.

Ricordando la visione di Galbraith, che teorizzò la necessità di maggiori informazioni in ambiente incerto e turbolento, è possibile dire che questi nuovi strumenti tecnologici soddisfano al meglio la necessità di aumentare la capacità elaborativa delle informazioni.

Concetti fondamentali

      Il Data Warehouse rappresenta un nuovo approccio per fornire accesso alle informazioni dell’impresa con lo scopo di trovare risposta alle richieste degli utenti di maggiore livello. L’approccio tradizionale di analisi dei dati si fonda sull’uso di strumenti semplici, basati su un linguaggio naturale o formale come SQL, per effettuare interrogazioni (query). Questo approccio tuttavia diventa inefficiente su grandi quantità di dati. Un approccio più moderno è quello denominato On Line Analytical Processing (OLAP), che si basa sulla predisposizione di una vasta gamma di query che sintetizzano i dati in base alle regole aziendali. Olap è più rapido perché si basa su dati precedentemente sommati e pertanto più vicini alle richieste degli utenti. Il rischio è quello di scartare dati di dettaglio di eventuale interesse. Per evitare questo rischio è possibile utilizzare appostiti tool di Data Mining, che consentono analisi più approfondite sfruttando tecniche sviluppate nei campi della statistica e delle macchine learning, per esempio le reti neurali.

      Tutti questi moderni approcci all’analisi e modellazione si basano sull’esistenza di un magazzino dati capiente e ben fornito, il Data Warehouse. Per sfruttare a pieno il valore dei dati in possesso delle aziende è necessario che questi siano modellati nel modo più semplice possibile per l’utilizzo da parte dell’utente. Come è note la maggior parte delle informazioni entrano in azienda attraverso procedure operative, che raramente sono state concepite per organizzare i dati come base di conoscenza e supporto decisionale. Per questo motivo i principi alla base dei sistemi di Data Warehouse sono rivolti alla forte interazione col dato da parte dell’utente sia in sintesi che in dettaglio, la disponibilità di serie storiche dei dati, elevate prestazioni per ogni tipo di interrogazioni estemporanea e una visione univoca del significato dei dati presenti nel Data Warehouse.

      I concetti chiave del DWH possono essere sintetizzati in:

Fornire una visione consistente delle informazioni dell’impresa

L’attuale situazione delle imprese:

  • ambienti informativi eterogeni (hardware e sistemi operativi diversi, database non compatibili, ecc.)
  • differenti interpretazioni dei dati all’interno dell’impresa
  • impossibilità di accedere alle sorgenti informative esterne all’impresa
  • analisi statistiche effettuate su dati limitati

Fornire risposte agli utenti di alto livello senza l’assistenza dei tecnici.

L’attuale situazione delle imprese:

  • utilizzo di rigidi report cartecei per la gestione strategica
  • gli utenti hanno necessità di accedere alle informazioni tempestivamente
  • la crescita degli investimenti in IT non ha fornito risposta ai punti precedenti

 

Come funziona

      Una delle ragioni per cui i concetti del DWH sono diventati molto importanti consiste nella grande diffusione di strumenti client/server e dalla disponibilità di macchine per l’elaborazione parallela.

      DWH è in effetti una soluzione basata su computer funzionanti in rete, i dati operativi sono immagazzinati su uno o più computer server e il data warehouse è gestito da un database server molto potente a cui gli utenti accedono via rete.

      I singoli componenti hanno raggiunto una maturità tecnologica nel corso degli ultimi dieci anni e i responsabili dei sistemi informativi hanno già acquisito tutte le conoscenze necessarie per utilizzare singolarmente questi strumenti.

      Vediamo in dettaglio i componenti necessari per adottare una soluzione di Data Warehouse.

       

I componenti del DWH

Nella Figura 14 sono stati evidenziati i componenti utilizzati in una soluzione di DWH e le interazioni esistenti.

All’interno dell’azienda esistono molti "depositi di informazione" eterogenei, inconsistenti, ridondanti e talvolta incompleti. Le analisi che possono essere condotte su questi tipi di dati risultano essere incomplete e circostanziate a singoli micro-obiettivi.

Le principali fonti informative da cui è possibile prelevare informazioni utili per il DWH sono i sistemi legacy, i dati delle applicazioni desktop di office automation (database desktop, fogli elettronici, documenti, presentazioni, oggetti multimediali, ecc.) e potenzialmente tutti i documenti che vengono prodotti all’interno dell’azienda o vengono ricevuti dall’esterno (fax, offerte, comunicati stampa, posta elettronica semistruttura e strutturata, ecc.).

Una volta individuato l’insieme di questi sistemi informativi è possibile utilizzare dei tools di estrazione e/o pulizia dei dati per renderli omogenei ed introdurli nel database di destinazione. Nei primi progetti di DWH questa operazione di conversione e "pulizia" dei dati veniva eseguita una-tantum. La conseguenza era quella di poter effettuare le analisi su dati che non sempre erano aggiornati. Attualmente i prodotti software di estrazione consentono di effettuare estrazioni on-line, consentendo di eseguire interrogazioni basate su informazioni sempre aggiornate.

Una volta realizzata la struttura del DWH e creata l’infrastruttura per alimentarne i contenuti è possibile sviluppare l’interfaccia, detta anche Front End, utilizzata per accedere a questo "magazzino di dati". Il fattore critico principale di quest’ultimo componente è costituito dalla semplicità di utilizzo. I dirigenti e gli impiegati di maggior livello aziendale sono infatti i principali utilizzatori di questi strumenti, ma solitamente non amano "perdere tempo" con strumenti software complicati da utilizzare.

Scheda DWH (6153 byte)

Figura 14 - I componenti del DWH

Database sorgenti

  • informazioni gestite da tutti i sistemi di supporto operativo
  • informazioni provenienti da sorgenti di dati esterne
  • vari database relazionali o flat files (come i fogli elettronici di Microsoft Excel)
  • le basi dati delle applicazioni OLTP (on line transaction processing)

Tools per l’estrazione e trasformazione dei dati

  • utility per estrarre, pulire, unificare e trasformare i dati provenienti dalle sorgenti di dati
  • sistemi di replicazione dei dati
  • driver per la connettività alle diverse sorgenti di dati
  • sistemi di modellazione dei dati per gestire il modello dei dati presenti nei database sorgenti e destinazione
  • repository dei metadati (dove vengono memorizzate le descrizioni dei dati, le sorgenti e le regole di trasformazione)

Database di destinazione: DataWareHouse

  • alta capacità di memorizzazione
  • supporto per le stored procedure (sono programmi immagazzinati sul database server pre compilati e composti da una serie di comandi SQL. In molti casi possono incrementare la velocità delle interrogazioni del 100%. Le stored procedures possono essere utilizzate per bilanciare la logica applicativa tra il client e il server nella programmazione client/server. Questo viene effettuato programmando complessi aggiornamenti ed interrogazioni direttamente sul server, permettendo al client di effettuare semplicemente una chiamata)
  • speciali sistemi di indicizzazione
  • tecniche di ottimizzazione delle query (interrogazioni)
  • monitor dei dati per valutare la crescita, la frequenza delle cancellazioni ecc.

Tools di accesso alle informazioni (front end)

  • facili da usare e con interfaccia grafica
  • flessibilità nell’analisi dei dati
  • supporto agli standard più diffusi (OLE Object Linking and Embedding, ODBC Open DataBase Connectivity e SQL)
  • architettura client/server
  • sistemi di sviluppo rapido (RAD rapid application development)

 

Estrazione dei dati

Per l’estrazione dei dati è possibile utilizzare strumenti già presenti in commercio e aperti agli standard come i database relazionali di Oracle, Ingres, Informix, Sybase, Microsoft o IBM. I vantaggi di scegliere una soluzione commerciale aperta agli standard sono:

  • la possibilità di utilizzare le potenti funzioni di replicazione dei dati comprese in questi prodotti
  • il costo relativamente contenuto delle licenze software di prodotti commerciali
  • le performance elevate dei prodotti RDBMS (Relational DataBase Management System)

Questa soluzione aperta agli standard è poco funzionale in ambienti eterogenei, in cui convivono software e hardware differenti e formati di dati con logiche profondamente variabili.

In queste realtà è possibile valutare la scelta di prodotti specifici per l’estrazione dei dati come Info Pump. I vantaggi di questa soluzione sono:

  • avanzate funzioni di estrazione con molti parametri personalizzabili
  • ottimizzazione per ambienti eterogenei
  • interfacce costruite per accedere a database diversi contemporaneamente

I problemi connessi con questa soluzione sorgono dai costi elevati di acquisizione e dalla complessità di questi prodotti software, per i quali è necessario prevedere adeguati percorsi formativi.

 

Database di destinazione

Anche in questo caso è possibile adottare una soluzione conforme agli standard. La scelta di un database commerciale è in questi casi fondamentale. I vantaggi connessi alla scelta di un RDBMS sono:

  • alta capacità di memorizzazione
  • know how già presente in azienda nei confronti di questi strumenti
  • supporto per le stored procedure
  • supporto per l’elaborazione parallela, specialmente per l’elaborazione degli indici

Il principale svantaggio di scegliere un database commerciale è rappresentato dalla complessa modalità di interrogazione. Infatti per interrogare un database server standard è necessario utilizzare l’SQL. Sarà quindi necessario sviluppare applicazioni personalizzate che astraggano la logica del database per consentire un accesso più naturale per gli utenti di alto livello.

I database server moderni hanno sviluppato alcune funzionalità per supportare soluzioni in questa direzione. Sono nati in questo senso due nuovi operatori del linguaggio SQL (Structure Query Language): Cube e RollUp. Questi comandi consentono l’aggregazione dei dati per realizzare report e analisi su base multidimensionale. Insieme a questi operatori vengono supportate le funzioni di "data piping" che permettono di recuperare dati da più fonti e di consolidarli in un Data Warehouse. Grazie ha questi strumenti di gestione dei dati è possibile attuare una corretta e rivoluzionaria gestione del patrimonio informativo presente (spesso passivamente) nel sistema informativo aziendale, consentendo di aumentare le capacità decisionali e operative allo scopo di migliorare la qualità dei beni e dei servizi offerti dall’impresa.

Tra i database server commerciali è indispensabile ricordare Oracle, Informix, Gupta, IMB DB2, Microsoft SQL, Sybase, Adabas quali leader del mercato.

Una soluzione alternativa ai database standard sono i database proprietari, mirati alla gestione dei data warehouse, come Pilot Analysis Server o ComShare. Queste soluzioni software dispongono di funzionalità avanzate per ottimizzare le interrogazioni e per supportare le decisioni strategiche. I vantaggi di questa soluzione sono i seguenti:

  • sofisticato engine per l’ottimizzazione delle interrogazioni complesse
  • gestione di strutture gerarchiche dei dati
  • stretta integrazione con i tool di interrogazione e reporting

Gli svantaggi di questa soluzione proprietaria sono i costi elevati e la mancanza di funzionalità tipiche dei database standard, come le repliche ed il supporto per i Very Large DataBase (VLDB).

 

Front End

A fronte delle diverse esigenze dell’utente il mercato ha risposto fornendo vari tipi di soluzione, che coprono in modo più o meno ampio le potenziali richieste. Talli soluzioni vengono classificate, in base alle funzioni coperte, come tool di query & reporting, di On Line Analytical Processing (Olap) e di Data Mining. Nel loro complesso vengono normalmente indicate come soluzioni di Business Intelligence (BI). Purtroppo quando si descrive un prodotto è più facile che si tenti di associarlo a una di queste categorie piuttosto che comprendere quali necessità effettivamente soddisfa. E’ importante invece sottolineare che la scelta di uno strumento non può derivare che da una approfondita analisi delle esigenze informative di chi lo utilizza. Non esiste lo strumento migliore, ma il più adeguato, in funzione alle tematiche di interesse, alla funzioni disponibili, al grado di personalizzazione ed ai costi di acquisto.

Nel passato (anni ’70 e ’80) le richieste degli utenti erano strettamente legate ad un accesso diretto e semplificato ai dati attraverso strumenti che permettessero l’espressione di richieste strutturate ed esplicite. L’evoluzione verso sistemi dedicati come i PC e le Workstation con interfaccia grafica, l’introduzione ed il potenziamento dei fogli elettronici (estremamente dotati per fare simulazioni, ma anche per costruire modelli matematici di media complessità), la loro programmabilità e la loro integrazione con prodotti di gestione dati DBMS ha sicuramente complicato la vita a chi intendeva classificare rigidamente i prodotti di analisi e supporto decisionale rispetto alle funzioni coperte. Non vi è dubbio infatti che in questa categoria possano rientrare anche prodotti come Lotus 1-2-3 e Microsoft Excel.

I tool per sviluppare il front end di accesso al data warehouse sono suddivisi essenzialmente in tre categorie a seconda del grado di personalizzazione che si intende raggiungere nella soluzione informatica.

  • Tool di sviluppo C/S (PowerBuilder, Visual Basic, Delphi, Visual FoxPro, ecc.), raccomandati per sviluppare soluzioni altamente personalizzate, in breve tempo ma con requisiti di conoscenza molto elevati.
  • Tool di interrogazione per utenti finali (Forest & Trees, Business Objects, ...). Questi tool supportano interrogazioni molto flessibili e potenti funzioni di report. Consentono agli utenti di accedere ai database senza l’intervento di tecnici specializzati. Solitamente vengono utilizzati per semplici interrogazioni su dati atomici senza concedere la possibilità di ulteriori aggregazioni e analisi dei dati.
  • EIS/DSS (Decision Support System) come Pilot Desktop, Designer e ComShare. Vedi anche Sistemi di supporto alle decisioni a pagina *. Questi tool sono molto costosi ma consentono di effettuare complesse analisi multidimensionali sulle informazioni presenti nel DWH. Consentono di effettuare l’aggregazione multidimensionale, la riorganizzazione e il consolidamento dei dati. Questi strumenti vengono utilizzati per produrre sofisticate analisi finanziarie e di business in genere. In alcuni casi consentono l’elaborazione on-fly sui dati e lo sviluppo di piccole applicazioni personalizzate.
  • Tool per il Data Mining come Pilot Discovery Server. Questi tool sono molto particolari in quanto consentono di identificare informazioni basandosi su ipotesi e domande iniziali. Questi prodotti generano in output l’analisi di tutti i dati significativi. Anche in questo caso però le applicazioni sono molto complesse da imparare e molto costose.

OLAP

Una semplice definizione di OLAP potrebbe essere quella di unao strumento per l’analisi rapida di informazioni distribuite e in forma multidimensionale.

In particolare una soluzione Olap deve integrare tre funzioni: interrogazione (querying), generazione di prospetti (reporting) e analisi. Con riferimento alle anlisi quelle comunemente impiegate sono di due tipi: slice and dice e drill down. Il primo tipo permette di segmentare i dati e quindi di esaminarli per gruppi omogenei. Il secondo permette di navigare nei dati ed esaminarli a diversi livelli di dettaglio. Ovviamente le fasi di querying e analisi sono normalmente iterative, nel senso che si procede a individuare un primo insieme di dati di interesse, su cui si produce un’analisi che porterà a una ulteriore interrogazione e così fino a quando un certo argomento non è stato completamente compreso. Quel punto è probabile che venga generato un prospetto in cui si descrive (con tavole, grafici e commenti) il percorso mentale intrapreso e l’interpretazione per quel fenomeno. Uno strumento Olap apparirebbe come tipicamente induttivo (cerco, esplorando i dati, una risposta ai miei perché e quindi una spiegazione ai fatti che sto studiando), in realtà esso prevede, per poter essere utilizzato con semplicità, l’esistenza di una o più viste dei dati aziendali che racchiudono buona parte delle regole interpretative. Questa attività preliminare è però normalmente a carico dell’amministratore dei dati (Data Administrator) che ha appunto l’onere di delineare il modello di riferimento (approccio deduttivo) all’interno del quale l’utente finale compie le sue esplorazioni (approccio induttivo). Seppure esistono similitudini con ciò che abbiamo definito come Data Mining, in realtà gli strumenti di analisi messi a disposizione nella ricerca di correlazioni e regole nei dati è profondamente diverso nei due casi. Nel Data Minign si utilizzano metodologie specifiche che richiedono (almeno nella fasi di impostazione dell’analisi) la presenza di specialisti, ma ovviamente permettono un approccio più scientifico e robusto nell’individuazione di modelli. Viceversa una soluzione Olap permette un modo di operare semplice e intuitivo, ma meno strutturato e più dispersivo. Inoltre va ricordato che la quantità di dati su cui effettuare l’esplorazione deve essere contenuta, imponendo così sintesi preliminari che presumono l’esistenza di un modello almeno parzialmente esplicativo dei dati.

Attori del sistema decisionale (10073 byte)

Figura 15 - Attori di un sistema decisionale

 

Progetto di un Data WareHouse

Come in precedenza analizzato per i progetti di groupware, progettare un sistema di data warehouse significa dare vita a un processo che coinvolge a tutto campo l’impresa in una visione progettuale d’insieme atta a determinare gli obiettivi che si intendono raggiungere con l’utilizzo di questi potenti strumenti. Durante lo studio di fattibilità è opportuno mettere in bilancio un impegno di almeno due o tre anni di lavoro ed un congruo investimento che può raggiungere anche l’ordine di spesa di un miliardo. Va ricordato poi che esiste una possibilità iniziale di rischio che è in grado di attenuare gli obiettivi iniziali. Il rischio principale consiste nell’adottare le tecniche utilizzate per lo sviluppo dei tradizionali sistemi informativi senza adeguarsi alle necessità organizzative richieste dai progetti di data warehouse.

I parametri di valutazione della criticità di questi sistemi sono molteplici. Ad esempio, le prestazioni dei sistemi, potrebbero rappresentare un elemento determinante nella risoluzione di complesse query che trasversalmente arrivano ad interessare anche tutte le tipologie di dati aziendali. In questo senso, una decisione potrebbe essere quella di orientare la scelta dell’hardware, verso piattaforme di tipo MMP (Massive Parallel Processing), architetture di tipo parallelo.

Un altro importante capitolo del discorso sul data warehouse riguarda le risorse umane. Per le ragioni finora esposte, potrebbe risultare insufficiente uno livello di conoscenze basato sulla formazione di tipo ITC quale gestore di un simile progetto. Quindi, la linea di tendenza determinante per l’assegnazione delle responsabilità di progetto, può privilegiare una nuova figura aziendale che potremmo chiamare "data warehouse administrator", un esperto in grado di associare ad una buona conoscenza del funzionamento dei sistemi informativi, delle competenze manageriali e una buona conoscenza della nuova normativa riguardante la tutela e la riservatezza dei dati personali (specialmente da quando è stata approvata la legge sulla privacy 196/03) che, in particolare nel caso delle analisi di marketing può costituire un problema.

Associando le competenze informatiche a quelle più propriamente legate alla gestione dell’impresa, possono essere individuati quegli indicatori di sintesi o "metadati", che rappresentano l’essenza delle informazioni aziendali distribuite, ritenute di fondamentale importanza per operare rapide decisioni di tipo strategico.

Appare evidente che le vaste conoscenze intersettoriali, la flessibilità e la capacità di governare grossi progetti sono i requisiti indispensabili richiesti a tutti i componenti del gruppo di lavoro.

La corretta conduzione di un progetto di DWH è fondamentale per evitare situazioni di parziale blocco, scostamenti tra le funzionalita sviluppate e le esigenze degli utenti, inconsistenze nei dati e conseguenti problemi di gestione delle informazioni.

Uno dei consigli principali da considerare durante la progettazione di questi sistemi, è quello di utilizzare degli strumenti di modellizzazione dei dati, che consentano di verificare il grado di coerenza tra gli obiettivi che intendono essere raggiunti e le informazioni presenti in azienda. In altre parole, questo può significare disporre di strumenti CASE tali da consentire di individuare con esattezza i dati aziendali, assegnando loro un significato e una precisa caratteristica del contenuto, una autorizzazione d’accesso e un collegamento relazionale con altri dati.

L’insieme di tutte le informazioni che riguardano i dati e la loro composizione nei raggruppamenti, i cosiddetti metadati, trovano domicilio nel repository, un grande contenitore in cui è possibile trovare ogni genere di informazione relativa ai dati aziendali presenti nella banca dati centralizzata. A fronte di un dato, il formato, la locazione e il tipo di accesso richiesto rappresentano solo alcune delle informazioni presenti nel repository.

Il progetto di un data warehouse richiede quindi molta attenzione nell’analisi del business al fine di identificare esattamente tutte le informazioni richieste. Inoltre va ricordato che l’implementazione di un sistema di DWH può richiedere ingenti investimenti di tempo e denaro. Per questo motivo è importante valutare anche il ritorno dell’investimento.

I fattori critici di successo di un progetto di data warehouse sono:

  • chiara definizione dei requisiti informativi, dei piano dei costi e analisi del ritorno dell’investimento. Questi fattori semplificano il controllo del piano di budget del progetto. Tutti devono essere consapevoli che il progetto di DWH apporta un valore aggiunto all’esistente sistema informativo. Questo è determinante per trovare gli stimoli necessari per il successo del progetto.
  • forte orientamento alla soluzione di data warehouse da parte di tutti gli utenti finali del progetto. E’ importante che il team del progetto mantenga alta la partecipazione degli utenti, rendendoli partecipi dell’implementazione del progetto. E’ determinante anche fornire gli skills adeguati a tutti gli utenti.
  • DWH non è un prodotto ma un progetto. Questo significa che è necessario ricercare la "soluzione" migliore. Tale soluzione deve incontrare perfettamente le esigente informative degli utenti finali. E’ importante considerare che un sistema di DWH è un sistema dinamico in quanto dinamiche sono le necessità informative degli utenti. Il business aziendale cambia in continuazione e il DWH dovrà adeguarsi a questi cambiamenti nel modo più veloce possibile.
  • implementare un progetto pilota. In un progetto di DWH è opportuno sviluppare un sistema ridotto in cui alcuni utenti (quelli notoriamente più preparati) possano valutare la corrispondenza con le esigenze informative e le performance complessive del sistema. Una volta effettuate tutti i collaudi necessari ed apportate tutte le modifiche e migliorie richieste dagli utenti del gruppo pilota è possibile estendere facilmente il progetto all’intera impresa.
  • valutare attentamente la scelta della tecnologia e dei partner. La scelta delle tecnologie più idonee al particolare progetto può far risparmiare molto tempo, riducendo sostanzialmente i costi da sostenere. L’attuale mercato offre molte possibilità nella scelta dei prodotti software e hardware. Nell’effettuare la scelta è opportuno valutare i seguenti fattori: minimizzare l’attività di svilupo software per ridurre i tempi e gli errori; ridurre i costi; massimizzare la flessibilità e le performance della soluzione; valutare attentamente la facilità di utilizzo degli strumenti.

La complessità delle soluzioni di DWH richiede le competenze di molti professionisti del mercato dell’IT. E’ attualmente impossibile disporre di persone che dispongano di tutte le conoscenze necessarie per sviluppare soluzioni a livello d’impresa. Le scelte di partnership strategica, dei professionisti IT e dei system integrator possono influenzare molto il successo di un progetto di DWH.

Entrando nella fase più operativa del progetto, sarebbe bello poter già disporre di una condizione di partenza per così dire ideale, in cui i dati presenti nei vari sistemi informativi risultassero allineati al livello qualitativo richiesto. Purtroppo, l’esperienza insegna che molto spesso la crescita indisciplinata dei sistemi informativi ha contribuito a lasciare degli scheletri nell’armadio dei dati aziendali. Per questo motivo e’ probabile che prima di iniziare a popolare il sistema di data warehouse, si renda necessaria un’opera tale di bonifica dei dati presenti nel database aziendale, da permettere di disporre di dati consistenti ottenuti tramite successive operazioni di pulizia e aggiustamento, finalizzate al caricamento di questi ultimi nel sistema di data warehouse stesso. In alcuni casi, una destrutturazione e una semplificazione dei dati, può favorire le elaborazioni multidimensionali che di solito caratterizzano elaborazioni su sistemi di data warehouse. Non sempre queste attività di bonifica sono così specificatamente separate, può capitare che la pulizia e l’aggiustamento dei dati avvenga nelle fasi di caricamento dei dati sul sistema, grazie a funzioni ausiliarie di servizio che possono essere svolte dagli appositi tools di caricamento. Un altro argomento che potrebbe essere affrontato nel corso del progetto, può riguardare la correlazione esistente tra le informazioni presenti su più banche dati. Questa possibilità richiede una particolare attenzione alla scelta di prodotti di middleware tali da consentire il prelievo su più piattaforme, di diverse tipologie di dati.

Quanto finora espresso, può rappresentare solo una parte delle azioni che dovrebbero essere svolte per predisporre il set di informazioni necessarie a far funzionare un sistema di data warehouse. Andando avanti, un’altra delicata fase del progetto, contempla la scelta dei tools di accesso per l’utenza. Infatti, è questo il caso in cui, la fragilità del discorso, è legata al modo in cui i tools di accesso scelti, possono influenzare il lavoro di creazione del data warehouse. Questo significa che il lavoro svolto, del quale è ormai chiara la dimensione e l’impegno, potrebbe anche essere messo in seria discussione da una scelta non propriamente calzante dei tools di acceso ai dati utilizzati dall’utenza finale per estrarre i metadati. Dal momento che il taglio delle informazioni che vengono prodotte è sicuramente collocabile in una fascia di interesse aziendale medio-alta, è facile individuare quali potrebbero essere i potenziali utenti finali e soprattutto quale potrebbe essere la loro tipologia. Elementi con una cultura di tipo manageriale, indipendenti, molto orientati agli obiettivi e con scarsissima disponibilità di tempo. Perciò, è facile comprendere quanto la scelta di tools di accesso ai dati possa risultare determinante, nel momento in cui risulti orientata verso quei prodotti che lasciano intendere una interpretazione onnicomprensiva delle esigenze dell’utenza, in termini di query e report, fissate sul comun denominatore della semplicità d’uso. In sintesi, potenza e facilità potrebbero essere le caratteristiche primarie incluse nella offerta di soluzioni software proposte dai diversi fornitori di sistemi di data warehouse per l’utenza finale, per acquisire maggiori quote di mercato.

A questo punto, può risultare ancor più chiaro quante e quali siano le variabili che possono condizionare il buon esito di un progetto di data warehouse, tanto che è possibile comprendere i motivi per cui molte organizzazioni intraprendono questa strada, procedendo secondo la teoria dei piccoli passi, diluendo il problema con l’avvio di realizzazioni che interessino un settore aziendale alla volta. Nel comparto bancario , è possibile incontrare delle applicazioni di data warehouse significative come quella realizzata da un importante istituto di credito che, per approfondire ancor meglio la conoscenza della propria clientela, si è dotato di un sistema data warehouse che permette di conoscere in tempo reale, i cambiamenti nelle abitudini dei propri clienti e di modellare di conseguenza su queste i propri prodotti e servizi. Di diversa applicazione, ma sempre basata sull’utilizzo di un sistema di data warehouse, è l’applicazione sviluppata da una nota banca per effettuare il controllo di gestione in modo proficuo, cioè utilizzando i benefici che può offrire una manipolazione elettronica dei dati anziché su supporto cartaceo. Riassumendo è possibile affermare che il data warehouse rappresenta uno strumento di avanzato livello tecnologico che esprime pienamente il passaggio dalla fase adolescenziale a quella dell’età adulta delle tecnologie informatiche e di telecomunicazione.

Le moderne imprese e organizzazioni non possono non prendere atto del ruolo strategico delle informazioni, le tecnologie informatiche e di comunicazione non possono rimanere fuori dai processi di business, le trasformazioni socio economiche si rendono irrinunciabili, il cambiamento richiede una gestione basata sull’applicazione del buon senso che è antitetica alla teoria del "tutto e subito" propugnata da schieramenti opposti a quelli attuali negli anni passati, ma comunque, clamorosamente fallita. In questo contesto, il data warehouse per l’impresa potrebbe risultare un salvagente per non affogare in profondi "warehouse di guai".

 

Evoluzioni del Data WareHouse

      I responsabili delle tecnologie dell’informazione cercano da tempo di integrare le applicazioni dei sistemi legacy e di ottimizzare le risorse su queste piattaforme. Diversi sono stati gli approcci, dal data modelling all’information engineering, con percorsi che forse sono stati più lenti del previsto a rilasciare benefici e risultati tangibili. Un nuovo approccio è oggi rappresentato dal data warehouse, che si sta rivelando un eccellente modo per spostere il confine dell’elaborazione operazionale negli ambienti transazionali. Uno scenario di evoluzione del data warehouse propone infatti architetture conosciute come Operational data Store, in grado di integrare i dati interni all’ambiente operazionale per produrre decisioni sul breve termine, rispetto a quelle di un data warehouse tradizionale, utile per decisioni meno immediate.

      In sistemi data warehouse, l’analisi di eventi di business può anche fornire meccanismi per l’integrazione con applicazioni esistenti , che utilizzano informazioni su processi ripetitivi e codificati di analisi e decisione. Un data warehouse può così trasformarsi in una nuova applicazione, in grado di attivare componenti elaborativi che realizzano un processo di workflow o routine generalizzato per la risoluzione dei problemi. L’automazione della gestione di questi eventi può far guadagnare in termini di efficienza o di ridotte operazioni manuali, come nel caso di integrazione con i sistemi transazionali. L’adozione, in futuro, di pacchetti decisionali in aree come la finanza, i servizi, i sistemi di distribuzione e così via, richiederanno sempre più queste caratteristiche di integrazione con agenti di distribuzione e di gestione delle eccezioni a fronte di eventi intercettati dal sistema informazionale. Le soluzioni più adatte a supportare a basso costo questa interazione sono le architetture di Decision Support System dinamiche: sistemi D.S.S. che consentono interazioni personalizzate con i sistemi operazionali in seguito a un controllo avvenuto sulle regole di business di un particolare processo.

Sistemi di supporto alle decisioni

      I processi elaborativi supportano decisioni che possono essere di tipo strutturato o non strutturato. Le prime si riferiscono a problemi ripetitivi, già incontrati e quindi è esistente una soluzione preconfezionata o routine di risoluzione già definite. Le seconde invece si riferiscono a problemi complessi in cui non esistono soluzioni pre-definite, occorre una gestione "su misura" (custom solutions). In un problema strutturato sono ben note le procedure per l’ottimizzazione e quindi decidere strategie di investimento ad esempio richiede la massimizzazione dei margini o la focalizzazione in un’area di mercato. Un altro esempio è costituito dalla pianificazione dei canali di distribuzione, dove l’uso di una data warehouse serve a definire il valore relativo di differenti strategie di distribuzione per prodotti. La gestione del rischio di mercato nelle istituzioni finanziarie è strettamente legata agli sviluppi che potrebbero influenzare il rischio , con scenari "what if" basati su dati storici. Decisioni non strutturate si trovano nella pianificazione di nuovi servizi, nella scelta fra una serie di progetti, nello sviluppo di nuovi prodotti o di responsabilità sociali. Le decisioni strutturate comportano la trasformazione del mondo reale in strutture e modelli standard; laddove questo non sia possibile, come nel caso del controllo manageriale e della pianificazione strategica, è necessario realizzare un sistema DSS completo , in grado di garantire il controllo operazionale e il controllo decisionale.

Caratteristiche dei sistemi DSS

I sistemi DSS nella maggior parte dei casi hanno le seguenti caratteristiche comuni:

  • danno supporto e controllo in situazioni non strutturate o semistrutturate, che richiedono giudizio umano per completare il ciclo operazionale;
  • offrono supporto a decisioni interdipendenti e/o sequenziali;
  • supportano tutte le fasi del processo (disegno, sviluppo, realizzazione della decisione);
  • sono adattativi, per consentire il confronto di condizioni variabili e dinamiche;
  • utilizzano modelli che consentono sperimentazione con differenti configurazioni;
  • quelli avanzati sono equipaggiati con componenti di conoscenza che abilitano l’effettiva soluzione.

      I sistemi a supporto delle decisioni interdipendenti e con iterazione diretta con i sistemi transazionali esistenti, sono quelli che in termini di accuratezza delle informazioni, facilità di costruzione con tecnologie esistenti e sistematicità di processo trovano già applicazione presso gli utenti.

I sistemi DSS dinamici

Per sistemi DSS dinamici s’intendono ambienti dove l’analisi dei dati segue un’azione di propagazione (feedback). La situazione potrebbe essere quella rappresentata in figura. L’agente attivo può essere un componente di workflow, una tecnologia di alert e, in alcuni casi, un semplice algoritmo di "publish & describe". Il componente di workflow essenzialmente ha il compito di propagare, oltre il sistema di data warehouse, informazioni "importanti" o semplicemente "da rilevare".

DSS dinamico (4396 byte)

Figura 16 - DSS dinamico: valore informazione e feedback

Tale componente deve accedere a una serie di regole e conoscenze per innestare questa azione; queste entità/conoscenze possono già essere supportate direttamente nei metadati in forma di regole appartenenti al dizionario aziendale e possono riguardare eventi come la marginalità di un prodotto, una percentuale di turnover, uno scostamento del budget e così via. In futuro queste entità potranno diventare anche dei meta-oggetti all’interno delle tecnologie di gestione di oggetti distribuiti. Le integrazioni con le aree applicative aziendali sono diverse, basate essenzialmente su :

  • segnalazione che un evento è accaduto;
  • notifica di un evento ad applicazioni dipendenti;
  • comunicazione di informazioni o messaggi su eventi ad applicazioni dipendenti.

      Esempi di questo tipo si trovano nell’area dei servizi finanziari, per integrare dati di mercato con applicazioni commerciali. Sebbene molte organizzazioni siano state a lungo tempo gerarchiche, il processo di decisione può essere un processo condiviso. I GDSS, sistemi decisionali di gruppo, hanno solide basi architetturali; l’attività può essere sia un processo decisionale vero e proprio che un lavoro collegato a un’azione, come creare una lista di possibili alternative o decidere su criteri per accettare un’alternativa. I sistemi DSS dinamici presentano una o più di queste caratteristiche:

  • possono essere utilizzati per supportare l’attività dei gruppi di decisione;
  • accomodano utenti con vari livelli di conoscenza;
  • sono progettati per un tipo di problema (standard) o per una varietà di decisioni (custom made);
  • sono progettati per sviluppare soluzioni di conflitti;
  • sono configurati su componenti di sistema esistenti.

      Le differenze sull’uso di un componente tecnologico di workflow o di un software di gestione di eventi/alert si basano sulle caratteristiche dell’azione.

      Nel primo caso in genere l’azione da intraprendere o la diffusione dell’informazione è di bassa priorità; nel secondo, la distribuzione dell’evento può avere elevate priorità e richiedere quindi un trattamento veloce. Il sistema deve inoltre garantire la consegna dell’informazione e non dare luogo ad anomalie o isolamenti, altrimenti tollerabili. Le differenze fra sistemi DSS tradizionali e quelli dinamici (entrambi basati su data warehouse) sintetizzate in Tabella 8 - Tipi di DSS a pagina *, si trovano nel ruolo dei componenti di esecuzione dell’accesso al data warehouse.

      Nei primi ogni applicazione è un agente statico entro la singola area tematica, che reagisce a richieste dell’utente finale; nei secondi l’applicazione ha un componente "attivo" che contiene la risoluzione del processo decisionale.

Due tipi di DSS

Dss

Dss dinamici

Dati intra-aziendali

Dati extra-aziendali

Sicurezza solo sui dati

Sicurezza su procedure e oggetti di business

Agenti di esecuzione

Agenti dinamici

Esecuzione su richiesta

Esecuzione attiva

Tabella 8 - Tipi di DSS

      Uno sviluppo di queste applicazioni sarà legato alla diffusione di tecnologie di alert più ampie, legate non solo al contenuto dei dati, ma anche delle procedure e regole di business. In maniera più immediata e usando tecnologie, esistenti, si assisterà a uno sviluppo di una specie di "DSS groupware" che dovrà includere workflow, nuovi media e oggetti distribuiti, che a valle dei sistemi decisionali collegheranno dinamicamente gli utenti al sistema decisionale. Il supporto di metadati direttamente in architetture di oggetti distribuiti favorirà questo sviluppo.

Integrare DSS con l’O.L.T.P.

      L’integrazione tra i componenti di workflow e l’ambiente di data warehouse è suggerita dalla possibilità di avere un feedback sul sistema generale. Le parole chiave sono integrazione e automazione. Ad esempio, in un sistema di supporto alle decisioni fortemente focalizzato, si può creare una personalizzazione stretta con il sistema operazionale, realizzando il feedback attraverso aggiornamenti propagati dal data warehouse. Qui esistono due aspetti del problema.

      Il primo, strettamente tecnologico, di connessione stretta con il sistema centralizzato, di sicurezza e di riconoscimento dell’utente che origina la propagazione all’interno del sistema operazionale.

      Il secondo è più correlato al processo di business, dove le regole che devono essere rispettate sono implementate attraverso interfacce dinamiche che devono consentire una piena definizione del controllo, delle attività di monitoring e delle regole di business stesse.

      Ad esempio, se l’analisi dell’andamento delle vendite di un dato prodotto in un punto di vendita mostra una bassa tendenza di acquisto e la decisione è quella di cancellare la disponibilità di quel prodotto, il sistema di esecuzione della decisione deve avere la regola di riconoscimento di ciò che costituisce una situazione di eccezione o un’anomalia. Lo stesso nel caso di aggiornamento automatico dei prezzi di listino di un determinato prodotto che sta realizzando trend di vendita particolari (Figura 17 - Esempio di transazione su Data Warehouse).

      Esempio DSS (6528 byte)

Figura 17 - Esempio di transazione su Data Warehouse

      Esistono modelli decisionali e di esecuzione della decisione differenti, che si riflettono nella modalità con cui viene propagato l’aggiornamento:

  • modalità strettamente sincronizzata;
  • store and forward su intervalli di tempo su base oraria o giornaliera;
  • store and forward su intervalli di tempo più ampi.

      Il primo caso è il meno comune, sia per applicabilità del caso di business sia per costi di tecnologia e infrastruttura; i rimanenti due casi sono più praticabili, sia per aree di business ormai identificate che per paradigmi di comunicazione consolidati (servizi di messaging e integrità della transazione). L’uso di queste procedure si trova, ad esempio, nell’individuazione di particolari comportamenti di acquisto e lancio di campagne di vendita mirate, come nell’analisi dell’MTBF (mean time between failure) di un impianto e l’aggiornamento dei programmi di manutenzione. Un fattore che influenza le caratteristiche di questa integrazione è anche l’evento analizzato sul sistema decisionale che può innescare l’implementazione della decisione da parte del sistema. A seconda del componente di analisi e interrogazione del DWH, il risultato dell’accesso può essere una lista di valori, o una variabile confrontata con valori standard o ancora un insieme che va interpretato. I prodotti di alert che sono apparsi durante il 1997 hanno migliorato gli aspetti di sincronizzazione, controllo e sicurezza. Facendo un confronto con il sistema DSS dinamico prima illustrato, in questo caso il componente che innesta la decisione è di natura diversa dall’agente visto in precedenza; quest’ultimo abilitava un feedback attraverso propagazione di informazioni, il componente di integrazione propaga il contenuto stesso dell’aggiornamento.

      Ad un livello più alto, quello organizzativo, il problema sta nel fatto che utenti diversi devono riconoscere modelli e disegni applicativi che definiscono un particolare processo e anche gli eventi di business che li integrano, con entità trasversali alle organizzazioni di gruppo di persone che non hanno mai cooperato strettamente. Inoltre la definizione di eventi e le specifiche delle informazioni che vanno inviate richiedono interfacce tra le applicazioni compatibili con tutte le applicazioni coinvolte.

      Nella maggior parte delle applicazioni le tecniche di feedback saranno nuove. Informazioni che erano innestate sincronicamente arriveranno ora in modalità anche asincrona. Test e debugging, in questi nuovi scenari, saranno notevolmente più complessi.

Re-engineering e ri-uso dei componenti

Negli esempi visti, gli ambienti di DWH rappresentano una parte del processo decisionale all’interno di un sistema di realizzazione di decisioni su processi fortemente focalizzati. Diverse opportunità possono nascere da questa integrazione attraverso il "ri-uso" di oggetti tecnologici. Si possono adattare componenti di interfaccia utente per mascherare le differenze tra il sistema DSS e l’ambiente Oltp. Software di Middleware multilivello e Object Requesitor Brokers possono fornire un ambiente virtuale sulla rete. Servizi di monitor distribuiti possono offrire la qualificazione dei messaggi e l’instradamento dal DWH al sistema Oltp. Componenti di workflow management possono consentire la sequenzializzazione e interdipendenza di decisioni. Adattatori software forniscono un integrazione degli ambienti desktop e tools di sviluppo. I ruoli sono chiari:

  • i componenti di workflow integrato renderanno più facile lo sviluppo di nuove applicazioni
  • le tecnologie a evento saranno utili per rendere riconoscibili stati di business contenuti nei DWH
  • framework di gestione ad oggetti avranno il compito di identificare meta-oggetti direttamente dai meta-data.

Potrebbe essere questa un evoluzione spinta del DWH da soluzioni focalizzate ad applicazioni integrate nel processo applicativo aziendale.

 

© 1988-2008 - Siseco    |    Home    |    Privacy    |    Credits    |    Commenti    |   P.Iva 01810290120   |