data express 4.0 - conformità, produttività e privacy con dati di test
DESCRIPTION
Data Express 4.0 - Conformità, produttività e privacy con dati di TestTRANSCRIPT
Conformità, produttività e privacy
con dati di Test
Micro Focus Data Express 4.0 Stefano Capra
2012
Uso dei dati di produzione per i test • I dati sono voluminosi e contengono
informazioni sensibili.
Creazione dei dati di test
• Soluzione onerosa, soggetta ad errori, e spesso basata su processi manuali.
• I dati non sono comprensibili e quindi poco usufruibili dagli utenti finiali.
• I dati spesso non sono disponibili quando il test lo richiede.
• Scarsa qualità dei dati di test che può causare difficoltà nel ciclo di QA.
Ambienti di Test – gli approcci più diffusi
Il 71% delle organizzazioni IT
utilizza dati di produzione per
eseguire i propri test. Research Report on 240 UK, French and German
organizations, May 2008
• Genera un processo automatico per la
generazione di subset di dati
rappresentativi ed anonimizzati.
• Rispetta la referential integrity fisica e
logica anche tra diverse piattaforme.
• Promuove il controllo, la gestione e la
sicurezza dell'ambiente di test.
• Supporta la conformità alle norme
internazionali in materia di protezione dei
dati sensibili alla privacy.
Data Express, la soluzione di Micro Focus
• Fornisce inoltre strumenti di analisi fisica e logica dei dati e di
data change management.
Hierarchical Databases
Analyse,
inventory &
classify data 2
Sequential Files
Relational Databases
Extract masked
data subset 4
Load into test
environment 5
Define test data
creation rules 3
Privacy Data
Masking Rules
Data Subset
Extraction Rules Referential
Model
Unload & extract
production data
into a common
format
1
Knowledge
Base
Il processo di implementazione
Data Builder Module
• Inventario e catalogazione dei file in base a:
– Applicazione di appartenenza;
– Piattaforma e db (DB2, VSAM, Oracle…);
– Occupazione di memoria
– Strutture fisiche
• Analisi dei dati
Un processo di campionamento dei dati genera informazioni statistiche circa il contenuto di ogni campo (impronta digitale) che consente:
– la classificazione dei metadati indipendentemente dalle loro caratteristiche fisiche;
– ulteriori informazioni per la comprensione dell’applicazione
La funzione fornisce informazioni statistiche sul contenuto di ogni campo,
mirando a:
– Rendere automatico e più sicuro il processo di classificazione dei metadati;
– Fornire informazioni utilizzabili per la verifica della qualità dei dati.
Analisi dei dati
• Il processo di mascheramento dati:
– E’ parametrico, automatico, ripetibile e irreversibile.
– Preserva il significato originale dell’informazione.
– Garantisce l’integrità tra gli archivi e l’univocità delle chiavi.
– Ricalcola eventuali codici di controllo (codice fiscale).
• La soluzione gestisce nativamente il mascheramentto di:
– Nomi, cognomi, ragioni sociali, indirizzi, numeri di telefono, codici
alfanumerici univoci, etc. etc.
• Exit routines facilmente personalizzabili.
– Vengono forniti modelli di routine adattabili a ulteriori esigenze
Data Masking Module
Data Subset Extraction Module
• Il processo di stralcio dei dati rispetta il modello relazionale
fisico e/o logico.
• Le regole di subsetting possono essere importate
direttamente da catalogo oppure definite attraverso il
modulo client.
• La simulazione dell’estrazione dati stima:
– il tempo e la cpu necessari per l’estrazione reale.
– la dimensione degli archivi di output.
– la % di riduzione tra ambienti source e target
• Un unico processo può generare dati ridotti e mascherati.
A
B
• Conformità alle normative
il Data Masking garantisce il rispetto della legge
sulla Privacy e di normative interne.
• Riduzione del time-to-market
80 - 90% di risparmio nell’elapsed time per la
generazione degli ambienti di test.
• Data Storage ridotti fino al 90%
il processo automatico della soluzione minimizza le risorse coinvolte,
riduce i costi relativi allo storage e ai MIPS/CPU.
• Riduzione dei rischi e incremento della qualità dei dati di Test
la soluzione produce ambienti di test coerenti e completi, assicurando
test più rigorosi e riducendo i rischi di inattività.
I benefici operazionali e di business
Generazione di ambienti di dati di pre-produzione ridotti e mascherati:
• nel rispetto della legge sulla privacy.
• garantendo la referential integrity.
• assicurando la stessa qualità dei dati di produzione.
Ambienti di test notevolmente contenuti, ridotti da 9 TB a 300 GB per ambiente.
• I dati sono automaticamente estratti, ridotti e mascherati dall’ambiente di produzione.
• L’intervento delle risorse è ridotto al monitoraggio del processo.
• Il risparmio dei MIPS è notevole grazie all’utilizzo degli indici
Ottimizzazione del processo di generazione dell’ambiente di dati:
• Un giorno per un refresh totale. Risparmio del 80% di elapsed.
L’esperienza di SANTANDER: risultati e benefici
Il webinar, della durata di 20 minuti, è disponibile, previa registrazione,
a questo indirizzo:
http://online.microfocus.com/dataexpressIT