data express 4.0 - conformità, produttività e privacy con dati di test

Conformità, produttività e privacy

con dati di Test

Micro Focus Data Express 4.0 Stefano Capra

2012

Uso dei dati di produzione per i test • I dati sono voluminosi e contengono

informazioni sensibili.

Creazione dei dati di test

• Soluzione onerosa, soggetta ad errori, e spesso basata su processi manuali.

• I dati non sono comprensibili e quindi poco usufruibili dagli utenti finiali.

• I dati spesso non sono disponibili quando il test lo richiede.

• Scarsa qualità dei dati di test che può causare difficoltà nel ciclo di QA.

Ambienti di Test – gli approcci più diffusi

Il 71% delle organizzazioni IT

utilizza dati di produzione per

eseguire i propri test. Research Report on 240 UK, French and German

organizations, May 2008

• Genera un processo automatico per la

generazione di subset di dati

rappresentativi ed anonimizzati.

• Rispetta la referential integrity fisica e

logica anche tra diverse piattaforme.

• Promuove il controllo, la gestione e la

sicurezza dell'ambiente di test.

• Supporta la conformità alle norme

internazionali in materia di protezione dei

dati sensibili alla privacy.

Data Express, la soluzione di Micro Focus

• Fornisce inoltre strumenti di analisi fisica e logica dei dati e di

data change management.

Hierarchical Databases

Analyse,

inventory &

classify data 2

Sequential Files

Relational Databases

Extract masked

data subset 4

Load into test

environment 5

Define test data

creation rules 3

Privacy Data

Masking Rules

Data Subset

Extraction Rules Referential

Model

Unload & extract

production data

into a common

format

1

Knowledge

Base

Il processo di implementazione

Data Builder Module

• Inventario e catalogazione dei file in base a:

– Applicazione di appartenenza;

– Piattaforma e db (DB2, VSAM, Oracle…);

– Occupazione di memoria

– Strutture fisiche

• Analisi dei dati

Un processo di campionamento dei dati genera informazioni statistiche circa il contenuto di ogni campo (impronta digitale) che consente:

– la classificazione dei metadati indipendentemente dalle loro caratteristiche fisiche;

– ulteriori informazioni per la comprensione dell’applicazione

La funzione fornisce informazioni statistiche sul contenuto di ogni campo,

mirando a:

– Rendere automatico e più sicuro il processo di classificazione dei metadati;

– Fornire informazioni utilizzabili per la verifica della qualità dei dati.

Analisi dei dati

• Il processo di mascheramento dati:

– E’ parametrico, automatico, ripetibile e irreversibile.

– Preserva il significato originale dell’informazione.

– Garantisce l’integrità tra gli archivi e l’univocità delle chiavi.

– Ricalcola eventuali codici di controllo (codice fiscale).

• La soluzione gestisce nativamente il mascheramentto di:

– Nomi, cognomi, ragioni sociali, indirizzi, numeri di telefono, codici

alfanumerici univoci, etc. etc.

• Exit routines facilmente personalizzabili.

– Vengono forniti modelli di routine adattabili a ulteriori esigenze

Data Masking Module

Data Subset Extraction Module

• Il processo di stralcio dei dati rispetta il modello relazionale

fisico e/o logico.

• Le regole di subsetting possono essere importate

direttamente da catalogo oppure definite attraverso il

modulo client.

• La simulazione dell’estrazione dati stima:

– il tempo e la cpu necessari per l’estrazione reale.

– la dimensione degli archivi di output.

– la % di riduzione tra ambienti source e target

• Un unico processo può generare dati ridotti e mascherati.

A

B

• Conformità alle normative

il Data Masking garantisce il rispetto della legge

sulla Privacy e di normative interne.

• Riduzione del time-to-market

80 - 90% di risparmio nell’elapsed time per la

generazione degli ambienti di test.

• Data Storage ridotti fino al 90%

il processo automatico della soluzione minimizza le risorse coinvolte,

riduce i costi relativi allo storage e ai MIPS/CPU.

• Riduzione dei rischi e incremento della qualità dei dati di Test

la soluzione produce ambienti di test coerenti e completi, assicurando

test più rigorosi e riducendo i rischi di inattività.

I benefici operazionali e di business

Generazione di ambienti di dati di pre-produzione ridotti e mascherati:

• nel rispetto della legge sulla privacy.

• garantendo la referential integrity.

• assicurando la stessa qualità dei dati di produzione.

Ambienti di test notevolmente contenuti, ridotti da 9 TB a 300 GB per ambiente.

• I dati sono automaticamente estratti, ridotti e mascherati dall’ambiente di produzione.

• L’intervento delle risorse è ridotto al monitoraggio del processo.

• Il risparmio dei MIPS è notevole grazie all’utilizzo degli indici

Ottimizzazione del processo di generazione dell’ambiente di dati:

• Un giorno per un refresh totale. Risparmio del 80% di elapsed.

L’esperienza di SANTANDER: risultati e benefici

Il webinar, della durata di 20 minuti, è disponibile, previa registrazione,

a questo indirizzo:

http://online.microfocus.com/dataexpressIT

data express 4.0 - conformità, produttività e privacy con dati di test

Technology