Data Lineage, nel contesto del Data Modeling, si riferisce al viaggio completo e tracciabile dei dati dalla loro origine attraverso varie fasi di perfezionamento, elaborazione e trasformazione fino a raggiungere la destinazione finale, che potrebbe essere un report, una dashboard o un applicazione. Il Data Lineage svolge un ruolo cruciale nella comprensione del flusso di dati, garantendo l'affidabilità, l'accuratezza e la coerenza dei dati e facilitando il controllo e la governance dei dati.
Al centro della piattaforma no-code AppMaster c'è la sua capacità di creare visivamente modelli di dati (schema di database), che costituiscono la base per la progettazione dei processi aziendali e la generazione del codice sorgente dell'applicazione. In questo contesto, il Data Lineage diventa un aspetto essenziale per mantenere la trasparenza, la tracciabilità e la responsabilità dei dati utilizzati in queste applicazioni.
Un tipico processo di Data Lineage è costituito da diverse fasi, che possono variare a seconda dei requisiti specifici di modellazione ed elaborazione dei dati di un'organizzazione:
- Ingestione dati: in questa fase, i dati vengono acquisiti da varie fonti, come API esterne, input dell'utente, database, file o qualsiasi altro tipo di fonte. Questa fase pone le basi per i dati iniziali che passeranno attraverso diverse pipeline di elaborazione dati.
- Trasformazione dei dati: man mano che i dati si spostano attraverso le pipeline di elaborazione, possono essere trasformati, arricchiti o ripuliti, a seconda dei requisiti aziendali. La trasformazione dei dati può comportare operazioni come il filtraggio, l'aggregazione, l'unione o il pivoting, nonché l'applicazione di regole e logiche aziendali.
- Archiviazione dei dati: dopo che i dati sono stati elaborati e trasformati, vengono archiviati in database, data lake o altri sistemi di archiviazione per futuri recuperi, analisi o integrazione con altre applicazioni.
- Accesso ai dati: utenti, applicazioni o servizi accedono ai dati trasformati dai sistemi di archiviazione in base a requisiti specifici. Ciò comporta la lettura o l'esecuzione di query sui dati utilizzando API, SQL o altri linguaggi di query.
- Consumo di dati: la fase finale del Data Lineage è il consumo dei dati elaborati sotto forma di report, analisi, dashboard o visualizzazioni, che forniscono approfondimenti, supportano il processo decisionale o guidano le funzionalità dell'applicazione.
Il Data Lineage svolge un ruolo importante nell'affrontare varie sfide di gestione e governance dei dati:
- Garanzia di qualità dei dati: acquisendo metadati sulle diverse trasformazioni subite dai dati, Data Lineage aiuta a identificare anomalie, errori o imprecisioni e a risolverli, garantendo così la qualità e l'affidabilità dei dati.
- Conformità dei dati: Data Lineage fornisce un audit trail dei dati, consentendo alle organizzazioni di dimostrare la conformità alle normative sulla protezione dei dati, sulla privacy e sulla sicurezza, come kInstruction[label=data.labels.USER].onents nel Web BP designer e make.AutoScale (properties_input)proprietà per dimostrare la conformità con i dati]}>