Amazon Web Services (AWS) kondigde onlangs de lancering aan van AWS Glue Data Quality, een serverloze oplossing die ontworpen is om data van hoge kwaliteit te beheren in data lakes en pipelines. Nu datameren steeds populairder worden, is het belangrijk om de datakwaliteit te waarborgen om te voorkomen dat ze veranderen in datamoerassen. Het vaststellen van datakwaliteit gaat echter meestal gepaard met handmatig werk en tijdrovende processen. AWS Glue Data Quality stroomlijnt het beheer van datakwaliteit en reduceert de tijd die wordt besteed aan handmatige taken aanzienlijk van enkele dagen tot slechts enkele uren.

De service automatiseert de berekening van datastatistieken, stelt regels voor datakwaliteit voor en bewaakt gegevens, waarbij waarschuwingen worden verzonden wanneer een daling in de datakwaliteit wordt gedetecteerd. Hierdoor wordt het identificeren van ontbrekende, verouderde of onjuiste gegevens efficiënter, waardoor bedrijven mogelijke negatieve gevolgen kunnen voorkomen. Als onderdeel van de AWS Glue-suite elimineert AWS Glue Data Quality de noodzaak voor infrastructuurbeheer en -onderhoud. De service automatiseert het proces van het berekenen van datastatistieken en het aanbevelen van datakwaliteitsregels, waardoor de versheid, nauwkeurigheid en integriteit van data wordt verbeterd.

Deze automatisering vermindert niet alleen het handmatige werk dat komt kijken bij data-analyse en het identificeren van regels, maar maakt het ook mogelijk om vooraf gedefinieerde regels voor datakwaliteit te gebruiken. Raadpleeg de Data Quality Definition Language (DQDL) voor een uitgebreide lijst van ondersteunde regels. Bovendien is AWS Glue Data Quality toegankelijk via meerdere platforms, waaronder AWS Glue Data Catalog, Glue Studio en Glue Studio-notebooks. Dankzij deze veelzijdigheid kunnen data stewards regels instellen in de Data Catalog, terwijl ontwikkelaars data-integratie pipelines kunnen bouwen met behulp van notebookgebaseerde interfaces. Bovendien kunnen data-engineers taken indienen vanuit hun favoriete code-editor via interactieve sessies.

