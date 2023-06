Amazon Web Services (AWS) kündigte kürzlich die Einführung von AWS Glue Data Quality an, einer serverlosen Lösung, die für eine hochwertige Datenverwaltung in Data Lakes und Pipelines entwickelt wurde. Da Data Lakes immer beliebter werden, wird die Sicherstellung der Datenqualität immer wichtiger, um zu verhindern, dass sie sich in einen Datensumpf verwandeln. Das Einrichten der Datenqualität erfordert jedoch in der Regel manuelle Arbeit und zeitaufwändige Prozesse. AWS Glue Data Quality rationalisiert die Verwaltung der Datenqualität und reduziert den Zeitaufwand für manuelle Aufgaben von mehreren Tagen auf nur wenige Stunden.

Der Service automatisiert die Berechnung von Datenstatistiken, schlägt Regeln für die Datenqualität vor, überwacht die Daten und sendet Warnungen, wenn eine Verschlechterung der Datenqualität festgestellt wird. Folglich wird die Identifizierung fehlender, veralteter oder falscher Daten effizienter und bewahrt Unternehmen vor möglichen negativen Auswirkungen. Als Teil der AWS Glue-Suite macht AWS Glue Data Quality die Verwaltung und Wartung der Infrastruktur überflüssig. Der Service automatisiert den Prozess der Berechnung von Datenstatistiken und der Empfehlung von Datenqualitätsregeln und verbessert so die Aktualität, Genauigkeit und Integrität der Daten.

Diese Automatisierung reduziert nicht nur den manuellen Arbeitsaufwand bei der Datenanalyse und Regelfindung, sondern ermöglicht auch die Verwendung vordefinierter Datenqualitätsregeln. Eine umfassende Liste der unterstützten Regeln finden Sie in der Data Quality Definition Language (DQDL). Darüber hinaus ist AWS Glue Data Quality über mehrere Plattformen zugänglich, darunter AWS Glue Data Catalog, Glue Studio und Glue Studio Notebooks. Dank dieser Vielseitigkeit können Datenverwalter Regeln im Data Catalog festlegen, während Entwickler Datenintegrationspipelines über Notebook-basierte Schnittstellen erstellen können. Darüber hinaus können Dateningenieure über interaktive Sitzungen Aufträge von ihrem bevorzugten Code-Editor aus übermitteln.

