Die Verwaltung ihres Datenbestand mit Data Map in Purview
Aktualisiert: 30. Sept. 2022
Sammlungen und Quellen[/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]Betrachten wir ein Szenario mit mehr als 1000 Ressourcen. Ohne eine angemessene Gruppierungspraxis wäre es unmöglich, alle Ressourcen durchzugehen. Außerdem wäre das Ändern der Zugriffsebenen aller 1000 Ressourcen, die zur gleichen Kategorie gehören, eine unproduktive Aufgabe, die Stunden dauern könnte. Um dies in den Griff zu bekommen, sind Sammlungen und Quellen sehr nützlich. Sammlungen und Ressourcen können Benutzern helfen, ihre Datenressourcen effektiv zu verwalten. Wir können uns das wie eine hierarchische Struktur vorstellen, jede Sammlung kann mehrere zusammenhängende Quellen enthalten, wir können verschiedene Rollen für Sammlungen festlegen, so dass die wichtigsten Benutzer und Gruppen auf die Ressourcen in der Sammlung zugreifen und darauf reagieren können. Alle Quellen in den Sammlungen sind durch die Anmeldeinformationen gesichert. Data Map speichert die Metadaten von allen Ressourcen mit einer elastischen Autoskalierung. Sie kann mit der niedrigsten Kapazität von einer Einheit beginnen und sich mit der Größe der Last erhöhen. [/et_pb_text][et_pb_image src=”https://hubsters.de/wp-content/uploads/2021/11/purview_datamap1.png” title_text=”purview_datamap1″ _builder_version=”4.8.1″ _module_preset=”default”][/et_pb_image][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]
Registrieren und Scannen[/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]In Purview können wir Datenressourcen in der Sammlung registrieren und sie scannen, um die Metadateninformationen zu erhalten. Purview bietet viele Arten von Datenquellen zur Registrierung, nicht nur die Dienste von Azure, sondern auch von anderen Plattformen. Dazu gehören strukturierte und unstrukturierte Back-End-Datenbanken wie Hive und SQL-Server sowie das Front-End-Datenvisualisierungstool Power BI. Am Ende können die Nutzer den Weg von den Rohdaten zur Visualisierung nachvollziehen. Wenn in der Visualisierung etwas schief läuft, können die Hauptnutzer die Rohdatenquellen der Werte in den Berichten leicht identifizieren und erhalten darüber hinaus Informationen über die Dateneigentümer und Datenverwalter. Der gesamte Prozess der Identifizierung der Ursache und der verantwortlichen Person wird erheblich verkürzt. [/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]Purview Scanning kann die technischen Informationen über die Datenquellen wie den technischen Namen, den Datentyp und die Größe ermitteln. Es kann das Schema von Datenressourcen für strukturierte Daten extrahieren. Die Geschäftsinformationen wie Klassifizierung, Glossar, Beschreibungen können beim Scannen automatisch gefunden oder manuell zu jedem Asset hinzugefügt werden.[/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]
Ausweis[/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]Jeder Scan benötigt die Zugangsdaten der entsprechenden Ressourcen. Diese Autorisierungsmethode bietet Sicherheit für die Daten der Kunden, da purview kein Passwort oder Zugangsschlüssel direkt speichert. Stattdessen können Benutzer die Key Vault-Verbindung in Purview herstellen und Geheimnisse als Anmeldeinformationen hinzufügen. Die vier möglichen Wege zur Authentifizierung des Purview-Kontos sind Managed Identity, Service Principal, SQL Authentication und Account Key oder Basic Authentication. Wenn Benutzer die Geheimnisse als Anmeldeinformationen hinzufügen, sollten sie auch die passende Authentifizierungsmethode auswählen. Die Berechtigungsverwaltung bietet eine Schnittstelle zur Verwaltung der Schlüsseltresore und Geheimnisse.[/et_pb_text][et_pb_image src=”https://hubsters.de/wp-content/uploads/2021/11/purview_datamap2.png” title_text=”purview_datamap2″ _builder_version=”4.8.1″ _module_preset=”default”][/et_pb_image][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]
Scan Regeln[/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px” min_height=”124px”]Nachdem die Ressourcenverbindung getestet wurde, können die Assets in dieser Ressource gescannt werden. Die Benutzer können den Scan für den gesamten Bereich oder nur für bestimmte Ordner oder Tabellen einstellen. Die Optionen basieren auf der Art der Quelle, die der Benutzer scannen möchte. Der Scan kann festgelegt oder regelmäßig geplant werden, z. B. wöchentlich oder monatlich. Bei regelmäßigen Scans gilt die Einstellung für den erstmaligen Scan auch für jeden weiteren Scan. Jede Prüfung folgt einer Prüfregel. Diese Regel definiert, nach welchen Informationen der Scan suchen soll, welche Klassifizierungsregel für Spalten verwendet werden soll und so weiter. Es gibt bereits einige Standard-Scanregeln für viele Arten von Ressourcen wie Azure Data Lake und SQL-Datenbanken. Benutzer können benutzerdefinierte Scanregeln mit speziellen Klassifizierungsregeln und Musterregeln je nach Bedarf festlegen. So können die Klassifizierung und die Musterzuordnung nach dem Scan automatisch generiert werden.[/et_pb_text][et_pb_image src=”https://hubsters.de/wp-content/uploads/2021/11/purview_datamap3.png” title_text=”purview_datamap3″ _builder_version=”4.8.1″ _module_preset=”default”][/et_pb_image][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]Innerhalb der Scan-Regeln gibt es Typen wie Musterregeln und Klassifizierungsregeln, die dabei helfen, Ihre Datenbestände oder Ordner zu kategorisieren. [/et_pb_text][et_pb_image src=”https://hubsters.de/wp-content/uploads/2021/11/classification_pattern_rules_purview.png” title_text=”classification_pattern_rules_purview” _builder_version=”4.8.1″ _module_preset=”default”][/et_pb_image][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]
Musterregeln[/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]Musterregeln werden für Azure File, Data Lake, Blob Storage und Amazon S3 verwendet. Nach der Auswahl des Speicherkontos für die Musterregel gilt die Regel ab dem nächsten Scan für dieses bestimmte Konto oder diesen Container. Benutzer können Statistiken und dynamische Ersetzer verwenden, um den qualifizierten Namen von Assets abzugleichen. So kann die Regel für eine Gruppe von Daten zugeordnet werden und den Anzeigenamen verwenden, den die Benutzer in der Regel hinzufügen. Wenn die Dateien nicht gruppiert werden sollen, können Benutzer die Option “Nicht als Ressourcengruppe gruppieren” aktivieren. [/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]
Klassifizierung[/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]Die Zielklassifizierung hilft dem Benutzer, spezielle Daten oder einen bestimmten Datentyp im Datenbestand zu finden. Es gibt viele Standard-Klassifizierungsregeln, die für den Scan-Regelsatz verwendet werden können. Kunden können auch benutzerdefinierte Klassifizierungsregeln erstellen, um den Datentyp für ihre eigenen Datensätze zu erkennen, wie z. B. Primärschlüssel oder Produktions-ID. Das Wörterbuch listet alle möglichen Objekte auf, die die Spalte enthalten kann. Es gibt auch einen Schwellenwert für die Mindestübereinstimmung, der anzeigt, wie viel Prozent des Spalteninhalts mindestens mit dem Ausdruck oder dem Wörterbuch übereinstimmen müssen. [/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]
Schlussfolgerung[/et_pb_text][et_pb_text _builder_version=”4.8.1″ header_2_font_size=”22px”]Data Map bietet ein elastisches Pay-as-you-go-Modell, so dass sich der Kunde keine Gedanken über die Skalierung und die Größenbeschränkung für die Funktionen machen muss. Sie ist die Grundlage von Purview für Data Discovery und Data Governance. Mit der Registrierungs- und Scan-Funktion für alle Datenquellen können Sie Ihre Data-Governance-Reise mit dem geringsten Aufwand beginnen. [/et_pb_text][/et_pb_column][/et_pb_row][et_pb_row _builder_version=”4.4.8″][et_pb_column type=”4_4″ _builder_version=”4.4.8″][et_pb_divider color=”#74c2d2″ _builder_version=”4.4.8″][/et_pb_divider][/et_pb_column][/et_pb_row][/et_pb_section][et_pb_section fb_built=”1″ _builder_version=”4.4.8″][et_pb_row column_structure=”1_3,2_3″ _builder_version=”4.4.8″ max_width=”862px” max_width__hover_enabled=”on|desktop”][et_pb_column type=”1_3″ _builder_version=”4.4.8″ custom_padding=”0px||0px|27px|false|false”][et_pb_image src=”https://hubsters.de/wp-content/uploads/2020/12/Qianyu_Chen.jpg” alt=”Linus Trips HUBSTER.S” title_text=”Qianyu_Chen” _builder_version=”4.8.1″ max_width_tablet=”30%” custom_margin=”|||0px|false|false” custom_margin_tablet=”” custom_margin_phone=”||-26px|0px|false|false” custom_margin_last_edited=”on|phone” custom_padding=”|||0px|false|false” module_alignment_tablet=”left”][/et_pb_image][/et_pb_column][et_pb_column type=”2_3″ _builder_version=”4.4.8″][et_pb_blurb title=”Qianyu Chen” _builder_version=”4.8.1″ custom_margin=”36px||||false|false”]
Qianyu Chen ist Solution Architect für Data Analytics und Machine Learning.[/et_pb_blurb][et_pb_blurb use_icon=”on” font_icon=”%%153%%” icon_color=”#303344″ icon_placement=”left” use_icon_font_size=”on” icon_font_size=”20px” _builder_version=”4.8.1″ header_text_align=”left” custom_margin=”||30px||false|false” animation=”off” link_option_url=”mailto:christoph.monzel@hubsters.de” body_text_align_tablet=”center” body_text_align_phone=”center” body_text_align_last_edited=”on|phone” text_orientation_tablet=”left” text_orientation_phone=”left” text_orientation_last_edited=”on|tablet” module_alignment_tablet=”center” module_alignment_phone=”” module_alignment_last_edited=”on|tablet”]
qianyu.chen@hubsters.de[/et_pb_blurb][/et_pb_column][/et_pb_row][/et_pb_section]