WS

XDWH Modellierungstool für Enterprise Datawarehouses und andere Informationssysteme

Homepage
Unternehmensprofil
Angebot
Tools
Vorträge
Gedanken
Tips
Kunden und Presse

Kontakt

 
Einführung Features Verfügbarkeit

Einführung

Das zentrale Data Warehouse (DWH) eines Unternehmens, aus dem mehrere Anwendungen und abteilungsspezifische Data Marts mit geprüften Daten versorgt werden, wird sinnvollerweise relational und normalisiert modelliert. Es muß alle Daten enthalten, die später für Auswertungen benötigt werden, und soll möglichst wenig Speicherplatz verbrauchen. Dabei muß das DWH so aufgebaut sein, daß sich alle Benutzer leicht zurechtfinden. Deshalb entsprechen die Entitäten im Data Warehouse den Einheiten im Unternehmen, über die berichtet wird. Die Daten werden aus verschiedenen Entitäten der operativen Datenbanken neu gruppiert und verknüpft. Zum Teil werden auch Daten, die sonst nur über umfangreichere Programme zu ermitteln wären, beim Laden des DWH berechnet und gespeichert.

Es reicht also nicht aus, die Herkunft der Daten aus den operativen Systemen zu dokumentieren. Vielmehr muß für das DWH in einer vorangehenden Modellierungsphase ein eigenes Datenmodell erstellt werden, das den Bezug zwischen den realen Einheiten und Vorgängen im Unternehmen und ihrer Repräsentation im DWH beschreibt. Das Datenmodell eines DWH dient damit gleichermaßen als Plan für die Entwickler des DWH wie auch als Information für die späteren Benutzer, die im Modell alle notwendigen Informationen über den Inhalt und den Aufbau des DWH finden müssen.

Als Medium für eine Online-Dokumentation hat sich HTML bewährt. Damit läßt sich die Dokumentation über einen Intranet-Server ohne großen Aufwand an allen Arbeitsplätzen zur Verfügung stellen. Alternativ können die Dateien auch auf einem normalen File-Server bereitgestellt werden, wobei die Verknüpfungen beim Zugriff mit einem Browser erhalten bleiben.

Im Einzelnen besteht das Datenmodell eines DWH aus folgenden Teilen:

  • In der fachlichen Beschreibung wird der Inhalt nach zusammenhängenden Themengebieten gegliedert. Zu jedem Themengebiet werden die Inhalte aus fachlicher Sicht beschrieben. Sie wird mit einem Editor für HTML-Dokumente erstellt.
  • In Enity-Relationship-Diagrammen werden die physikalischen Entitäten und ihre Relationen in einer Gesamtübersicht und in Auszügen für die Themengebiete dargestellt. Die Diagramme werden mit einem Flow-Charter erstellt und für die HTML-Dokumentation als GIF-Datei exportiert.
  • In der Definition des physikalischen Aufbaus werden alle Dateien, Variablen und benutzerdefinierten Formate beschrieben. Diese Definition wird mit dem XDWH-Tool in eine Datenbank eingegeben und gepflegt. Die entsprechende HTML-Dokumentation wird dann automatisch erzeugt.
  • Speziell beim Einsatz des SAS-Systems ist es sinnvoll, die Erstellung der benutzerdefinierten Formate in das physikalische Modell mit aufzunehmen. Hierzu gehören alle im Unternehmen verwendeten Schlüssel und die physikalische Abbildung von n:1-Relationen für spätere Auswertungen.
Zusätzlich muß in der Modellierungsphase kontrolliert werden, ob alle notwendigen Sichten durch Denormalisierungen dargestellt werden können. Deshalb wird ein spezieller Tabellentyp (Data Mart) benötigt, in dem die Tabellen des DWH über ihre Schlüssel zu denormalisierten Sichten für Auswertungssysteme verknüpft werden.

Features

Im Rahmen des oben beschriebenen Konzepts unterstützt das XDWH-Tool die physikalische Modellierung des Enterprise DWH mit folgenden Features:
  • Zentrale Verzeichnisse für Variablen, Indexes und Formate als "Resoucen" mit umfangreichen Kommentaren
  • Definition der Dateien incl. Beschreibung und folgenden Historisierungskonzepten:
    • Gültigkeitszeitraum: es wird nur ein neuer Satz angelegt, wenn sich eine Variable geändert hat, (z.B. für Vertragsdaten)
    • Stichtag: es wird für jeden Stichtag ein neuer Satz angelegt (z.B. für Salden)
    • Intervall: es wird für jeden Stichtag ein neuer Satz angelegt, die Werte können über beliebige Intervalle aggregiert werden (z.B. für Umsätze)
  • Kommentare für die Zuordnung von Variablen und Indexes zu Dateien
  • Automatische Erstellung der Dateien und des Codes zur Erstellung der Dateien
  • Automatische Erstellung der definierten Formate und des Codes zur Erstellung der Formate und Informate aus Dateien. Dabei werden folgende Varianten unterstützt:
    • direkte Zuordnung, d.h. ein Wert entspricht genau einem Label und umgekehrt
    • "von bis unter" - Logik für Gruppierungen, d.h. alle Werte, die kleiner sind als der nächst größere, erhalten dasselbe Label,
    • "über bis einschließlich" - Logik für Gruppierungen und verkürzte Eingaben, d.h. alle Werte, die größer sind als der nächst kleinere, erhalten dasselbe Label, entsprechendes gilt für Angaben bei Informaten zur Beschleunigung der Eingaben.
    Bei Informaten wird zusätzlich die Upcase-Option zur Unterdrückung der Unterscheidung von Groß- und Kleinschreibung unterstützt.
  • Automatsche Erstellung von Dummy-Äquivalenten für bereits deklarierte aber noch nicht erstellte Formate und Informate in der Modellierungsphase. Damit wird die Angabe der Formate und Informate bei der Definition der Variablen unterstützt.
  • Automatische Erstellung der vollständigen Dokumentation in verknüpften HTML-Files. Hierzu gehören:
    • vollständige Verzeichnisse für Dateien, Formate und Variablen,
    • je ein HTML-File zur Beschreibung eines Formats und seiner Verwendung bei Variablen,
    • je ein HTML-File zur Beschreibung einer Variablen und ihrer Verwendung in Dateien,
    • je ein HTML-File zur Beschreibung einer Datei mit allen Variablen und Indexes sowie ihrer Verwendung zur Erstellung von Data Marts und Formaten,
    • je ein HTML-File zur Beschreibung der Zusammensetzung von Data Marts.

Verfügbarkeit

XDWH ist in der Version 1.4 für die SAS Version 6.12 verfügbar. Für die SAS Version 8 (u.a. lange Datei- und Variablennamen) wird das Tool zur Zeit grundlegend ´┐Żberarbeitet und modernisiert.

Die Erfahrung hat gezeigt, daß eine Installation solcher Tools ohne praktische Einführung mit viel vermeidbarem Einarbeitungsaufwand verbunden und deshalb nicht sinnvoll ist.

Deshalb wird das XDWH-Tool grundsätzlich zusammen mit einer zweitägigen Einführung angeboten. Darüberhinaus ist eine einmonatige betreute Testinstallation möglich.
 
 

 
 

©WS Unternehmensberatung und Controlling-Systeme GmbH
Friedrich-Weinbrenner-Straße 20
69126 Heidelberg

Tel.: 06221 / 401 409
Fax: 06221 / 401 422

EMail: info @ ws-unternehmensberatung.de

Amtsgericht Heidelberg, HRB 5485
Geschäftsführer: Wilfried Schollenberger
zurück zum Anfang