Kauf von Technology Co., Ltd. Shenzhen-Universal

Qualitativ hochwertiges Produkt, Dienstleistung, wird der Kern-Anbieter in Laserindustrie!

Startseite > News > Inhalt
So halten Sie Ihre großen Daten Seen klar und navigable
- Jul 03, 2017 -

Die vier Vs der großen Daten sind Volumen, Vielfalt, Geschwindigkeit und Richtigkeit der Daten.

Alle sind wichtige Faktoren, die Datenarchitekten erkennen, wie sie große Datenmanagement-Strategien entwickeln.


Doch da die großen Daten weiterhin in den Unternehmen exponentiell wachsen, beginnen sie, in stagnierende und sogar toxische Datenseen und Repositories zu gelangen, weil so viele Daten in diese Datenaufbewahrungsteiche geworfen und gemischt werden.

In extremen Fällen, in denen jedes neue Bit von großen Daten einfach in einen Datenaufbewahrungsbereich mit knapper Überprüfung geworfen wird, ist die Sichtbarkeit dieser Daten und die Fähigkeit, daraus Wert abzuleiten, fast unmöglich.

Das "Wasser" in diesen Datenseen Wolken und Datenarchitekten und Entwickler sehen, dass es schwieriger wird, mit den Daten auf agile Weise zu arbeiten.


Gemeinsam, diese Taschen von verschmutzten Daten Seen geben Anlass zu einem fünften V, dass ich glaube, es ist Zeit, um große Daten hinzufügen: Viskosität.


Die Viskosität in ihrer üblichen Verwendung wird verwendet, um die Dicke der Flüssigkeiten zu beschreiben. Zum Beispiel hat Honig eine viel höhere Viskosität als Wasser.


Sie können sehen, die Verknüpfung zu Datenseen beginnen, sich von der zunehmenden Verschmutzung zu verformen, die sich aus schlechten Praktiken rund um die Datenreinigung und Archivierung ergibt.

Diese Daten beginnen, schlammig und "congeal" zu dem Punkt zu kommen, wo es nicht mehr navigiert werden kann.


Hier sind einige Schritte, die Datenarchitekten nehmen können, um diese Daten aufzuräumen, damit sie wieder nutzbar gemacht werden können und wie CIOs ihnen helfen können.

1. Ein Geschäftsfall muss gebaut werden.

Die Aufräumung von Daten oder die Suche nach Möglichkeiten zur Umgliederung und Rehabilitierung ist eine Hintergrundaufgabe, die nicht sofort auf eine Verringerung der betrieblichen Aufwendungen oder Erhöhungen der Einnahmen abzielt.

Infolgedessen wird ein Projekt wie dieses, das viele Stunden von einer großen Gehaltsperson Zeit nehmen kann, nicht mit Führungskräften populär sein, die nicht unbedingt die IT verstehen oder schätzen.


Trotzdem müssen die CIOs es verkaufen.


Die geschäftlichen Vorteile sind:

1. Ihre Zeit für den Markt für Business Analytics wird sich verbessern, wenn Ihre Daten sauber und agil sind

2. gut verwaltete Daten verbessern die Einhaltung von Vorschriften und Governance

3. Datensicherheit und Verwahrung werden verbessert, weil durch die Ausrichtung der Daten, können Sie auch überprüfen Zugriffsberechtigungen und Datenspeicher Sicherheit Richtlinien

4. Kosteneinsparungen könnten dazu beitragen, wenn Sie Ihre Datenaufbewahrungsregeln definieren und unnütze Daten verwerfen, die zu Inhouse- oder Cloud-Lagerkosten beitragen.


2. Datenarchitekten sollten den Bau einer Seenkette berücksichtigen.

Separate Datenseen sind hilfreich, wenn sie nach Themenbereich organisiert werden. Zum Beispiel könnte es einen Datensee für Verkauf und Marketing geben.

Ein zweiter Datensee könnte durch Fertigung und Ingenieurwesen genutzt werden. Ein Drittel könnte für die Finanzierung sein, und so weiter.


Wenn es darum geht, Daten aus diesen unterschiedlichen Datenquellen zu aggregieren, können getrennte "Build" Pools von Daten erstellt werden, indem sie aus diesen Ursprungsdatenseen zusammenfassen, aber die Integrität der Ursprungsdatenseen wird beibehalten.


Die verteilte Datenarchitektur könnte auf einem einzelnen Server durchgeführt werden, indem mehrere Datenbanken und / oder Systempartitionen eingerichtet werden. Oder es könnte auf mehreren Servern durchgeführt werden.

In jedem Fall gibt es wahrscheinlich mehr Verarbeitungs-Overhead, um Daten zu halten, die in Ursprungs-Subjekt-Seen getrennt sind, aber dieser Wert wird durch die Daten-Agilität und Organisation zurückgegeben, die Sie gewinnen.


3. Die von diesen Datenseen geteilten Daten müssen normalisiert werden.

Wenn Datenüberlappung vorliegen, müssen Datenarchitekten über Möglichkeiten verfügen, um Probleme wie zwei verschiedene Begriffe aus zwei verschiedenen Systemen zu lösen, die dieselben Daten oder Datenelemente mit unterschiedlichen Werten beschreiben.


Am Ende ist das Ziel, saubere Daten zu haben, die gut organisiert und verwaltet werden.

Wenn die Daten organisiert, verwaltet und leicht mit Daten aus anderen sauberen Datenseen für analytische Abfragen, die mehrere Bereiche des Themas überspannen, aggregiert werden, werden die Anwendungen, die diese Daten verwenden, agiler, weil Sie sie nicht mehr fressende Daten füttern.


Das Beste von allen, Sie haben Ihr Unternehmen positioniert, um in Analytik voranzukommen, denn die Qualität Ihrer Daten hält Sie nicht mehr zurück.