Im ersten Teil dieser Blogserie zum Thema “Herausforderung Datenmanagement im Mittelstand” gab ich Ihnen einen Einblick über Verteilung von produktiven zu sonstigen Daten und Informationen über durchschnittliche jährliche Zuwächse.

Heute schreibe ich über die Herausforderung aktueller Sicherungskonzepte und welche Optimierungsmöglichkeiten es dafür gibt.

Wie werden Daten gesichert?

In vielen Unternehmen sehen wir immer wieder vergleichbare “Datensicherungsstandards”:

  • Wochenende volle Sicherung aller Daten (Full Backup)
  • Wochentags inkrementelles oder differenzielles Backup der Veränderungen
  • Aufbewahrung von Wochen-, Monats- und Jahressicherungen
  • Sicherungszyklus und Aufbewahrung aller Daten ist identisch, eine Klassifizierung nicht möglich ist
  • Daten mit Tapes oder vergleichbarer Technik außer Gefahrenzone bringen (z.B. Bank, Geschäftsführer)
  • Daten wachsen ständig an und müssen alle gleichermaßen gesichert werden

So oder vergleichbar sieht es in den meisten Unternehmen aus, die traditionelle Backups durchführen. Bisher war diese Methodik grundsätzlich nicht falsch. Durch ständiges Datenwachstum und neuen Anforderungen an die IT, wird diese Strategie zunehmend zum Flaschenhals. Sicherungsmedien werden zu klein, Sicherungsfenster reichen nicht mehr aus, Aufbewahrung wird bei Gleichbehandlung aller Daten problematisch, Auslagerung der Daten funktioniert nicht und der administrative Aufwand steigt stetig an.

Sicherungswachstum

Um die Probleme durch den stetigen Wachstum von Daten vor allem auch in Bezug auf die Datensicherung besser zu verstehen, möchte ich dies an einem Beispiel erklären.

Gehen wir von einem mittelständischen Unternehmen aus, welches eine Gesamtkapazität von 13 TB an Daten hat. Diese sind auf einem Storage in Form von virtuellen Maschinen, Filesystemen, Datenbanken und co. abgelegt. Der Anteil an Dateien, welche auf dem Fileserver für den Zugriff von Benutzern abgelegt wurde, liegt bei 3 TB.

Typische Aufbewahrungsfristen

Das Unternehmen möchte innerhalb eines Monats für jeden Tag eine Tagessicherung durchführen und an jedem Wochenende eine Vollsicherung. Die Sicherungen am Monatsende werden für ein Jahr aufgehoben. Zusätzlich soll die letzte Sicherung des Jahres für drei Jahre aufbewahrt werden. Daraus ergeben sich folgende Sicherungskapazitäten:

Sicherungsart Sicherungen Summe
Tagessicherung 20 x 100 GB 2 TB
Wochensicherung 4 x 13 TB 52 TB
Monatssicherung 11 x 13 TB 143 TB
Jahressicherung 2 x 13 TB 26 TB
223 TB

Aus 13 TB zu sichernden Daten werden nach 3 Jahren, ohne den jährlichen Datenwachstum zu berücksichtigen, bereits 223 TB Sicherungsdaten. Wie wir im ersten Blog-Beitrag erkannt haben, liegt der jährliche Datenwachstum bei ca. 40%, wovon die meisten Befragen selbst von nur 20% ausgegangen sind. Treffen wir uns in der Mitte und gehen bei unserem mittelständischen Unternehmen von lediglich 30% jährlichem Wachstum aus.

Datenwachstum im primären Storage

Gehen wir von 13 TB an Gesamtdaten und von einem Wachstum von 30%, erhalten wir bereits nach drei Jahren 22 TB an Daten und nach 5 Jahren 37 TB.

Backupvolumen

Wenn diese 13 TB inklusive dessen Wachstum über die Jahre nach oberen System gesichert werden, erhalten wir nach drei Jahren 396 TB an Backupvolumen und nach 5 Jahren 670 TB. Im Vergleich dazu sind 13 TB bzw. nach 5 Jahren 37 TB an Daten verschwindet gering und in unterem Diagramm kaum noch zu erkennen. Dies verdeutlicht evtl. etwas besser welche Datenmengen bei Backups inzwischen auf Backup to Disk oder Tape abgelegt werden.

Sicherungsbänder und Backup to Disk

Würde man diese Daten mit einer durchschnittlichen Kompressionsrate auf Tapes sichern, ergibt dies bei LTO 5 nach drei Jahren 180 und bei LTO 6 immerhin noch 92 Bänder. Dabei wurde nicht die Trennung von Sicherungen berücksichtigt, sondern einfach die Kapazität 1:1 umgerechnet. Mit einer gewissen Struktur würde man somit noch mehr Bänder benötigen.

Verwendet man anstatt Tapes 4 oder 6 TB Festplatten zur Sicherung, sieht es nicht viel besser aus. Ohne die Verluste durch ein Raid zu berücksichtigen wären es im ersten Jahr 49 Stück 4 TB Festplatten bzw. bei 6 TB Festplatten 33 Stück. Im dritten Jahr hätten wir bereits 99 der 4 TB Festplatten im Einsatz und bei 6 TB 66 Stück.

Backup to Tape
Backup to Disk

Lösungen

Backup to Disk mit echter Block-Deduplizierung

Eine Möglichkeit besteht darin, Backup to Disk mit einer echten Block-Deduplizierung zu verwenden. Dies macht einen großen Unterschied zu normalen Kompressionsmöglichkeiten die pro Backup arbeiten oder Technologien die lediglich pro Vollsicherung eine Deduplizierung durchführen.

Alle eingehenden Daten werden zuerst komprimiert und dann auf kleine Blöcke im Bereich von z.B. 16 bis 128 GB analysiert. Gibt es diesen Block bereits (z.B. in einem Backup vor 8 Monaten), dann wird lediglich ein Pointer zu den bereits bestehenden Daten gespeichert. Durch diese Technik erreicht man eine Einsparung im Bereich von 5 bis 15-fachen. 10 TB Plattenplatz ergeben somit leicht 50 TB an tatsächlichen Sicherungsvolumen.

Nehmen wir wieder unser Beispiel des mittelständischen Unternehmens mit 13 TB an Daten. Es werden im ersten Jahr 196 TB an Sicherungsdaten produziert. Nach einer eher unterdurchschnittlichen Deduplizierung (Faktor 7,5) bleiben davon ca. 26 TB auf Festplatte übrig. Nach drei Jahren hat das Unternehmen ein Sicherungsvolumen durch Tages-, Wochen-, Monats- und Jahressicherungen von 396 TB. Diese belegen nach Komprimierung und Deduplizierung ledig 53 TB auf Backup to Disk. Dies entspricht nicht mehr den 99 Festplatten mit 4 TB (ohne Raid), sondern lediglich 14 dieser Festplatten und kann somit in ein günstiges NAS-System durchaus in zwei oder vier Höheneinheiten untergebracht werden.

Im dritten Teil der Blogserie über die Herausforderung Datenmanagement im Mittelstand wird es um die Dauer von Backups gehen und wie man diese optimieren kann.

Haben Sie Fragen zu diesem Thema?

Ich freue mich auf Ihren Anruf! 
Thomas Schimana EDV-BV Fachspezialist für Datenmanagement und Virtualisierung

Weitere Blog Beiträge

Datenschutzgrundverordnung erfordert neues Abonnieren

Mittwoch, 2 Mai, 2018|Kommentare deaktiviert für Datenschutzgrundverordnung erfordert neues Abonnieren

Datenschutzgrundverordnung erfordert neues Abonnieren Am 25. Mai 2018 tritt die EU-Datenschutz-Grundverordnung (EU-DSGVO) in Kraft, [...]

EDV-BV Frühlingsmesse am 26.04.2018

Donnerstag, 15 März, 2018|Kommentare deaktiviert für EDV-BV Frühlingsmesse am 26.04.2018

EDV-BV Frühlingsmesse am 26.04.2018 Die moderne Arbeitswelt und ihre Auswirkungen auf die IT [...]

EU-Datenschutz-Grundverordnung Infoveranstaltung

Sonntag, 7 Januar, 2018|Kommentare deaktiviert für EU-Datenschutz-Grundverordnung Infoveranstaltung

EU-Datenschutz-Grundverordnung Infoveranstaltung am 10.04, 02.05 und 11.06.18 Am 25. Mai 2018 [...]