schule/its/tex/backup.tex

%Notizen:

\section{Backup}
	\subsection{Sicherungsarten}
		\subsubsection{Großvater - Vater - Sohn Prinzip}
			(auch Generationenprinzip genannt): Bei diesem Verfahren wird bspw. an 4 Tagen auf jeweils eine Festplatte (Sohn) das Backup geschrieben (Festplatten T1-T4). Am 5. Tag wird eine Wochensicherung gemacht und zurück gelegt (Festplatten W1-W4). Die darauffolgende Woche wird T1-T4 jeweils wieder mit neuen Backups überschrieben und eine neue Wochensicherung erzeugt. Am Ende des Monats wird die erste Monatssicherung erstellt (M1-M12). Daraufhin werden wieder alle T und W Festplatten überschrieben. Im neuen Jahr wird dann am Ende des 1. Monats zum ersten mal M1 überschrieben. Das heißt es können bis zu 1 Jahr alte Daten zurückgesichert werden.
		\subsubsection{Vollbackup}
			Hier werden alle Daten gesichert. Dies ist der Grundstein für andere Backupverfahren. Vorteil ist, es wird immer nur ein Band zur Wiederherstellung benötigt, jedoch hat das einen sehr hohen Speicherbedarf.
		\subsubsection{Inkrementelles Backup}
			Am ersten Tag wird ein Vollbackup erstellt. Daraufhin werden nurnoch die Unterschiede zum Vortag gesichert. Dieses Verfahren hat einen niedrigen Speicherbedarf, da immer nur Änderungen gespeichert werden und alle ungeänderten Daten in älteren Backups liegen. Die Wiederherstellung kann dadurch jedoch unter umständen zeitintensiv werden, da jede Datei in unterschiedlichen Inkrementen in der Vergangenheit liegen können und dadurch alle Speicher durchsucht werden müssen.
		\subsubsection{Differentielles Backup}
			Am ersten Tag wird ein Vollbackup erstellt. Daraufhin wird jeden Tag die Differenz (die Änderungen) zum Vollbackup gesichert. Der Vorteil dabei ist, dass nicht alle Bänder zur Verfügung stehen müssen, um etwas wiederherzustellen. Es reicht das Vollbackup + Tages Band. Dadurch ist die Rücksicherung auch schneller, benötigt jedoch mehr Speicherplatz wie das inkrementelle Backup.

		\newpage
	\subsection{RAID}
		\texttt{RAID} steht für "'Redundant Array of Independent Disks"'

		\subsubsection{RAID 0 (Striping)}
			\begin{figure}[ht!]
				\centering
				\includegraphics[scale=0.5]{156px-RAID_0.png}
			\end{figure}
			Es fehlt die Redundanz aber alle Festplatten werden zu einer logischen Platte zusammengeführt. Damit können Zugriffe auf allen Platten parallel (und nicht wie bei normalen Platten sequentiell) durchgeführt werden. Um möcglichst schnell Daten parallel abfragen zu können, werden diese in Datenblöcke zerlegt (striping) und auf den unterschiedlichen Platten verteilt. Die Größe der Datenblöcke wird als Striping-Granularität (auch chunk size) bezeichnet (meistens 64kB). Fällt eine Festplatte aus, können die Daten nicht mehr vollständig rekonstruiert werden (abgesehen von kleinen Dateien unter der chunk size des Systems).

		\subsubsection{RAID 1 (Mirroring)}
			\begin{figure}[ht!]
				\centering
				\includegraphics[scale=0.5]{156px-RAID_1.png}
			\end{figure}
			Hier werden alle Daten jeweils auf allen Festplatten gespeichert (gespiegelt). Dieses System bietet eine hohe Ausfallsicherheit, da bei einem Ausfall einer Platte die andere Festplatte immernoch alle Daten bereitstellen kann. Beim lesen der Daten wird die Leistung erhöht (bei 2 Platten doppelte Leseleistung), da parallel von verschiedenen Festplatten Sektoren gelesen werden kann (Geschwindigkeit gleich hoch wie bei RAID 0).

			\newpage

		\subsubsection{RAID 5 (Block-Level-Striping + Parität)}
			\begin{figure}[ht!]
				\centering
				\includegraphics[scale=0.5]{320px-RAID_5.png}
			\end{figure}
			Hier werden die Daten wie bei RAID 0 in Blöcken verteilt auf die Festplatten, jedoch wird dazu immer eine Paritätsinformation erzeugt und auch auf den verschiedenen Platten gespeichert (Unterschied zu RAID 4). Dadurch können die Festplatten sehr Effizient genutzt werden und die Daten sind trotzdem redundant. Der Controller ist jedoch sehr teuer und lohnt sich bei wenigen Platten meistens nicht (RAID 10 günstiger). Die Parität wird durch eine XOR Operation über die Nutzdaten erstellt.

		\subsubsection{RAID 6 (Block-Level-Striping + doppelt verteilte Parität)}
			\begin{figure}[ht!]
				\centering
				\includegraphics[scale=0.5]{320px-RAID_6.png}
			\end{figure}
			Dieses System verkraftet bis zu 2 gleichzeitig ausfallende Festplatten. Die Wiederherstellung einer Platte dauert viele Stunden in denen RAID 6 im Vergleich zu RAID 5 trotzdem noch vor einem weiteren Ausfall geschützt ist.

		\subsubsection{RAID 01}
			\begin{figure}[ht!]
				\centering
				\includegraphics[scale=0.5]{240px-RAID_01.png}
			\end{figure}
			Ist ein RAID 1 Verbund über mehrere RAID 0 Verbünde (01 Leserichtung von unten nach oben). Dieser Verbund kann auch mit einer ungeraden Anzahl an Festplatten erzeugt werden (im Gegensatz zu RAID 10). Dann werden bei bspw. 3 Platten auf jeder 50\% Nutzdaten und 50\% Spiegelung der Nutzdaten einer anderen Platte eingeteilt. Die Daten werden wie bei RAID 0 gestriped und bei Ausfall müssen in diesem Fall 2 von 3 Platten in Takt sein, um die Daten vollständig wiederherstellen zu können.

		\subsubsection{RAID 10}
			\begin{figure}[ht!]
				\centering
				\includegraphics[scale=0.5]{240px-RAID_10.png}
			\end{figure}
			Ist ein RAID 0 Verbund über mehrere RAID 1 Verbünde. Dabei werden Sicherheit und gesteigerte Schreib-/Lesegeschwindigkeiten miteinander kombiniert. Hierbei wird immer eine gerade Anzahl >= 4 an Festplatten benötigt. Es bietet eine schnellere Rekonstruktion der Daten, da diese im unteren Zweig (RAID 1) wiederhergestellt werden und nicht über den Hauptzweig wie bei RAID 01.

		\subsubsection{RAID 50}
			Benötigt mindestens 6 Festplatten und bietet einen hohen Datendurchsatz, da die Daten auf 2 XOR-Units verteilt wird. Dieser Verbund wird bei Datenbanken verwendet, bei denen Schreibdurchsatz und Redundanz im Vordergrund stehen.

		\newpage

	\subsection{Storage}
		\begin{figure}[ht!]
			\centering
			\includegraphics[scale=0.5]{dasnassan.jpg}
		\end{figure}

		\subsubsection{DAS (Direct Attached Storage)}
			An einen einzelnen Rechner angeschlossene Festplatten. Es kann nur über den Host auf die Festplatten zugegriffen werden. Sollte dieser also ausfallen, gibt es keinen Zugriff mehr auf die Daten. Ein Vorteil ist der geringe Hardwareaufwand, da die Platte nur mit einem PC verbunden werden muss und nicht weiter konfiguriert wird.

		\subsubsection{NAS (Network Attached Storage)}
			Ist ein einfach zu verwaltender Dateiserver. Es dient dazu die Speicherkapität im Netz freizugeben und muss daher über zusätzliche Übertragungsprotokolle (SMB/CIFS) verfügen. Vorteile dieses Systems sind: ein niedrigerer Energieverbrauch wie herkömmliche PC-Systeme. NAS können große Datenmengen mehreren Benutzern über Freigaben schnell zugänglich gemacht werden. NAS-Systeme können mit mehreren Festplatten ausgestattet werden und damit im RAID geschalten werden.

		\subsubsection{SAN (Storage Area Network)}
			Ist ein Netzwerk zur Anbindung von Disk-Arrays und Tape-Libraries an Server Systeme. Das bedeutet, Server belasten mit Zugriffen auf Daten nicht das interne Netzwerk, sondern können über Fibre Channel auf das SAN zugreifen. Die Zugriffe auf das Speichergerät und dessen Dateisystem wird durch den zugreifenden Rechner verwaltet (wie bei DAS). Strukturell ist ein SAN analog zu einem LAN aufgebaut ?> Router, Switches, Hubs