Direkter Datenzugriff auf Binärdateien
Bytes laden anstatt Dateien ...
Direkter Zugriff auf Binärdateien
Der Zugriff auf die Daten einer Datei war im letzten Tutorial von C++ Grundlagen bisher immer seriell. Man musste erst die davor stehenden Daten lesen, um an die weiter hinten stehenden zu gelangen. Die Daten sind ja auf hintereinander liegenden Speicherplätzen der Festplatte angeordnet. Der Zugriff erfolgt dabei über einen Datenzeiger, der bei jedem Lesen und Schreiben automatisch weitergestellt wird.
Ein C++ Programmierer kann jedoch der PC Hardware ganz genau vorschreiben was sie zu tun und/oder zu lassen hat (Java ist im Vergleich dagegen noch nichtmal in der Lage, rauszufinden ob der Processor Virtuell ist oder nicht...!).Da der Datenzeiger der Festplattte nunmal Bestandteil der Hardware ist, können wir somit auch den Dateizeiger gezielt auf der Platte rumtanzen lassen. Üblicherweise benutzt man in C++ Binärdateien zur Verwaltung und Speicherung von Datensätzen. Mit dem direktem Zugriff auf bestimmte Daten einer Datei (ohne vorheriges Lesen vorstehender Daten) erreichen wir folgende Vorteile:
- Maximale Geschwindigkeitsausnutzung - Nichts ist schneller
- Durch die genaue Positionierung kommt nur das zurück was wir "bestellt" haben.
- Gespeicherte und zurück geladene Binärdateien haben sich nicht verändert. Das bedeutet z.B., dass riesige, komplexe Datemstrukturen oder andere Benutzerdefinierte Datentypen (z.B. Objektorientierte Programmierung) nicht deserialisiert werden muss. In vielen Sprachen ist sowas unvorstellbar!
- Man kann z.B. öffters Burnout´s mit 7200 UpM auf gleichen Position veranstalten. Die rasche Abnutzung hat den Nebeneffekt, dass die Platte frühzeitig an Altsheimer erkrannt und man ist gezwungen eine neue zu kaufen- Neu bedeutet oft schneller & besser!
Hierzu verfügt das Objekt fstream über die smarte Methode seekg()!
Im Beispiel gibt es eine Datenstruktur "datenStruktur". Direkt darunter wird ein Array mit genau diesem Typ erstellt und hat einem Index von 6! Somit haben wir jetzt eine Datenstruktur von der Größe 7 * 204 Bytes!
Datei:
Quelldateien/main.cpp- #include <iostream> // std::cout, std::endl, std::cin
- #include <stdlib.h> // EXIT_SUCCESS
- #include <fstream> // std::fstream
- #include <string> // std::cin >>
- #include <conio.h> // getch()
-
- using std::fstream;
- using std::system;
- using std::cout;
-
- struct datenStruktur
- {
- char name[100]; // 100 Bytes
- char Nachname[100]; // 100 Bytes
- long nummer; // 4 bytes
- };
-
- datenStruktur StrukturGruppe[] = {
- { "Meister", "Meier", 1 },
- { "Proper", "Nachname", 2 },
- { "MEISTERT", "Schroeder", 3 },
- { "Martin", "Krause", 4 },
- { "Marius", "Schmitz", 5 },
- { "frischer", "Hofmann", 6 },
- { "TonyStark", "Montana", 7 }
- }, rDatenStruktur;
-
-
- int main(void)
- {
- // Binärdatei zum Schreiben und Lesen öffnen
- fstream stream("StrukturGruppeArray.dat", std::ios::in | std::ios::out | std::ios::binary);
- if (stream.is_open())
- {
- // Vorzeichenlose Int Variable mit dem Wert ((204*7)/204) == 7! Errechnet die Anzahl
- // an datenStruktur im Array StrukturGruppe[]
- unsigned int uIStrukturArrayCount = (sizeof(StrukturGruppe) / sizeof(datenStruktur));
- // StrukturGruppenArray per Binäroperator übergeben
- // sowie die Gesamtgröße der StrukturGruppe in Bytes übergeben
- stream.write(
- (char*)&StrukturGruppe,
- uIStrukturArrayCount * sizeof(datenStruktur)
- );
- // Die gesamte Datenstruktur sollte jetzt auf deiner Platte neben deiner *.exe Datei
- // in "StrukturGruppeArray.dat" als Binärdatei gespeichert sein.
- // Falls das nicht geklappt hat, erstelle die Datei manuell!
-
- // Auf Nutzereingabe warten, welche bestimmt welche von denn Verfügbaren Datenstrukturen
- // gezielt aus der StrukturGruppeArray.dat geladen werden soll
- unsigned int datenSatz;
- do
- {
- cout << "Datensatz anzeigem: [1-" << uIStrukturArrayCount << "]: ";
- std::cin >> datenSatz;
- } while (datenSatz < 1 || datenSatz > uIStrukturArrayCount);
- /*
- * Per fstream.write() haben wir eben das StrukturGruppe[] Array/Objekt binär nach StrukturGruppeArray.dat
- * kopiert. Die Gesamt Göße der StrukturGruppeArray.dat Datei müsste exakt 1428 Bytes betragen.
- * Mit fstream.read(...) kann der Inhalt der Datei wieder geladen werden. Bei einem einfachem Aufruf würde der
- * Dateizeiger am Anfang der Datei (Position 0 inerhalb der Datei) anfangen und sie bis zum Ende auslesen.
- * Mit der Methode fstream.seekg() können wir die Startposition ändern.
- * Angenommen du gibst 5 bei "Datensatz anzeigem" ein, sähe die Berechnung für denn Aufruf so aus:
- *
- * stream.seekg((5-1) * 204);
- *
- * Minus 1 wird gerecchnet, weil die niedrigste Eingabe bei "Datensatz anzeigem" als 1 angezeigt wurde. sie
- * aber in Wirklichkeit 0 ist. Die neue Rechnug sieht also so aus:
- *
- * stream.seekg(816);
- */
- stream.seekg((datenSatz - 1) * sizeof(datenStruktur));
- // Als nächstes wird fstream.read() ausgeführt.
- stream.read(
- (char*)&rDatenStruktur,
- sizeof(datenStruktur)
- );
- /*
- * Dem ersten Parameter wurde dem binärem Operator (char*) eine Referenz von rDatenStruktur übergeben.
- * Der zweite Parameter besagt, wieviele Bytes ausgelesen werden sollen. Hier wurden umgerechnet 204
- * übergeben was exakt eine Strukturgröße ist. Der Dateizeiger fängt also bei Byte 816 erst an und
- * liesst auch nur 204 Bytes bis zum 1020ten Byte. Die Strucktur wird durch die Referenz übertragen.
- *
- */
- stream.close();
- cout << "Name: " << rDatenStruktur.name << "\t\t" \
- << "Nachname: " << rDatenStruktur.Nachname << "\t";
- cout << "Nummer: " << rDatenStruktur.nummer << std::endl;
- }
- else
- {
- stream.clear();
- cout << "StrukturGruppeArray.dat konnte nicht geladen werden!" << std::endl;
- }
-
- getch();
- return EXIT_SUCCESS;
- }