This page has been robot translated, sorry for typos if any. Original content here.

SMART

S.M.A.R.T.

SMART (aus dem Englischen. Selbstüberwachungs-, Analyse- und Berichterstellungstechnologie - Technologie zur Selbstüberwachung, Analyse und Berichterstellung) - eine Technologie zur Beurteilung des Zustands einer Festplatte mit eingebautem Selbstdiagnosegerät sowie ein Mechanismus zur Vorhersage des Zeitpunkts ihres Ausfalls.

Geschichte

Die erste Festplatte mit einem Selbstdiagnosesystem wurde 1992 von IBM in IBM 9337-Festplattenarrays für AS / 400-Server mit IBM 0662 SCSI-2-Festplatten eingeführt. Die Technologie wurde Predictive Failure Analysis (PFA) genannt. Es wurden mehrere Schlüsselparameter gemessen, die direkt vom Plattencontroller ausgewertet wurden. Das Ergebnis war auf nur ein Bit beschränkt: Entweder ist alles in Ordnung, oder die Festplatte fällt bald aus. Später entwickelten Compaq, Seagate, Quantum und Conner eine weitere Technologie namens IntelliSafe. Es war ein allgemeines Protokoll zur Ausgabe von Informationen über den Status der Festplatte, aber die gemessenen Parameter und ihre Schwellenwerte wurden von jedem Unternehmen unabhängig bestimmt.

Anfang 1995 bot Compaq an, die Technologie zu standardisieren. IBM, Seagate, Quantum, Conner und Western Digital (letztere hatten zu diesem Zeitpunkt kein Festplatten-Tracking-System) unterstützten diese Idee. Grundlage war die Technologie IntelliSafe. Der gemeinsam entwickelte Standard hieß SMART. Der SMART I-Standard sah die Überwachung der Grundparameter vor und wurde erst nach dem Befehl gestartet.

Hitachi beteiligte sich an der Entwicklung von SMART II und bot eine Methode zur vollständigen Selbstdiagnose des Laufwerks (erweiterter Selbsttest) sowie eine Fehlerprotokollierungsfunktion an. SMART III verfügt über eine Funktion zum Erkennen von Oberflächenfehlern und die Möglichkeit, diese für den Benutzer transparent wiederherzustellen.

Beschreibung

SMART überwacht die Hauptmerkmale des Laufwerks, von denen jedes eine Bewertung erhält. Merkmale können in zwei Gruppen unterteilt werden:

  • 1) Parameter, die den natürlichen Alterungsprozess der Festplatte widerspiegeln (Spindeldrehzahl, Anzahl der Kopfbewegungen, Anzahl der Ein- und Ausschaltzyklen);
  • 2) Aktuelle Laufwerkparameter (Höhe der Köpfe über der Plattenoberfläche, Anzahl der neu zugewiesenen Sektoren, Zeit für die Spurensuche und Anzahl der Suchfehler).

Die Daten werden in hexadezimaler Form gespeichert, als Rohwert („Rohwerte“) bezeichnet und dann in einen Wert umgewandelt - ein Wert, der die Zuverlässigkeit in Bezug auf einen bestimmten Referenzwert symbolisiert. Normalerweise reicht der Wert von 0 bis 100 (einige Attribute haben Werte von 0 bis 200 und von 0 bis 253).

Eine hohe Punktzahl zeigt an, dass sich dieser Parameter nicht ändert oder sich langsam verschlechtert. Niedrig - ein möglicher Ausfall in naher Zukunft.

Ein Wert, der unter dem Mindestwert liegt, ab dem der Hersteller den störungsfreien Betrieb des Frequenzumrichters garantiert, führt zum Ausfall des Knotens.

Mit der SMART-Technologie können Sie:

  • 1) Überwachen von Zustandsparametern;
  • 2) Oberflächenabtastung;
  • 3) Oberflächenabtastung mit automatischem Ersetzen von zweifelhaften Sektoren durch zuverlässige.

Es ist zu beachten, dass Sie mit der SMART-Technologie den Ausfall des Geräts aufgrund von mechanischen Fehlern vorhersagen können, was etwa 60% der Ursachen für den Ausfall der Festplatte entspricht. SMART kann die Auswirkungen eines Spannungsstoßes oder eines mechanischen Schlags nicht vorhersagen.

Es sollte beachtet werden, dass Laufwerke ihren Zustand nicht unabhängig mit SMART-Technologie melden können, es gibt jedoch spezielle Programme dafür. Daher ist der Einsatz der SMART-Technologie ohne die folgenden zwei Komponenten nicht möglich:

  • 1) in den Speichercontroller eingebettete Software;
  • 2) In den Host eingebettete externe Software.

Programme, die den Status von SMART-Attributen anzeigen, arbeiten nach dem folgenden Algorithmus:

  • Überprüfen Sie die Verfügbarkeit des SMART-Technologie-Supports durch das Laufwerk.
  • Senden eines Abfragebefehls SMART-Tables;
  • Tabellen in den Anwendungspuffer bringen;
  • Dekodierung von Tabellenstrukturen, Extrahieren der Attributnummer und ihres numerischen Wertes;
  • Vergleich standardisierter Attributnummern mit ihren Namen (manchmal abhängig von Typ, Modell oder Hersteller, wie zum Beispiel im Victoria-Programm);
  • Ausgabe numerischer Werte in lesbarer Form (z. B. Umwandlung von Hexadezimalwerten in Dezimalwerte);
  • Extrahieren von Attributflags aus Tabellen (Attribute, die die Attributzuweisung in einem bestimmten Laufwerk kennzeichnen, z. B. "Vital" oder "Zähler");
  • Zeigt den Gesamtstatus des Geräts basierend auf allen Tabellen, Werten und Flags an.

SMART-Attribute

Die bekannte SMART-Attributtabelle sieht folgendermaßen aus:

Nein Hex Attributname Besser wenn ... Beschreibung
01 01 Raw Read Error Rate
Weniger
Die Fehlerrate beim Lesen von Daten von der Festplatte, deren Ursprung auf den Hardwareteil der Festplatte zurückzuführen ist.
Für alle Seagate, Samsung (F1 und neuer) Laufwerke und Fujitsu 2.5? Dies ist die Anzahl der internen Korrekturen von Daten, die vor der Ausgabe an die Schnittstelle ausgeführt wurden, sodass es möglich ist, ruhig auf erschreckend große Zahlen zu reagieren.
02 02 Durchsatzleistung
Mehr
Gesamtleistung der Festplatte. Wenn der Attributwert abnimmt, liegt wahrscheinlich ein Problem mit der Festplatte vor.
03 03 Anlaufzeit
Weniger
Zeitpunkt der Förderung des Scheibenpakets vom Ruhezustand zur Arbeitsgeschwindigkeit.
Sie wächst, wenn die Mechanik abgenutzt ist (erhöhte Reibung im Lager usw.). Dies kann auch auf eine schlechte Leistung hinweisen (z. B. Spannungsabfall am Anfang einer Scheibe).
04 04 Start / Stop Count Die Gesamtzahl der Start / Stopp-Zyklen der Spindel. Die Laufwerke einiger Hersteller (z. B. Seagate) verfügen über einen Einschaltzähler. Das Rohwertfeld speichert die Gesamtzahl der Starts / Stopps der Festplatte.
05 05 Neu zugewiesene Sektoren zählen
Weniger
Die Anzahl der Sektor-Neuzuweisungsoperationen. Wenn eine Festplatte einen Lese- / Schreibfehler erkennt, markiert sie den Sektor als „neu zugewiesen“ und überträgt die Daten in einen dedizierten Sicherungsbereich . Aus diesem Grund ist es unmöglich, fehlerhafte Blöcke auf modernen Festplatten zu erkennen - sie sind alle in neu zugewiesenen Sektoren verborgen. Dieser Vorgang wird als Neuzuordnung bezeichnet, und der neu zugewiesene Sektor wird neu zugeordnet. Je größer der Wert ist, desto schlechter ist der Oberflächenzustand der Platten. Das Rohwertfeld enthält die Gesamtzahl der neu zugewiesenen Sektoren.
Die Erhöhung des Wertes dieses Attributs kann auf eine Verschlechterung des Oberflächenzustands der Pfannkuchen der Scheibe hindeuten.
06 06 Lesen Sie die Channel Margin Lesen von Aktienkanälen. Der Zweck dieses Attributs ist nicht dokumentiert. In modernen Antrieben wird nicht verwendet.
07 07 Fehlerrate suchen
Weniger
Fehlerrate beim Positionieren der Magnetkopfeinheit. Je mehr von ihnen, desto schlechter ist der Zustand der Mechanik und / oder der Oberfläche der Festplatte. Der Parameterwert kann auch durch Überhitzung und externe Vibrationen (z. B. von benachbarten Scheiben im Korb) beeinflusst werden.
08 08 Zeit Leistung suchen
Mehr
Die durchschnittliche Leistung der Positionierung von Magnetköpfen. Wenn der Attributwert abnimmt (Verlangsamung der Positionierung), ist die Wahrscheinlichkeit von Problemen mit dem mechanischen Teil des Stellantriebs hoch.
09 09 Einschaltdauer (Betriebsstunden)
Weniger
Die Anzahl der Stunden (Minuten, Sekunden - je nach Hersteller), die im eingeschalteten Zustand gehalten werden. Als Schwellenwert wird die Passzeit zwischen Ausfällen (MTBF - Mean Time Between Failure) gewählt.
10 0A Anzahl der Wiederholungsversuche
Weniger
Die Anzahl der wiederholten Versuche, eine Disc auf ihre Betriebsgeschwindigkeit zu bringen, falls der erste Versuch nicht erfolgreich war. Wenn der Attributwert zunimmt, besteht eine hohe Wahrscheinlichkeit von Problemen mit dem mechanischen Teil.
11 0B Neukalibrierungsversuche
Weniger
Die Anzahl der Neukalibrierungswiederholungsversuche, falls der erste Versuch fehlgeschlagen ist. Wenn der Attributwert zunimmt, ist die Wahrscheinlichkeit von Problemen mit dem mechanischen Teil hoch.
12 0C Gerät aus- und wieder einschalten Die Anzahl der vollständigen Ein-Aus-Zyklen der Festplatte.
13 0D Soft Read-Fehlerrate
Weniger
Die Anzahl der Lesefehler, die aufgrund des Fehlers der Software nicht behoben werden konnten. Alle Fehler sind nicht mechanischer Natur und zeigen nur die falsche Kennzeichnung / Interaktion mit den Festplattenprogrammen oder dem Betriebssystem an.
184 B8 End-to-End-Fehler
Weniger
Dieses Attribut - Teil der HP SMART IV-Technologie - bedeutet, dass nach der Datenübertragung durch den Cache die Parität der Daten zwischen Host und Festplatte nicht übereinstimmt.
187 BB Gemeldete UNC-Fehler
Weniger
Fehler, die mit Hardwarefehler-Lösungstechniken nicht behoben werden konnten.
188 BC Befehls-Timeout
Weniger
Die Anzahl der unterbrochenen Vorgänge aufgrund eines Festplatten-Timeouts. Normalerweise sollte dieser Attributwert Null sein, und wenn der Wert viel höher als Null ist, treten höchstwahrscheinlich ernsthafte Stromprobleme oder oxidierte Datenkabel auf.
190 BE Luftstromtemperatur (WDC)
Weniger
Die Temperatur der Luft auf der Festplatte. Für Seagate-Laufwerke wird die Formel verwendet (100 - HDA-Temperatur). Für Western Digital-Laufwerke - (125-HDA).
191 Bf G-sense Fehlerrate
Weniger
Die Anzahl der Fehler, die sich aus Stoßbelastungen ergeben. Das Attribut speichert die Messwerte des eingebauten Beschleunigungsmessers, der alle Stöße, Erschütterungen, Stürze und sogar ungenaue Installationen der Festplatte im Computergehäuse aufzeichnet.
192 C0 Zählung der Ausschaltrückzüge
Weniger
Die Anzahl der Abschaltzyklen oder Abstürze (Ein- / Ausschalten des Laufwerks).
193 C1 Lade- / Entladezyklus
Weniger
Die Anzahl der Zyklen, um den Magnetkopfblock in der Parkzone / in der Arbeitsposition zu bewegen.
194 C2 HDA-Temperatur
Weniger
Die Messwerte des eingebauten Wärmesensors für den mechanischen Teil der Festplattenbänke (HDA - Hard Disk Assembly) werden hier gespeichert. Informationen werden aus dem eingebauten Wärmesensor entfernt, der einer der Magnetköpfe ist, normalerweise der Boden in der Bank. Die aktuellen, minimalen und maximalen Temperaturen sind in den Attributbitfeldern festgelegt. Nicht alle Programme, die mit SMART arbeiten, analysieren diese Felder korrekt. Daher sollte ihre Aussage kritisch behandelt werden.
195 C3 Hardware-ECC wiederhergestellt
Weniger
Die Anzahl der Hardware-Festplatten zur Fehlerkorrektur (Lesen, Positionieren, Übertragen auf der externen Schnittstelle). Bei Festplatten mit SATA-Schnittstelle verschlechtert sich der Wert häufig mit zunehmender Systembusfrequenz - SATA reagiert sehr empfindlich auf Übertaktung.
196 C4 Anzahl der Neuzuweisungsereignisse
Weniger
Die Anzahl der Neuzuordnungsvorgänge. Das Feld "Rohwert" des Attributs speichert die Gesamtzahl der Versuche, Informationen aus den neu zugewiesenen Sektoren in den Ersatzbereich zu übertragen. Es werden sowohl erfolgreiche als auch erfolglose Versuche gezählt.
197 C5 Anzahl der aktuell ausstehenden Sektoren
Weniger
Die Anzahl der Sektoren, die ersetzt werden können. Sie wurden noch nicht als schlecht identifiziert, aber das Lesen unterscheidet sich vom Lesen eines stabilen Sektors. Dies sind die sogenannten verdächtigen oder instabilen Sektoren. Bei erfolgreicher nachträglicher Lektüre des Sektors wird dieser von der Anzahl der Kandidaten ausgeschlossen. Bei wiederholten fehlerhaften Lesevorgängen versucht das Laufwerk, die Daten wiederherzustellen, und führt eine erneute Zuordnung durch.
Die Erhöhung des Werts dieses Attributs kann auf eine physische Verschlechterung der Festplatte hinweisen.
198 C6 Nicht korrigierbare Sektoranzahl
Weniger
Die Anzahl der nicht einstellbaren (Plattenmittel) Sektoren. Bei einer Erhöhung der Fehlerzahl ist die Wahrscheinlichkeit von kritischen Oberflächenfehlern und / oder der Mechanik des Antriebs hoch.
199 C7 UltraDMA-CRC-Fehleranzahl
Weniger
Die Anzahl der Fehler, die auftreten, wenn Daten über eine externe Schnittstelle im UltraDMA-Modus übertragen werden (Verstöße gegen die Paketintegrität usw.). Das Anwachsen dieses Attributs weist auf ein schlechtes (zerknittertes, verdrilltes) Kabel und schlechte Kontakte hin. Solche Fehler treten auch während des Übertaktens des PCI-Busses, bei Stromausfällen, starken elektromagnetischen Aufnehmern und manchmal aufgrund des Treibers auf.
Vielleicht der Grund für die schlechte Qualität der Feder. Verwenden Sie zur Behebung ein schleifenloses SATA-Kabel mit fester Verbindung zu den Laufwerkskontakten.
200 C8 Schreibfehlerrate /
Mehrzonenfehlerrate
Weniger
Zeigt die Gesamtzahl der Fehler an, die beim Schreiben eines Sektors auftreten. Zeigt die Gesamtzahl der Festplattenschreibfehler an. Kann als Indikator für Oberflächenqualität und Antriebsmechanik dienen.
201 C9 Soft Read Fehlerrate
Weniger
Die Häufigkeit von "Software" -Fehlern beim Lesen von Daten von der Festplatte.

Dieser Parameter zeigt die Häufigkeit von Fehlern bei Lesevorgängen von der Plattenoberfläche aufgrund eines Softwarefehlers an, nicht jedoch die Hardware des Laufwerks.

202 CA. Datenadressmarkierungsfehler
Weniger
Markieren Sie (DAM) die herstellerspezifische Nummer des Data Address Markers (DAM).
203 CB Run out abbrechen
Weniger
Die Anzahl der ECC-Fehler.
204 CC Weiche ECC-Korrektur
Weniger
Die Anzahl der von der Software korrigierten ECC-Fehler.
205 CD Thermische Unebenheitsrate (TAR)
Weniger
Anzahl der thermischen Unebenheiten.
206 CE Flughöhe Die Höhe zwischen dem Kopf und der Oberfläche der Festplatte.
207 CF. Hochstrom durchdrehen
Weniger
Die Stärke des Stroms während der Promotion der Disc.
208 D0 Drehen Sie Buzz Anzahl der Buzz-Routinen zum Hochfahren des Laufwerks.
209 D1 Offline-Suchleistung Suchleistung im Offline-Betrieb.
220 DC Disk Shift
Weniger
Der Versatz des Plattenblocks zur Spindel. Entsteht meist aus einem Schlag oder einem Sturz. Maßeinheit unbekannt. Mit zunehmendem Attribut wird die Festplatte schnell funktionsunfähig.
221 DD G-Sense-Fehlerrate
Weniger
Die Anzahl der durch externe Lasten und Stöße verursachten Fehler. Das Attribut speichert die Messwerte des eingebauten Stoßsensors.
222 DE Geladene Stunden Die Zeit, die von der Magnetkopfeinheit zwischen dem Entladen vom Parkbereich zum Arbeitsbereich der Platte und dem Zurückladen der Einheit zum Parkbereich verbracht wird.
223 Df Anzahl der Wiederholungen beim Laden / Entladen Die Anzahl der neuen Versuche, den Magnetkopfblock nach einem erfolglosen Versuch vom / zum Parkbereich zu entladen / zu laden.
224 E0 Lastreibung
Weniger
Die Größe der Reibungskraft der Magnetköpfe beim Abladen von der Parkfläche.
225 E1 Anzahl der Ladezyklen
Weniger
Die Anzahl der Zyklen, um einen Block von Magnetköpfen im Parkbereich zu bewegen.
226 E2 Lade 'in'-Zeit Die Zeit, die das Laufwerk benötigt, um die Magnetköpfe vom Parkbereich auf die Arbeitsfläche der Disc zu entladen.
227 E3 Drehmomentverstärkungszahl
Weniger
Die Anzahl der Versuche, das Drehmoment zu kompensieren.
228 E4 Ein- und Ausschaltzyklus
Weniger
Die Anzahl der Wiederholungen des automatischen Parkens eines Blocks von Magnetköpfen infolge des Ausschaltens.
230 E6 GMR-Kopfamplitude Die Amplitude des "Jitters" (die Entfernung der sich wiederholenden Bewegung des Magnetkopfblocks).
231 E7 Temperatur
Weniger
Die Temperatur der Festplatte.
240 F0 Kopf Flugstunden Die Gesamtzeit in Stunden, die das Hauptgerät in Betriebsposition verbracht hat.
250 FA Fehlerwiederholungsrate lesen
Weniger
Die Anzahl der Fehler beim Lesen einer Festplatte.

Wo

  • Mehr - Ein größerer Parameterwert ist besser.
  • Weniger - Ein kleinerer Parameterwert ist besser.
  • Kritischer Parameter - Hintergrund der roten Linie