This page has been robot translated, sorry for typos if any. Original content here.

SMART

S.M.A.R.T.

SMART (aus dem Englischen. Selbstüberwachungs-, Analyse- und Berichtstechnologie - Technologie der Selbstüberwachung, Analyse und Berichterstattung) - eine Technologie zur Bewertung des Status einer Festplatte mit eingebauter Selbstdiagnoseausrüstung sowie ein Mechanismus zur Vorhersage des Zeitpunkts seines Ausfalls.

Geschichte von

Die erste Festplatte mit einem Selbstdiagnosesystem wurde 1992 von IBM in IBM 9337-Disk-Arrays für AS / 400-Server mit IBM 0662 SCSI-2-Festplatten eingeführt. Die Technologie wurde Predictive Failure Analysis (PFA) genannt. Mehrere Schlüsselparameter wurden gemessen, sie wurden direkt vom Plattencontroller ausgewertet. Das Ergebnis war auf nur ein Bit beschränkt: entweder ist alles in Ordnung, oder die Platte könnte bald ausfallen. Später entwickelten Compaq, Seagate, Quantum und Conner eine andere Technologie namens IntelliSafe. Es war ein allgemeines Protokoll zum Ausgeben von Informationen über den Status der Festplatte, aber die gemessenen Parameter und ihre Schwellenwerte, die jede Firma unabhängig bestimmt hat.

Anfang 1995 bot Compaq an, die Technologie zu standardisieren. IBM, Seagate, Quantum, Conner und Western Digital (letzteres hatte zu dieser Zeit kein Festplattenverfolgungssystem) unterstützten diese Idee. Die Basis wurde Technologie IntelliSafe genommen. Der gemeinsam entwickelte Standard hieß SMART, der SMART I Standard zur Überwachung der Basisparameter und wurde erst nach dem Kommando gestartet.

Hitachi nahm an der Entwicklung von SMART II, ​​bietet eine Methode der vollständigen Selbstdiagnose des Laufwerks (erweiterte Selbsttest), erschien auch Fehlerprotokollierung. SMART III verfügt über eine Funktion zum Erkennen von Oberflächendefekten und der Fähigkeit, diese für den Benutzer transparent wiederherzustellen.

Beschreibung

SMART überwacht die Hauptmerkmale des Laufwerks, von denen jedes eine Bewertung erhält. Merkmale können in zwei Gruppen unterteilt werden:

  • 1) Parameter, die den Prozess der natürlichen Alterung der Festplatte widerspiegeln (Spindeldrehzahl, Anzahl der Kopfbewegungen, Anzahl der Ein-Aus-Zyklen);
  • 2) aktuelle Antriebsparameter (Höhe der Köpfe über der Plattenoberfläche, Anzahl der neu zugewiesenen Sektoren, Suchzeit und Anzahl der Suchfehler).

Die Daten werden in Hexadezimalform gespeichert, der so genannte Rohwert ("rohe Werte"), und dann in einen Wert konvertiert, einen Wert, der die Zuverlässigkeit relativ zu einem Referenzwert symbolisiert. In der Regel liegt der Wert zwischen 0 und 100 (einige Attribute haben Werte von 0 bis 200 und von 0 bis 253).

Ein hoher Wert zeigt an, dass keine Änderungen in diesem Parameter oder seiner langsamen Verschlechterung vorhanden sind. Niedrig - ein möglicher Fehler in naher Zukunft.

Ein Wert kleiner als das Minimum, bei dem der Hersteller den fehlerfreien Betrieb des Antriebs garantiert, bedeutet, dass der Knoten ausfällt.

Mit der SMART-Technologie können Sie:

  • 1) Überwachung der Zustandsparameter;
  • 2) Oberflächenabtastung;
  • 3) Oberflächenabtastung mit automatischem Ersatz von zweifelhaften Sektoren durch zuverlässige.

Es sollte beachtet werden, dass die SMART-Technologie es ermöglicht, den Ausfall des Geräts aufgrund von mechanischen Fehlern vorherzusagen, was ungefähr 60% der Ursachen eines Festplattenausfalls ist. SMART kann die Auswirkungen eines Spannungsstoßes oder mechanischen Schocks nicht vorhersagen.

Es sollte angemerkt werden, dass Laufwerke ihren Zustand nicht mithilfe der SMART-Technologie selbst melden können. Es gibt jedoch spezielle Programme dafür. Daher ist die Verwendung der SMART-Technologie ohne die folgenden zwei Komponenten nicht möglich:

  • 1) in den Speichercontroller eingebettete Software;
  • 2) Externe Software, die in den Host eingebettet ist.

Programme, die den Status von SMART-Attributen anzeigen, funktionieren nach dem folgenden Algorithmus:

  • Überprüfen Sie, ob die Technologie zur Unterstützung von SMART-Laufwerken vorhanden ist.
  • Senden eines Abfragebefehls SMART-tables;
  • Tabellen in den Anwendungspuffer holen;
  • Dekodierung von Tabellenstrukturen, Extrahieren der Attributnummer und ihres numerischen Werts;
  • Vergleich von standardisierten Attributnummern mit ihren Namen (manchmal abhängig vom Typ, Modell oder Hersteller, wie im Victoria-Programm);
  • Ausgabe numerischer Werte in einer Form, die leicht zu lesen ist (zB Umwandlung von Hexadezimalwerten in Dezimalwerte);
  • Extrahieren von Attributflags aus den Tabellen (Attribute, die die Attributzuordnung in einem bestimmten Laufwerk charakterisieren, z. B. "vital" oder "counter");
  • Zeigt den Gesamtstatus des Geräts basierend auf allen Tabellen, Werten und Flags an.

SMART-Attribute

Die Tabelle bekannter Attribute SMART sieht folgendermaßen aus:

Nein Hex Attributname Besser wenn ... Beschreibung
01 01 Roh-Lese-Fehlerrate
Weniger
Die Fehlerrate beim Lesen von Daten von der Festplatte, deren Ursprung auf den Hardwareteil der Festplatte zurückzuführen ist.
Für alle Seagate, Samsung (F1 und neuer) Laufwerke und Fujitsu 2.5? Dies ist die Anzahl der internen Korrekturen der Daten, die vor der Ausgabe an die Schnittstelle durchgeführt wurden, daher ist es möglich, auf beängstigend große Zahlen ruhig zu reagieren.
02 02 Durchsatzleistung
Mehr
Gesamtleistung der Festplatte Wenn der Attributwert abnimmt, ist es wahrscheinlich, dass es Probleme mit der Festplatte gibt.
03 03 Spin-up-Zeit
Weniger
Zeitpunkt der Förderung des Scheibenpakets vom Ruhezustand zur Arbeitsgeschwindigkeit
Er wächst, wenn sich die Mechanik abnutzt (erhöhte Reibung im Lager usw.), kann auch auf schlechte Leistung hinweisen (z. B. Spannungsabfall zu Beginn einer Scheibe).
04 04 Anzahl starten / stoppen Die Gesamtzahl der Start-Stopp-Zyklen der Spindel. Einige Disc-Hersteller (z. B. Seagate) - Power-On-Modus-Zähler. Das Rohwertfeld speichert die Gesamtzahl der Starts / Stopps der Festplatte.
05 05 Reallocated Sectors Count
Weniger
Die Anzahl der Sektor-Neuzuordnungsvorgänge. Wenn eine Festplatte einen Lese- / Schreibfehler erkennt, markiert sie den Sektor als "neu zugewiesen" und überträgt die Daten an einen dedizierten Sicherungsbereich . Aus diesem Grund ist es unmöglich, auf modernen Festplatten schlechte Blöcke zu sehen - sie sind alle in neu zugewiesenen Sektoren versteckt. Dieser Prozess wird als Neuzuordnung bezeichnet und der neu zugeordnete Sektor wird neu zugeordnet. Je größer der Wert ist, desto schlechter ist der Oberflächenzustand der Platten. Das Rohwertfeld enthält die Gesamtzahl der neu zugewiesenen Sektoren.
Der Anstieg des Werts dieses Attributs kann eine Verschlechterung des Oberflächenzustands der Pfannkuchen der Platte anzeigen.
06 06 Kanalrand lesen Lagerkanalablesung. Der Zweck dieses Attributs ist nicht dokumentiert. In modernen Antrieben wird nicht verwendet.
07 07 Fehlerrate suchen
Weniger
Fehlerrate beim Positionieren der Magnetkopfeinheit. Je mehr von ihnen, desto schlechter ist der Zustand der Mechanik und / oder der Oberfläche der Festplatte. Der Parameterwert kann auch durch Überhitzung und externe Vibrationen (z. B. von benachbarten Scheiben im Korb) beeinflusst werden.
08 08 Suche nach der Zeitleistung
Mehr
Die durchschnittliche Leistung der Operation der Positionierung von Magnetköpfen. Wenn der Attributwert abnimmt (Verlangsamungspositionierung), ist die Wahrscheinlichkeit von Problemen mit dem mechanischen Teil des Aktuators hoch.
09 09 Einschaltzeitzählung (Einschaltzeiten)
Weniger
Die Anzahl der Stunden (Minuten, Sekunden - je nach Hersteller) im eingeschalteten Zustand. Die Pausenzeit zwischen Ausfällen (MTBF - mean time between failure) wird als der Schwellenwert dafür gewählt.
10 0A Spin-Up-Wiederholungsanzahl
Weniger
Die Anzahl der wiederholten Versuche, eine Disc auf ihre Betriebsgeschwindigkeit zu drehen, falls der erste Versuch nicht erfolgreich war. Wenn der Attributwert ansteigt, besteht eine hohe Wahrscheinlichkeit von Problemen mit dem mechanischen Teil.
11 0B Neukalibrierungsversuche
Weniger
Die Anzahl der Wiederholungen von Rekalibrierungsanforderungen für den Fall, dass der erste Versuch nicht erfolgreich war. Wenn der Attributwert ansteigt, ist die Wahrscheinlichkeit von Problemen mit dem mechanischen Teil hoch.
12 0C Anzahl der Geräte aus Die Anzahl der vollständigen Ein / Aus-Zyklen der Festplatte.
13 0D Soft Read Fehlerrate
Weniger
Die Anzahl der Fehler beim Lesen, aufgrund des Fehlers der Software, der nicht korrigiert werden konnte. Alle Fehler sind nicht mechanischer Natur und zeigen nur die falsche Markierung / Interaktion mit den Festplattenprogrammen oder dem Betriebssystem an.
184 B8 Ende-zu-Ende-Fehler
Weniger
Dieses Attribut - Teil der HP SMART IV-Technologie - bedeutet, dass nach der Übertragung von Daten über den Cache die Parität der Daten zwischen dem Host und der Festplatte nicht übereinstimmt.
187 BB Berichtete UNC-Fehler
Weniger
Fehler, die mit Methoden der Hardware-Fehlerbehandlung nicht behoben werden konnten.
188 BC Befehlszeitüberschreitung
Weniger
Die Anzahl der unterbrochenen Vorgänge aufgrund des HDD-Timeouts. Normalerweise sollte dieser Attributwert Null sein, und wenn der Wert viel höher als Null ist, dann wird es wahrscheinlich einige ernsthafte Stromversorgungsprobleme oder oxidierte Datenkabel geben.
190 BE Luftstromtemperatur (WDC)
Weniger
Die Temperatur der Luft in der Festplatte. Für Seagate-Laufwerke wird die Formel (100 - HDA-Temperatur) verwendet. Für Western Digital Laufwerke - (125-HDA).
191 Bf G-sense Fehlerrate
Weniger
Die Anzahl der Fehler aufgrund von Stoßbelastungen. Das Attribut speichert die Messwerte des eingebauten Beschleunigungsmessers, der alle Erschütterungen, Erschütterungen, Stürze und sogar ungenaue Installation der Diskette im Computergehäuse aufzeichnet.
192 C0 Ausschalt-Countdown
Weniger
Die Anzahl der Herunterfahrzyklen oder Abstürze (Ein- / Ausschalten des Laufwerks).
193 C1 Laden / Entladen Zyklus
Weniger
Die Anzahl der Bewegungszyklen des Magnetkopfblocks in der Parkzone / in der Arbeitsposition.
194 C2 HDA Temperatur
Weniger
Die Messwerte des eingebauten Temperatursensors für den mechanischen Teil der Diskettenbanken (HDA - Hard Disk Assembly) sind hier gespeichert. Informationen werden vom eingebauten Temperatursensor entfernt, der einer der Magnetköpfe ist, normalerweise der Boden in der Bank. Die aktuellen, minimalen und maximalen Temperaturen sind in den Attribut-Bitfeldern festgelegt. Nicht alle Programme, die mit SMART arbeiten, analysieren diese Felder korrekt, so dass ihre Aussagen kritisch behandelt werden sollten.
195 C3 Hardware ECC wiederhergestellt
Weniger
Die Anzahl der Fehlerkorrektur-Hardware-Festplatten (Lesen, Positionieren, Senden auf der externen Schnittstelle). Bei Festplatten mit einer SATA-Schnittstelle verschlechtert sich der Wert häufig mit zunehmender Systembusfrequenz - SATA reagiert sehr empfindlich auf Übertaktung.
196 C4 Reallocation Event Count
Weniger
Die Anzahl der Neuzuordnungsvorgänge Das Feld "Rohwert" des Attributs speichert die Gesamtzahl der Versuche, Informationen aus den neu zugewiesenen Sektoren in den Ersatzbereich zu übertragen. Sowohl erfolgreiche als auch nicht erfolgreiche Versuche werden gezählt.
197 C5 Aktuelle Pending Sector Count
Weniger
Die Anzahl der Sektoren, die für einen Ersatz infrage kommen. Sie wurden noch nicht als schlecht identifiziert, aber das Lesen unterscheidet sich von dem Lesen eines stabilen Sektors, dies sind die sogenannten verdächtigen oder instabilen Sektoren. Im Falle einer erfolgreichen anschließenden Lektüre des Sektors ist es von der Anzahl der Kandidaten ausgeschlossen. Im Falle von wiederholten fehlerhaften Lesevorgängen versucht das Laufwerk, es wiederherzustellen, und führt eine Neuzuordnungsoperation aus.
Die Erhöhung des Werts dieses Attributs kann auf eine physische Verschlechterung der Festplatte hinweisen.
198 C6 Nicht korrigierbare Sektoranzahl
Weniger
Die Anzahl der nicht einstellbaren Sektoren (Datenträger). Bei einer Erhöhung der Anzahl der Fehler ist die Wahrscheinlichkeit kritischer Oberflächendefekte und / oder Mechanik des Antriebs hoch.
199 C7 UltraDMA CRC Fehleranzahl
Weniger
Die Anzahl der Fehler, die auftreten, wenn Daten im UltraDMA-Modus über die externe Schnittstelle übertragen werden (Verletzungen der Paketintegrität usw.). Das Wachstum dieses Attributs weist auf ein schlechtes (zerknittertes, verdrehtes) Kabel und schlechte Kontakte hin. Solche Fehler treten auch beim PCI-Bus-Übertakten, bei Stromausfällen, starken elektromagnetischen Pickups und manchmal auch beim Treiber auf.
Vielleicht der Grund für schlechte Qualität. Um dies zu beheben, versuchen Sie, ein SATA-Loop-freies Kabel mit einer festen Verbindung zu den Festplattenkontakten zu verwenden.
200 C8 Schreibfehlerrate /
Multi-Zonen Fehlerrate
Weniger
Zeigt die Gesamtzahl der Fehler an, die beim Schreiben eines Sektors auftreten. Zeigt die Gesamtzahl der Schreibfehler an. Kann als Indikator für Oberflächenqualität und Antriebsmechanik dienen.
201 C9 Soft-Lesefehlerrate
Weniger
Die Häufigkeit des Auftretens von "Software" -Fehlern beim Lesen von Daten von der Platte.

Dieser Parameter zeigt die Häufigkeit von Fehlern bei Lesevorgängen von der Plattenoberfläche aufgrund von Software und nicht von der Hardware des Laufwerks an.

202 CA Datenadresse Fehler markieren
Weniger
Markiere (DAM) anbieterspezifische Nummer des Data Address Markers (DAM).
203 CB Lauf abbrechen
Weniger
Die Anzahl der ECC-Fehler.
204 CC Soft ECC-Korrektur
Weniger
Die Anzahl der durch Software korrigierten ECC-Fehler.
205 CD Thermische Unebenheitsrate (TAR)
Weniger
Anzahl der thermischen Unebenheitsfehler.
206 CE Flughöhe Die Höhe zwischen dem Kopf und der Oberfläche der Festplatte.
207 CF Spin hoher Strom
Weniger
Die Stärke des Stroms während der Promotion der Disc.
208 D0 Spin Buzz Anzahl der Buzz-Routinen, um das Laufwerk hochzufahren.
209 D1 Offline-Suchleistung Drive sucht Leistung während Offline-Operationen.
220 DC Diskettenverschiebung
Weniger
Der Versatzabstand des Plattenblocks zur Spindel. Meistens entsteht durch einen Schlag oder einen Sturz. Maßeinheit unbekannt. Wenn das Attribut zunimmt, wird die Festplatte schnell funktionsunfähig.
221 DD G-Sense Fehlerrate
Weniger
Die Anzahl der Fehler, die durch externe Lasten und Stöße verursacht werden. Das Attribut speichert die Messwerte des eingebauten Stoßsensors.
222 DE Geladene Stunden Zeit, die die Magnetkopfeinheit zwischen dem Entladen von dem Parkbereich zu dem Arbeitsbereich der Platte und dem Zurückladen der Einheit in den Parkbereich verbracht hat.
223 Df Lade / Entlade-Wiederholungsanzahl Die Anzahl neuer Versuche, einen Magnetkopfblock nach einem erfolglosen Versuch aus dem Parkbereich zu entladen / zu laden.
224 E0 Friktion laden
Weniger
Die Größe der Reibungskraft der Magnetköpfe, wenn sie von der Parkfläche entladen wird.
225 E1 Lastzyklus zählen
Weniger
Die Anzahl der Zyklen zum Bewegen des Magnetkopfblocks im Parkbereich.
226 E2 Lade 'In'-Zeit Die Zeit, die der Antrieb benötigt, um die Magnetköpfe von der Parkfläche zur Arbeitsfläche der Platte zu entladen.
227 E3 Drehmomentverstärkungszahl
Weniger
Die Anzahl der Versuche, das Drehmoment zu kompensieren.
228 E4 Ausschalt-Zyklus
Weniger
Die Zahl der Wiederholungen der automatischen Abstellung des Blocks der Magnetköpfe infolge der Abschaltung.
230 E6 GMR Kopfamplitude Die Amplitude des "Jitter" (der Abstand der sich wiederholenden Bewegung des Blocks von Magnetköpfen).
231 E7 Temperatur
Weniger
Die Temperatur der Festplatte.
240 F0 Kopf Flugstunden Gesamtzeit, in der sich die Kopfeinheit in Betriebsstellung in Stunden befindet.
250 FA Lesen Sie die Wiederholungsrate für Fehler
Weniger
Die Anzahl der Fehler beim Lesen einer Festplatte.

Wo?

  • Mehr - Ein größerer Parameterwert ist besser.
  • Weniger - Ein kleinerer Parameterwert ist besser.
  • Kritischer Parameter - roter Linienhintergrund