This page has been robot translated, sorry for typos if any. Original content here.

SMART

S.M.A.R.T.

SMART (Selbstüberwachungs-, Analyse- und Berichtstechnologie) ist eine Technologie zum Bewerten des Zustands einer Festplatte durch die integrierte Selbstdiagnoseausrüstung sowie ein Mechanismus zum Vorhersagen des Zeitpunkts ihres Ausfalls.

Geschichte

Die erste Festplatte mit einem Selbstdiagnosesystem wurde 1992 von IBM in IBM 9337-Disk-Arrays für AS / 400-Server mit IBM 0662 SCSI-2-Festplatten eingeführt. Die Technologie wurde Predictive Failure Analysis (PFA) genannt. Mehrere Schlüsselparameter wurden gemessen, ihre Auswertung wurde direkt vom Plattencontroller durchgeführt. Das Ergebnis war auf nur ein Bit beschränkt: entweder ist alles in Ordnung, oder die Platte könnte bald ausfallen. Später entwickelten Compaq, Seagate, Quantum und Conner eine andere Technologie namens IntelliSafe. Es hatte ein gemeinsames Protokoll für die Ausgabe von Informationen über den Zustand der Festplatte, aber gemessen die Parameter und ihre Schwellenwerte jeder Firma unabhängig bestimmt.

Anfang 1995 schlug Compaq vor, die Technologie zu standardisieren. IBM, Seagate, Quantum, Conner und Western Digital (letzteres hatte zu diesem Zeitpunkt noch kein System zur Überwachung von Festplattenparametern) unterstützten diese Idee. Die Basis wurde Technologie IntelliSafe genommen. Ein gemeinsam entwickelter Standard hieß SMART Standard SMART I zur Überwachung der Hauptparameter und wurde erst nach dem Befehl gestartet.

Bei der Entwicklung von SMART II nahm Hitachi teil, der eine Methode des vollständigen Selbsttests des Laufwerks bot (Extended Self-Test), und eine Funktion der Fehlerprotokollierung erschien. SMART III verfügt über eine Funktion zur Erkennung von Oberflächendefekten und die Möglichkeit, diese für den Benutzer "transparent" wiederherzustellen.

Beschreibung

SMART überwacht die Hauptmerkmale des Antriebs, von denen jeder eine Schätzung erhält. Merkmale können in zwei Gruppen unterteilt werden:

  • 1) Parameter, die den natürlichen Alterungsprozess der Festplatte widerspiegeln (Spindeldrehzahl, Anzahl der Kopfbewegungen, Anzahl der Ein / Aus-Zyklen);
  • 2) aktuelle Parameter des Laufwerks (Kopfhöhe über der Plattenoberfläche, die Anzahl der neu zugewiesenen Sektoren, die Suchzeit und die Anzahl der Suchfehler).

Daten werden in einer hexadezimalen Form gespeichert, die als Rohwert bezeichnet wird, und dann in einen Wert konvertiert, einen Wert, der die Zuverlässigkeit relativ zu einem Referenzwert symbolisiert. Normalerweise liegt der Wert im Bereich von 0 bis 100 (einige Attribute haben Werte von 0 bis 200 und von 0 bis 253).

Ein hoher Wert zeigt an, dass sich dieser Parameter oder seine langsame Verschlechterung nicht geändert hat. Niedrig - über eine mögliche Fehlfunktion in naher Zukunft.

Ein Wert kleiner als das Minimum, bei dem der Hersteller einen störungsfreien Betrieb des Antriebs garantiert, bedeutet den Ausfall des Knotens.

Mit der SMART-Technologie können Sie:

  • 1) Überwachung von Zustandsparametern;
  • 2) Oberflächenabtastung;
  • 3) Oberflächenabtastung mit automatischem Ersatz von zweifelhaften Sektoren durch zuverlässige.

Es sollte beachtet werden, dass die SMART-Technologie es ermöglicht, den Ausfall des Geräts aufgrund von mechanischen Fehlfunktionen vorherzusagen, was etwa 60% der Ursachen für einen Festplattenausfall ist. Vorhersage der Folgen eines Stromstoßes oder eines mechanischen Schocks SMART ist nicht in der Lage.

Es sollte angemerkt werden, dass Laufwerke ihren Status nicht durch die SMART-Technologie selbstständig melden können, aber zu diesem Zweck gibt es spezielle Programme. Daher ist die Verwendung der SMART-Technologie ohne die folgenden zwei Komponenten nicht möglich:

  • 1) in den Antriebsregler integrierte Software;
  • 2) Externe Software, die in den Host eingebettet ist.

Programme, die den Status von SMART-Attributen anzeigen, arbeiten nach dem folgenden Algorithmus:

  • Überprüfen Sie, ob die Unterstützung für das SMART-Technologielaufwerk verfügbar ist.
  • Senden eines SMART-Tabellen-Abfragebefehls;
  • Tabellen in den Anwendungspuffer holen;
  • Dekodieren von Tabellenstrukturen, Extrahieren der Attributnummer und ihres numerischen Werts;
  • Vergleich von standardisierten Attributnummern mit ihren Namen (manchmal - abhängig von Typ, Modell oder Hersteller, wie zB im Programm Victoria);
  • Ausgabe von numerischen Werten in einer für die Wahrnehmung günstigen Form (z. B. Umwandlung von hexadezimalen Werten in dezimale Werte);
  • Extrahieren von Attributen aus Attributtabellen (Attribute, die die Zuweisung eines Attributs in einem bestimmten Laufwerk charakterisieren, z. B. "vital" oder "counter");
  • Ausgabe des allgemeinen Zustands des Geräts basierend auf allen Tabellen, Werten und Flags.

SMART-Attribute

Eine Tabelle bekannter SMART-Attribute sieht folgendermaßen aus:

Anzahl Hex Attributname Es ist besser, wenn ... Beschreibung
01 01 Roh-Lese-Fehlerrate
Weniger
Die Häufigkeit von Fehlern beim Lesen von Daten von einer Festplatte, deren Ursprung auf die Hardware der Festplatte zurückzuführen ist.
Für alle Seagate, Samsung (F1 und neuer) und Fujitsu 2.5? dies ist die Anzahl der internen Korrekturen der Daten, die vor der Ausgabe an die Schnittstelle gespeichert wurden, daher ist es möglich, ruhig auf erschreckend große Zahlen zu reagieren.
02 02 Durchsatzleistung
Weitere Informationen
Gesamtleistung der Festplatte Wenn der Wert des Attributs abnimmt, besteht eine hohe Wahrscheinlichkeit, dass Probleme mit dem Datenträger auftreten.
03 03 Spin-Up-Zeit
Weniger
Zeit, um das Paket von Platten aus dem Ruhezustand auf die Betriebsgeschwindigkeit abzuwickeln.
Es erhöht sich mit dem Verschleiß der Mechanik (erhöhte Reibung im Lager usw.), es kann auch auf eine schlechte Stromversorgung (z. B. einen Spannungsabfall beim Start der Scheibe) hinweisen.
04 04 Anzahl starten / stoppen Die Gesamtzahl der Start-Stopp-Zyklen der Spindel. Einige Disc-Hersteller (z. B. Seagate) verfügen über einen Countdown-Zähler für die Stromsparfunktion. Das Rohwertfeld speichert die Gesamtzahl der Starts / Stopps der Festplatte.
05 05 Reallocated Sectors Count
Weniger
Anzahl der Sektor-Neuzuordnungsvorgänge Wenn eine Disc einen Lese- / Schreibfehler erkennt, markiert sie den Sektor "neu zugeordnet" und überträgt die Daten an einen dedizierten Ersatzbereich . Deshalb kann man auf modernen Festplatten keine schlechten Blöcke sehen - sie sind alle in den neu zugewiesenen Sektoren versteckt. Dieser Prozess wird als Neuzuordnung bezeichnet und der neu zugeordnete Sektor wird neu zugeordnet. Je höher der Wert, desto schlechter der Oberflächenzustand der Platten. Das Rohwertfeld enthält die Gesamtzahl der neu zugewiesenen Sektoren.
Ein Anstieg des Werts dieses Attributs kann eine Verschlechterung des Zustands der Oberfläche der Pfannkuchen der Platte anzeigen.
06 06 Kanalrand lesen Die Reserve des Lesekanals. Der Zweck dieses Attributs ist nicht dokumentiert. In modernen Antrieben wird nicht verwendet.
07 07 Fehlerrate suchen
Weniger
Fehlerhäufigkeit beim Positionieren eines Magnetkopfblocks. Je mehr von ihnen, desto schlechter der Zustand der Mechanik und / oder der Oberfläche der Festplatte. Außerdem kann der Wert des Parameters durch Überhitzung und externe Vibrationen (z. B. von benachbarten Scheiben im Korb) beeinflusst werden.
08 08 Suche nach der Zeitleistung
Weitere Informationen
Die durchschnittliche Leistung eines Positioniervorgangs mit Magnetköpfen. Wenn der Wert des Attributs abnimmt (Verlangsamung der Positionierung), dann ist die Wahrscheinlichkeit von Problemen mit dem mechanischen Teil des Antriebs der Köpfe hoch.
09 09 Einschaltzeitzählung (Einschaltzeiten)
Weniger
Die Anzahl der Stunden (Minuten, Sekunden - je nach Hersteller), im eingeschalteten Zustand. Als ein Schwellenwert für ihn ist die MTBF die mittlere Zeit zwischen dem Versagen.
10 0A Spin-Up-Wiederholungsanzahl
Weniger
Die Anzahl der wiederholten Versuche, die Festplatte auf die Arbeitsgeschwindigkeit aufzudrehen, falls der erste Versuch fehlgeschlagen ist. Wenn der Wert des Attributs zunimmt, ist die Wahrscheinlichkeit einer Fehlfunktion mit dem mechanischen Teil hoch.
11. 0B Neukalibrierungsversuche
Weniger
Die Anzahl der Wiederholungen von Rekalibrierungsanforderungen für den Fall, dass der erste Versuch fehlgeschlagen ist. Wenn der Wert des Attributs zunimmt, ist die Wahrscheinlichkeit von Problemen mit dem mechanischen Teil hoch.
12. 0C Anzahl der Geräte aus Anzahl der vollständigen Zyklen zum Ein- und Ausschalten der Festplatte.
13. 0D Soft Read Fehlerrate
Weniger
Die Anzahl der Fehler beim Lesen, aufgrund der Fehler der Software, die nicht zur Korrektur geeignet waren. Alle Fehler sind nicht mechanischer Natur und zeigen nur die falsche Markierung / Interaktion mit der Programm- oder Betriebssystem-Diskette an.
184 B8 Ende-zu-Ende-Fehler
Weniger
Dieses Attribut - Teil der HP SMART IV-Technologie - bedeutet, dass nach der Datenübertragung durch den Cache-Speicher die Datenparität zwischen dem Host und der Festplatte nicht übereinstimmt.
187 BB Berichtete UNC-Fehler
Weniger
Fehler, die mit Methoden der Fehlerbeseitigung durch Hardware nicht behoben werden konnten.
188 BC Befehlszeitlimit
Weniger
Anzahl der unterbrochenen Vorgänge aufgrund des HDD-Timeouts Normalerweise sollte dieser Attributwert Null sein, und wenn der Wert viel höher als Null ist, dann werden höchstwahrscheinlich einige ernsthafte Stromversorgungsprobleme oder oxidierte Kabel für die Datenübertragung auftreten.
190 BE Luftstromtemperatur (WDC)
Weniger
Lufttemperatur im Festplattengehäuse. Für Platten wird Seagate durch die Formel (100 - HDA-Temperatur) berechnet. Für Western Digital - (125-HDA) Discs.
191 BF G-sense Fehlerrate
Weniger
Die Anzahl der Fehler, die als Folge von Stoßlasten auftreten. Das Attribut speichert die Messwerte des eingebauten Beschleunigungsmessers, der alle Erschütterungen, Erschütterungen, Stürze und sogar ungenaue Festplatteninstallationen im Computergehäuse aufzeichnet.
192 C0 Ausschalt-Countdown
Weniger
Anzahl der Zyklen von Stillständen oder Notfällen (Ein- / Ausschalten des Antriebs).
193 C1 Laden / Entladen Zyklus
Weniger
Anzahl der Bewegungszyklen der Magnetkopfeinheit zur Parkzone / in Arbeitsposition.
194 C2 HDA Temperatur
Weniger
Hier werden die Messwerte des eingebauten Temperatursensors für den mechanischen Teil der Diskettenbanken (HDA - Hard Disk Assembly) gespeichert. Informationen werden vom eingebauten Temperatursensor entfernt, der einer der Magnetköpfe ist, normalerweise der untere in der Bank. In den Bitfeldern des Attributs sind die aktuellen, minimalen und maximalen Temperaturen festgelegt. Nicht alle Programme, die mit SMART arbeiten, zerlegen diese Felder korrekt, so dass ihre Angaben kritisch behandelt werden sollten.
195 C3 Hardware ECC wiederhergestellt
Weniger
Die Anzahl der Fehler, die von der Hardware der Festplatte korrigiert wurden (Lesen, Positionieren, Übertragung über die externe Schnittstelle). Bei SATA-Laufwerken verschlechtert sich der Wert häufig mit zunehmender Systembusfrequenz - SATA reagiert sehr empfindlich auf Übertaktung.
196 C4 Reallocation Event Count
Weniger
Anzahl der Neuzuweisungsvorgänge Das Feld "Rohwert" des Attributs speichert die Gesamtzahl der Versuche, Informationen aus den neu zugewiesenen Sektoren in den Ersatzbereich zu übertragen. Sowohl erfolgreiche als auch erfolglose Versuche werden berücksichtigt.
197 C5 Aktuelle Pending Sector Count
Weniger
Anzahl der Sektoren, die für einen Ersatz infrage kommen. Sie wurden noch nicht als schlecht identifiziert, aber das Lesen von ihnen unterscheidet sich von dem Lesen eines stabilen Sektors, dies sind die sogenannten verdächtigen oder instabilen Sektoren. Im Falle einer erfolgreichen anschließenden Lektüre des Sektors ist es von der Anzahl der Kandidaten ausgeschlossen. Im Falle von wiederholten fehlerhaften Lesevorgängen versucht das Laufwerk, es wiederherzustellen, und führt eine Neuzuordnungsoperation aus.
Eine Erhöhung des Werts dieses Attributs kann auf eine physische Verschlechterung der Festplatte hinweisen.
198 C6 Nicht korrigierbare Sektoranzahl
Weniger
Die Anzahl der Sektoren, die nicht korrigiert werden können (per Datenträger). Bei einer Erhöhung der Anzahl der Fehler ist die Wahrscheinlichkeit kritischer Oberflächendefekte und / oder der Antriebsmechanik hoch.
199 C7 UltraDMA CRC Fehleranzahl
Weniger
Die Anzahl der Fehler, die auftreten, wenn Daten im UltraDMA-Modus über eine externe Schnittstelle übertragen werden (Verletzungen der Paketintegrität usw.). Das Wachstum dieses Attributs weist auf ein schlechtes (mint, verdrehtes) Kabel und schlechte Kontakte hin. Solche Fehler treten auch auf, wenn der PCI-Bus übertaktet wird, Stromausfälle auftreten, starke elektromagnetische Störungen auftreten und manchmal durch den Fehler des Fahrers.
Wahrscheinlich liegt der Grund in einem minderwertigen Trail. Versuchen Sie zur Korrektur ein SATA-Kabel ohne Latch zu verwenden, das fest mit den Kontakten der Festplatte verbunden ist.
200 C8 Schreibfehlerrate /
Multi-Zonen Fehlerrate
Weniger
Zeigt die Gesamtzahl der Fehler an, die beim Schreiben eines Sektors auftreten. Zeigt die Gesamtzahl der Schreibfehler pro Festplatte an. Es kann als Indikator für die Qualität der Oberfläche und Mechanik des Antriebs dienen.
201 C9 Soft-Lesefehlerrate
Weniger
Häufigkeit des Auftretens von "Programm" -Fehlern beim Lesen von Daten von einer Platte.

Dieser Parameter zeigt die Häufigkeit von Fehlern bei Lesevorgängen von der Oberfläche der Festplatte aufgrund eines Softwarefehlers und nicht die Hardware des Laufwerks an.

202 CA Datenadresse Fehler markieren
Weniger
Anzahl der DAM-Fehler (Data Address Mark) (oder) anbieterspezifisch
203 CB Auslaufen abbrechen
Weniger
Anzahl der ECC-Fehler
204 CC Soft ECC-Korrektur
Weniger
Anzahl der ECC-Fehler programmgesteuert korrigiert.
205 Cd Thermische Unebenheitsrate (TAR)
Weniger
Anzahl der thermischen Unebenheitsfehler.
206 CE Flughöhe Höhe zwischen dem Kopf und der Oberfläche der Scheibe.
207 CF Spin hoher Strom
Weniger
Die Stärke des Stroms, wenn sich die Festplatte dreht.
208 D0 Spin Buzz Anzahl der Buzz-Routinen, um das Laufwerk hochzufahren.
209 D1 Offline-Suchleistung Die Leistung der Suche bei Offline-Vorgängen (Drive sucht die Leistung bei Offline-Vorgängen.)
220 DC Festplattenverschiebung
Weniger
Der Abstand der Plattenblockverschiebung relativ zur Spindel. Meist aufgrund von Stößen oder Stürzen. Die Maßeinheit ist unbekannt. Mit einer Erhöhung des Attributs wird die Festplatte schnell unbrauchbar.
221 DD G-Sense Fehlerrate
Weniger
Die Anzahl der Fehler aufgrund von externen Lasten und Stößen. Das Attribut speichert die Messwerte des eingebauten Stoßsensors.
222 DE Geladene Stunden Die Zeit, die der Block von Magnetköpfen zwischen dem Entladen von dem Parkbereich zu dem Arbeitsbereich der Platte und dem Zurückladen der Einheit in den Parkbereich verbracht hat.
223 DF Lade / Entlade-Wiederholungsanzahl Anzahl neuer Versuche, die Magnetkopfeinheit nach einem erfolglosen Versuch aus dem Parkbereich zu laden / zu entladen.
224 E0 Friktion laden
Weniger
Die Größe der Reibungskraft der Magnetkopfeinheit, wenn sie aus dem Parkbereich entladen wird.
225 E1 Lastzykluszahl
Weniger
Anzahl der Zyklen zum Bewegen des Magnetkopfblocks zum Parkbereich.
226 E2 Lade 'In'-Zeit Die Zeit, während der der Antrieb die Magnetköpfe von der Parkfläche zur Arbeitsfläche der Platte entlädt.
227 E3 Drehmomentverstärkungszahl
Weniger
Die Anzahl der Versuche, das Drehmoment zu kompensieren.
228 E4 Ausschalt-Zyklus
Weniger
Die Anzahl der Wiederholungen des automatischen Einparkens der Magnetkopfeinheit als Folge des Ausschaltens.
230 E6 GMR Kopfamplitude Amplitude von "Jitter" (der Abstand der wiederholten Bewegung des Blocks von Magnetköpfen).
231 E7 Temperatur
Weniger
Die Temperatur der Festplatte.
240 F0 Kopf Flugstunden Gesamtzeit der Kopfeinheit in Arbeitsposition in Stunden.
250 FA Lesen Sie die Wiederholungsrate für Fehler
Weniger
Die Anzahl der Fehler beim Lesen der Festplatte.

Wo:

  • Weitere Informationen - Höherer Parameterwert ist besser
  • Weniger - Ein kleinerer Parameterwert ist besser
  • Kritischer Parameter - roter Linienhintergrund