This page has been robot translated, sorry for typos if any. Original content here.

SMART

S.M.A.R.T.

SMART (Selbstüberwachungs-, Analyse- und Berichterstellungstechnologie) ist eine Technologie zur Bewertung des Zustandes einer Festplatte durch das eingebaute Selbstdiagnosegerät sowie einen Mechanismus zur Vorhersage des Zeitpunkts des Ausfalls.

Geschichte

Die erste Festplatte mit einem Selbstdiagnosesystem wurde 1992 von IBM in IBM 9337-Disk-Arrays für AS / 400-Server mit IBM 0662 SCSI-2-Platten eingeführt. Die Technologie wurde Predictive Failure Analysis (PFA) genannt. Mehrere Schlüsselparameter wurden gemessen, ihre Auswertung wurde direkt vom Plattencontroller durchgeführt. Das Ergebnis war auf nur ein Bit beschränkt: Entweder ist alles in Ordnung oder die Festplatte könnte bald ausfallen. Später entwickelten Compaq, Seagate, Quantum und Conner eine weitere Technologie namens IntelliSafe. Es hatte ein gemeinsames Protokoll für die Ausgabe von Informationen über den Zustand der Festplatte, aber gemessen die Parameter und ihre Schwellenwerte jedes Unternehmen unabhängig bestimmt.

Anfang 1995 schlug Compaq vor, die Technologie zu standardisieren. Diese Idee wurde von IBM, Seagate, Quantum, Conner und Western Digital unterstützt (letztere hatten damals noch kein System zur Überwachung von Festplattenparametern). Die Basis war die Technologie IntelliSafe. Ein gemeinsam entwickelter Standard wurde SMART Standard SMART I zur Überwachung der wichtigsten Parameter genannt und erst nach dem Befehl gestartet.

Bei der Entwicklung von SMART II beteiligte sich Hitachi daran, eine Methode für den vollständigen Selbsttest des Laufwerks anzubieten (erweiterter Selbsttest), und die Fehlerprotokollierungsfunktion erschien ebenfalls. SMART III verfügt über eine Funktion zur Erkennung von Oberflächendefekten und die Fähigkeit, diese für den Benutzer "transparent" wiederherzustellen.

Beschreibung

SMART überwacht die Hauptmerkmale des Laufwerks, von denen jedes eine Schätzung erhält. Merkmale können in zwei Gruppen unterteilt werden:

  • 1) Parameter, die den natürlichen Alterungsprozess der Festplatte widerspiegeln (Spindeldrehzahl, Anzahl der Kopfbewegungen, Anzahl der Ein / Aus-Zyklen);
  • 2) aktuelle Parameter des Laufwerks (Kopfhöhe über der Plattenoberfläche, Anzahl neu zugeordneter Sektoren, Suchlaufzeit und Anzahl der Suchfehler).

Daten werden in einer hexadezimalen Form gespeichert, die als Rohwert bezeichnet wird, und dann in einen Wert konvertiert, einen Wert, der die Zuverlässigkeit relativ zu einem Referenzwert symbolisiert. Normalerweise liegt der Wert im Bereich von 0 bis 100 (einige Attribute haben Werte von 0 bis 200 und von 0 bis 253).

Ein hoher Wert zeigt an, dass sich dieser Parameter oder seine langsame Verschlechterung nicht ändert. Niedrig - über eine mögliche Fehlfunktion in naher Zukunft.

Ein Wert kleiner als das Minimum, bei dem der Hersteller den störungsfreien Betrieb des Antriebs garantiert, bedeutet den Ausfall des Knotens.

Mit der SMART Technologie können Sie:

  • 1) Überwachung von Zustandsparametern;
  • 2) Oberflächenabtastung;
  • 3) Oberflächenabtastung mit automatischem Austausch zweifelhafter Sektoren durch zuverlässige.

Es sollte beachtet werden, dass die SMART-Technologie Ihnen erlaubt, den Ausfall des Geräts als Folge von mechanischen Fehlfunktionen vorherzusagen, was ungefähr 60% der Ursachen für einen Festplattenausfall ist. Vorhersagen der Folgen eines Stromstoßes oder eines mechanischen Schocks SMART ist nicht in der Lage.

Es ist zu beachten, dass Laufwerke ihren Status nicht eigenständig über die SMART-Technologie melden können, dafür gibt es spezielle Programme. Der Einsatz der SMART-Technologie ist somit ohne die folgenden zwei Komponenten nicht möglich:

  • 1) im Antriebsregler integrierte Software;
  • 2) In den Host eingebettete externe Software.

Programme, die den Status von SMART-Attributen anzeigen, arbeiten nach folgendem Algorithmus:

  • Überprüfen Sie die Verfügbarkeit der Unterstützung für das SMART-Technologie-Laufwerk.
  • Senden eines SMART-Tabellenabfrage-Befehls;
  • Tabellen in den Anwendungspuffer holen;
  • Dekodieren von Tabellenstrukturen, Extrahieren der Attributnummer und ihres numerischen Werts;
  • Vergleich von standardisierten Attributnummern mit ihren Namen (manchmal - abhängig von Typ, Modell oder Hersteller, wie zB im Programm Victoria);
  • Ausgabe von numerischen Werten in einer für die Wahrnehmung geeigneten Form (z. B. Umwandlung von hexadezimalen Werten in dezimale Werte);
  • Extrahieren von Attributen aus Attributtabellen (Attribute, die die Zuordnung eines Attributs in einem bestimmten Laufwerk kennzeichnen, z. B. "vital" oder "counter");
  • Ausgabe des allgemeinen Zustands des Geräts basierend auf allen Tabellen, Werten und Flags.

SMART-Attribute

Eine Tabelle mit bekannten SMART-Attributen sieht folgendermaßen aus:

Nein. Hexe Attributname Es ist besser, wenn ... Beschreibung
01 01 Raw-Lesefehlerrate
Weniger
Die Häufigkeit von Fehlern beim Lesen von Daten von einer Festplatte, deren Ursprung auf der Hardware der Festplatte beruht.
Für alle Seagate, Samsung (F1 und neuer) und Fujitsu 2.5? Dies ist die Anzahl interner Korrekturen der Daten, die vor der Ausgabe an die Schnittstelle gehalten werden, daher ist es möglich, auf erschreckend große Zahlen ruhig zu reagieren.
02 02 Durchsatzleistung
Mehr Infos
Allgemeine Festplattenleistung. Wenn der Wert des Attributs abnimmt, besteht eine hohe Wahrscheinlichkeit, dass Probleme mit der Festplatte auftreten.
03 03 Spin-Up-Zeit
Weniger
Zeit, um das Paket der Festplatten aus dem Ruhezustand auf die Betriebsgeschwindigkeit abzurollen.
Es erhöht sich mit dem Verschleiß der Mechanik (erhöhte Reibung im Lager usw.), es kann auch eine schlechte Qualität der Stromversorgung anzeigen (z. B. Spannungssenkung am Anfang der Festplatte).
04 04 Start / Stopp-Count Die Gesamtanzahl der Start-Stopp-Zyklen der Spindel. Einige Disc-Hersteller (z. B. Seagate) verfügen über einen Energiespar-Countdown-Zähler. Das Feld "Rohwert" speichert die Gesamtzahl der Starts / Stopps der Festplatte.
05 05 Neu zugeordnete Sektoren Anzahl
Weniger
Anzahl der Sektorneuzuordnungsoperationen. Wenn eine Disc einen Lese- / Schreibfehler erkennt, markiert sie den Sektor "neu zugeordnet" und überträgt die Daten in einen dedizierten Ersatzbereich . Deswegen kann man auf modernen Festplatten keine schlechten Blöcke sehen - sie sind alle in den neu zugewiesenen Sektoren versteckt. Dieser Prozess wird als Neuzuordnung bezeichnet, und der neuzuordnende Sektor ist Neuzuordnung. Je höher der Wert, desto schlechter ist der Oberflächenzustand der Platten. Das Feld Rohwert enthält die Gesamtzahl der neu zugewiesenen Sektoren.
Eine Zunahme des Wertes dieses Attributs kann auf eine Verschlechterung des Zustandes der Oberfläche der Pfannkuchen der Platte hinweisen.
06 06 Channel-Margin lesen Die Reserve des Lesekanals. Der Zweck dieses Attributs ist nicht dokumentiert. In modernen Laufwerken wird nicht verwendet.
07 07 Suchfehlerrate
Weniger
Häufigkeit von Fehlern bei der Positionierung eines Magnetkopfes. Je mehr von ihnen, desto schlechter ist der Zustand der Mechanik und / oder der Oberfläche der Festplatte. Außerdem kann der Wert des Parameters durch Überhitzung und externe Vibrationen (z. B. von benachbarten Festplatten im Korb) beeinflusst werden.
08 08 Suche nach Zeitleistung
Mehr Infos
Die durchschnittliche Leistung eines Positioniervorgangs mit Magnetköpfen. Wenn der Wert des Attributs abnimmt (Verlangsamung der Positionierung), ist die Wahrscheinlichkeit von Problemen mit dem mechanischen Teil des Antriebes der Köpfe hoch.
09 09 Einschaltzeit (Einschaltstunden)
Weniger
Die Anzahl der Stunden (Minuten, Sekunden - je nach Hersteller) im On-Zustand. Die MTBF ist als Schwellenwert für ihn die mittlere Zeit zwischen dem Ausfall.
10 0A Spin-Up-Wiederholung
Weniger
Die Anzahl der wiederholten Versuche, Festplatten auf die Arbeitsgeschwindigkeit aufzudrehen, falls der erste Versuch fehlgeschlagen ist. Wenn der Wert des Attributs zunimmt, ist die Wahrscheinlichkeit einer Fehlfunktion des mechanischen Teils hoch.
11. 0B Neukalibrierungswiederholungen
Weniger
Die Anzahl der Wiederholungen von Rekalibrierungsanforderungen für den Fall, dass der erste Versuch fehlgeschlagen ist. Wenn der Wert des Attributs zunimmt, ist die Wahrscheinlichkeit von Problemen mit dem mechanischen Teil hoch.
12. 0C Anzahl der Geräte-Stromzähler Anzahl der vollständigen Zyklen zum Ein- und Ausschalten der Festplatte.
13. 0D Soft-Lesefehlerrate
Weniger
Die Anzahl der Fehler beim Lesen, aufgrund der Fehler der Software, die sich nicht zur Korrektur eignete. Alle Fehler sind nicht mechanischer Art und weisen nur auf das falsche Markup / Interaktion mit der Programm- oder Betriebssystemdiskette hin.
184 B8 End-to-End-Fehler
Weniger
Dieses Attribut, das Teil der HP SMART IV-Technologie ist, bedeutet, dass nach der Datenübertragung durch den Cache-Speicher die Parität der Daten zwischen dem Host und der Festplatte nicht übereinstimmt.
187 BB Gemeldete UNC-Fehler
Weniger
Fehler, die nicht mithilfe von Methoden zur Fehlerbehebung durch Hardware wiederhergestellt werden konnten.
188 BC Befehlszeitlimit
Weniger
Anzahl der unterbrochenen Vorgänge aufgrund von HDD-Timeout. Normalerweise sollte dieser Attributwert Null sein, und wenn der Wert viel höher als Null ist, dann wird es höchstwahrscheinlich ernsthafte Stromprobleme oder oxidierte Kabel für die Datenübertragung geben.
190 BE Luftstromtemperatur (WDC)
Weniger
Lufttemperatur im Festplattengehäuse. Für Festplatten wird Seagate nach der Formel berechnet (100 - HDA-Temperatur). Für Western Digital - (125-HDA) Discs.
191 BF G-Sense-Fehlerrate
Weniger
Die Anzahl der Fehler, die durch Stoßlasten auftreten. Das Attribut speichert die Messwerte des eingebauten Beschleunigungsmessers, der alle Auswirkungen, Stöße, Abstürze und sogar ungenaue Festplatteninstallation im Computergehäuse aufzeichnet.
192 C0 Ausschalt-Countdown
Weniger
Anzahl der Abschaltzyklen oder Notausfälle (Ein- / Ausschalten des Antriebs).
193 C1 Lade- / Entladezyklus
Weniger
Anzahl der Zyklen der Bewegung der Magnetkopfeinheit in die Parkzone / in der Arbeitsposition.
194 C2 HDA-Temperatur
Weniger
Hier werden die Messwerte des eingebauten Temperatursensors für den mechanischen Teil der Plattenbänke (HDA - Hard Disk Assembly) gespeichert. Die Information wird vom eingebauten Temperatursensor entfernt, der einer der Magnetköpfe ist, normalerweise der untere in der Bank. In den Bitfeldern des Attributs sind die aktuellen, minimalen und maximalen Temperaturen festgelegt. Nicht alle Programme, die mit SMART arbeiten, zerlegen diese Felder korrekt, sodass ihre Angaben kritisch behandelt werden sollten.
195 C3 Hardware ECC wiederhergestellt
Weniger
Die Anzahl der Fehler, die von der Hardware der Festplatte korrigiert wurden (Lesen, Positionieren, Senden über die externe Schnittstelle). Bei SATA-Laufwerken verschlechtert sich der Wert oft mit zunehmender Systembusfrequenz - SATA reagiert sehr empfindlich auf Übertaktung.
196 C4 Anzahl der Zuordnungsereignisse
Weniger
Anzahl der Neuzuweisungsoperationen. Das Feld "Rohwert" des Attributs speichert die Gesamtzahl der Versuche, Informationen aus den neu zugewiesenen Sektoren in den Reservebereich zu übertragen. Sowohl erfolgreiche als auch erfolglose Versuche werden berücksichtigt.
197 C5 Aktuelle ausstehende Sektoranzahl
Weniger
Anzahl der Sektoren, die Kandidaten für den Ersatz sind. Sie sind noch nicht als schlecht identifiziert worden, aber das Lesen von ihnen unterscheidet sich vom Lesen eines stabilen Sektors, das sind die sogenannten verdächtigen oder instabilen Sektoren. Bei erfolgreicher Ablesung des Sektors ist er von der Anzahl der Kandidaten ausgeschlossen. Bei wiederholten fehlerhaften Leseversuchen versucht das Laufwerk, es wiederherzustellen und führt eine Neuzuordnung durch.
Eine Erhöhung des Werts dieses Attributs kann auf eine physische Verschlechterung der Festplatte hindeuten.
198 C6 Nicht korrigierbare Sektoranzahl
Weniger
Die Anzahl der Sektoren, die nicht korrigiert werden können (mit Disketten). Bei einer Erhöhung der Anzahl der Fehler ist die Wahrscheinlichkeit kritischer Oberflächendefekte und / oder der Antriebsmechanik hoch.
199 C7 UltraDMA CRC-Fehleranzahl
Weniger
Die Anzahl der Fehler, die auftreten, wenn Daten im UltraDMA-Modus über eine externe Schnittstelle übertragen werden (Verletzung der Paketintegrität usw.). Das Wachstum dieses Attributs weist auf ein schlechtes (mint, twisted) Kabel und schlechte Kontakte hin. Außerdem treten solche Fehler auf, wenn der PCI-Bus übertaktet wird, Stromausfälle, starke elektromagnetische Interferenzen und manchmal auch der Fehler des Treibers.
Wahrscheinlich liegt der Grund in einer schlechten Qualität. Verwenden Sie zur Korrektur ein SATA-Kabel ohne Verriegelungen, das fest mit den Kontakten der Festplatte verbunden ist.
200 C8 Fehler schreiben Rate /
Mehrzonenfehlerrate
Weniger
Zeigt die Gesamtzahl der Fehler an, die beim Schreiben eines Sektors auftreten. Zeigt die Gesamtzahl der Schreibfehler pro Datenträger an. Es kann als Indikator für die Qualität der Oberfläche und der Mechanik des Antriebs dienen.
201 C9 Soft-Lesefehlerrate
Weniger
Häufigkeit des Auftretens von "Programm" -Fehlern beim Lesen von Daten von einer Festplatte.

Dieser Parameter zeigt die Häufigkeit von Fehlern bei Leseoperationen von der Oberfläche der Festplatte durch den Fehler der Software und nicht die Hardware des Laufwerks an.

202 Kalifornien Datenadressen-Fehler
Weniger
Anzahl der Datenadressen (DAM) Fehler (oder) herstellerspezifisch.
203 CB Streichen
Weniger
Anzahl der ECC-Fehler.
204 CC Soft-ECC-Korrektur
Weniger
Anzahl der ECC-Fehler, die programmgesteuert korrigiert wurden.
205 Cd Thermische Rauhigkeit (TAR)
Weniger
Anzahl der thermischen Unebenheitsfehler.
206 CE Flughöhe Höhe zwischen dem Kopf und der Oberfläche der Scheibe.
207 CF Hochstrom spannen
Weniger
Die Größe des Stroms, wenn sich die Platte dreht.
208 D0 Spin-Buzz Anzahl der Buzz-Routinen zum Hochfahren des Laufwerks.
209 D1 Offline-Suchleistung Die Leistung der Suche während der Offline-Vorgänge (die Suchleistung von Drive während der Offline-Vorgänge)
220 DC Festplattenverschiebung
Weniger
Der Abstand der Plattenblockverschiebung relativ zur Spindel. Meist aufgrund von Auswirkungen oder Stürzen. Die Maßeinheit ist unbekannt. Mit einer Zunahme des Attributs wird die Festplatte schnell nicht mehr funktionsfähig.
221 DD G-Sense-Fehlerrate
Weniger
Die Anzahl der Fehler aufgrund von externen Lasten und Stößen. Das Attribut speichert die Werte des eingebauten Schocksensors.
222 DE Geladene Stunden Die Zeit, die der Block der Magnetköpfe zwischen dem Entladen aus dem Parkbereich in den Arbeitsbereich der Platte verbracht hat und die Einheit zurück in den Parkbereich lädt.
223 DF Wiederholungszählung laden / entladen Anzahl der neuen Versuche, die Magnetkopfeinheit nach einem erfolglosen Versuch aus dem Parkbereich zu entladen / zu laden.
224 E0 Lastreibung
Weniger
Die Größe der Reibungskraft der Magnetkopfeinheit, wenn diese aus dem Parkbereich entladen wird.
225 E1 Ladezyklusanzahl
Weniger
Anzahl der Zyklen, um den Block der Magnetköpfe zum Parkplatz zu bewegen.
226 E2 'In'-Zeit laden Die Zeit, während der der Antrieb die Magnetköpfe aus dem Parkbereich auf die Arbeitsfläche der Platte entlädt.
227 E3 Drehmomentverstärkungsanzahl
Weniger
Die Anzahl der Versuche, das Drehmoment zu kompensieren.
228 E4 Power-Off-Einfahrzyklus
Weniger
Die Anzahl der Wiederholungen des automatischen Einparkens der Magnetkopfeinheit als Ergebnis der Abschaltung.
230 E6 GMR-Kopfamplitude Amplitude von "Jitter" (der Abstand der wiederholten Bewegung des Blocks von Magnetköpfen).
231 E7 Temperatur
Weniger
Die Temperatur der Festplatte.
240 F0 Hauptflugstunden Gesamtzeit der Haupteinheit in Arbeitsposition in Stunden.
250 FA Lesefehler-Wiederholungsrate
Weniger
Die Anzahl der Fehler beim Lesen der Festplatte.

Wo:

  • Mehr Infos - Höherer Parameterwert ist besser
  • Weniger - Ein kleinerer Parameterwert ist besser
  • Kritischer Parameter - rote Linie Hintergrund