SMART zur Festplattenüberwachung einrichten

fehlt wasgeht sogutsehr guthat geholfen (1 votes, average: 5,00 out of 5)
Loading ... Loading ...
Werbung




Close up of modern opened hard disk drive

Linux bietet ein Systemdiagnosetool Smartmontools, mit der man Festplatten testen kann sowie im Dauerbetrieb auch überwachen kann. Dabei greift SMART auf die direkte Diagnose-Fähigkeit der Festplatte zurück und liefert aussagefähige Ergebnisse.
Bevor also neue Server in Betrieb genommen werden, sollten die Festplatte geprüft werden und auch die Überwachung mit smartd aktiviert werden.

Smartmontools installieren

Die Smartmontools bestehen aus 2 Programmen.
smartctl dient zur Prüfung und Auswertung der Festplattenparameter. Dieses Tool kann viele Werte wie beispielsweise die Betriebsstunden der Festplatte oder auch die Temperatur.
smartd ist ein Dämon zur dauerhaften Überwachung der Festplatte. In regelmäßigen Abständen prüft dieses Programm die Daten der Festplatte und schlägt bei Überschreiten von Grenzwerten Alarm.

smartmontools installieren

# aptitude install smartmontools

Nachdem das Programm installiert ist, können die Festplatten getestet werden.

smartctl zur Festplatten-Diagnose

Neue Festplatten können direkt mit smartctl getestet werden. Eine schnelle Gesamtausgabe ergibt der Befehl

# smartcl -H /dev/sda

Hier sollte als Ergebnis ein PASSED stehen

smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Somit wäre die Festplatte zunächst in Ordnung.

Aber es geht auch ausführlicher

# smartctl --all /dev/sda

gibt eine komplette Diagnose der Festplatte /dev/sda aus. Interesant sind evtl. hier die Ausgaben über die Daten der Platte, beispielsweise Model und Device sowie evtl. die Firmware. Diese findet man im oberen Bereich der Ausgabe.

Aber auch der Wert von “Power_On_Hours” oder “Temperature_Celsius” könnte für den einen oder anderen Administrator von Wert sein. Ist die Festplatte schon länger in Betrieb, ist ein Ausfall wahrscheinlicher. Ebenfalls ist die Temperatur von Interesse, denn liegt diese über 55 Grad, kann dies der Festplatte durchaus schaden. Allerdings muss gerade bei der Temperatur darauf geachtet werden, mit welcher Festplatte man es zu tun hat. Desktop SATA Festplatten sollten relativ kühl sein, wobei Server-Festplatten, die mit SAS oder SCSI angebunden sind, durchaus eine höhere Temperatur vertragen können, denn diese sind darauf ausgelegt.

Langzeitdiagnose mit smartd

smartd ist der Dämon der smartmontools. Dieser Dämon arbeitet selbständig im Hintergrund und überwacht die Festplatten.

Zunächst muss der Dämon die Erlaubnis bekommen, den Dämon zu starten.
/etc/default/smartmontools

start_smartd=yes

Die Konfigurationsdatei für den Dämon ist die /etc/smartd.conf
Hier werden sämtlich Einstellungen übernommen.

Es genügt eine einzige Zeile, um alle Festplatten, die von SMART unterstützt werden, automatisch zu überwachen

DEVICESCAN -m mail@example.tld -M exec /usr/share/smartmontools/smartd-runner
  • DEVICESCAN
    scannt nach allen Festplatten, die SMART unterstützen und aktiviert die Überwachung
    Der Bereich erstreckt sich von /dev/hd[a-l] bis /dev/sd[a-z]
  • -m mail@example.tld
    im Falle einer Fehlerfeststellung, wird automatisch eine Email mit genaueren Informationen verschickt
  • -M
    Angabe über die Häufigkeit für das Versenden der Diagnosemails.
    -M ist per default dann -M daily. Andere Möglichkeiten wären
    -M once, -M diminishing, -M test, -M exec

Mit “-M test” erreicht man das versenden einer Test-Email, um den Versand zu testen. Smartd fällt dann aber im Normalen Modus und versendet auch Warnmails, wenn etwas auftritt.
So steht im Manpage:

Note  that if  this  Directive  is used, smartd will also send the normal email warnings that were
enabled with the '-m' Directive, in addition to the single test email

Ist der Versand der Testmail nicht gewünscht, kann der exec Befehl genutzt werden.

Dieser Befehl ist eine langfristige Überwachung aller im System befindlichen Festplatten möglich und der Administrator erhält umgehend nach Erkennen eines Problems eine Email.

Es besteht allerdings auch die Möglichkeit, Festplatten mit unterschiedlichen Parametern zu überwachen.
Dazu muss der Platten Name separat angegeben werden:

/dev/sda -m root@example.tld -M exec /usr/share/smartmontools/smartd-runner
/dev/sdc -m dataadmin@example.tld -M exec /usr/share/smartmontools/smartd-runner

In diesem Falle werden je nach Festplatte die Diagnose-Meldungen an verschiedene System-Administratoren verschickt, beispielsweise um rechtzeitig Backups anlegen zu können, da verschiedene Personen für verschiedene Festplatten-Bereiche zuständig sind.

Die Konfiguration kann nun getestet werden

# smartd -q onecheck

und der Dämon neu gestartet

# /etc/init.d/smartmontools restart

Eine komplette Liste der Parameter für die /etc/smartd.conf gibt es hier:

#   -d TYPE Set the device type: ata, scsi, marvell, removable, 3ware,N, hpt,L/M/N
#   -T TYPE set the tolerance to one of: normal, permissive
#   -o VAL  Enable/disable automatic offline tests (on/off)
#   -S VAL  Enable/disable attribute autosave (on/off)
#   -n MODE No check. MODE is one of: never, sleep, standby, idle
#   -H      Monitor SMART Health Status, report if failed
#   -l TYPE Monitor SMART log.  Type is one of: error, selftest
#   -f      Monitor for failure of any 'Usage' Attributes
#   -m ADD  Send warning email to ADD for -H, -l error, -l selftest, and -f
#   -M TYPE Modify email warning behavior (see man page)
#   -s REGE Start self-test when type/date matches regular expression (see man page)
#   -p      Report changes in 'Prefailure' Normalized Attributes
#   -u      Report changes in 'Usage' Normalized Attributes
#   -t      Equivalent to -p and -u Directives
#   -r ID   Also report Raw values of Attribute ID with -p, -u or -t
#   -R ID   Track changes in Attribute ID Raw value with -p, -u or -t
#   -i ID   Ignore Attribute ID for -f Directive
#   -I ID   Ignore Attribute ID for -p, -u or -t Directive
#   -C ID   Report if Current Pending Sector count non-zero
#   -U ID   Report if Offline Uncorrectable count non-zero
#   -W D,I,C Monitor Temperature D)ifference, I)nformal limit, C)ritical limit
#   -v N,ST Modifies labeling of Attribute N (see man page)
#   -a      Default: equivalent to -H -f -t -l error -l selftest -C 197 -U 198
#   -F TYPE Use firmware bug workaround. Type is one of: none, samsung
#   -P TYPE Drive-specific presets: use, ignore, show, showall
#    #      Comment: text after a hash sign is ignored
#    \      Line continuation character
# Attribute ID is a decimal integer 1 <= ID <= 255
# except for -C and -U, where ID = 0 turns them off.
# All but -d, -m and -M Directives are only implemented for ATA devices


Werbung


3 Kommentare zu: SMART zur Festplattenüberwachung einrichten

  1. admin sagt:

    stimmt, der exec Befehl ruft ein Skript auf, welches die Ausgabe der Problem- bzw Diagnose Meldung bearbeiten, verändern oder aufbessern lässt.
    Nutzt man nur -M test, wird eine normale Standard-Mail verschickt.

    Der Aufruf heißt also
    -M test
    oder
    -M exec /usr/share/smartmontools/smartd-runner
    wobei das smartd-runner ein Bash Skript ist.
    Möchte man keine aufbereitete Email, kann die -M Option auch ganz weg gelassen werden.

    Positiver Nebeneffekt bei -M test ist, dass man eine Mail bekommt, wenn der Server unerwartet neu gestartet hat (zumindest bei mir im test).

  2. Patschi sagt:

    Hallo,

    habe soeben versucht, die Häufigkeit der eMails auf “test” zu setzen, jedoch ergibt das beim Config überprüfen nur Fehler…

    Habe folgende Zeile versucht:
    DEVICESCAN -m mail@domain.tld -M test exec /usr/share/smartmontools/smartd-runner

    Dabei kommt immer folgender Fehler:
    Opened configuration file /etc/smartd.conf
    File /etc/smartd.conf line 151 (drive DEVICESCAN): unknown Directive: exec
    Run smartd -D to print a list of valid Directives.
    Configuration file /etc/smartd.conf has fatal syntax errors.

    Vielen Dank für deine Hilfe & netter Blog! :)

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *


*

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>