Comment vérifier l’état de santé d’un SSD/HDD sous Linux

Si tu es administrateur système et responsable de la gestion des systèmes Linux dans un centre de données. Alors, il est recommandé de vérifier régulièrement la santé des disques SSD et HDD. Cela t’aidera à identifier les disques défaillants et ils pourront être remplacés avant toute perte de données. S.M.A.R.T est un outil utilisé pour surveiller l’état de santé des SSD et des HDD. Il te permet également d’effectuer des tests à la demande sur le disque.

Dans ce billet, nous allons te montrer comment vérifier la santé des SSD et des HDD sous Linux.

Conditions préalables

  • Un serveur ou un ordinateur de bureau exécutant le système d’exploitation Linux.
  • Un mot de passe root est configuré sur le serveur.

Installe Smartctl

Par défaut, Smartctl est inclus dans le référentiel par défaut de toutes les principales distributions Linux.

Pour les distributions Debian et Ubuntu, installe Smartctl à l’aide de la commande suivante :

apt-get install smartmontools -y

Pour les distributions RHEL, CentOS et Fedora, installe Smartctl à l’aide de la commande suivante :

dnf install smartmontools

Après avoir installé Smartctl, démarre le service Smartctl à l’aide de la commande suivante :

systemctl start smartd

Tu peux vérifier l’état de Smartd à l’aide de la commande suivante :

systemctl status smartd

Tu devrais obtenir le résultat suivant :

? smartmontools.service - Self Monitoring and Reporting Technology (SMART) Daemon
     Loaded: loaded (/lib/systemd/system/smartmontools.service; enabled; vendor preset: enabled)
     Active: active (running) since Fri 2021-07-02 08:58:33 UTC; 11s ago
       Docs: man:smartd(8)
             man:smartd.conf(5)
   Main PID: 1042 (smartd)
     Status: "Next check of 0 devices will start at 09:28:33"
      Tasks: 1 (limit: 2353)
     Memory: 1.2M
     CGroup: /system.slice/smartmontools.service
             ??1042 /usr/sbin/smartd -n

Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sda, opened
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sda, [QEMU     QEMU HARDDISK    2.5+], 53.6 GB
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sda, IE (SMART) not enabled, skip device
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Try 'smartctl -s on /dev/sda' to turn on SMART features
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sdb, opened
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sdb, [AN       Volume           2.5+], S/N: sdb, 53.6 GB
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sdb, IE (SMART) not enabled, skip device
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Try 'smartctl -s on /dev/sdb' to turn on SMART features
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 0 NVMe devices
Jul 02 08:58:33 ubuntu2004 systemd[1]: Started Self Monitoring and Reporting Technology (SMART) Daemon.

Tester la santé du SSD/HDD

Après avoir installé Smartctl, tu devras activer les fonctions SMART sur ton disque dur.

Tu peux le faire à l’aide de la commande suivante :

smartctl -s on /dev/sda

La première chose que tu devras faire est d’obtenir des informations sur le SSD ou le HDD.

Tu peux le faire à l’aide de la commande suivante :

smartctl -i /dev/sda

Cela te donnera les informations détaillées de ton disque dur.

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD5000LPVX-75V0TT0
Serial Number:    WXV1EC4KN2N7
LU WWN Device Id: 5 0014ee 65af65611
Firmware Version: 01.01A01
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Fri Jul  2 14:39:33 2021 IST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Si tu veux effectuer un petit test sur le disque, exécute la commande suivante :

smartctl -t short -a /dev/sda

Tu devrais obtenir la sortie suivante :

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD5000LPVX-75V0TT0
Serial Number:    WXV1EC4KN2N7
LU WWN Device Id: 5 0014ee 65af65611
Firmware Version: 01.01A01
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Fri Jul  2 14:40:23 2021 IST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		( 9360) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.

Le test court testera les propriétés électriques, les propriétés mécaniques et la lecture/vérification.

Pour trouver et imprimer le résultat de l’auto-test, exécute la commande suivante :

smartctl -l selftest /dev/sda

Tu devrais obtenir le résultat suivant :

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      7609         -
# 2  Short offline       Interrupted (host reset)      90%      6972         -
# 3  Short offline       Aborted by host               70%      6972         -
# 4  Short offline       Interrupted (host reset)      70%         2         -

Pour exécuter un test long, utilise la commande suivante :

smartctl -t long -a /dev/sda

Tu devrais obtenir le résultat suivant :

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 107 minutes for test to complete.
Test will complete after Fri Jul  2 16:30:41 2021

Use smartctl -X to abort test.
 

Le test long testera tout ce qui a été inclus dans le test court.

Tu peux arrêter le test, exécute la commande suivante :

smartctl -X /dev/sda

Tu devrais voir le résultat suivant :

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Abort SMART off-line mode self-test routine".
Self-testing aborted!

Pour tester la santé générale du lecteur, exécute la commande suivante :

smartctl -d ata -H /dev/sda

Tu devrais obtenir le résultat suivant :

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Pour vérifier le temps estimé pour effectuer le test, exécute la commande suivante: :

smartctl -c /dev/sda

Tu devrais obtenir le résultat suivant :

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (  25)	The self-test routine was aborted by
					the host.
Total time to complete Offline 
data collection: 		( 9360) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 107) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x7035)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

Pour imprimer uniquement le journal des erreurs, exécute la commande suivante :

smartctl -l error /dev/sda

Pour obtenir des informations d’aide, exécute la commande suivante: :

smartctl --help

Conclusion

Dans le guide ci-dessus, tu as appris à installer et à utiliser l’outil S.M.A.R.T pour vérifier la santé de tes disques SSH et HDD. J’espère que cela t’aidera beaucoup. Pour plus d’informations, lis la page de manuel smartctl.

Vous aimerez aussi...