Cómo saber si tu disco duro se va a romper en Linux (Diagnóstico S.M.A.R.T.)

En el mundo de los servidores, hay pocas cosas que den más pánico que el sonido de un disco mecánico haciendo "clac, clac" o el cuelgue repentino de un SSD. La pérdida de datos es la peor pesadilla de cualquier administrador, pero por suerte, la tecnología está de nuestro lado.

Todos los discos duros modernos vienen con un chivato interno llamado S.M.A.R.T. (Tecnología de Auto-Monitorización, Análisis y Reporte). Es una caja negra que registra el desgaste físico del componente. En Guía SysAdmin te enseñamos a extraer esta información desde la terminal de Linux usando la herramienta smartctl para que puedas clonar tus datos antes de que sea demasiado tarde.

1. Instalar el kit de primeros auxilios

A diferencia de otros comandos básicos, la suite de herramientas SMART no siempre viene preinstalada. Para instalarla en distribuciones basadas en Debian/Ubuntu, abre tu terminal y ejecuta:

sudo apt update && sudo apt install smartmontools

Instalacion del kit de primeros auxilios

2. Identificar a nuestro paciente

Antes de operar, necesitamos saber cómo llama el sistema operativo a nuestro disco duro. Para ver una lista de todos los discos conectados, usamos el comando:

lsblk

Busca en la lista tu disco principal. Normalmente se llamará sda, sdb (si es SATA) o nvme0n1 (si es un SSD M.2 moderno). La ruta completa que usaremos será /dev/sda.

Identificar a nuestro paciente, comando lsblk

3. Hacer la radiografía completa (El comando maestro)

Ahora vamos a pedirle al disco que nos escupa todo su historial médico. Ejecuta el siguiente comando (sustituyendo "sda" por el nombre de tu disco):

sudo smartctl -a /dev/sda

La terminal se llenará de texto. No te asustes, no necesitas ser ingeniero para entenderlo. Solo tienes que buscar estas dos secciones críticas:

A. El diagnóstico rápido:

Busca una línea casi al principio que dice SMART overall-health self-assessment test result:. Si al lado dice PASSED, respira tranquilo, el disco cree que está sano. Si dice FAILED, apaga los servicios de inmediato y haz una copia de seguridad: el disco está en las últimas.

B. Los datos de la autopsia (Atributos):

Baja un poco más hasta la tabla de atributos (Vendor Specific SMART Attributes). Fíjate en la columna de la derecha (RAW_VALUE) de estos tres indicadores:

Power_On_Hours: Te dice exactamente cuántas horas lleva encendido el disco en toda su vida.
Reallocated_Sector_Ct: (Sectores reasignados). Si este número es mayor que 0, significa que el disco ha encontrado zonas físicamente rotas y está moviendo los datos para evitar perderlos. ¡Es la señal de alerta roja definitiva!
Wear_Leveling_Count: (Solo en SSD). Indica el porcentaje de vida útil que le queda a la memoria flash de tu disco de estado sólido.

Hacer la radiografia completa el comando maestro

La información es poder. Un disco duro no avisa con un correo electrónico cuando va a fallar, pero si revisas sus datos S.M.A.R.T. de vez en cuando, nunca te pillará por sorpresa.

Recuerda: si los datos de tu disco pintan mal, no intentes repararlo. Usa nuestra guía sobre cómo hacer copias de seguridad automáticas con rsync y pon tus datos a salvo en otra unidad de inmediato.

Guía Sysadmin

Buscar este blog

Cómo bloquear webs en tu red local montando un Proxy Squid en Linux