En el mundo de los servidores, hay pocas cosas que den más pánico que el sonido de un disco mecánico haciendo "clac, clac" o el cuelgue repentino de un SSD. La pérdida de datos es la peor pesadilla de cualquier administrador, pero por suerte, la tecnología está de nuestro lado.
Todos los discos duros modernos vienen con un chivato interno llamado S.M.A.R.T. (Tecnología de Auto-Monitorización, Análisis y Reporte). Es una caja negra que registra el desgaste físico del componente. En Guía SysAdmin te enseñamos a extraer esta información desde la terminal de Linux usando la herramienta smartctl para que puedas clonar tus datos antes de que sea demasiado tarde.
1. Instalar el kit de primeros auxilios
A diferencia de otros comandos básicos, la suite de herramientas SMART no siempre viene preinstalada. Para instalarla en distribuciones basadas en Debian/Ubuntu, abre tu terminal y ejecuta:
sudo apt update && sudo apt install smartmontools2. Identificar a nuestro paciente
Antes de operar, necesitamos saber cómo llama el sistema operativo a nuestro disco duro. Para ver una lista de todos los discos conectados, usamos el comando:
lsblk
Busca en la lista tu disco principal. Normalmente se llamará sda, sdb (si es SATA) o nvme0n1 (si es un SSD M.2 moderno). La ruta completa que usaremos será /dev/sda.
3. Hacer la radiografía completa (El comando maestro)
Ahora vamos a pedirle al disco que nos escupa todo su historial médico. Ejecuta el siguiente comando (sustituyendo "sda" por el nombre de tu disco):
sudo smartctl -a /dev/sda
La terminal se llenará de texto. No te asustes, no necesitas ser ingeniero para entenderlo. Solo tienes que buscar estas dos secciones críticas:
A. El diagnóstico rápido:
Busca una línea casi al principio que dice SMART overall-health self-assessment test result:. Si al lado dice PASSED, respira tranquilo, el disco cree que está sano. Si dice FAILED, apaga los servicios de inmediato y haz una copia de seguridad: el disco está en las últimas.
B. Los datos de la autopsia (Atributos):
Baja un poco más hasta la tabla de atributos (Vendor Specific SMART Attributes). Fíjate en la columna de la derecha (RAW_VALUE) de estos tres indicadores:
- Power_On_Hours: Te dice exactamente cuántas horas lleva encendido el disco en toda su vida.
- Reallocated_Sector_Ct: (Sectores reasignados). Si este número es mayor que 0, significa que el disco ha encontrado zonas físicamente rotas y está moviendo los datos para evitar perderlos. ¡Es la señal de alerta roja definitiva!
- Wear_Leveling_Count: (Solo en SSD). Indica el porcentaje de vida útil que le queda a la memoria flash de tu disco de estado sólido.
La información es poder. Un disco duro no avisa con un correo electrónico cuando va a fallar, pero si revisas sus datos S.M.A.R.T. de vez en cuando, nunca te pillará por sorpresa.
Recuerda: si los datos de tu disco pintan mal, no intentes repararlo. Usa nuestra guía sobre cómo hacer copias de seguridad automáticas con rsync y pon tus datos a salvo en otra unidad de inmediato.



Comentarios
Publicar un comentario
¿Dudas con la terminal? ¿Algún error en los logs al ejecutar el tutorial? ¡Deja tu comentario y lo revisamos juntos!