Вышла новая версия пакета smartmontools 6.6 (https://www.smartmontools.org/), содержащего приложения (smartctl и smartd) для мониторинга и контроля (S)ATA, SCSI/SAS и NVMe дисков, поддерживающих технологию SMART. Поддерживается работа на платформах Linux, FreeBSD, Darwin (OS X), Windows, QNX, OS/2, Solaris, NetBSD и OpenBSD.Основные изменения, реализованные с момента выхода 6.5:
- smartctl ATA: поддержка ATA ACS-4 and SATA 3.3, управление ATA SCT Feature Control, реализован '-l defects' для вывода лога дефектов, исправлен вывод режима security и работа с дисками в спящем режиме, реализована установка и получение DSN
- smartctl NVMe: вывод идентификатора IEEE EUI-64 NVMe пространств имен, поддержка спецификации NVMe 1.3
- smartd: автоматическое распознавание и игнорирование дублирующихся устройств, улучшена логика определения температуры SCSI/SAS, управление ATA DSN
- новый тип устройств "-d intelliprop,N" для поддержки контроллеров IntelliProp
- обновления в базе дисков drivedb (HDD, SSD, USB устройства);
- Linux: поддержка SG_IO V4 API, улучшение поддержки hpsa устройств
- FreeBSD: исправление паники в ядрах с INVARIANTS, улучшена поддержка Legacy ATA контроллеров, добавлена поддержка FreeBSD 11
- NetBSD: поддержка NVMe, поддержка 28-bit ATA, исправления ошибок компиляции
- OS/2: добавлена поддержка драйвера OS2AHCI, поддержка тестирования дисков, код интегрирован в проект.
- Windows: поддержка NVMe драйвера Windows 10 (stornvme.sys), исправлена работа с IRST драйвером 15.2, добавлена возможность запуска powershell скриптов прямо из smartd, документация поставляется в виде PDF страниц
- OSX/Darwin: добавлена экспериментальная поддержка NVMe основанная на недокументированном SMART NVMe API.
- Создан официальное зеркало (https://github.com/smartmontools/smartmontools/) на github интегрированное с Circle CI.URL: https://www.smartmontools.org/
Новость: http://www.opennet.me/opennews/art.shtml?num=47514
> OS/2: добавлена поддержка0.o
Посаны, кое сейчас год?
и чо? Мне прислали репорт, я заморочился и поднял это г... в виртуалке, сделал патч и заодно поправил кучу косяков в оригинальном коде. Юзер протестировал билд, я закоммитил.
Круто, конечно, но удивляет почему тогда заодно и поддержку DOS не запилили, например - мне кажется в этом смысла было бы как минимум не меньше,
Присылайте патч, если он пройдёт review и добавит статистически значимое количество устройств (например все ahci) то я думаю, что его добавят. Тем более, что в мире до сих пор дофига всякого железа с дос внутри, недавно даже усб3 для доса запилили
> Круто, конечно, но удивляет почему тогда заодно и поддержку DOS не запилилиПотому что @os2.kiev.ua, а не @dos.kiev.ua? ;-)
2 Samm: с новым выпуском! Похоже, придётся послезавтра вешать традиционную багу насчёт обновления странички http://www.smartmontools.org/wiki/LiveCDs :)
Спасибо. Ага, релизы достаточно часто чтобы это надоедало, но достаточно редко чтобы не запилить бота )))
На всяком хитром всё так же штатно собралось:Wrote: /usr/src/RPM/SRPMS/smartmontools-6.6-alt1.src.rpm
Wrote: /usr/src/RPM/RPMS/e2k/smartmontools-6.6-alt1.e2k.rpm
Wrote: /usr/src/RPM/RPMS/e2k/smartmontools-debuginfo-6.6-alt1.e2k.rpm
ага, 98 добавь
> и заодно поправил кучу косяков в оригинальном коде
> кучу косяков в оригинальном коде
> кучу косяковнасторожило
Ага, тоже хотел качнуть, но после этой фразы рука дрогнула.
> поправил кучу косяковфиксед
Так речь же про косяки в os_os2.cpp
> Так речь же про косяки в os_os2.cppOS/2:
Явно не твой.
юморист от бога
>> OS/2: добавлена поддержкаА как они их, Линукс-то, а? :)
Как вспомню: Banyan Vines, Netware, Os/2...
>>> OS/2: добавлена поддержка
> А как они их, Линукс-то, а? :)
> Как вспомню: Banyan Vines, Netware, Os/2...Кстати да, чего не для Netware, Minix и Multics
я выше вроде как понятно объяснил, ага
> я выше вроде как понятно объяснил, агаА надо было на опеннете проконсультироваться! Пора бы уже знать, что тут лучше знают, что, как и где вам, в ваше свободное время, лучше делать!
FreeBSD ports update: https://bugs.freebsd.org/bugzilla/show_bug.cgi?id=223456
> OS/2
> FreeBSD ports update: https://bugs.freebsd.org/bugzilla/show_bug.cgi?id=223456Зачем тревожить покой спящих последним сном?
>> OS/2
>> FreeBSD ports update: https://bugs.freebsd.org/bugzilla/show_bug.cgi?id=223456
> Зачем тревожить покой спящих последним сном?еще 1 петросян в треде. потому, что есть статистически значимое количество систем на которых этот порт используется. еще потому, что система предоставляет все необходимые апи для реализации этой возможности.
а что, есть какая-то польза от SMART ? по-моему все устройства скрывают и маскируют свои дефекты изо всех сил, никакой полезной инфо не отдают.
> а что, есть какая-то польза от SMART ?есть
> по-моему все устройства скрывают и маскируют свои дефекты изо всех сил, никакой полезной инфо не отдают.
это не так. Другой вопрос, что со стандартизацией швах, но тут как раз smartmontools и его drivedb в помощь.
> а что, есть какая-то польза от SMART ?Лично для меня неоднократно была польза.
> по-моему все устройства скрывают и маскируют свои дефекты изо всех сил, никакой полезной инфо не отдают.
С чего это винту маскировать дефект, возникший в процессе эксплуатации? Или ты из тех, кто считает smartmontools утилитой для проверки новых винтов?
> Или ты из тех, кто считает smartmontools утилитой для проверки новых винтов?Ну он отлично запускает смарт-тесты и отображает результат. Так почему нет?
Да-да, смарт-тесты в самом винте, но более удобного просто нет.
Я имел ввиду, что человек без запуска тестов просто смотрит вывод smart на новом винте и ожидает увидеть там что-то страшное. Разумеется ничего не видит и делает вывод, что винты всё скрывают.
Про крутящиеся:
1. По статистике Гугла по-моему в 50% случаев smart предупреждает до того как диск сломается.
2. Можно запустить тест (возможно, hdparm тоже можно, не особо пользуюсь). Для меня лично провал теста - это причина поменять диск по гарантии.
3. Можно посмотреть лог ошибок или определить CRC ошибки на кабеле (или чипе экспандера).
Про SSD и NVMe:
1. Самое главное - Wear level можно посмотреть. Если оно например 1, то диск не сломается сразу, но производитель уже не гарантирует запись (я так понимаю у Intel заканчивается гарантия на этом например). Если важны данные, то имеет смысл менять диск в этом случае.
2. Тоже самое про CRC (если не NVMe).
в статье - в 30%
> 3. Можно посмотреть лог ошибок или определить CRC ошибки на кабеле (или
> чипе экспандера).
> Про SSD и NVMe:
> 1. Самое главное - Wear level можно посмотреть. Если оно например 1,
> то диск не сломается сразу, но производитель уже не гарантирует запись
> (я так понимаю у Intel заканчивается гарантия на этом например). Если
> важны данные, то имеет смысл менять диск в этом случае.Кстати, часть дисков при wearing level 1 переходят в режим read only. У меня такой диск был, причем, вероятно, из-за криворукости фирмварописателей он отвечал "Ok" на команды записи, но по факту ничего не писал. Ext4fs драйвер при таком забавно сходит с ума на fsck. Спасти данные, впрочем, реально, ну и на том спасибо.
> а что, есть какая-то польза от SMART ? по-моему все устройства скрывают
> и маскируют свои дефекты изо всех сил, никакой полезной инфо не отдают.Его сильно затупили после того, как не в меру "умные" бивисописцы стали совать в SMART свой нос и чуть что -- орать на пользователя, мол, бойся-бэкапься; если склероз не обманывает, до этого в смарте можно было видеть заводские дефекты (что нормально), ну а после лет десять как уже сплошные красивые нолики.
Научиться бы всяким тогдашним асусам брать первую производную, если уж так интересно... (другой вопрос -- где хранить данные для дельт(ы), ну так если не получается сделать нормально, лучше было вовсе не делать)
Но польза есть.
бивисописцы обычно проверяют только smart health status и это имеет смысл. Другой вопрос, что часть из них если smart health fail выводят на экран сообщение и ждут нажатия кнопки, вот за это точно надо руки отрывать.Что касается атрибутов - обычно никто ничего особо не прячет. Там 2 основных проблемы:
1) это отсутствие стандартизации атрибутов и у кучи вендоров внятного описания их. Обычно с enterprise железками немного лучше, там можно в недрах сайта найти мануал с описаниями, у дешевых ендюзерский, особенно OEM, вообще никто не заморачивается. У scsi/sas очень модно сделать свою log page с уникальным форматом, который никто читать не умеет, включая вендорские утилиты ))
2) немного улучшил ситуацию -l devstat лог, в котором атрибуты и их значения стандартизированы, но им мало кто пользуется, увы. А там где он есть - далеко не всегда все поля заполнены, причем я склонен тут винить обычное разгильдяйство, а не злой умысел.
3) есть и куча глюков в самих firmware дисков, так что написанному не всегда удается верить.
4) У ssd, кстати, достаточно часто бывает внутренний атрибут с количеством сбойных ячеек после производства, это нормально, опять же - никто ничего не скрывает, но описание приходится долго искать, чаще, кстати, в случае ssd легче найти спеку на контроллер чем описание от вендора, благо большинство вендоров референсный фирмвар почти не трогают. Отдельные китайцы, кстати, настолько, сцуко, ленивы, что вообще не трогают и оставляют в model "SATA DISK" и такое можно идентифицировать только по номеру firmware (реальные кейзы)
>> а что, есть какая-то польза от SMART ? по-моему все устройства скрывают
>> и маскируют свои дефекты изо всех сил, никакой полезной инфо не отдают.
> Его сильно затупили после того, как не в меру "умные" бивисописцы стали
> совать в SMART свой нос и чуть что -- орать на
> пользователя, мол, бойся-бэкапься; если склероз не обманывает, до этого в смарте
> можно было видеть заводские дефекты (что нормально), ну а после лет
> десять как уже сплошные красивые нолики.Когда это в смарте показывались заводские дефекты? Их показывали разве что в виде бумажки, наклеенной на MFM хард ;)
в некоторых скази/sas дисках были таблицы с заводскими дефектами, насколько я помню. Но да, скорее экзотика, да и смысла 0.
> а что, есть какая-то польза от SMART ?Вообще никакой. Диск или дохлый или нет.
Samm, у меня счётчики ошибок постоянно растут. Это нормально? Так и должно быть? Какие нормальные производные по времени для счётчиков ошибок?
> Samm, у меня счётчики ошибок постоянно растут. Это нормально? Так и должно
> быть? Какие нормальные производные по времени для счётчиков ошибок?Зависит от того, что за атрибут. Если это что-то vendor specific и оно показывает огромные значения - можете смело игнорировать.
hardware_ecc_recovered, seek_error_rate . Каждую секунду растут, причём не на единицы, а как минимум на тысячи-сотни тысяч.
Я тоже заметил что от производителя зависит. У Seagate например счетчик ошибок похоже включает восстановленные. Имеет смысл написать в какой-то специализированный форум, может там подскажут.
Может у кого-то найдется подобная модель чтобы сравнить.
Не восстановленные, а и сами операции поиска и чтения. Т.е. при нуле ошибок, но активной работе, их счётчики будут расти. Вот расписано: http://forum.ru-board.com/topic.cgi?forum=84&topic=5208> Я тоже заметил что от производителя зависит. У Seagate например счетчик ошибок
> похоже включает восстановленные. Имеет смысл написать в какой-то специализированный форум,
> может там подскажут.
> Может у кого-то найдется подобная модель чтобы сравнить.
туда не смотри, value/worst/thresh смотриhttps://superuser.com/questions/1037644/samsung-ssd-wear-lev...
> у меня счётчики ошибок постоянно растут.Seagate?
Да. Но куплен до 2007, сегодняшняя смертность сигейтов к нему неприменима.
Для сигейтов бешеные показатели Raw_Read_Error_Rate и Seek_Error_Rate — норма.
И ещё вопрос, стоит ли мне новый винт купить, или лучше на том, что есть, работать? Потому что новые, слышал, живут очень недолго, но винту, как видите, больше 11 лет, при том, что срок службы у винтов 5 лет. Резервной копии нет вообще: винт 1, а облакам не доверяю.
> облакам не доверяюоткрой для себя LUKS
> открой для себя LUKSА ты уверен, что там нет уязвимостей и бекдоров, а также в /dev/urandom, а также в sha256? После всего произошедшего (shattered, pixie dust, openssl, etv) я не уверен.
Ученики ушли просветлённые. Сисадмин после этого вообще отказался от шифрования своего диска. А инженер Чжа Вынь сделал криптоконтейнер внутри криптоконтейнера.
©
> Резервной копии нет вообще: винт 1Купите номер два, при неиспользовании усыпляйте/отключайте по вкусу?
Новые бывают не только сигейты, соответственно wd/hgst живут вполне прилично.
Купил три года назад 2 одинаковых WD AV-GP,один был тихий как положено, второй чутка вибрировал и гудел. Рулетка.
>> Резервной копии нет вообще: винт 1
> Новые бывают не только сигейты, соответственно wd/hgst живут вполне прилично.Судя по анализу инфы в открытом доступе, hgst/hitachi живёт больше всех. Под брендом wd проигрывают hgst.
> Купите номер два, при неиспользовании усыпляйте/отключайте по вкусу?
БП не потянет.
И все винты, покупку которых я рассматривал, произведены в КНР, что означает почти гарантированное наличие бекдора в прошивке/железе.
>что означает почти гарантированное наличие бекдора в прошивке/железе.А проц с мамкой ты себе в гараже надо думать, сварганил? Ох уж эти мамкины хацкеры... пора открывать ателье по пошиву шапочек из фольги.
> И все винты, покупку которых я рассматривал, произведены в КНР, что означает
> почти гарантированное наличие бекдора в прошивке/железе.С чего ты взял, что сборка КНР означает разработку в КНР? И почему такое недоверие именно к КНР? Бекдор в харде — штука узкоспециализированная, его трудно монетизировать, а кроме прибыли китайцев мало что волнует.
Как будто в первый раз.https://xakep.ru/2011/12/26/58104/
>С чего ты взял, что сборка КНР означает разработку в КНР?
Дело не в разработке, а в производстве. Ничто не мешает модифицировать прошивку при прозводстве. Ничто также не мешает модифицировать кремний так, чтобы цифровая подпись китайцев тоже проходила проверку. Даже если всё это вскроется - куда вендоры то денутся с подводной лодки, китай вне конкуренции.
>И почему такое недоверие именно к КНР?
китайцы не раз и не два и не 10 уже попадались на бекдорах, внедрённых в прошивки на этапе производства.
Постить ссылку на "хакер.ру" на IT-сайте, это как на приёме у английской королевы встать на стол, снять штаны и громко об0ср@ться прямо на белоснужную скатерть. Гнать ссаными тряпками!>Ничто также не мешает модифицировать кремний так
Модифированный кремний? Ждём на девайсах наклейки "Без КНР"?
К фразе:
>китайцы не раз и не два и не 10 уже попадались на бекдорах, внедрённых в прошивки на этапе производства.необходимо прикладывать веские пруфы и не раз, и не два, а десять. Правда, судя по ссылке на "хакер", пруфы будут такого же школьного уровня.
Короче, низкопробная дешёвая паранойя.
>на белоснужнуюНа белоснежную, самофикс.
> И ещё вопрос, стоит ли мне новый винт купить, или лучше на том, что есть, работать? Потому что новые, слышал, живут очень недолго, но винту, как видите, больше 11 лет, при том, что срок службы у винтов 5 лет. Резервной копии нет вообще: винт 1, а облакам не доверяю.Есть смысл по крайней мере обзавестись вторым винтом для бекапов. Время их жизни как 11 лет назад было, так и сейчас остаётся непредсказуемым.
>Official read only mirror of the smartmontools project SVN
>SVNКончался 2017 год...
Неужели так сложно сконвертировать в гит и послать на 3 буквы всех тех, кто не желает использовать гит?
>>Official read only mirror of the smartmontools project SVN
>>SVN
> Кончался 2017 год...
> Неужели так сложно сконвертировать в гит и послать на 3 буквы всех
> тех, кто не желает использовать гит?Эээ.
1) Проект уже переезжал с CVS в свое время. В настоящий момент особых причин для переезда N2 нет и уж точно выбор VCS не является сдерживающим фактором.
2) Над проектом работают в свое свободное время около 3 человек. На SVN в данный момент завязано часть функционала (release procedure, один из способов обновления smart-db, вывод версии в ночных билдах, и так далее). Все это можно переписать на git, но это займет время + потребуется поддерживать svn версию drivedb.h для уже выпущенных релизов. Я с намного большим удовольствием и пользой поработаю над любым из тикетов с реализацией новых фич, благо там дофига в todo (https://www.smartmontools.org/report/1).
3) Для тех, кто хочет использовать git/github и создан официальный миррор. Можно делать fork, PR, issue, грабить корованы и собирать в докере и circle ci. Patches are welcome. Если в какой-то момент мы решим, что SVN более не нужен - то он и станет основным репозиторием, вроде как очевидно же.
Евть вопрос (возможно глупый, так как окружение несколько экзотично - но, в конце концов, не os/2).В общем, есть ядро 64-бит, окружение 32-бит (плюс 64-битный chroot), пачка sata жестких дисков и PCI-E NVME Lite-On M8Pe. С SATA-винтами всё оллично, а вот smartctl -a /dev/nvme0 работает из-под 64 бит, а 32-битная версия возвращает
Read NVMe Identify Controller failed: NVME_IOCTL_ADMIN_CMD: Bad addressКуда копать? Квалификации у меня хватит, а вот за намёк в какую сторону рыть - буду благодарен.
P.S. Желающие объяснить, что 32 бита надо выкинуть могут сразу пройти прямо и налево, надо мне так.
Ну скорее всего размер ioctl в 64 и 32 бит версии разный, strace и sizeof вам в помощь. Это, в принципе, наверное можно пофиксить, но зачем? Лучше соберите статиком 64 бит версию, если уж так хочется держать 32bit env.
> В общем, есть ядро 64-бит, окружение 32-бит (плюс 64-битный chroot), пачка sata
> жестких дисков и PCI-E NVME Lite-On M8Pe. С SATA-винтами всё
> оллично, а вот smartctl -a /dev/nvme0 работает из-под 64 бит, а
> 32-битная версия возвращает
> Read NVMe Identify Controller failed: NVME_IOCTL_ADMIN_CMD: Bad address
> Куда копать? Квалификации у меня хватит, а вот за намёк в какую
> сторону рыть - буду благодарен.Длинный ответ: тут может быть несколько проблем, как со стороны userland (size, aligment), так и со стороны драйвера. Копать - в сторону compat_ioctl в ядре и соответствующих обсуждений в ядерном листе. Я бы, наверное, начал с дампа памяти в ioctl 32 и 64 бит версии, и дальше бы уже смотрел что там в ведро ушло. В целом можете зарепортить на сайте, будет время - гляну, благо несложно репродюснуть.
Ясно, спасибо. Я в сторону размера как-то совсем не подумал по причине абсолютно корректной работы с SATA-дисками, но погляжу. Насчёт репортить... Оно экзотика всё же, даже мне, хоть я и брыкался изо всех сил, придётся переезжать на 64-битное окружение как только станет возможным.
> 1,2Ясно.
> 3
Это просто замечательно!
> Неужели так сложно сконвертировать в гит и послать на 3 буквы всех тех,
> кто не желает использовать гит?Гораздо быстрее, проще и правильней послать в пять букв тех, кто не желает использовать Subversion.
> Гораздо быстрее, проще и правильней послать в пять букв тех, кто не
> желает использовать Subversion.Врети! Гит - это свято! Использование гита дает плюс стопицот на все знания и наоборот, нубов сразу видно по неиспользованию гита!
>> Гораздо быстрее, проще и правильней послать в пять букв тех, кто не
>> желает использовать Subversion.
> Врети! Гит - это свято! Использование гита дает плюс стопицот на все
> знания и наоборот, нубов сразу видно по неиспользованию гита!а причём тут свято? просто гит лучше, а сабвершн - это лишняя фрагментация. Когда-нибудь и гит устареет.
> просто гит лучшеТак говорят либо укушенные Линусом -- но этим хоть <плюй> в глаза, либо те, кто никогда не ворочал репозитариями по 10-30 гигабайт контекстно-несливаемых данных.
> Гораздо быстрее, проще и правильней послать в пять букв тех, кто не
> желает использовать Subversion.В винду?
> В винду?Ну, не настолько далеко, но в том направлении, да. :)
С помощью сабжа можно перепрошить диск, чтобы на бэды не ругался?
Нет, более того - вы хотите странного.
> перепрошить диск, чтобы на бэды не ругалсяПродать свой хлам надумал?
> С помощью сабжа можно перепрошить диск, чтобы на бэды не ругался?Можно, шей.
Всегда первым делом сносим модные фирменные утилиты производителей и чекаем диски с SMT - результаты в 90% случаев намного точнее отображают реальное состояние диска, хотя по логике должно быть наоборот. Но годы опыта не дадут соврать.
Утилиты производителей нередко существуют тупо просто потому что нужно. Это не значит что их кто-то реально поддерживает или вообще правильно сделал.
Например, недавно обраружили что самсунговский ssd magic когда ему говоришь сделать secure erase он вместо этого тупо нули на весь диск пишет (видно через strace)... Во как. А казалось бы Самсунг пытается выйти в номер 1...
Автоматический запуск short, long тестов по расписанию работает?
> Автоматический запуск short, long тестов по расписанию работает?это часть функционала smartd, и да, работает, чего бы ему не работать.
если бы работало то не спрашивал. В конфиге так /dev/sda -d sat -a -o on -S on -s (S/../.././23|L/../../6/23)
Служба запущена.
> если бы работало то не спрашивал. В конфиге так /dev/sda -d sat
> -a -o on -S on -s (S/../.././23|L/../../6/23)
> Служба запущена.Сделайте багрепорт со всеми логами на www.smartmontools.org. Я посмотрю. У меня на серверах тесты по расписанию работают, репорты шлются.
отличная программа!. снимает смарт с усб дисков и это очень удобно.
Samm, какую команду набрать, и какой должен быть вывод, чтобы понять, что диск пора менять? (debian linux.) в предположении, что диск дешёвый, и что хотим обезопасить себя по максимуму? и ещё два подвопроса: какой должен быть вывод, если диск пора менять, но данные точно не пострадали? и какой вывод, если данные могли пострадать, и верить им уже нельзя?
1. smartctl не заменяет бекапы, от слова совсем. Я бы начал с smatctl -H /dev/sda и smartctl -t long /dev/sda (и потом мониторим по -C и -l selftest)2. Пора менять если у нас начинаются pending sectors в случае HDD или Health падает меньше чем 20-30% в случае SSD.
3. Верить данным на диске вообще не стоит. В идеале - это файловая система или storage которыйх хранит checksum данных, например zfs.
4. Если selftest завершился с ошибкой - с очень большой вероятностью часть данных не получится считать, увы. В логах будут указан LBA ошибки, можно попытаться вычислить какой файл пострадал.
> чтобы понять, что диск пора менять?Юзай пока не сдохнет. Бэкапы важного - еженедельно.
> Юзай пока не сдохнет. Бэкапы важного - еженедельно.s/важного/неважного/
Obvious fix.
Важное давно защищается CDP.
>> Юзай пока не сдохнет. Бэкапы важного - еженедельно.
> s/важного/неважного/
> Obvious fix.
> Важное давно защищается CDP.CDP - Проект углеродной отчётности? Причём тут углерод?
>> Юзай пока не сдохнет. Бэкапы важного - еженедельно.
> s/важного/неважного/Для корпорастов есть RAID c HotSwap и Spare