Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count” Хостинг

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Samsung 750 EVO 120GB Retail Boxes

Background on Project Kenko 01

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Samsung 750 EVO 120GB Drives Front And Back

If you check the mentioned attribute

177 Wear Leveling Count

you will notice that the «Value» is 99. This describes the general health level of the SSD memory cells.
Samsung decided to drop from 100 to 99 very-very quickly. So on Samsung SSDs, this «Value» is 100 only for very short period — even after some hours of usage, this may decrease to 99.

This is why newer Hard Disk Sentinel versions displays 100% correctly in this situation (if there are no problems), until the SSD (really) experienced more usage. This depends on the time it used and the amount of written data.

Do you have the latest version of Hard Disk Sentinel (4.30)? If not, I’d recommend to update for that version as it may display 100% health.

In general, yes, the health constantly decreases for SSDs — which is completely normal.

Other models work the same way — but may provide a such generic health level differently. Other models (and the SSD controller used in them) may use further techniques (for example Sandforce SSD controllers compress data to reduce the amount of data actually written to the memory cells) — which may cause that the health level can be constant for longer time, even for months.

У меня износились в очередной раз SSD диски на одном из железных серверов. В связи с этим решил сделать заметку на эту тему, используя наглядный пример. С SSD дисками до сих пор куча вопросов в плане надежности и мониторинга износа. У каждого вендора SSD свои метрики в SMART, так что не мудрено и запутаться. Поделюсь той информацией, что есть у меня.

Если у вас есть желание научиться строить и поддерживать высокодоступные и надежные системы, рекомендую познакомиться с онлайн-курсом «DevOps практики и инструменты» в OTUS. Курс не для новичков, для поступления нужно пройти вступительный тест.

Заметка будет краткой с информацией только по существу. Для начала, как я мониторю диски. За основу взят шаблон для Zabbix — zbx-smartctl. У меня есть статья на тему мониторинга SMART в Zabbix. Но там используется другой шаблон, не такой функциональный. Да и в целом статья слегка устарела, но ее можно использовать для теоретической подготовки. За основу рекомендую сразу взять шаблон из первой ссылки.

Важное замечание. Из-за того, что у разных вендоров разные метрики, отвечающие за жизнеспособность SSD, слепо доверять приведенному шаблону нельзя. Он в целом хорошо работает на всех дисках, кроме метрики износа ssd. На каких-то дисках он вообще не работает. На каких-то параметр SSD wearout не уменьшается с 100 до 0, а наоборот растет с 0 до 100, соответственно, надо изменить триггеры.

В общем, шаблон нужно допиливать по месту и обязательно проверять вручную все метрики и триггеры. На одном из серверов, где все это проделано, у меня сработал триггер на SSD wearout. Я зашел в метрики диска и убедился, что диск реально изношен.

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Косвенный признак наработанных часов подтверждает, что диск реально старый и скорее всего подходит конец срока его службы. Для того, чтобы убедиться в этом, идем в консоль и глазами проверяем смарт ssd диска:

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Обращаю внимание на параметр Total_LBAs_Written. Для того, чтобы его правильно интерпретировать, нам надо узнать размер сектора диска, так как показывает он именно их число.

Теперь идем на TLB Calculator и смотрим количество перезаписей диска.

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Износ SSD диска подтверждается. Хотя по документам Samsung SSD 850 EVO 500GB способен записать 150TBW, рисковать мне не хочется. К тому же сервер арендуется и тех поддержка без проблем заменит изношенный диск. Главное, чтобы они поменяли тот диск.

После этой истории, если сервер критичный, я не делаю замену диска. Я прошу через тех. поддержку дать подменный сервер, чтобы переехать на него. Обычно идут на встречу. По крайней мере в Selectel. Дают бонусы, чтобы запустить новый сервер на день. После переноса пишу в тех поддержку и они переводят новый сервер на основной тариф, а старый выключают и забирают.

Такая процедура мне видится более прогнозируемой, надежной и быстрой, нежели замена диска. Я не знаю точно, как наливали систему на диск, какие настройки биоса. Загрузится ли система с новым чистым диском, есть ли на втором диске рабочий загрузчик и т.д. В общем, много подводных камней. Гораздо надежнее перенести виртуалки на новый сервер, пока у тебя старый еще работает.

У меня есть Samsung SSD на моем ноутбуке и на некоторых серверах.

Когда я делаю:

Я получаю результаты, которые не могу понять. Вот некоторые примеры:

# my laptop Samsung SSD 850 EVO 500GB (new)
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
177 Wear_Leveling_Count 0x0013 100 100 000 Pre-fail Always — 0

# server 256 GB, SAMSUNG MZ7TE256HMHP-00000
177 Wear_Leveling_Count 0x0013 095 095 000 Pre-fail Always — 95

# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (1 year old)
177 Wear_Leveling_Count 0x0013 099 099 000 Pre-fail Always — 99

# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (suppose to be new)
177 Wear_Leveling_Count 0x0013 099 099 000 Pre-fail Always — 99

# server 480 GB, SAMSUNG MZ7KM480HAHP-0E005
177 Wear_Leveling_Count 0x0013 099 099 005 Pre-fail Always — 3

# server 240 GB, SAMSUNG MZ7KM240HAGR-0E005
177 Wear_Leveling_Count 0x0013 099 099 005 Pre-fail Always — 11

Есть идеи как читать Wear_Leveling_Count?

Некоторые значения минимальны, некоторые максимальны.

Если рассмотреть «ноутбук» Samsung SSD 850 EVO 500GB, он равен 0 и, вероятно, перейдет на 100, а затем потерпит неудачу.

Если считать первый «сервер» 256 GB, SAMSUNG MZ7TE256HMHP-00000, то он уже на максимуме? Будет ли он падать до нуля?

Кингстон описал этот атрибут SMART следующим образом:

Количество циклов стирания / программирования на блок в среднем. Этот атрибут предназначен для показа неизбежного износа. Нормализованное уравнение: 100 — (100 * Среднее число стираний / NAND максимальное номинальное количество циклов стирания)

Raw DataВ этих случаях не обращайте внимания (производители могут манипулировать ими для работы по-разному) и посмотрите на Current Valueстолбец.

Этот источник от Anandtech дает нам хорошее представление о том, как использовать эту цифру:

Значение SMART Wear Leveling Count (WLC) дает нам все необходимые данные. Текущее значение обозначает оставшийся срок службы привода в процентах, что означает, что оно начинается с 100 и уменьшается линейно при записи в привод. Необработанное значение WLC подсчитывает израсходованные циклы P / E, поэтому, если эти два значения отслеживаются во время записи на накопитель, рано или поздно мы найдем место, где нормализованное значение падает на единицу.

Все ваши диски находятся между 95 и 100, и в конечном итоге упадет до 0. Это оценка того , сколько write, erase, и rewriteт.д. циклы , каждый блок может пройти , прежде чем удается, и на данный момент, один из ваших приводов оценивается в использовали 5% его текущего ожидаемого срока службы. Опять же, ключевое слово здесь оценивается.

Также обратите внимание, что ваши накопители могут использовать разные технологии NAND, отсюда и различия в восприятии жизни. Некоторые технологии NAND предполагают, что блоки будут работать около 1000 циклов PE каждый, другие могут быть оценены до 30 000.

SMART сообщает о состоянии PREFAILED для моего Samsung SM951 (AHCI) 128 ГБ, о котором сообщается в Linux как SAMSUNG MZHPV128HDGM-00000 (BXW2500Q).

Но в моем случае я думаю, что это ошибка прошивки привода,

  • потому что это total-bytes-writtenсвойство указано как 1,1 ТБ, в то время как накопитель имеет указанное общее записанное количество байтов (TBW) 75 ТБ! Что, вероятно, на стороне сохранения (очень), потому что аналогичные (MLC NAND) накопители достигли множества из этого (600 ТБ) в реальном тесте на выносливость ,
  • и кроме wear_level_countпредупреждения не сообщается о каких-либо других ошибках или предупреждениях, связанных с префайлом или устареванием,

Поэтому я бы посоветовал изучить эти значения для вашего диска / системы и основывать свои выводы на этом.

Я предпочитаю утилиту низкого уровня, skdumpкоторая поставляется вместе с libatasmartтой же библиотекой, что и Gnome Disks .

Используйте следующую команду, заменив /dev/sdcпуть к вашему блочному устройству:

sudo skdump /dev/sdc

The status of the solid state disk is PERFECT. Problematic or weak sectors were not found.
The health is determined by SSD specific S.M.A.R.T. attribute(s): #177 Wear Leveling Count

As displayed, no problems found (so the SSD works without problems,
tests should show no errors) but the mentioned attribute determines the overall health of the device.
On the S.M.A.R.T. page, it is possible to examine how the affected attribute may changed over time.

This generic health value is calculated by the SSD itself in a way defined by the manufacturer
(depending on number of program/erase cycles, amount of written data and so).
It is completely independent from Hard Disk Sentinel and any software, actual OS / Windows version, restart and so:
as the amount of written data increases, the health of the SSD should slowly and surely decreases.

Читайте также:  Конструктор сайтов (Юкит): отзывы, обзор, промокод, примеры сайтов

Depending on the manufacturer and model of the SSD, there are different attributes which can
determine the generic health of the SSD (usually only one of them present on the S.M.A.R.T. page):

  • #169 Remaining Life Percentage
  • #173 Media Wearout Indicator
  • #177 Wear Leveling Count
  • #202 Percentage Of The Rated Lifetime Used
  • #231 SSD Life Left
  • Percentage used endurance indicator (for SAS SSDs)
  • Available Spare Percent, Percentage Used (for NVMe M.2 SSDs)

The benefits of SSD health decrease

Even if sounds weird, the health decrease is not bad, exactly the opposite. The health decrease can
help us to

  • be prepared for a planned replacement when the health goes too low (for example below 50% or
    even earlier especially in a mission-critical environment).
  • try to minimise the amount of writes to extend the lifetime of the SSD.

Usually manufacturers define a Terabytes Written (TBW) value for SSDs, which is typically around
100-200 Terabytes (100000-200000 Gigabytes). If the health of the SSD decreases due to excessive amount of writes and the SSD fails,
the manufacturer may refuse replacement if the amount of written data is higher than this value. Refer
to the manual/specifications of your particular SSD about the actual TBW related to that model.

Recommendations

As health decrease caused by wearout can’t be fixed / repaired (as we can’t replace memory cells
of the SSD) we can only try to extend the lifetime by minimising the amount of data written to make
the degradation slower. Observe the Health % and the Lifetime writes value
(showing the total amount of data written) values on the Overview
page to be notified about the current status of the device.

Different SSDs may be affected differently — as some SSDs can show very frequent decrease of health,
the health can even go down every some days:

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

In some cases, a Windows (re)installation, major update may cause high amount of data written (eg.
10-30 GBytes written) and as a result, the health may go down immediately with a percent,
for example from 100 to 99%. This is normal
and there is no need to worry until the health is still high (above 50%).

Custom health threshold for the SSD

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Similarly, it is possible to specify custom temperature thresholds on the
Temperature page, in the upper right corner by the «Set custom temperature thresholds» link.
This may be important for some SSDs, especially NVMe M.2 SSDs which can work (and tolerate)
higher temperature ranges, for example 60-70 Celsius (or even higher) too.
Any device may have custom health / temperature thresholds, so it is possible to define
different, independent health / temperature thresholds even for all hard disks / SSDs in Hard Disk Sentinel.

Monitoring the status of all SSDs are very important to be notified about possible degradations, new problems
related to normal wearout caused by usage (writes) or even bad sectors which may affect SSDs
and hard disks too and cause unreadable files/folders, unbootable system, data corruption or data loss.

Все мы знаем, что твердотельные накопители имеют ограниченный заранее определенный срок службы. Как проверить в Linux текущее состояние SSD?

В большинстве результатов поиска Google запрашивается поиск информации SMART для процентного поля с именем Media_Wearout_Indicator или других индикаторов жаргона, таких как Longterm Data Endurance — которые не существуют — да, я проверил два твердотельных накопителя, в обоих из которых отсутствуют эти поля. Я мог бы продолжить, чтобы найти третий SSD, но я чувствую, что поля не стандартизированы.

Чтобы продемонстрировать проблему, вот два примера.

С первым SSD не ясно, какое поле указывает уровень износа. Однако есть только один Unknown_Attribute, значение RAW которого находится в диапазоне от 1 до 100, поэтому я могу только предположить, что это то, что мы ищем:

Таким образом, этот SSD использовал 57% своей продолжительности перезаписи, это правильно?

С другим диском SSD_Life_Left ATTRIBUTE выделяется, но его значение Raw, равное 0, указывающее на оставшийся срок службы 0%, маловероятно для очевидно здорового твердотельного накопителя, если только он не окажется в опасности (мы увидим через несколько дней), и если на нем написано «0% срока службы использовалось», это также невозможно для изношенного жесткого диска (изношен = используется более года).

В первом примере я думаю, что вы имеете в виду «Индикатор износа носителя» на дисках Intel, который является атрибутом 233. Да, он имеет диапазон от 0 до 100, где 100 — это совершенно новый, неиспользуемый диск, и 0 полностью изношен. По вашему мнению, это поле, кажется, не существует.

Во втором примере, пожалуйста, прочитайте официальные документы о SSD_Life_Left. На этой странице:

Очень важно, чтобы вы полностью понимали, что говорит smartctl (8), а не делали предположений. К сожалению, инструменты SMART не всегда в курсе последних SSD и их атрибутов. Таким образом, не всегда можно точно определить, сколько раз чипы были записаны. Лучшее, что вы можете сделать, это посмотреть на «Power_On_Hours», который в вашем случае равен «6568», определить среднюю загрузку диска и усреднить ее.

Вы должны быть в состоянии найти спецификации вашего накопителя и определить процесс изготовления чипов. Процессорные микросхемы 32 нм будут иметь более длительную стойкость при записи, чем технологические микросхемы 24 нм. Тем не менее, кажется, что «в среднем» можно ожидать от 3000 до 4000 записей, при этом как минимум 1000 и максимум 6000. Таким образом, если у вас SSD на 64 ГБ, то вы должны ожидать, что где-то около 192 ТБ до 256 ТБ будет записано на SSD, при условии выравнивания износа.

Например, если вы используете, скажем, 11 Кбит / с на вашем диске, вы можете ожидать около 40 МБ в час. При 6568 включенных часах вы записали примерно 260 ГБ на диск. Зная, что вы можете выдержать около 200 ТБ от общего количества операций записи, до сбоя у вас будет около 600 лет до сбоя из-за износа чипов. Ваш диск может выйти из строя из-за изношенных конденсаторов или регулирования напряжения.

Если у вас нет SSD от Intel: будьте осторожны! У меня есть Samsung SSD, и я был полностью введен в заблуждение ошибочной маркировкой атрибутов в smartmontools / smartctl. Если у вас есть что-то кроме Intel — моя история о (бессмысленной) боли может оказаться полезной на /ubuntu//a/460463/65722 .

Пусть ваше соотношение качества информации и затраченного времени будет лучше моего!

у меня есть сервер с рейд-картой LSI , у меня установлено 7 твердотельных накопителей Samsung.

Это так, что

  • / dev / sda — это SSD моей операционной системы, помеченный как Raid Controller как JBOD.
  • Другие 7 SSD отображаются только как / dev / sdb, потому что они RAID 0 (или RAID-?).

чтобы получить информацию о дисках за контроллером рейда хитрость заключается в

затем получить информацию о Smartctl, такую ​​как

  • WEAR_LEVELING_COUNT
  • POWER_ON_HOURS
  • TEMPERATURE_CELCIUS и все другие хорошие вещи

для каждого диска сделать

это то, как вы подключаетесь к карте raid, когда несколько дисков не отображаются в виде нескольких устройств, таких как / dev / sdb, / dev / sdc, / dev / sdd и т. д.

Все мы знаем, что твердотельные накопители имеют ограниченный заранее определенный срок службы. Поэтому вопрос для меня заключается в том, как я могу проверить (Ubuntu) Linux, каково текущее состояние моего SSD? А может быть, оценка, сколько времени это займет?

Графический инструмент предпочтительнее, но инструмент командной строки тоже подойдет.

Я использую Xubuntu 12.04 LTS

Установите Gnome Disk Utility и проверьте SMART Data and Tests на наличие уровней выравнивания износа или аналогичных. Чем выше это значение (%, от 1 до 100), тем больше «израсходовано» ваш SSD, что означает, что у вас, скорее всего, будут проблемы. Но если у вас недавно установлен SSD, вам не нужно об этом беспокоиться.

sudo apt-get install gnome-disk-utility

или через командную строку

проверить работоспособность SSD

Для дистрибутивов на основе Ubuntu, Mint или Debian

# apt-get install smartmontools

Media_Wearout_Indicator — это то, что вы ищете. Если 100 означает, что ваш ssd имеет 100% жизни, то меньшее число означает, что осталось меньше жизни.

Чтобы показать вашу SDD информацию

# smartctl -a /dev/sda

Вы можете прочитать полную статью в блоге Nam Huy Linux — Как проверить жизнь SSD в Linux

Если у вас нет SSD от Intel: ПРОЧИТАЙТЕ ЭТО.

Осторожно !! — Я был беспечно введен в заблуждение «smartmontools». У меня есть Samsung SSD, и инструмент smartmonitor / ‘smartctl’, к счастью, неверно сообщил, что атрибут ‘ 233’ (шестнадцатеричный ‘E9’) был ‘Media_Wearout_Indicator’; на самом деле — нет, для Samsung (и других производителей) дело обстоит иначе. Эта и другие публикации на форуме, вопросы / ответы по обмену стека и блоги опытных пользователей, которые я нашел, похоже, «сфокусированы на Intel», с лишь смутными намеками на то, что «это может измениться». (В отличие от любого предложения, что вам нужно остерегаться неправильной и ошибочной маркировки атрибута smartmontools).

Читайте также:  Приложение Mikrotik для настройки Mikrotik. (

Когда я готовился скопировать мой SSD на новый жесткий диск, который я купил (из-за того, что мне сказали smartmontools), я загрузился в windows (у меня есть система двойной загрузки), чтобы узнать кое-что о SSD из того, что доступно только для windows Инструмент Samsung ‘Samsung_Magician_v43.exe’ должен был рассказать мне о моем диске — он был шокирующе неинформативным.

После нескольких часов копания — я наконец-то смог запустить инструменты только для окон: hddgaurdian — ‘code.google.com/p/hddguardian’, а затем еще CrystalDiskInfo: Surprise! оба инструмента независимо говорят мне, что мой Samsung SSD «в порядке» (hdd guardian говорит «5 звезд» и Crystal Disk «98% OK»). В отличие от этого, инструмент smartctl явно обозначил атрибут как «десятичный-233 /« hex-E9 »как« Индикатор износа носителя »- и сказал мне, что его значение было« 1 »или 1% — показатель (риск) в ожидании сбоя. Чтобы быть настолько уверенным, насколько я могу, я вырыл и выкопал и, наконец, смог найти по крайней мере что-то от официального представителя Samsung: » http://www.samsung.com/global/business/semiconductor/minisite/SSD/us/download/ 07_Communicating_With_Your_SSD.pdf«В документе действительно подразумевается, что атрибут« hex E9 »/« decimal »233» не используется Samsung одинаково. (Samsung: Я очень разочарован, пожалуйста, исправьте ваш официальный программный инструмент или хотя бы сделайте это ясно, что вы не предоставляете информацию об износе!)

Кроме того, если у вас нет ни твердотельного накопителя Intel, ни накопителя Samsung, будьте осторожны, эта информация, похоже, различается у разных производителей. (например, см. таблицу меток атрибутов на code.google.com/p/hddguardian/wiki/about_reliability для единственного полезного указания степени изменчивости, которую я обнаружил.)

Так , что: Если у вас нет Intel SSD— ничего не вводить в заблуждение ложных имен меток атрибутов , предоставленных SmartMonitor. Возможно, это улучшится в будущем, но версия, установленная по умолчанию для Ubuntu 12.04 LTS (апрель 2014 г.), полностью провалилась. Вместо того, чтобы сказать вам, что он «не знает» — smartctl просто неправильно назвал атрибут. Я не нашел другого инструмента для Linux, который бы делал «правильную» информацию прозрачной или ясной.

Для дисков Kingston на компьютерах на основе Debian

Аналогично этому ответу выполнить

Однако, когда я выполняю команду, чтобы показать информацию о диске, похоже, что SMART был отключен:

Вы должны включить это, выполнив следующее от имени пользователя root:

# smartctl -s on -a /dev/sda

Затем вы можете выполнить самопроверку, выполнив короткий тест (который занял у меня около 1 минуты):

# smartctl -t short -a /dev/sda

или более тщательный тест (который занял у меня около 1,5 часов):

# smartctl -t long -a /dev/sda

Обратите внимание, что в большинстве случаев вам не нужно размонтировать диск для выполнения этих тестов. Если вы делаете, видите man smartctl.

Теперь при выполнении smartctl -a /dev/sdaвы должны увидеть результат теста самооценки. Это, вероятно, все, что вам действительно нужно беспокоиться:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Если вам нравятся подробности, вы также увидите следующую таблицу:

Если вы ищете, что означают все эти значения, обратитесь к документации Kingston .

Wear_Leveling_Count — это правильный атрибут для отслеживания. Однако, как и другие атрибуты, 100 является лучшим значением, а 0 — худшим. Думайте об этом как о «проценте оставшейся жизни».

Лучший способ проверить работоспособность SSD — это следовать рекомендациям производителя. Поскольку они варьируются от производителя к производителю и могут меняться со временем, рекомендуется проконсультироваться с производителем накопителей, если у вас есть проблемы. Основываясь на показателях MTBF (стандарт JEDEC JESD218A определяет метод), предоставленных большинством производителей, SSD должен без проблем работать более миллиона часов.

У меня есть несколько таких, охватывающих несколько производителей. Я могу гарантировать, что атрибуты SMART различаются у разных производителей. Для сравнения приведу пример из OCZ и интеллектуальные данные от устройства Corsair F40 вместе с обсуждением того, насколько ненадежными являются эти данные.

Хотя данные SMART, безусловно, могут иметь значение, поскольку в конечном итоге все устройства выходят из строя, важно регулярно выполнять резервное копирование данных. Это обеспечивает спокойствие, что ваши данные в безопасности, пока вы ждете (вероятно, в течение нескольких лет), чтобы ваш SSD вышел из строя. По мере снижения затрат и увеличения емкости, скорее всего, вы замените SSD из-за недостатка места, а не из-за отказа. (По моему опыту в 10 раз больше вероятности). Я бы просто регулярно делал резервные копии и не беспокоился об этом.

Опыт работы, http://www.hardcoreware.net/mtbf-ssd-what-does-it-mean-for-you/

Для (хотя бы некоторых) накопителей NVMe вы можете сделать

smartctl -a /dev/nvme0

Затем вы можете найти строку вроде:

Здесь более низкие числа лучше и 100%означают, что диск «изношен». Документация производителя предполагает, что можно получить числа выше 100%, если вы продолжите использовать накопитель после этой точки ( пример от Seagate, см. Стр. 12 ).

Обратите внимание, что если вы используете пространство имен или устройства разделения, например /dev/nvme0n1или /dev/nvme0n1p1, это не будет работать, и вместо этого вы получите сообщение типа Read NVMe SMART/Health Information failed: NVMe Status 0x4002.

Analyse data field

  • It should reflect the actual status. Should not depend on time or past values. Determine the result without using long time analysing or testing methods.
  • It should not increase with time — do not show the health status better after some time (except if some pending sectors were successfully tested and they can be used because they have no problems).
  • It should reflect small changes and degradations. Constantly increasing number of problems should constantly decrease the result.
  • It should count the relationship between attributes. More different problems should decrease the result much drastically than only one single problematic attribute.
  • The result should be same for two (or more) hard disks with the same problems, even if the hard disks are from different models, manufacturers.

The hard disk has 100% condition initially. All critical health-rated S.M.A.R.T. parameters (if they are available, it depends on the manufacturer) decrease this value. These attributes have a pre defined weight and a maximum limit value (the latter defines the maximum degradation in health value for the attribute). The overall health percent value is calculated by multiplying the remaining percent values (100 — degradation %).

Currently, Hard Disk Sentinel has two different such methods. By using the default method, the weights and limits (see below) are lighter. If the more strict, recommended for servers option is used the values are much more strict, the problems may reduce the health much drastically.

Weights and limits for the default calcuation method:

Weights and limits for the more strict calculation method:

The numbers are determined by examining the arrived reports and the S.M.A.R.T. status of (unusable) hard disks received for data recovery.

Note: the Data column contains hexadecimal values. These should be converted to decimal before calculation. The lower 16 bits (righmost 4 digits) are used in the calculation method.

For example: using the default calculation method. If the «Reallocated sectors count» attribute has 0002 in the «Data» column, the health value = 100 x ( 100 — 2×1 ) % = 98 %

If the «Current pending sectors count» attribute has 0005 in the «Data» column also on the same hard disk, the health is = 98 x ( 100 — 5×0.6) % = 95 %. The more strict calculation method gives 100 x (100 — 2×6) % x (100 — 5×4) % = 70 % as the resulting health value.

The limit % defines how much % can the attribute decrease the overall health value. For example, if the «Off line uncorrectable sectors» attribute contains 0200 in the «Data» column (which is 512 if converted to decimal value), the heatlh should fall by 512 x 1 = 512 %, but the limit for this attribute is only 70 %. With other words, if the value of the «Off line uncorrectable sectors» is high, the health value of the disk cannot be larger than 30 %. Other problems may decrease the health value more.

Hard Disk Sentinel Help — Health calculation

It is possible to select many different health (condition) calculation methods at the advanced options. The differences between these evaluation methods:

Онлайн курcы по Mikrotik

Если у вас есть желание научиться работать с роутерами микротик и стать специалистом в этой области, рекомендую пройти курcы по программе, основанной на информации из официального курcа MikroTik Certified Network Associate. Помимо официальной программы, в курcах будут лабораторные работы, в которых вы на практике сможете проверить и закрепить полученные знания. Все подробности на сайте Курcы по ИТ.

Стоимость обучения весьма демократична, хорошая возможность получить новые знания в актуальной на сегодняшний день предметной области. Особенности курcов:

  • Знания, ориентированные на практику;
  • Реальные ситуации и задачи;
  • Лучшее из международных программ.

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”.

The drive is still under warranty so I decide to ask Samsung support about their unusual #177 numbers. Sounds easy enough right? You won’t believe the brick wall that I ran into on this.

Читайте также:  Упрощение отправки: никаких фатальных беспокойств с нашим надежным пунктом назначения

Today is 12/5. It’s been two days and it’s become obvious to me Samsung is not going to answer this question. Since Samsung decided to ignore what I consider a legitimate professional request, I’ve made that decision for them and decided to go public with this stonewalling.

It’s my opinion that if the IT community cannot ascertain the health of an SSD using standard industry tools and industry standard attributes, then we shouldn’t buy their products. I’m very concerned that Samsung would choose to shroud the Attribute 177 in some kind of secrecy. It’s like they don’t want us to know the exact health of their storage devices. What are they hiding?

I look forward to your comments, corrections, suggestions and directly related discussions.

There is no official standard for SMART attributes. Each vendor is free to use their own format for SMART attributes, and in fact they do. Moreover, the SMART attribute definitions often vary between different models from the same vendor, and even between different firmware for the same model.

So to answer your question, attribute #177 may be a wear levelling count for one SSD, but may mean something completely different for other SSDs.

Thank you for your reply : )

Yes, I agree that manufacturer’s frequently use their own yardsticks when displaying their SMART data. Imho that is unfortunate as I and other IT persons feel that standardized values are much better for the hardware involved community. Manufacturers should support the standardization so we can compare apples to apples.

With regard to Samsung and the EVO SSD being discussed, I really don’t care if they use icons of penguins to report #177 values. I just want to know what numerical value those penquins represent in terms percent of wear leveling. For example, do 13 penguins mean 13% worn? I don’t think this is too much to ask of Samsung. Would you not agree?

Please, other forum members (and even Samsung) feel free to jump in here!

Regards . . .

I agree that all vendors should provide detailed specifications for their SMART attributes.

I would also like to see circuit diagrams, technical reference manuals, real diagnostic software, and data recovery software at the firmware level. I had access to this sort of stuff 30 years ago, but nowadays we get little more than marketing pap.

Better late than never they say:

Unless I’m incorrect, I just found out that the Attribute “Wear Leveling Count” is now shown as a Statistic called «Percentage Used Endurance Indicator» and/or «Percentage Used Endurance Indicator». If interested see:
Interpreting SSD Wearout Indicators for CloudGen Firewall Hardware Models.

And . . . I do see «Percentage Used Endurance Indicator» on the 860 EVO 250GB (Model MZ-76E250).

Hope that (is correct) and helps : )

Similar threads

Memory cells in solid state devices (generally flash storage) can tolerate only limited number of overwrite passes, so experience «wear» during normal use.

The «wear-leveling» feature of the SSD tries to hide/minimise this effect
but generally it can’t be eliminated. Usually the SSD device maintains an overall health of the memory cells
and provides this information by various attributes.

If no problems found, Hard Disk Sentinel reads such
attribute(s) to determine the complete health of the solid state device and displays in the text description: The health is determined by SSD specific S.M.A.R.T. attribute(s):

Such attributes can be #177 Wear Leveling Count, #231 SSD Life Left, #233 Media Wearout Indicator, Percentage Used, Remaining Drive Life or similar. On the S.M.A.R.T. page, it is possible to examine the current value and also change with time.

Such values (and thus the health) is calculated by the SSD, independently from any software, based
on the actual usage: amount of written data, power on time and so. To keep the health high, try to minimise the amount of data written to your SSD.

SMART Attribute 177 Wear Leveling Count on Samsung SSDs

Samsung provides a nifty PDF with their SMART attributes and their meanings. SMART Attribute 177 is “Wear Leveling Count” and Hard Disk Sentinel Pro correctly reports this.

By way of recap, here were the Wear Leveling Count indicators at 2.09TBW on both drives.

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Project Kenko 01 2TBW SMART Wear Leveling Count Indicator

You can see that the 0GB Pre-Fill drive was starting to show higher wear leveling count indicators than the 90GB Pre-Fill drive.

Moving onto the same snapshot at 4TBW we see that pattern amplified.

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Project Kenko 01 4TBW SMART Wear Leveling Count Indicator

That was a completely unexpected result as of our last update at 4TB, here is where we thought we were heading in terms of a zero point for the wear level indicator:

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Project Kenko 01 4TBW Estimated Wear Leveling Count 0 Point

Despite the trajectory each drive was on, the 0GB Pre-Fill drive hung around in the low single digits for some time then hit a paltry “1” value in the Wear Leveling Count attribute. Even getting to 10TB did not flip this 1 to a 0. Unlike what we saw from 0-4TBW, the drives were much closer together regarding final TBW when the indicator hit 1.

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Project Kenko 01 TBW When SMART 177 At 1

This result did align with what we had been seeing at the 4TB and 8TB checkpoints. Looking at the raw data which “shows the total count of P/E Cycles.” One on the indicator is about 500 P/E cycles on the NAND. The 90GB Pre-Fill hit 1 for this figure at 495 on the raw value.

Question Samsung EVO uses Secret Non-Industry Standard for “Wear Leveling Count”

Project Kenko 01 Drives At 8TBW

Here is the interesting part, as we pushed the drives past 500 on the P/E cycle indicators over 600, or 20% further than when we hit 1%, and the indicator was still at 1% on both drives. The 1% did not flip even at 10 TBW.

Analyse vendor specific values

If this option is selected, the health-related S.M.A.R.T. attributes are evaluated. All such attributes will have a small condition value calculated between 0 and 100% based on the actual value, the threshold and the theoretical maximum value (the latter is determined by Hard Disk Sentinel based on the manufacturer and model). Multiplying these values will give the overall health of the hard disk condition.

For example: the threshold for the «Reallocated sectors count» is 36, the value is 84 and the initial value for this attribute was 100. The condition value for this attribute is: (1 — (100-84)/(100-36)) x 100 = 75 %. If (on the same hard disk) the threshold for the «Seek error rate» is 30, the value is 60, and the initial value is 90, the condition of this attribute is 50 % and the overall health of the hard disk is 37.5 %.

Note: 1.40 and previous versions of Hard Disk Sentinel had only more strict, recommended for servers calculation method. Upgrading from 1.40 or older version may result in a different health value display. On the advanced options page it is possible to modify the calculation method any time.

Note: the selected calculation method is saved into the reports to prevent confusion.

By using the «more strict» method, the health value decreases drastically in case of any small problem, so the use of this method is recommended only when no (even small) problem is allowed.

Final Words for this Update

Our next installment will feature when the drives failed, and how we saw them fail. It was extremely slow going as write speeds dipped to sub 14MB/s. Our big takeaway from this is that with either case, either using a drive with no data or using a drive with 90GB of static data, the wear level indicator hits 1% well before 35TBW on the drives. Since neither drive showed reallocated sectors even at 9TBW (a bit of foreshadowing here), it is hard to recommend using SMART monitoring tools and the SMART attribute for Wear Leveling Count on the Samsung 750 EVO SSDs. On the other hand, if you were an unscrupulous SMB or home IT person looking to replace desktop SSDs at a faster rate than they would need to be replaced, the Samsung 750 EVO’s Wear Leveling Count is an excellent attribute to point to show there is a “problem.”

More to come. In the meantime, we are not recommending Samsung SSD 750 EVO 120TB drives as even read caching drives. For basic desktop OS use they are fine. There is a trend toward using consumer drives as storage caching devices (e.g. L2ARC with ZFS) that do not need to feature write power loss protection. We are not recommending you try this with the Samsung 750 EVO.

Оцените статью
Хостинги