Среднее время выхода из строя (MTTF): когда производители дисков публикуют это сообщение, как следует интерпретировать их номера?

Среднее время до отказа (MTTF) обычно дается в терминах часов, и, выполняя некоторые вычисления, кажется, что диск должен потерпеть неудачу только после того, как прошло много лет.

Кажется, что диски нуждаются в ремонте чаще всего. Кто-нибудь знает, почему это так?

  • Firefox, который отслеживает время загрузки веб-страницы, включая время восстановления DNS?
  • Я понял, что в этом метрике есть что-то подозрительное. Я интерпретирую здесь что-то не так?

  • Firefox, который отслеживает время загрузки веб-страницы, включая время восстановления DNS?
  • 4 Solutions collect form web for “Среднее время выхода из строя (MTTF): когда производители дисков публикуют это сообщение, как следует интерпретировать их номера?”

    Прежде всего:

    MTTF = среднее время до отказа
    MTTR = Среднее время ремонта
    MTBF = среднее время между отказами = MTTF + MTTR

    MTBF часто более или менее равен MTTF, так как ремонт может занять час, а MTTF может составлять десятки тысяч часов. Но также MTBF часто неприменим, так как дефектные продукты не ремонтируются, а просто заменяются, потому что ремонт стоит больше, чем замена.

    Расчет MTTF представляет собой сложный статистический метод, включающий вычисление вероятности отказа каждой отдельной части. И это не линейная вещь, как иногда допускают люди. Если у вас есть MTTF 1000 000 часов, что не означает, что в 1000 устройствах произойдет один отказ после 1000 часов или что вы получите отказ в 1000 000 устройств через 1 час.
    Многие электронные устройства следуют «кривой ванны» ,

    Введите описание изображения здесь

    Где есть много неудач на раннем этапе, а затем долгое время с едва ли неудачами, и в конце жизни число сбоев снова возрастает. На жестких дисках есть также некоторые механические части, которые имеют более линейную кривую отказа; Это медленно растет с 1-го дня.

    Если производитель говорит, например, 1000 000 часов MTTF (это чаще всего POH или Power-On Hours), это означает, что в среднем диск должен длиться> 100 лет. Некоторые диски продлятся дольше, некоторые из них не будут работать раньше. Поэтому, несмотря на 1000 000 часов, вполне возможно, что после 1000 часов произойдет сбой. У меня когда-то был провал двигателя в течение недели, и тогда вам нужно подумать о кривой ванны. Запасной диск хорошо вращался в течение 50 000 часов.

    Если у части оборудования есть MTBF, использующий 1,000,000 часов, это не означает, что какое-либо оборудование может длиться 1 000 000 часов. Напротив, это означает, что примерно 1 000 000 единиц оборудования, которые находятся в пределах их номинального срока службы, работают в течение одного часа, или 100 000 штук работают в течение десяти часов (но все еще в течение расчетного срока службы) или 60 000 000 в течение одной минуты и т. Д. В лоте будет примерно один провал. Обратите внимание, что номинальный срок службы службы полностью ортогонален MTBF. Рассмотрим следующие два типа виджетов:

    1. Каждый виджет, независимо от возраста, имеет 0,1% шанс провалиться каждый час.
    2. Из каждого миллиарда виджетов все, кроме одного, будут действовать ровно 61 минуту, а затем умрут; Что один умрет через 30 минут; Виджеты имеют заданный срок службы 60 минут.

    Первый вид виджета будет иметь средний срок службы около 1000 часов, а также MTBF около 1000 часов. Второй будет иметь средний срок службы 61 минуту, но MTBF составляет 1 000 000 000 часов в течение срока его службы. Хотя может показаться странным сказать, что второе устройство имеет MTBF, что почти в миллиард раз больше ожидаемого срока службы, MTBF вряд ли является бессмысленной фигурой.

    Предположим, что кто-то собирается провести эксперимент, который требует, чтобы 1 000 000 устройств работали отлично в течение часа, после чего все они будут утилизированы. Если какое-либо устройство выходит из строя, весь эксперимент будет разрушен. Что было бы более полезно – устройство, которое прослужит в среднем 1000 часов, но имеет MTBF всего 1000 часов, или устройство, которое продлится не более 61 минуты, но будет иметь только один из миллиардов шансов на неудачу Встретить эту отметку?

    Добавляя к ответу Стивенва: Известные производители дисков все делают ожог новых устройств, как и производители электронных компонентов. На жестких дисках существует не только общий MTBF и MTTF, но и индивидуальная статистика сбоев для блоков дисков. Другими словами: некоторые части вращающегося диска «диск» на диске могут потерпеть неудачу, а большинство все еще читает / пишет нормально. Так называемые «плохие сектора» могут быть обнаружены, а затем отображены прошивкой внутри накопителя.

    Все диски сегодня содержат дополнительные секторы в резерве, которые затем могут использоваться вместо секторов дефектов. Это просто предостережение производителя: если они этого не сделают, они не смогут продать диск в объявленной емкости. Если они создают дополнительный x% скрытых секторов в качестве резерва, они увеличивают стоимость на некоторые <x%, но достигают гораздо более высокой общей производительности.

    На дисках сегодня хранится количество поврежденных секторов, которые также можно считывать с помощью соответствующего программного обеспечения. Этот и другие параметры здоровья диска (например, температура) называются значениями SMART .

    Теперь, как только производитель выполнил тест на сжигание диска, а некоторые из секторов имеют почти сбой и были переназначены внутренней прошивкой накопителя, параметр SMART «Плохой сектор» SMART установлен на 0. Затем Привод доставляется клиентам.

    Как правило, после процесса ожога клиренс уже не рассматривается в начале кривой ванны, о которой уже упоминалось. Нам повезло, и мы видим только увеличение вероятности неудач с течением времени.

    Поэтому, если вы посмотрите на MTTF, который цитируется производителем, для любого неудачного моделирования, которое вы, возможно, захотите сделать, вы можете игнорировать начало кривой ванны.

    Вы должны интерпретировать это как маркетинг. На самом деле они не знают точного MTBF (среднее время между отказами), поэтому для их оценки используются различные трюки, и они показывают более высокие цифры для дисков предприятия, чтобы оправдать их стоимость.

    В действительности для производителей жестких дисков владельцам жестких дисков приходится отказываться сразу после окончания гарантии.

    Как теория заговора, я считаю, что массовая неудача Seagate 7200.11 была ошибкой в ​​реализации «запрограммированной смерти», вызвавшей отказ дисков до того, как гарантия закончилась, поэтому им пришлось «исправить» обновление прошивки.

    Давайте будем гением компьютера.