The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 дней работы, opennews (??), 03-Июн-23, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


28. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +1 +/
Сообщение от Kuromi (ok), 03-Июн-23, 19:49 
"Исправление ошибки публиковать не планируется. Проблема долгое время оставалась не замеченной так как многолетние uptime не типичны для серверов, которые для поддержания в актуальном состоянии периодически приходится перезапускать для установки обновлений ядра или для перехода на новый выпуск операционной системы."

С одной стороны это логично, с другой стороны сразу становится понятно почему условнае NASA использует совсем другое железо и другого качества. Представьте себе космический зонд зависший через 3 года. Вояджер сколько уже там летит, 50 лет?

Ответить | Правка | Наверх | Cообщить модератору

30. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +11 +/
Сообщение от Аноним (31), 03-Июн-23, 20:03 
7 бед один ресет. У вояджера на этот случай два процессора. Даже если процессор с багом они попеременно могут работать. Сложные системы проектируют с расчетом что в проце точно есть баг, возможно из-за старения, но никто не знает какой.
Ответить | Правка | Наверх | Cообщить модератору

32. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  –1 +/
Сообщение от Kuromi (ok), 03-Июн-23, 20:13 
> 7 бед один ресет. У вояджера на этот случай два процессора. Даже
> если процессор с багом они попеременно могут работать. Сложные системы проектируют
> с расчетом что в проце точно есть баг, возможно из-за старения,
> но никто не знает какой.

И тем не менее были случаи когда не помогало. Из относительно недавнего вспоминается наш спутник который вышел на орбиту, но так и не смог заработать и сгорел впоследствии.
Да и не только у нас такое было.

Ответить | Правка | Наверх | Cообщить модератору

109. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +2 +/
Сообщение от Аноним (107), 04-Июн-23, 04:58 
ваш это чей? куроми не гуглится
Ответить | Правка | Наверх | Cообщить модератору

33. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +4 +/
Сообщение от Аноним (33), 03-Июн-23, 20:14 
И все процессоры одновременно зависнут... Резервирование - это защита от высокоэнергетичных частиц, а не от программных и аппаратных багов.
Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору

44. Скрыто модератором  +/
Сообщение от Аноним (-), 03-Июн-23, 20:59 
Ответить | Правка | Наверх | Cообщить модератору

48. Скрыто модератором  +/
Сообщение от Аноним (48), 03-Июн-23, 21:21 
Ответить | Правка | Наверх | Cообщить модератору

87. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +2 +/
Сообщение от Аноним (87), 04-Июн-23, 00:51 
Ерунда. И от программных, и от аппаратных багов вполне себе резервирование защищает.
Ответить | Правка | К родителю #33 | Наверх | Cообщить модератору

191. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +/
Сообщение от Tron is Whistling (?), 04-Июн-23, 20:43 
На этот случай там есть watchdog. Ребутнётся, и порядок.
В таких аппаратах вероятность нештатной работы процессоров однозначно учитывается.
Ответить | Правка | К родителю #33 | Наверх | Cообщить модератору

85. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +1 +/
Сообщение от Аноним (87), 04-Июн-23, 00:28 
Шесть процессоров. Не два а шесть. Трех разных типов.
Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору

215. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +/
Сообщение от Neon (??), 05-Июн-23, 04:45 
А как определить, кто из пары глючит ? Нужен еще третий. А кто контролирует контролера ?
Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору

228. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +/
Сообщение от Аноним (-), 05-Июн-23, 20:43 
> А как определить, кто из пары глючит ? Нужен еще третий.

Даже это частично решаемо, скажем тестовыми контрольными точками с заранее известными результатами. Не панацея но глючную систему отловить можно.

> А кто контролирует контролера ?

Это может быть хардварная логика вообще, в которой ломаться не так уж много чему и есть. Впрочем, даже с софтом проверки можно закольцевать и системы будут проверять друг друга. Если есть несколько полных закольцованых веток, при обнаружении в 1 из них таких вещей уповать на другие, пока эта например полностью перезагружается, возможно даже целиком, по питанию, и если оно еще способно работать - оно подхватит после восстановления состояния. А если померла так померла, что уж делать, система продолжит работу с меньшим запасом надежности.

Ответить | Правка | Наверх | Cообщить модератору

52. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +1 +/
Сообщение от username (??), 03-Июн-23, 21:42 
Ну, сервер это не вояджер. Мало того, что иногда приходится перезагружать, скажем, для обновлений, так еще и энергосбережение чаще всего отключают в первую очередь
Ответить | Правка | К родителю #28 | Наверх | Cообщить модератору

58. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +/
Сообщение от www2 (??), 03-Июн-23, 21:57 
Перезагружать лучше по плану, когда минимум ущерба будет, а не среди бела дня из-за перепрлнения какого-то счётчика в процессоре. На работе достался в наследство сервер, который 9 лет не перезагружали. Пришёл я и всю малину обгадил - начал всякие обновления ставить :D
Ответить | Правка | Наверх | Cообщить модератору

74. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  –1 +/
Сообщение от Аноним (74), 03-Июн-23, 22:44 
Зачем? До тебя этот сервер никому не был нужен, уже и уязвимости, к нему применимые, все забыли, а теперь точно сломают...
Ответить | Правка | Наверх | Cообщить модератору

192. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +/
Сообщение от Tron is Whistling (?), 04-Июн-23, 20:44 
На аптаймодрочерство давно можно забить, кластеры решают.
Ответить | Правка | К родителю #58 | Наверх | Cообщить модератору

227. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +/
Сообщение от Аноним (227), 05-Июн-23, 20:37 
> Перезагружать лучше по плану, когда минимум ущерба будет, а не среди бела
> дня из-за перепрлнения какого-то счётчика в процессоре.

Обычно так и получается - большую часть серверов апдейтят чаще чем раз в 2 года. Так что ограниечние забавное но реального вреда от него не так уж много.

Ответить | Правка | К родителю #58 | Наверх | Cообщить модератору

129. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  –1 +/
Сообщение от Бывалый смузихлёб (?), 04-Июн-23, 09:06 
Под космос совсем другие и требования и технологии. Хотя посмотришь сейчас на такой проц или память - даже до бюджетного смартфона как до луны, а стОит - как вся китайская провинция, делающая те смартфоны

По процам иногда в забугорной военщине забавней бывает. Порой разработка какого-то комплекса настолько растягивается, а на что-то новое настолько лень переделывать, что проще затолкать целые шкафы старых процов.
Например, у новейшей версии американского Пэтриота стоит несколько ящиков Intel Paragon i860 по производительности примерно уровня Эльбурс-2

Ответить | Правка | К родителю #28 | Наверх | Cообщить модератору

133. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  –1 +/
Сообщение от Аноним (115), 04-Июн-23, 09:49 
> Под космос совсем другие и требования и технологии.

Когда как. Масковский корабль летает на обычном x86. Или вон вертолетик на марсе из ширпотреба деланый. Там же резервирование да и дополнительные проверки и мк на исполниловку.
> Например, у новейшей версии американского Пэтриота стоит несколько ящиков
> Intel Paragon i860 по производительности примерно уровня Эльбурс-2

Думается у них электричества немеряно, производительность у встраиваемой техники - "достаточная", т.е. либо решает свои задачи в реальном времени, либо нет, апгрейдить смысла мало. А радикально перепахивать древний проект... оно точно надо, если он работает и запас комплектухи есть?

Ответить | Правка | Наверх | Cообщить модератору

169. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +/
Сообщение от Kuromi (ok), 04-Июн-23, 19:12 
>> Под космос совсем другие и требования и технологии.
> Когда как. Масковский корабль летает на обычном x86. Или вон вертолетик на
> марсе из ширпотреба деланый. Там же резервирование да и дополнительные проверки
> и мк на исполниловку.
>> Например, у новейшей версии американского Пэтриота стоит несколько ящиков
>> Intel Paragon i860 по производительности примерно уровня Эльбурс-2
> Думается у них электричества немеряно, производительность у встраиваемой техники - "достаточная",
> т.е. либо решает свои задачи в реальном времени, либо нет, апгрейдить
> смысла мало. А радикально перепахивать древний проект... оно точно надо, если
> он работает и запас комплектухи есть?

Ну, вертолетик на Марсе не показатель, там условия пожестче чем на Земле, само собой, но не настолько жесткие как в открытом космосе. Да и возможно вертолетик не был рассчитан на ОЧЕНЬ долгий срок службы, зато отработал как proof of concept.

Ответить | Правка | Наверх | Cообщить модератору

190. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +/
Сообщение от Аноним (115), 04-Июн-23, 20:40 
> Ну, вертолетик на Марсе не показатель, там условия пожестче чем на Земле,
> само собой, но не настолько жесткие как в открытом космосе.

Как я понимаю самые неприятные для спутников условия - в некоторых местах орбит Земли где супердофига заряженных частиц. И спутники которые проходят эти регионы периодически - должны быть RAD HARD практически без вариантов. У кого-то (NASA?) есть забавная карта числа upset vs расположение на орбите. Она мягко говоря неоднородная. Есть хорошие места, есть по сути проклятые.

> Да и возможно вертолетик не был рассчитан на ОЧЕНЬ долгий срок службы,

Ну да. Это нахальный эксперимент, у него батарейка от жестких и экзотичных режимов наверное скиснет, да и заряжать от солнечной батареи при том что ее даже от пыли почистить некому -

> зато отработал как proof of concept.

Ну да. И ведь работает же. Вполне себе приличное время. Хоть и из ширпотреба собран. Марсоход конечно покапитальнее собран.

Ответить | Правка | Наверх | Cообщить модератору

149. "Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."  +/
Сообщение от Аноним (149), 04-Июн-23, 14:21 
SpaceX:
https://www.opennet.me/opennews/art.shtml?num=53083
Ответить | Правка | К родителю #129 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру