The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Разработчики ядра Linux обсуждают вопрос удаления субархитек..., opennews (?), 12-Дек-18, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


43. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +7 +/
Сообщение от Anonim (??), 13-Дек-18, 00:25 
Давай не офтопить. Вот конкретно ты используешь x32? Ты пересобрал под него, не знаю, хромиум? Или firefox? И как, работает? Намного ли стал меньше жрать памяти?

Бесноватые были во все времена. И в основном им нужно внимание. И вставляя про них упоминания, ты лишь им помогаешь.

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

51. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  –2 +/
Сообщение от КГБ СССР (?), 13-Дек-18, 00:40 
Я использую 32-разрядные (они давно все с поддержкой PAE) или 64-разрядные операционные системы на соответствующем железе и, по возможности, 32-разрядные программы в этих 32- или 64-разрядных операционных системах. Никакому прикладному софту обычного юзера ни для чего не нужно уметь адресовать много памяти. При прочих равных 32-разрядный софт почти всегда лучше, быстрее и экономнее для ресурсов. Я никак не могу представить себе, для чего, например, браузеру, мультимедийному проигрывателю, табличному процессору или текстовому редактору быть 64-битными. Если ты можешь назвать конкретные выгоды — назови.
Ответить | Правка | Наверх | Cообщить модератору

72. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  –1 +/
Сообщение от fske (?), 13-Дек-18, 01:29 
>При прочих равных 32-разрядный софт почти всегда лучше, быстрее и экономнее для ресурсов.

Результаты проведенного тестирования товарища аналитика как всегда искать в гугле или он соизволить свой пук в лужу аргументировать?

Ответить | Правка | Наверх | Cообщить модератору

78. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  –2 +/
Сообщение от Аноним (78), 13-Дек-18, 02:01 
Не, не соизволитъ. Он просто немного рассказал о том, что он там использует. Думая, что это кому-то интересно.
Ответить | Правка | Наверх | Cообщить модератору

244. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (243), 13-Дек-18, 15:05 
> Не, не соизволитъ. Он просто немного рассказал о том, что он там
> использует. Думая, что это кому-то интересно.

Так и пусть себе использует. И майнтайнит свой зоопарк сам, если других желающих это делать не найдется. У меня вот последних лет 10 - насквозь 64-битная система на основных комапх. Зато программы могут mmap()-ать любые файлы, а графический редактор не упадет по глупой причине если я открою там даже огроменную картинку. И это все же хорошо.

Ответить | Правка | Наверх | Cообщить модератору

123. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +2 +/
Сообщение от Анонимный прохожий (?), 13-Дек-18, 07:15 
> При прочих равных 32-разрядный софт почти всегда лучше, быстрее и экономнее для ресурсов

А что не 16-разрядный?  Будет ещё экономичнее и быстрее.

Ответить | Правка | К родителю #51 | Наверх | Cообщить модератору

134. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  –6 +/
Сообщение от КГБ СССР (?), 13-Дек-18, 07:57 
Не будет. 32-битный софт при прочих равных быстрее 16-битного. И быстрее 64-битного.
Ответить | Правка | Наверх | Cообщить модератору

150. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +4 +/
Сообщение от Аноним (150), 13-Дек-18, 08:55 
Вернёмся к этому вопросу в 38-ом году.
Ответить | Правка | Наверх | Cообщить модератору

155. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  –1 +/
Сообщение от КГБ СССР (?), 13-Дек-18, 09:15 
> Вернёмся к этому вопросу в 38-ом году.

Что должно произойти в 38 году? «Часы сломаются»? Это не страшно. И это на самом деле не зависит от адресации памяти. Можно «новую эпоху» открывать хоть каждые десять лет. Просто для удобства выбирают какие-то отправные даты и затем «ради обратной совместимости» морочат себе и людям головы. Это на самом деле не проблема.

Открою, кстати, маленькую большую тайну: 64-битная архитектура x86 на самом деле не использует 64-разрядную адресацию. Вот и стоило затевать всю эту канитель? Польза ведь только для Большого Железа.

Ответить | Правка | Наверх | Cообщить модератору

246. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (243), 13-Дек-18, 15:07 
Поскольку вгрузить в оперативу более 4 гигз одним чихом и работсть с этим можно - стоило. А то что 640 кило хватит всем - вот кому хватит, тот пусть и пользуется 640 кило.
Ответить | Правка | Наверх | Cообщить модератору

263. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  –1 +/
Сообщение от КГБ СССР (?), 13-Дек-18, 15:56 
> Поскольку вгрузить в оперативу более 4 гигз одним чихом и работсть с
> этим можно - стоило. А то что 640 кило хватит всем
> - вот кому хватит, тот пусть и пользуется 640 кило.

Вгрузить в оперативку более 4 гигов одним чихом можно было и раньше — при помощи PAE. Открою тебе страшную тайну: и больше можно было, если ещё увеличить разрядность адресации. Сколько угодно много можно, если на то пошло. Ограничение в 4 гига — это ограничение для _одной программы_. Его обойти в 32-битной архитектуре не получится, да. А надо? А точно-точно надо? Ты не сумеешь обосновать необходимость этого, поскольку в реальности не существует рациональной аргументации за это. Нет, жирные регистры можно и без всеобъемлющего перехода на 64 бита (более того, можно удвоить и учетверить жирность их, если очень надо). Да, адресовать много памяти можно и без всеобъемлющего перехода на 64 бита. Смысл 64 битов только в общем адресном пространстве для архитектуры, и более ни в чём. Ну и в типа согласовании. Внутри себя это смесь «разноразрядных» устройств и технологий. И даже та AMD64, которую ты здесь нахваливаешь, не понимая, что она есть такое, имеет на самом деле меньшую (внезапно!) разрядность адресации памяти. Просто потому, что не надо никому так много памяти в настоящее время. Чтоб ты лучше понял суть сказанного, AMD64 — это такая PAE наоборот, когда отсчитывают от большего, а не от меньшего. Ну и плюс несколько новых 64-битных плюшек. Маркетинг и разводилово в лучшем виде.

Ответить | Правка | Наверх | Cообщить модератору

271. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +2 +/
Сообщение от Аноним (-), 13-Дек-18, 16:22 
> Вгрузить в оперативку более 4 гигов одним чихом можно было и раньше — при
> помощи PAE.

Вот знаешь что, давай ты такой умный этим и пользуйся. А я таки буду использовать линейные моделди адресных пространств в стиле фон-неймана. Потому что это удобно, и ниипет. И поэтому вон тот редактор графики (любой!) спокойно сожрет даже какой-нибудь скан A0 в диком разрешении не поперхнувшись. Если в системе в принципе есть достаточно оперативы. И наверное это - хорошо и правильно.

А у тебя с твоими разглагольствованиями редактор тупо грохнется когда ему адресного пространства не хватит. И таки вгрузить картинку в память и что-то сделать с ее пикселями - это таки самый простой и логичный способ. Все остальное намного сложнее, медленнее и требует нефиговый объем нетривиального кода, который по сути попытается изобрести нечто типа свопфайлов, только через задний проход и без явной поддержки железом. Потому что в железо программы ща вообще не пускают и именно в настоящий HW-assisted paging подпертый MMU они еще и не вклинятся. Во избежание поимения всей системы.

> Открою тебе страшную тайну: и больше можно было, если ещё увеличить разрядность адресации.

Это напоминает мне ту городскую легенду, где чувак посмотрел что можно выжать из его древнего драндулета, если стырить пороховой ускоритель...

> Ограничение в 4 гига — это ограничение для _одной программы_. Его обойти
> в 32-битной архитектуре не получится, да. А надо?

Да, надо. А почему, собственно, я не должен иметь возможность открыть БОЛЬШУЮ картинку в редакторе, например? Или еще что-то большое в память загнать целиком и поработать с этим со скоростью RAM, а не винча? Это как бы на несколько порядков разница по производительности. И мне видится очень тупым что я не могу адресовать всю оперативку одним линейным куском. Доступным одним куском а не лоскутным одеялом в куче процессов, если так удобнее и результативнее.

> Ты не сумеешь обосновать необходимость этого, поскольку в реальности не существует
> рациональной аргументации за это.

Уже обосновал. А все эти PAE как по мне должны сдохнуть жестокой смертью, как самые извращенские костыли которые я когда либо видел. Это просто е...й стыд системной архитектуры. Впрочем у интеля в IA32 такого вообще есть.

> имеет на самом деле меньшую (внезапно!) разрядность адресации памяти.

Она имеет достаточную адресацию памяти для того чтобы отдать мне ВСЮ установленную в компе оперативу одним куском в моей программе, если мне что-то такое вдруг надо.

Ответить | Правка | Наверх | Cообщить модератору

282. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  –1 +/
Сообщение от КГБ СССР (?), 13-Дек-18, 17:02 
> Вот знаешь что, давай ты такой умный этим и пользуйся. А я таки буду использовать линейные моделди адресных пространств в стиле фон-неймана. Потому что это удобно, и ниипет. И поэтому вон тот редактор графики (любой!) спокойно сожрет даже какой-нибудь скан A0 в диком разрешении не поперхнувшись. Если в системе в принципе есть достаточно оперативы. И наверное это - хорошо и правильно.

Я с год назад, кажется, приводил на этом форуме в пример сравнительно успешную работу старинного Фотошопа версии 5.5 с громадной картинкой размером 20000 х 20000 точек. Полноценной работой это, конечно, не назовешь, но тут дело принципа. 32-битный графический редактор способен схарчить и переварить такое файло. На большее в него захардкодили ограничения, ЕМНИП.

Да, и я бы предпочел в качестве ПК компьютер Гарвардской архитектуры. Не делают-с, увы.


> А у тебя с твоими разглагольствованиями редактор тупо грохнется когда ему адресного пространства не хватит. И таки вгрузить картинку в память и что-то сделать с ее пикселями - это таки самый простой и логичный способ. Все остальное намного сложнее, медленнее и требует нефиговый объем нетривиального кода, который по сути попытается изобрести нечто типа свопфайлов, только через задний проход и без явной поддержки железом. Потому что в железо программы ща вообще не пускают и именно в настоящий HW-assisted paging подпертый MMU они еще и не вклинятся. Во избежание поимения всей системы.

Обходить ограничения научились ещё в допотопные времена работой с памятью через окошко (потому-то людям с прямыми руками и не требуются на самом деле колоссальные объёмы памяти и большая разрядность адресации). Ты что, до сих пор не в курсе? Чувак, я потрясён! :)


> Это напоминает мне ту городскую легенду, где чувак посмотрел что можно выжать из его древнего драндулета, если стырить пороховой ускоритель...

Загугли же наконец про то, что такое виртуальная память.


> Да, надо. А почему, собственно, я не должен иметь возможность открыть БОЛЬШУЮ картинку в редакторе, например? Или еще что-то большое в память загнать целиком и поработать с этим со скоростью RAM, а не винча? Это как бы на несколько порядков разница по производительности. И мне видится очень тупым что я не могу адресовать всю оперативку одним линейным куском. Доступным одним куском а не лоскутным одеялом в куче процессов, если так удобнее и результативнее.

Если руки не из нижней части спины, то это всё не обязательно.

Как быстро вы все забыли, что ещё каких-то двадцать лет назад суперкомпьютеры имели сопоставимые с нынешними ПК вычислительные мощности, но при этом на них успешно выполнялись задачи для суперкомпьютеров, а на нынешних супер-ПК Ворд тормозит так же, как и тогда тормозил.


> Уже обосновал. А все эти PAE как по мне должны сдохнуть жестокой смертью, как самые извращенские костыли которые я когда либо видел. Это просто е...й стыд системной архитектуры. Впрочем у интеля в IA32 такого вообще есть.

То есть ты не осознаёшь, что AMD64 + EM64T — это тоже набор костылей, «расширенный и улучшенный»? Ну и замечательно, только с этого и надо было начинать, я бы не тратил своё время на чтение твоих графоманских простыней. :)

Ответить | Правка | Наверх | Cообщить модератору

293. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 13-Дек-18, 17:41 
> успешную работу старинного Фотошопа версии 5.5 с громадной картинкой размером 20000
> х 20000 точек. Полноценной работой это, конечно, не назовешь,

Ну а вот у меня NASAвская картинка на 300, если не ошибаюсь, мегапикселей - нормально открылась. Без вот этих вот оговорочек про полноценную работу. И вот так мне почему-то больше нравится.

> но тут дело принципа.

У меня простой принцип: компьютеры должны работать, а не канифолить мозг. И когда я не могу просто взять и просто воспользоваться всей оперативкой которую я установил, без дурных условий и оговорок - клятая железка греет мне мозг и это очков симпатий ей совсем не добавляет.

> На большее в него захардкодили ограничения, ЕМНИП.

Ну так юзер иначе повесится от такой "работы", когда аналог paging все время будет диском тарахтеть. В то время как половина оперативы компа не используется. Очень умно и эффективно.

> Да, и я бы предпочел в качестве ПК компьютер Гарвардской архитектуры. Не
> делают-с, увы.

Програмить канительно. Кто не верит - ну вон атмеги и аттини есть. На них даже си натянули худо-бедно. И даже плюсы слегка. Но вот именно гарвардская природа таки основательно канифолит мозг и требует отдельных приседаний.

ARM например умнее сделал - "электрически" у них ядро гарвардец. I и D шины - электрически разные. Поэтому оно может одновременно тащить инструкции и данные для них - по разным шинам. Одновременно. Но для софта это таки вывешено как фоннейман и програмить это все же не так геморно как настоящего гарвардца.

> колоссальные объёмы памяти и большая разрядность адресации). Ты что, до сих
> пор не в курсе? Чувак, я потрясён! :)

Я в курсе что можно самому изобрести эрзац-своп и эрзац-mmu. Там вон чуваки на атмеге убунту забутявили - сэмулировав ARMv5 с MMU :D. Есть только одна проблема - они загрузки системы в минимальном виде ждали 2 часа, чтоли, а работа с шеллом больше смахивала на пошаговую стратегию - ваш ход, вы жмете букву. Ход переходит к AI, он обдумавает ваш ход минуту :)

> Загугли же наконец про то, что такое виртуальная память.

Я в курсе, спасибо. И на системном уровне это рюхается ядром и MMU. В которые user-mode софт в общем случае лучше не пускать, иначе расхакают всю систему вдрызг.

Я также насмотрелся на всякие банки, окошки и проч. Достаточно для того чтобы возненавидеть все это и полюбить линейную адресацию и memory-mapped периферию. Потому что это просто, быстро, эффективно и не грызет мозг, в отличие от камасутры с переключениями банков, окошек, эрзацсвопов и прочей гадостью, заставляющей костылить убогость железа в софте.

> Если руки не из нижней части спины, то это всё не обязательно.

Ну как бы с точки зрения скорости работы и минимального объема кода, минимума глюков и проч - это самый простой и логичный вариант.

> успешно выполнялись задачи для суперкомпьютеров, а на нынешних супер-ПК Ворд тормозит
> так же, как и тогда тормозил.

Я рад за суперкомпьютеры но у меня нет суперкомпьютерных задач. И таки вот конкретно мой компьютер таки не особо тормозит. Он достаточно мощный для того чтобы я его так по грубому завалить работами мог только весьма эпизодически. Ну ок, полный ребилд с ноля кернела со всеми наворотами в 8 потоков займет его на ~15 минут. Частичный или более скромную конфигу - меньше. А обычные задачи - блин у меня свопа то нет. Чтобы не наслаждаться латенси от paging. Ну zram вон есть, на случай если приперло. В него cold добро можно отгрузить компресанутым, если приперло. Но RAM, даже компреснутый и косящий под swap - не идет ни в какое сравнение с латенси винча :)

> То есть ты не осознаёшь, что AMD64 + EM64T — это тоже набор костылей,

То-есть я отлично осознаю что это набор костылей и далеко не предел мечтаний. Но это лучше чем IA32 и всякие PAE. А чего-то недорогого и сильно лучше пока особо и нет. Ну вот ARM еще появляются, да RISC-V на подходе. У ARM ядра в целом менее кривые, но при переходе 32 -> 64 они тоже ессно совместимостью с легаси обвесились. Без этого их порвут. RISC-V ... ну его в 32-битной инкарнации в штуках способных запустить linux никто не видел, так что там они могут и не париться :) но это лишь потому что они стартанули после начала заката 32-бит эпохи.

Ответить | Правка | Наверх | Cообщить модератору

355. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от КГБ СССР (?), 14-Дек-18, 01:51 
Ещё о Фотошопах.

Photoshop 7 позволяет создать картинку размером 30000 на 30000 точек, то есть 900 мегапукселей. Её пустой стартовый вес — 2,51 ГБ.

Photoshop CS позволяет создать картинку размером 300000 на 300000 точек, то есть 90000 мегапикселей. Стартовый вес пустого файла обещают нам аж в 251,5 ГБ.

Достаточно или надо ещё? ;-) Дальнейших изысканий с последующими версиями я не проводил, ибо мне таки достаточно.

Обращаю внимание твоё и всех адептов прогрессивной математики, что это 32-разрядные программы.

Ответить | Правка | Наверх | Cообщить модератору

397. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 14-Дек-18, 15:14 
> Photoshop 7 позволяет создать картинку размером 30000 на 30000 точек, то есть
> 900 мегапукселей. Её пустой стартовый вес — 2,51 ГБ.

...и когда у меня в системе есть 16 гигз памяти, невозможность линейно адресовать всего-то 2.5 гигза (для кернела тоже надо адреса) - не находит понимания. Еще более иди0тски, когда прога тарахтит винчом экономя адресное пространство :D :D :D в то время как большая часть оперативы пустует. Циферок, блин, в математике не хватило. Волшебно.

> Photoshop CS позволяет создать картинку размером 300000 на 300000 точек, то есть
> 90000 мегапикселей. Стартовый вес пустого файла обещают нам аж в 251,5 ГБ.

И это прекрасно. Но без 64 битов он не сможет держать его одним куском в памяти и эффективно с ним работать. А свопить на диск даже "всего-то" 2.5 гига - это ты как-нибудь без меня. Поттому что SSD при такой "работе" тормозить будет, конечно, умерерно, но протрется довольно быстро. А на винче - скорость работы будет такой, что на третий день такого работинга захочется послать все к чертям и заняться выращиванием рассады.

> Обращаю внимание твоё и всех адептов прогрессивной математики, что это 32-разрядные программы.

Спасибо, я видел как фотошоп работает когда он не может держать всю картинку в памяти. Смею заверить, увиденного хватило для того чтобы предоставить эту участь другим.

Ответить | Правка | К родителю #355 | Наверх | Cообщить модератору

401. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от КГБ СССР (?), 14-Дек-18, 15:38 
Прекрасный комментарий, настоящий гимн неэффективности! Даже в совке такого махрового лицемерного трындежа не было. :-)

Так ты эмбедовкой занимаешься, говоришь? Ну-ну… Большой привет клиентам! :-)

Ответить | Правка | К родителю #397 | Наверх | Cообщить модератору

453. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 15-Дек-18, 15:33 
> Прекрасный комментарий, настоящий гимн неэффективности! Даже в совке такого махрового
> лицемерного трындежа не было. :-)

Гимн неэффективности - это когда машина хрустит винчом и решает задачу в десятки раз медленнее, вместо того чтобы просто взять и использовать весь свой имеющийся ресурс.

> Так ты эмбедовкой занимаешься, говоришь? Ну-ну… Большой привет клиентам! :-)

А в эмбедовке все просто: задача или умещается в ресурсы, или нет. И если умещается - то в общем то дальнейшие оптимизации имеют смысл разве что для души и прочих перспектив поюзать этот код потом и на более дохлом хардваре, или под более крутой поток данных, или там что еще.

И в эмбедовке только сказочный талпайоп изначально хватает камень, ресурсы которого заведомо впритык. Уж разработка всяко делается на железе с запасом. А потом смотрится - если можно малой кровью обрубить под более хилую железку, это проносит какие-то профиты и не тормозит проект на годы - ок, может быть.

А так еще дедушка Кнут сказал нам что преждевременная оптимизация - корень всех зол. Мы его таки услышали.

Ответить | Правка | К родителю #401 | Наверх | Cообщить модератору

403. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (514), 14-Дек-18, 15:49 
> И это прекрасно. Но без 64 битов он не сможет держать его
> одним куском в памяти и эффективно с ним работать.

Вообще то, эффективнее всего работать не кусками влезающими в оперативку, а с кусочками влезающими в кеш процессора. Насколько я знаю, видео все и всегда обрабатывают как раз такими кусочками.

Ответить | Правка | К родителю #397 | Наверх | Cообщить модератору

454. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 15-Дек-18, 15:43 
> Вообще то, эффективнее всего работать не кусками влезающими в оперативку, а с
> кусочками влезающими в кеш процессора.

Аксиома: если математика несложная, а картинка большая - основное время работы с ней что так что эдак уйдет на выгруз из оперативы источника и вгруз в оперативу результата.

Кэш как таковой кэш ничего с этим сделать не может. Ваша мысль имеет право только в допущении что все упирается в процессор, а не оперативку. Но процессоры сейчас быстрые и оперативку обгоняют сильно, по поводу чего и есть кэши. Так что какие-то такие соображения могут иметь смысл только для каких-то очень частных случаев, когда математика применяемая к кускам картинки очень крутая, обращается к пикселам много раз подряд и это - какой-то существенный процент времени по сравнению с IO с оперативой. А если вы жуете всю картинку - то вы ее всю прочтете и запишете в оперативу. Что с кэшом, что без. И таки при лопатинге 2.5 гигз кэш во многих случаях погоды вообще не сделает. Лучшее что там может закешироваться - сам алгоритм, но никак не данные которые он жевал.

Да, я развлекался с компрессором данных. И когда у меня source и destination уместились в кэш, на повторных сжатиях и распаковках выигрыш получился офигительный. На однократной профита не наступает - в конечном итоге источник придется взять оперативки, а результат записать в оперативку. Что с кэшом, что без. Куда такой профит прикрутить - я толком и не придумал. Ну, можно бенчмарки накручивать, наверное. Если 7z b меряет 20000 MIPS, то подмухлевав в таком духе можно получить и все 100000 если не больше. Проблема в том что в реальных сценариях это никто не увидит.

> Насколько я знаю, видео все и всегда обрабатывают как раз такими кусочками.

Хотелось бы пруфца на столь храброе заявление. Желательно в исходниках.

Ответить | Правка | К родителю #403 | Наверх | Cообщить модератору

457. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (514), 15-Дек-18, 16:21 
Помимо производительности шины памяти есть так же время запроса. Насколько мне известно кеш второго уровня страничный и если процессор запрашивает данные из страницы которой нет в кеше, то содержимое одной из страниц кеша сбрасывается в оперативку. И только после того как сброс будет полностью завершён будет произведён запрос блока из оперативки. Это операция занимает около 100нс и вообще не ускоряется с появлением нового железа, скорость света будь она не ладна. То есть узким местом будет даже не шина, а пинг до оперативки. Всего 10 млн. операций с памятью в секунду, пентиум-1 умрёт со смеху обрабатывая картинку за тоже время, что и топовый i7.
Ответить | Правка | К родителю #454 | Наверх | Cообщить модератору

467. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 15-Дек-18, 20:47 
> Помимо производительности шины памяти есть так же время запроса.

Да. Однако RAM сильно отстает и на последовательном доступе, и на рандомном. В случае последовательного, кстати, характерного для работы с изображениями, GPU вообще используют специальные виды памяти. И таки даже GDDR5, не говоря про HBM и проч - очень хорошо показывает DDR3/4 кто в этом рулит.

Пример: ПСП DDR3 и GDDR5 примерно сравнимых времен покупки около 20 GB/sec vs 180GB/sec. Разница почти в 9 раз. На именно рандомном доступе так конечно не будет. Но для работы с картинками - последовательный доступ достаточно характерен. Именно рандомно хватать пикселы картинки по всей площади - так можно, но что это за процессинг картинки лично я не понимаю.

> секунду, пентиум-1 умрёт со смеху обрабатывая картинку за тоже время, что
> и топовый i7.

Таки со времен первого пентиума щины стали быстрее, частоты увеличились везде, DDR тоже улучшился. И в результате это скорее "одноплатник с половину кредитки умрет со смеха, уделав в 30 раз огроменный железный ящик, потребляя в 30 раз меньше энергии". Ну вот как-то так технологии со времен первого пня ушли, что первопень ползает со скоростью когда даже MIPS в роутере-мыльнице будет над ним смеяться.

Ответить | Правка | К родителю #457 | Наверх | Cообщить модератору

492. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от КГБ СССР (?), 16-Дек-18, 00:03 
Напомню лицам с девичьей памятью, что у первопня и вообще тогдашних процессоров был сравнительно короткий конвейер и совсем маленький множитель тактовой частоты, что вкупе с низком латентностью памяти прекрасно работает на сравнительно маленьких порциях данных. А в современных процессорах с многомегабайтными кешами нескольких уровней и длиннющим конвейером, большими множителями, очень большой латентностью ОЗУ (но при широкой оного шине) высокая производительность имеет место только для больших порций данных. На скромных и компактных «морально устаревших» программах, умевших-таки обрабатывать огромное файло, не умещавшееся даже в ОЗУ, а не только в кеш, выигрыш ультрасовременных вычислительных железяк внезапно нивелируется, если их не грузить чем-то очень объёмным. Что недвусмысленно намекает и на некоторые свойства железа, и на умения погромиздов, пишущих модно-прогрессивный софт. Я приводил уже в пример суперкомпьютер начала девяностых, имевший максимально 128 гигов памяти. Но оном суперкомпьютере люди решали суперкомпьютерные задачи. На сопоставимом по «чистой» вычислительной мощности современном писюке веб-макака способна разве что писать однодневный ненужнософт в невероятно прожорливых IDE. Мощность как бы выросла, ага, и «время ращработчиков дороже стоит», а польза от вычислений снизилась на многие-многие порядки.
Ответить | Правка | К родителю #467 | Наверх | Cообщить модератору

494. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 16-Дек-18, 16:11 
> вкупе с низком латентностью памяти прекрасно работает на сравнительно маленьких порциях
> данных. А в современных процессорах с многомегабайтными кешами нескольких уровней и
> длиннющим конвейером, большими множителями, очень большой латентностью ОЗУ (но при широкой
> оного шине) высокая производительность имеет место только для больших порций данных.

И тем не менее - с тех пор АБСОЛЮТНО ВСЕ разогналось как минимум В РАЗЫ. Настолько что по скорости и латенси памяти этому УГ может воткнуть даже мипсовая мыльница-роутер, потому что там видите ли DDR2, а то и 3 нормальный впаяли, на приличной частоте. А у пенька извините что было? EDO? Или в лучшем случае SDRAM? Одно это обеспечит ему чебурашью скорость работы.

Придирчивый народ мониторит в тех же армовских одноплатниках частоты/ширину шины. Потому что одно дело DDR2 на 16-битной шине, и совсем другое 32 и тем более 64 бита DDR3 c более приличной частотой. Он такой красивый и на больших порциях выиграет, и на маленьки. Потому что порции при лопатинге картинки уж наверное покрупнее 16 битов подразумевались, и наверное с каким-никаким линейным доступом - по другому картинки процессят только очень странные люди, которым производительность явно не интересна была: они мигом аннулируют любые намеки на кеширование, префетч и создают море оверхеда на шине памяти т.к. там для каждой операции потребуется слать адреса, а не просто запустить отправку жирного блока и грести лопатой, уже без отсылки адресов на каждую порцию, чуть ли не по порции размером с ширину шины каждый такт, что гораздо веселее.

> На скромных и компактных «морально устаревших» программах, умевших-таки обрабатывать
> огромное файло, не умещавшееся даже в ОЗУ,

Это все круто, НО есть весьма характерный tradeoff между памятью и скоростью. И как бы экономия памяти означает тормозной процессинг. Особенно весело когда половина оперативы в результате пустая, а программа занимается тасовкой файлов по причине нехватки, блин, циферок в своей математике. Очень "эффективно" получается.

При том что против идеи процессинга данных не влезающих в RAM я ничего не имею. Это по своему красиво. Но производительность зачастую получается издевательской по сравнению с тем что можно получить врузив датасет в рам - и так делают только когда данные реально большие или неограниченно растут. Ну типа как OSMная база данных, особенно ежели со всей историей редактирования - там да, никакой RAM не хватит, и с течением времени данных будет только больше.

> кеш, выигрыш ультрасовременных вычислительных железяк внезапно нивелируется, если их
> не грузить чем-то очень объёмным.

Таки оно все-же выигрывает даже и так. Из-за апгрейда остальных частей системы, и вообще. А так то можно порассуждать о том что будет если кэши вырубить, что пентиуму, что core i9. Они оба будут жалкими, но пень все-же продует в разы и так. Но менее эпично чем обычно :)

> Что недвусмысленно намекает и на некоторые свойства железа, и на умения погромиздов,

Погромизды стали оптимизировать свой софт под свойства актуального железа, делая удобно именно ему. Чтобы оно реализовывало свой потенциал. Таки железо и софт шли навстречу друг другу.

Пэтому вот вам выравнивание структур на линию кэша. Даже если это и делает структуру более жирной, зато скорость доступа улучшается, т.к. кэшу удобно стало. А вот крипто, ворочает 64 бита за раз. Потому что проц может за такт долбануть 32 бита, а может 64. И если за тот же такт вдвое больше обмолочено, это профит. Почти в 2 раза. Нахаляву. И сама математика такая что уже не избегает операций регистр-регистр, потому что РОНов типа много.

> уже в пример суперкомпьютер начала девяностых, имевший максимально 128 гигов памяти.
> Но оном суперкомпьютере люди решали суперкомпьютерные задачи.

При том эти задачи были интересны лишь очень узкому кругу лиц. И как бы тогда никто не смотрел видео на компьютерах. И картинки в 300Мпикс всерьез никто не редактировал. Ну вот может кроме нескольких рож с суперкомпьютерами на всю планету.

Типовой же юзерь 5 фотошопа с пентиумом получив на вход 300Мпикс картинку очень быстро отползет, увидев как его фотож... с этим реально работает. Теоретически, конечно, он через недельку прожует это. Практически оно юзеру через недельку - не очень то и хотелось.

А про монстроIDE и софт с полураспадом в год я таки согласен :)

Ответить | Правка | К родителю #492 | Наверх | Cообщить модератору

515. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от КГБ СССР (?), 16-Дек-18, 22:14 
> И тем не менее - с тех пор АБСОЛЮТНО ВСЕ разогналось как
> минимум В РАЗЫ. Настолько что по скорости и латенси памяти этому
> УГ может воткнуть даже мипсовая мыльница-роутер, потому что там видите ли
> DDR2, а то и 3 нормальный впаяли, на приличной частоте. А
> у пенька извините что было? EDO? Или в лучшем случае SDRAM?
> Одно это обеспечит ему чебурашью скорость работы.

Разогнали шины и множители, что даёт эффект на больших порциях данных (aka bloatware). А реальные «железные» скорости не разогнались особо, потому что там физика. Если сильно разгонять, начнёшь радио слушать чипом. Надеюсь, ты ещё помнишь про то, как получается «частота процессора», и про обещания Интела обеспечить всем коммунизм^W по 10 ГГц в каждый дом?


> Придирчивый народ мониторит в тех же армовских одноплатниках частоты/ширину шины. Потому
> что одно дело DDR2 на 16-битной шине, и совсем другое 32
> и тем более 64 бита DDR3 c более приличной частотой. Он
> такой красивый и на больших порциях выиграет, и на маленьки.

Как ты думаешь, почему оперативную память делают по «морально устаревшим» техпроцессам, и почему внутренняя скорость чипов памяти не растёт?

>  c более приличной частотой

Нету там внутри никакой «более приличной частоты». Только ширина шины больше. И накладные расходы на её обслуживание, ха-ха-ха. Старую память контроллеру обойти было быстро не только потому, что её было мало. :)

Ты пойми: бесплатный сыр бывает только в мышеловке.


>> На скромных и компактных «морально устаревших» программах, умевших-таки обрабатывать
>> огромное файло, не умещавшееся даже в ОЗУ,
> Это все круто, НО есть весьма характерный tradeoff между памятью и скоростью.
> И как бы экономия памяти означает тормозной процессинг. Особенно весело когда
> половина оперативы в результате пустая, а программа занимается тасовкой файлов по
> причине нехватки, блин, циферок в своей математике. Очень "эффективно" получается.

Я уже видел, как по стратегии «займём всю память, она же не должна простаивать» постоянно приходится пинать ОС вручную, чтобы освободила память для других приложений, а «только что закрытым» она понадобится не раньше, чем я это решу, а не тупой диспетчер памяти, настроенный обезьянами.

Когда я читаю твои развесистые рассуждения о том, как правильно использовать памяти, мне кажется, что ты всё-таки на самом деле не понимаешь, что такое виртуальная память и что такое неймановская архитектура. Слова умные вроде знаешь, и даже складывать их в предложения умеешь, а смысла никакого из них не рождается.

Представь, что ОЗУ — это быстрый кэш, не более того. Если ты забил промежуточный буфер между медленной долговременной памятью (диском) и процессором, то быстро ехать уже не получится даже при всём желании. Поэтому правильно держать эту буферную память максимально свободной, ибо иначе придётся постоянно лезть на диск за каждым ссаным байтом, пока ОЗУ будет занято тем, что «может пригодиться, ведь его только что недавно закрыли». И это в каждый момент времени! Ага, я такое видел. Спасибо, больше не хочу. Предпочитаю лучше подождать дополнительных 100 мс при каждом запуске приложения, а не постоянно доставать всё нужное из свопа.


> При том что против идеи процессинга данных не влезающих в RAM я
> ничего не имею. Это по своему красиво. Но производительность зачастую получается
> издевательской по сравнению с тем что можно получить врузив датасет в
> рам - и так делают только когда данные реально большие или
> неограниченно растут. Ну типа как OSMная база данных, особенно ежели со
> всей историей редактирования - там да, никакой RAM не хватит, и
> с течением времени данных будет только больше.

Бджд, для высокой производительности программ надо всего лишь писать производительный код на максимально близком к железу уровне, вот и всё. А не превращать всё в «интерпретатор языка высокого уровня». Почему-то у хорошей сисясто-ассемблерной программы обычно нет проблем с производительностью даже на старом железе и скудной памяти, а у модно-прогрессивных аппликух постоянно нехватка ресурсов, «надо докупить ещё, память нынче стоит копейки».


>> кеш, выигрыш ультрасовременных вычислительных железяк внезапно нивелируется, если их
>> не грузить чем-то очень объёмным.
> Таки оно все-же выигрывает даже и так. Из-за апгрейда остальных частей системы,
> и вообще. А так то можно порассуждать о том что будет
> если кэши вырубить, что пентиуму, что core i9. Они оба будут
> жалкими, но пень все-же продует в разы и так. Но менее
> эпично чем обычно :)

Внутренние скорости работы чипов и прочего железа — гугл ит, плиз, энд рид ит.


>> Что недвусмысленно намекает и на некоторые свойства железа, и на умения погромиздов,
> Погромизды стали оптимизировать свой софт под свойства актуального железа, делая удобно
> именно ему. Чтобы оно реализовывало свой потенциал. Таки железо и софт
> шли навстречу друг другу.

Нет, товарищ комсорг, не так всё было. Никто ничего не оптимизировал, ибо оптимизацию ваши товарищи по комсомолу и партии возложили на трудящихся в формате регулярного похода в магазин за новым железом.


Дальше лень.

Ответить | Правка | К родителю #494 | Наверх | Cообщить модератору

523. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (523), 17-Дек-18, 02:52 
> Разогнали шины и множители, что даёт эффект на больших порциях данных (aka bloatware).

То-есть если я бэкап жму - это bloatware, оказывается? Да и фоточки разрешением 640х480 не втыкают.

> А реальные «железные» скорости не разогнались особо, потому что там физика.

Сильнее всего в те поры физика упиралась в нормы техпроцессов и результирующее оттуда потребление и тепловыделение. По мере уменьшения элементов схем тепловыделение уменьшалось, довольно круто. Пропорционально 3...4 степени.

Кроме того - не умели делать компактное, массовое и эффективное охлаждение на подобные мощности (в серверах лучше, но звук!!!). А еще - преобразователи питания и управление питанием, DVFS и проч.

С тех пор как минимум...
- Многофазные схемы питания с регулируемым вольтажом. Которые не пасуют перед отгрузкой 1V 100A в проц. Ну вот такой вот трамвайчик.
- Полимерные lowESR кондеры, которые и не вскипают от нагрева своим же ESR.
- DVFS, power & clock gating - позволили схемам быть быстрым в пике но не жрать как трамвай на холостых режимах.
- Частоты стали выше в разы. Глобально, везде.
- Вентиляторами научились управлять с регулировкой оборотов.
- Сами технологии охлаждения здорово прокачали (на десктопах, в лаптопах, а теперь и в мобильных устройствах).
- Шины - усовершенствовали и довольно радикально сменили парадигмы местами. Это была эпоха начала конца параллельных шин.
- Оператива сейчас напрямую к процу, а не чипсету. Минус латенси гейтовки CPU FSB <-> RAM чипсетом.

> Если сильно разгонять, начнёшь радио слушать чипом.

В железном ящике? :) А так слив по transmission line и антеннам засчитан. Да, это пришлось узнать не только RF engineer'ам, но и цифровикам c энного момента. Как раз поэтому.

Как ты думаешь, почему в IDE стало 80 проводов? :) Посотри на кабель SATA, особенно 6Gbps. Это не просто кусок провода. А дорожки на платах следуют хитрым паттернам и идут парами. Не просто так. Они все стали низковольтными, дифференциальными, более последовательными и менее синхронными в отличие от наивных первобытных шин сделанных "в лоб".

А так у цифры фронты крутые - даже в "низкоскоростной" схеме уровня ардуины по этому поводу можно выкусить. Спроси у Зенкова какой спектр у прямоугольника с его фронтами.

> Интела обеспечить всем коммунизм^W по 10 ГГц в каждый дом?

Таки интел лоханулся именно по линии частот и тепловыделения. Загнать кремний на 10ГГц как таковой можно. Но не миллиардом транзисторов, в этом случае он умрет по перегреву.

Вести 10ГГц по плате так себе идея. Реально по FR4 разводят до примерно 5. Кто не верит - смотрит домашние роутеры. Хотя в спутникаовых штуках и 10 вроде делают, но выглядит специфично.

Собственно опытом RFщиков пользуются. Когда надо, излучает. Когда не надо - не излучает. Правда теперь цифровики реально мыслят как СВЧшники наполовину. Даже не только из-за мегагерцев, но и из-за наносекундных фронтов, которые разлетаются независимо от периодичности. Если кто не понял - возможны странные методы синтеза сигнала, когда периодики с энным периодом как таковой может и не быть. Какой период у wideband сигналов?

> Как ты думаешь, почему оперативную память делают по «морально устаревшим» техпроцессам,
> и почему внутренняя скорость чипов памяти не растёт?

А потому что смысла нет. Если сделать DRAM меньше по размеру элемента, конденсаторы DRAM начнут жутко утекать, вместо счастья случится EPIC FAIL. Этот эффект очень сильно долбит на мелких техпроцессах. И там где потребление важно, борьбе с этим посвящен целый раздел технологий power management. Потребление ничего не делающего тонкого чипа довольно сильно состоит из утечек. А когда так DRAM делает - она еще и склерозом становится. И чем жарче - тем лучше. Любители тырить пароли из ребутнутого компа - уважают жидкий азот :)

> Нету там внутри никакой «более приличной частоты».

Да все там есть. Хотя самые высокие частоты синтезируют прямо в чипах, чтобы не тащить по плате. Man PLL.

> Только ширина шины больше.

А теперь посмотри в вике что означает "DDR" - одно это делает шину вдвое быстрее на той же частоте. Даже если забить на прочие оптимизации и ощутимый пересмотр "электрики" в сторону дружественности высоким скоростям.

> И накладные расходы на её обслуживание, ха-ха-ха. Старую память контроллеру обойти
> было быстро не только потому, что её было мало. :)

Старая память была тормозной аки трактор, неоптимальной по циклам шины, дурной по физике, тормозной по частотам. И работала с непотребной скоростью. Пеньку с EDO, да даже и с SDR SDRAM - воткнет даже 20-баксовая MIPSовая мыльница с DDR'ом.

> Ты пойми: бесплатный сыр бывает только в мышеловке.

Бывает эволюция технологий. Физику нельзя обмануть. Но можно взять на свою сторону. Там где мы хотим излучать - антенна. Не хотим - делаем transmission line (wave guide). Это просто делается по разному. С явным осмыслением. Да, это уже не просто протяжка дорожек наобум и требует странные скиллы. И не всегда выходит с первого раза даже с крутейшими CAD и симуляторами.

...а цена в чуть ином. Например DVFS и управление вентилями позволяет системе с одной стороны не выть как пылесос в холостом режиме, с другой - показывать впечатляющую производительность. Но это делает систему более хрупкой. Можно срубить сдуру вентилятор. Можно заказать чипу питания напряжение выше чем он физически выдержит на этой частоте. Начинают требоваться сервисные процики, которые этим займутся в жестком реальном времени. Система становится сложнее и хлипче. Ее старт напоминает запуск ракеты.

> Я уже видел, как по стратегии «займём всю память, она же не
> должна простаивать» постоянно приходится пинать ОС вручную,

Кому приходится - тот пусть этим и страдает. А я в моей ОС не занимаюсь ручным менеджментом память по счастью.

> такое виртуальная память и что такое неймановская архитектура. Слова умные вроде
> знаешь, и даже складывать их в предложения умеешь, а смысла никакого из них не рождается.

Таки понимаю. Это ты не понимаешь что в обозримом будущем возможно вообще вся память в системе станет адресуемой напрямую. Без такого понятия как стораж. NVDIMM тому первый звоночек, но ни разу не последний. Вообще идея пропихать NAND через SATA - изврат. И даже через PCI-E. Он логичнее смотрится замапленым напрямую в адреса, с тонким и быстрым слоем трансляции.

MRAM/FRAM - и подавно. Упомянутых кстати уже промышленно делают. Ramtron так по жизни для индустриалов делает "вечные EEPROM", Ti слегка это лицензировал для своих МК.

> Представь, что ОЗУ — это быстрый кэш, не более того.

Скоро, похоже, сторажи станут "медленным RAM", как мне кажется. Периферия уже стала, она вся сплошь "memory mapped". Это удобно. И сишникам с точки зрения програмизма, и виртуалкам, достаточно очевидный IOMMU позволяет отрезать железку в VM. Делая то же что MMU, но с другой стороны.

> буфер между медленной долговременной памятью (диском) и процессором, то быстро ехать
> уже не получится даже при всём желании.

Плохо стыкуется с примером 300Мпикс картинки и процессинга ее пикселей. Вгрузить ее с диска 1 раз, к тому же сжатую. Декомпресс и любая возня с пикселями будут намного лучше, если попадут в хотя-бы RAM, без насилия над диском вообще. На линейных операциях характерных для обсчета картинок к тому же неплох даже обычный RAM. Хотя GDDR или HBM в GPU лучше. Но их меньше, потому что они дорогие и не апгрейдабельные.

> буферную память максимально свободной, ибо иначе придётся постоянно лезть на диск
> за каждым ссаным байтом, пока ОЗУ будет занято тем, что «может
> пригодиться, ведь его только что недавно закрыли».

И тем не менее, по моему опыту, жирный дисковый буфер - делает работу с ОС намного приятнее. По сути превращая медленный стораж в подобие быстрого рамдиска. Спору нет, если все забить приложениями - эта иллюзия отвалится. Поэтому забивать память под завязку приложениями все же не стоит.

...но если картинка весила допустим 5 гигз, в системе было 16, то у меня еще 11 гигз на все такое прочее. А обсчитать картинку как просто массив в оперативе явно быстрее чем таскать ее расжатую версию из свопа с диска и чего там еще. Вот отлить несколько гигз на диск - это не быстро по хоть каким стандартам. И поэтому фотожоп с 300Мпикс картинке на первом пне - не упадет, но скорость его работы - заманает в край. В отличие от скорости работы любого редактора на машине с 16 гигз.

> лучше подождать дополнительных 100 мс при каждом запуске приложения, а не
> постоянно доставать всё нужное из свопа.

У меня нет свопа. Как максимум у меня есть zram, типа-своп в сжатом рамдиске. Если оперативы хронически не хватило - холодные данные можно попробовать закомпрессить, в надежде что вот так ее все же хватит. Если и так не хватит - и нафиг. Камасутра с 5-м фотошопом на пентиуме и 300 мпикс картинкой - не ко мне.

> Бджд, для высокой производительности программ надо всего лишь писать производительный
> код на максимально близком к железу уровне, вот и всё.

С современным железом это легче сказать чем сделать. Начиная с того что реально код не имеет дело с блоками выполнения. Он попадает в uCode ROM и тот разваливает его на микрооперации, а что случится дальше, а также сколько и каких блоков фактически есть в том или ином камне - известно лишь крайне приблизительно. Кроме того - при чрезмерном увлечении код получается не портабельным или обладает хреновой производительностью на других архитектурах, если там сделано иначе.

А так то да, дрова в досе и даже 95 писали на асме. Было круто и быстро. Но работало только на x86. А нтя таки с дровами на си уже была. Поэтому и была неповоротливой, зато таки портированной на кучу архитектур. Этот тренд и в остальных системах продолжился.

> А не превращать всё в «интерпретатор языка высокого уровня».

Как бы интерпретаторы никогда не были быстрыми. Еще со времен бэйсика.

> Почему-то у хорошей сисясто-ассемблерной программы обычно нет проблем
> с производительностью даже на старом железе и скудной памяти, а у модно-прогрессивных
> аппликух постоянно нехватка ресурсов, «надо докупить ещё, память нынче стоит копейки».

И все же, даже если ты запустишь чисто сишный вариант допустим современного крипто на чем-то 32-битном а потом на сравнимом 64-битном, разница будет довольно убедительной. Так же с мультимедийным добром и прочей тяжелой математикой. А где еще производительность собственно нужна? Ну наверное не в туповэйтинге юзерского ввода.

> Внутренние скорости работы чипов и прочего железа — гугл ит, плиз, энд рид ит.

Хотите об этом поговорить? :) Я как бы в курсе ПСП шин.

И так для понимания...
- ПСП шины памяти на K6-2 (даже покруче первого пентиума) около 600Мб/сек была.
- ПСП DDR3 у моего десктопа около 20 Гб/сек.
- ПСП GPU GDDR5 под 180Гб/сек.

Это более-менее линейный доступ. Первые 2 измерены мемтестами, последнее opencl'ными бенчами похожими по смыслу. И как угодно но при прочих равных линейный доступ к оперативе, типовой для обсчета картинки, воткнет той штуке эпохи пентиумов в 33 раза на типовых паттернах характерных для обсчета картинок. Но еще лучше будет если это влезет в GPU и туда придет opencl фильтр, который мало того что массово SIMDшный как черти что, так еще и ПСП эвон какой. И он таки реально в разы быстрее основного cpu сжует это. Поэтому и GPU, собственно - хорошо с графикой работает.

> Нет, товарищ комсорг, не так всё было. Никто ничего не оптимизировал,

Посмотри на эволюцию крипто и не тупи. Симметричные алгоритмы и хэширование.

Salsa, chacha, sha-3, да даже AES... их лучше на 64-бит проце крутить. Больше за 1 такт обсчитывается. И вот так было везде где скорость счета кого-то колыхала. Будь то графические фильтры или мультимедийные кодеки или что там еще.

> ибо оптимизацию ваши товарищи по комсомолу и партии возложили на трудящихся в
> формате регулярного похода в магазин за новым железом.

Да ну ерунда, не все же - вебмакаки. Есть и алгоритмисты. И они таки тоже на 32 бита забили.

А как я это узнал? Блин попробовал найти алгоритмов под 32 битный микроконтроллер. И обчертыхался. Таки да, 64-бит математика там есть, и даже работает, но таки из 32-бит регистров она получается медленнее. И код жирнее, чем если нативный юнит с которым оперировали был бы 32 бита. А на 64 бит проце оно конечно же офигенно раскладывается.

Ответить | Правка | К родителю #515 | Наверх | Cообщить модератору

532. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Ю.Т. (?), 17-Дек-18, 08:39 
> Сильнее всего в те поры физика упиралась в нормы техпроцессов и результирующее
> оттуда потребление и тепловыделение. По мере уменьшения элементов схем тепловыделение
> уменьшалось, довольно круто. Пропорционально 3...4 степени.

Почему не 7...8? Где теплоёмкость?

Тепловыделение в электронных элементах зависит от объёма единичного элемента, который *в общем* пропорционален 3-й степени линейного размера, силы протекающего тока и частоты переключений.

Ответить | Правка | К родителю #523 | Наверх | Cообщить модератору

548. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от КГБ СССР (?), 17-Дек-18, 10:39 
>> Разогнали шины и множители, что даёт эффект на больших порциях данных (aka bloatware).
> То-есть если я бэкап жму - это bloatware, оказывается? Да и фоточки
> разрешением 640х480 не втыкают.

Не в кассу. Будьте добры высказывать ваши тезисы по существу, тов. комсорг.


>> А реальные «железные» скорости не разогнались особо, потому что там физика.
> Сильнее всего в те поры физика упиралась в нормы техпроцессов и результирующее
> оттуда потребление и тепловыделение. По мере уменьшения элементов схем тепловыделение
> уменьшалось, довольно круто. Пропорционально 3...4 степени.

Техпроцессы считают по производственному оборудованию, ёпт, а не по транзисторам. :)

Тепловыделение делают настолько высоким, сколько можно остудить за приемлемую стоимость без стремительной деградации кристалла. А можно сделать любым, да. В том числе таким, что печка i9 будет работать при комнатной температуре вообще без радиатора. Но будет немножко не так быстро. И в этом месте любому здравомыслящему человеку должно стать понятно, что прогрессивные современные процессоры уже с завода разогнаны. Самую малость, ага, чуть-чуть. И ещё это трезвомыслящим людям повод для размышлений о том, насколько велики на самом деле внутри архитектурные изменения в сравнении с Pentium Pro. Если мысленно отрезать, эксперимента ради, весь кэш, то останется из внутренних отделов… ой, какое всё знакомое! Что ж ты делаешь, Интел!


> Кроме того - не умели делать компактное, массовое и эффективное охлаждение на
> подобные мощности (в серверах лучше, но звук!!!). А еще - преобразователи
> питания и управление питанием, DVFS и проч.

С чего ты взял, что не умели? Или речь про теплотрубки? Ну да, на писяках этого когда-то не было.

А схемы питания с каких пор стали рокетсаенсом? Просто не гнали первопни до тепловыделения под 300—500 Вт, как гонят i9. П-ц, натуральный же утюг.


>[оверквотинг удален]
> - DVFS, power & clock gating - позволили схемам быть быстрым в
> пике но не жрать как трамвай на холостых режимах.
> - Частоты стали выше в разы. Глобально, везде.
> - Вентиляторами научились управлять с регулировкой оборотов.
> - Сами технологии охлаждения здорово прокачали (на десктопах, в лаптопах, а теперь
> и в мобильных устройствах).
> - Шины - усовершенствовали и довольно радикально сменили парадигмы местами. Это была
> эпоха начала конца параллельных шин.
> - Оператива сейчас напрямую к процу, а не чипсету. Минус латенси гейтовки
> CPU FSB <-> RAM чипсетом.

Некоторые элементы значительно улучшены, верно, и появилось чуть нового. Но всё остальное, ты уж извини, это не рокетсаенс. И не надо тут людям вешать на уши про управление оборотами вентиляторов, смешно же читать. :)

А шины просто расширили, по сути. Никаких научно-технических прорывов не было.

Касательно ОЗУ — ты хоть сам себе честно ответь на вопрос: CL 2 и CL 20 — это сколько разницы в абсолютной скорости на уровне ячеек, и на уровне шины, и на уровне контроллера? Про эффективность так про эффективность! ;-)


>[оверквотинг удален]
> засчитан. Да, это пришлось узнать не только RF engineer'ам, но и
> цифровикам c энного момента. Как раз поэтому.
> Как ты думаешь, почему в IDE стало 80 проводов? :) Посотри на
> кабель SATA, особенно 6Gbps. Это не просто кусок провода. А дорожки
> на платах следуют хитрым паттернам и идут парами. Не просто так.
> Они все стали низковольтными, дифференциальными, более последовательными и менее синхронными
> в отличие от наивных первобытных шин сделанных "в лоб".
> А так у цифры фронты крутые - даже в "низкоскоростной" схеме уровня
> ардуины по этому поводу можно выкусить. Спроси у Зенкова какой спектр
> у прямоугольника с его фронтами.

Вот и пришлось менять параллельные шины на последовательные. Чтоб на высоких скоростях не слушать сплошное радио всеми внутренними потрохами и внешними устройствами. Радио не буквально, разумеется, а в виде помех и наводок, ибо местами на несколькогигагерцовых частотах мелкие проводники сами начинают излучать. Таки да, внутри железного ящика. :)


>> Интела обеспечить всем коммунизм^W по 10 ГГц в каждый дом?
> Таки интел лоханулся именно по линии частот и тепловыделения. Загнать кремний на
> 10ГГц как таковой можно. Но не миллиардом транзисторов, в этом случае
> он умрет по перегреву.

Загнать-то можно. Ещё в какие годы Межделмаш сделал транзистор, переключающийся на 100+ ГГц. Только с этого нет пользы, ибо на высоких частотах появляются новые факторы из-за новых физических явлений, а не только тепловое излучение.


>> Как ты думаешь, почему оперативную память делают по «морально устаревшим» техпроцессам,
>> и почему внутренняя скорость чипов памяти не растёт?
> А потому что смысла нет. Если сделать DRAM меньше по размеру элемента,
> конденсаторы DRAM начнут жутко утекать, вместо счастья случится EPIC FAIL. Этот
> эффект очень сильно долбит на мелких техпроцессах. И там где потребление
> важно, борьбе с этим посвящен целый раздел технологий power management. Потребление
> ничего не делающего тонкого чипа довольно сильно состоит из утечек. А
> когда так DRAM делает - она еще и склерозом становится. И
> чем жарче - тем лучше. Любители тырить пароли из ребутнутого компа
> - уважают жидкий азот :)

Ну вот, вроде как человек в теме и в курсе всех проблем. А за системду топит. Непостижимо. Заплатили? Скажи хоть сколько. Может и я начну писать за деньги агитпродукт за системду.


>> И накладные расходы на её обслуживание, ха-ха-ха. Старую память контроллеру обойти
>> было быстро не только потому, что её было мало. :)
> Старая память была тормозной аки трактор, неоптимальной по циклам шины, дурной по
> физике, тормозной по частотам. И работала с непотребной скоростью. Пеньку с
> EDO, да даже и с SDR SDRAM - воткнет даже 20-баксовая
> MIPSовая мыльница с DDR'ом.

Ну я не про аж такую старую. Берём 20-летней давности SDRAM типа PC-100, например.


> Таки понимаю. Это ты не понимаешь что в обозримом будущем возможно вообще
> вся память в системе станет адресуемой напрямую. Без такого понятия как
> стораж. NVDIMM тому первый звоночек, но ни разу не последний. Вообще
> идея пропихать NAND через SATA - изврат. И даже через PCI-E.
> Он логичнее смотрится замапленым напрямую в адреса, с тонким и быстрым
> слоем трансляции.

Сомневаюсь в скором наступлении этого светлого будущего. Это неэффективно с точки зрения накладных расходов для большинства применений. То есть сделать-то можно, но мало кому это на самом деле нужно. А кому нужно, те не удовлетворятся ширпотребом.

Жадные производители настолько зажрались, что распаивают на материнках лишние слоты с расшаренными линиями. Зато всё в разноцветных огнях светодидов, разукрашено в цвета китайского дракона и так далее.


> MRAM/FRAM - и подавно. Упомянутых кстати уже промышленно делают. Ramtron так по
> жизни для индустриалов делает "вечные EEPROM", Ti слегка это лицензировал для
> своих МК.

Ну, я думаю, что излишне напоминать, сколько мы читаем о «завтраках» на эту тему. А воз и ныне там. Я уже забил ждать. :)


>> Представь, что ОЗУ — это быстрый кэш, не более того.
> Скоро, похоже, сторажи станут "медленным RAM", как мне кажется. Периферия уже стала,
> она вся сплошь "memory mapped". Это удобно. И сишникам с точки
> зрения програмизма, и виртуалкам, достаточно очевидный IOMMU позволяет отрезать железку
> в VM. Делая то же что MMU, но с другой стороны.

Идея очень хорошая и плодотворная, но не с теми ячейками, которые пихают в SSD.

>> буфер между медленной долговременной памятью (диском) и процессором, то быстро ехать
>> уже не получится даже при всём желании.
> Плохо стыкуется с примером 300Мпикс картинки и процессинга ее пикселей. Вгрузить ее
> с диска 1 раз, к тому же сжатую. Декомпресс и любая
> возня с пикселями будут намного лучше, если попадут в хотя-бы RAM,
> без насилия над диском вообще. На линейных операциях характерных для обсчета
> картинок к тому же неплох даже обычный RAM. Хотя GDDR или
> HBM в GPU лучше. Но их меньше, потому что они дорогие
> и не апгрейдабельные.

В теоретической неймановской модели вся память условно одинакова и равноценна. Почему бы не править только те куски файла, которые надо, через окошко, не дёргая весь файл? Экономия налицо, причём при любых условиях. Ну понятно, что на актуальном железе память на самом деле не одинакова, не однородна, и ещё в ней есть медленные диски, а файло на них ещё и упаковано. :)


>> буферную память максимально свободной, ибо иначе придётся постоянно лезть на диск
>> за каждым ссаным байтом, пока ОЗУ будет занято тем, что «может
>> пригодиться, ведь его только что недавно закрыли».
> И тем не менее, по моему опыту, жирный дисковый буфер - делает
> работу с ОС намного приятнее. По сути превращая медленный стораж в
> подобие быстрого рамдиска. Спору нет, если все забить приложениями - эта
> иллюзия отвалится. Поэтому забивать память под завязку приложениями все же не
> стоит.

Я имел в виду всё-таки ОЗУ.


> ...но если картинка весила допустим 5 гигз, в системе было 16, то
> у меня еще 11 гигз на все такое прочее. А обсчитать
> картинку как просто массив в оперативе явно быстрее чем таскать ее
> расжатую версию из свопа с диска и чего там еще. Вот
> отлить несколько гигз на диск - это не быстро по хоть
> каким стандартам. И поэтому фотожоп с 300Мпикс картинке на первом пне
> - не упадет, но скорость его работы - заманает в край.
> В отличие от скорости работы любого редактора на машине с 16
> гигз.

Не. Не всё так просто. Руконогие эту картинку будут («а чо? память дивошая!») кэшировать и перекэшировать многократно и на каждую отмену сделанных операций и ещё на массу факторов. Поэтому всё равно памяти всегда будет мало. Простое увеличение объёма ОЗУ никак не решает проблему неэффективных алгоритмов и рук, выросших из низа спины.

Возможно, что создателям эффективных графических редакторов и файловых форматов пригодились бы знания разработчиков файловых систем, но эти ребята как-то не пересекаются между собой по роду деятельности.


>> лучше подождать дополнительных 100 мс при каждом запуске приложения, а не
>> постоянно доставать всё нужное из свопа.
> У меня нет свопа. Как максимум у меня есть zram, типа-своп в
> сжатом рамдиске. Если оперативы хронически не хватило - холодные данные можно
> попробовать закомпрессить, в надежде что вот так ее все же хватит.
> Если и так не хватит - и нафиг. Камасутра с 5-м
> фотошопом на пентиуме и 300 мпикс картинкой - не ко мне.

Идея свопа в ОЗУ спорна, но обсуждать её лень.

>> Бджд, для высокой производительности программ надо всего лишь писать производительный
>> код на максимально близком к железу уровне, вот и всё.
> С современным железом это легче сказать чем сделать. Начиная с того что
> реально код не имеет дело с блоками выполнения. Он попадает в
> uCode ROM и тот разваливает его на микрооперации, а что случится
> дальше, а также сколько и каких блоков фактически есть в том
> или ином камне - известно лишь крайне приблизительно. Кроме того -
> при чрезмерном увлечении код получается не портабельным или обладает хреновой производительностью
> на других архитектурах, если там сделано иначе.

Ну это уже вопросы, выходящие даже за те рамки, что мы тут расширяем и углубляем. :)

Пока Си и ассемблеры работают для того железа, которое сейчас у нас есть, можно принять как соглашение, что это железо внутри не изменилось со времён первых x86.

> А так то да, дрова в досе и даже 95 писали на
> асме. Было круто и быстро. Но работало только на x86. А
> нтя таки с дровами на си уже была. Поэтому и была
> неповоротливой, зато таки портированной на кучу архитектур. Этот тренд и в
> остальных системах продолжился.

А нам точно-точно  надо, чтоб работало где-то ещё? Кроссплатформенность — это непродуктивная идея, с точки потребителя. Нативный софт всегда работает лучше и быстрее.


> И так для понимания...
> - ПСП шины памяти на K6-2 (даже покруче первого пентиума) около 600Мб/сек
> была.
> - ПСП DDR3 у моего десктопа около 20 Гб/сек.
> - ПСП GPU GDDR5 под 180Гб/сек.

Согласен. А теперь ответь на мой любимый простой вопрос: почему при таком впечатляющем прогрессе новый Ворд тормозит на самом новом железе так же, как тогдашний Ворд на тогдашнем железе.


>> Нет, товарищ комсорг, не так всё было. Никто ничего не оптимизировал,
> Посмотри на эволюцию крипто и не тупи. Симметричные алгоритмы и хэширование.
> Salsa, chacha, sha-3, да даже AES... их лучше на 64-бит проце крутить.
> Больше за 1 такт обсчитывается. И вот так было везде где
> скорость счета кого-то колыхала. Будь то графические фильтры или мультимедийные кодеки
> или что там еще.

Мне до крипто никакого дела, мне есть дело только до браузеров, фотошопов и вордов.


>> ибо оптимизацию ваши товарищи по комсомолу и партии возложили на трудящихся в
>> формате регулярного похода в магазин за новым железом.
> Да ну ерунда, не все же - вебмакаки. Есть и алгоритмисты. И
> они таки тоже на 32 бита забили.

Да ладно, не по сеньке эта шапка. Забили производители железа. Как я уже говорил, фактически ADM64 это та же PAE, только «наоборот». Это не настоящая 64-битная архитектура.

Сорри, я не всё комментирую, а кусочками, нет времени.

Ответить | Правка | К родителю #523 | Наверх | Cообщить модератору

373. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Онаним (?), 14-Дек-18, 09:30 
Что да - то да, ручной paging - это жопа. Ребята просто ZX Spectrum 128K не застали, где было одно окно в 16 килобайт. Чтобы через это окно работать со всем объёмом памяти - надо было очень сильно извращаться.
Ответить | Правка | К родителю #271 | Наверх | Cообщить модератору

398. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 14-Дек-18, 15:17 
Я застал другие 8-битные железки. Тоже с банкингами и прочей камасутрой. И именно поэтому - на фоне этого УГ даже cortex M0 - masterpiece of engineering :D
Ответить | Правка | Наверх | Cообщить модератору

571. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Алексей Михайловичemail (?), 17-Дек-18, 18:51 
Да не гони. Вот я, положим, решил песню написать. Живых барабанов у меня дома нет, да и вряд ли появятся (сосед не хуже меня стреляет всё-таки), а ещё я жадный и не хочу платить сессионнику, поэтому нужны электронные. Пошёл я качать библиотеку для драм-машины, чтобы песенка всё-таки жила. Скачиваю библу, распаковываю… А там — эка невидаль! — аж целых 5 с хреном гигов чистых данных. И что-то нет у меня желания выбирать библиотеки сэмплов по разрядности моей системы.
Ответить | Правка | К родителю #263 | Наверх | Cообщить модератору

275. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 13-Дек-18, 16:35 
> Что должно произойти в 38 году? «Часы сломаются»? Это не страшно. И
> это на самом деле не зависит от адресации памяти.

А таки в результате на самом деле требуется "старшая часть" этого 32-битного счетчика. И я такой костыль вбил даже на STM32 где именно железный счетчик 32 разряда на уровне железа. Но есть (bat-backed) регистр где хранится старшая часть. Чтобы если оно дотикает до 2038 - не сдохло бы внезапно по дурной причине. А вся работа с временем таки в 64 битах. Хоть это и чуть более пухлый код на 32-бит платформе. Зато не подохнет внезапно в 2038, если к тому моменту это еще будет работать и будет кому-то надо. Потому что х...во когда железка внезапно взглюкивает по такой причине.

Ответить | Правка | К родителю #155 | Наверх | Cообщить модератору

283. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от КГБ СССР (?), 13-Дек-18, 17:05 
> А таки в результате на самом деле требуется "старшая часть" этого 32-битного
> счетчика. И я такой костыль вбил даже на STM32 где именно
> железный счетчик 32 разряда на уровне железа. Но есть (bat-backed) регистр
> где хранится старшая часть. Чтобы если оно дотикает до 2038 -
> не сдохло бы внезапно по дурной причине. А вся работа с
> временем таки в 64 битах. Хоть это и чуть более пухлый
> код на 32-бит платформе. Зато не подохнет внезапно в 2038, если
> к тому моменту это еще будет работать и будет кому-то надо.
> Потому что х...во когда железка внезапно взглюкивает по такой причине.

С этим соображением я согласен. Если часы железные, то придётся менять железо. А оно вполне может быть живо к году Г, и даже незаменимо, если прикручено к какой-нибудь домне или станку за десять миллионов зелени или к чему похуже.

Но наших серверов и персоналок этой всё не касается.

Ответить | Правка | Наверх | Cообщить модератору

299. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 13-Дек-18, 17:55 
> С этим соображением я согласен. Если часы железные, то придётся менять железо.

Часы железные. Но - время из них я перегружаю лишь эпизодически, в основном при старте после ресета и все такое. А на самом деле оно живет в 64-бит переменной которая "никогда не переполнится" (по крайней мере, я до этого не доживу, и железяка тоже). Оно апдейтится по IRQ от RTC, но софт не видит 32-бит счетчик. Он ворочает 64-бит переменную. Это удобнее и безопаснее по математике и к тому же доступ к тому 32-бит счетчику специфичный, так что 64 бита в RAM как-то менее проблемны в целом, и иметь дело с ними может оказаться еще и быстрее.

> А оно вполне может быть живо к году Г, и даже незаменимо, если прикручено к
> какой-нибудь домне или станку за десять миллионов зелени или к чему похуже.

Ну вот я не знаю заранее куда этот код и потомки этих железок будут в 2038 году прикручены и мне бы не хотелось чтобы меня вспомнили нелестным словом за такую отложенную по времени свинью. Поэтому в новых проектах этот момент я стараюсь учитывать. А хотя-бы и поступившись немного эффективностью кода. Потому что 64 бита на 32-битном ядре таки требуют больше кода. Так что с точки зрения только эффективности - меня можно за это и замесить.

Ответить | Правка | Наверх | Cообщить модератору

278. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от КО (?), 13-Дек-18, 16:48 
x32 нет, ибо там не честный x86, а с префиксами, т.е. не то не сё. Регистров больше чем в 32 битах, команды длиннее, памяти для приложения столько же. Да и толком не тестировал никто, как оно себя ведет.
Ответить | Правка | К родителю #134 | Наверх | Cообщить модератору

284. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от КГБ СССР (?), 13-Дек-18, 17:06 
> x32 нет, ибо там не честный x86, а с префиксами, т.е. не
> то не сё. Регистров больше чем в 32 битах, команды длиннее,
> памяти для приложения столько же. Да и толком не тестировал никто,
> как оно себя ведет.

Да и линукс с ним, я уже устал от этой дискуссии. :)

Ответить | Правка | Наверх | Cообщить модератору

126. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +1 +/
Сообщение от Проходил мимо (?), 13-Дек-18, 07:39 
> Я никак не могу представить себе, для чего, например, браузеру, мультимедийному проигрывателю, табличному процессору или текстовому редактору быть 64-битными. Если ты можешь назвать конкретные выгоды — назови.

Мой браузер, после того, как откроет все окна и вкладки, которыми я пользуюсь, потребляет существенно больше, чем 4Гб памяти. Так что идите вы со своими 32 битами на маршрут по умолчанию.

Ответить | Правка | К родителю #51 | Наверх | Cообщить модератору

131. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +2 +/
Сообщение от Аноним (514), 13-Дек-18, 07:53 
> Мой браузер, после того, как откроет все окна и вкладки, которыми я
> пользуюсь, потребляет существенно больше, чем 4Гб памяти. Так что идите вы
> со своими 32 битами на маршрут по умолчанию.

Твой браузер умеет работать в несколько процессов при необходимости. Проблемы могут быть только если одна вкладка выжрет 4ГиБ памяти.

Ответить | Правка | Наверх | Cообщить модератору

137. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Акакжев (?), 13-Дек-18, 08:17 
Деревья, списки и аналогичные используемые браузером структуры данных столько потребляют как раз из-за размера указателей.
Ответить | Правка | К родителю #126 | Наверх | Cообщить модератору

156. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  –2 +/
Сообщение от КГБ СССР (?), 13-Дек-18, 09:16 
> Деревья, списки и аналогичные используемые браузером структуры данных столько потребляют
> как раз из-за размера указателей.

Ну вот с некоторых пор даже в ИТ многие люди не понимают столь банальных основополагающих вещей.

Ответить | Правка | Наверх | Cообщить модератору

215. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (215), 13-Дек-18, 12:32 
> потребляет существенно больше, чем 4Гб памяти

...
> Деревья, списки и аналогичные используемые браузером структуры данных столько потребляют как раз из-за размера указателей.

Грубо говоря, если _существенно_ больше 4 ГБ и именно "из-за указателей", то, опять же очень грубо, разделив 4ГБ на два получим под 2ГБ - как раз близко к ограничению памяти для процесса на 32битной ОС (ну там конечно можно еще повыкручивать - пользовательскому процессу в выделенной виртуальной памяти отдать 3 гига, оставив 1 "технический" гиг под нужды ОС). Ну т.е. под картинки в сотнях вкладок уже ничего не останется. И не заводите шарманку про сотню открытых вкладок.

Ответить | Правка | К родителю #137 | Наверх | Cообщить модератору

225. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +1 +/
Сообщение от www2 (??), 13-Дек-18, 13:14 
У каждой вкладки своё адресное пространство, если она обслуживается отдельным процессом. Внезапно, современные Chrome и Firefox работают именно так - запускают по отдельному процессу на каждую вкладку. Можешь запустить хоть 100 вкладок, каждая из которых будет жрать по 3 гигабайта, лишь бы у тебя было столько виртуальной памяти.
Ответить | Правка | Наверх | Cообщить модератору

265. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от КГБ СССР (?), 13-Дек-18, 16:00 
> У каждой вкладки своё адресное пространство, если она обслуживается отдельным процессом.
> Внезапно, современные Chrome и Firefox работают именно так - запускают по
> отдельному процессу на каждую вкладку. Можешь запустить хоть 100 вкладок, каждая
> из которых будет жрать по 3 гигабайта, лишь бы у тебя
> было столько виртуальной памяти.

294-й не понимает, что такое виртуальная память и её адресация. И в кучу к нему этого не понимают, судя по таким дискуссиям, 2/3 анонимов опеннета.

Ответить | Правка | Наверх | Cообщить модератору

274. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (-), 13-Дек-18, 16:31 
Тот анонимус таки не 294 :P. Но общую идею вроде уловил и вещает нормально.

Как там у стругацких было? Слепил дубля, отправил его на работу. Дубль получился туповатый... как-то так, да :)

Ответить | Правка | Наверх | Cообщить модератору

165. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от нах (?), 13-Дек-18, 10:07 
мы очень рады услышать что твой браузер - раздутое шпионское bloatware, но спрашивали - зачем оно такое, и какие выгоды ты получил от того, что оно не умещается в 4G (у меня - умещается, да, вкладок около сотни, но лишь десяток регулярно используемых. Да, разумеется он не 64битный.)
Ответить | Правка | К родителю #126 | Наверх | Cообщить модератору

224. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +1 +/
Сообщение от www2 (??), 13-Дек-18, 13:11 
Твой браузер работает в 64-битной системе и по умолчанию для всего целочисленного использует не 32, а 64 бита. Если его с теми же вкладками открыть в 32-битном режиме, он может и сожрёт существенно больше 4 гигабайт памяти, но сожрёт существенно меньше, чем жрал в 64-битном режиме. А если учесть, что современные браузеры умеют работать в многопроцессном режиме, то у каждого процесса будет своё адресное пространство в 4 гигабайта. На каждую вкладку приходится по одному процессу. В 4 гигабайта двухчасовой фильм на DVD умещается. Что там в браузере в одной вкладке может быть на 4 гигабайта?
Ответить | Правка | К родителю #126 | Наверх | Cообщить модератору

174. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +3 +/
Сообщение от Nuzhnyemail (?), 13-Дек-18, 10:45 
Воинствующее невежество.
32-х битные программы на 64-битной ОС будут практически всегда работать медленнее, чем 64-х битные. Почему? Потому что для работы с этими самыми указателями надо будет производить в 2 раза больше ассемблерных инструкций (64-х битный можно просто положить в регистр одной командой). Размер указателей, как правило, очень слабо влияет на производительность, потому что программы пишутся для работы с данными, а не с указателями. Самые медленные программы - это обработка мультимедиа, архивация, научные расчёты. В них указателей мало, а самих данных много. Поэтому в случае с 64-х битыми программами поток команд уменьшается, обрабатываются данные быстрее (регистры стали больше), а в памяти по данным проигрыш совсем небольшой, на уровне погрешности.
Теперь от теории перейдём к практике:
1. Ubuntu: https://www.phoronix.com/scan.php?page=article&item=ubuntu-1...
2. Windows:
2.1. https://www.passmark.com/forum/performancetest/283-comparing...
2.2. http://www.iinuu.eu/en/it-guru/windows-7-32-vs-64-bit-perfor...

Тестирование всяких Фотошопов и т.п. ПО показывает примерно аналогичные цифры: 64-х битные программы выигрывают около 10-30%.

Готов послушать контраргументы, подкреплённые тестами.

Ответить | Правка | К родителю #51 | Наверх | Cообщить модератору

228. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +1 +/
Сообщение от Совершенно другой аноним (?), 13-Дек-18, 13:34 
> 32-х битные программы на 64-битной ОС будут практически всегда работать медленнее, чем 64-х битные.

нет, не поэтому. В архитектуре x86_64 банально вдвое больше регистров общего назначения, так-что хотя-бы за счёт этого - гораздо больше можно провести вычислений не производя чтение/запись из/в память.

> Почему? Потому что для работы с этими самыми указателями надо будет производить в 2 раза больше ассемблерных инструкций (64-х битный можно просто положить в регистр одной командой).

тут Вы неправы. В 32-х разрядной архитектуре размерность адресного пространства ограничена 4G - 32 бита, никаких доп.регистров там не требуется - при работе в 64-х разрядной ОС 32-х разрядное прикладной ПО будет ограничено 4G адресного пространства. Плюс, конечно, ОС должна знать и не выделять память сверх этого лимита.

Кстати у 64-х разрядных программ и ОС есть и свои отрицательные моменты - как минимум вдвое большее потребление памяти при сохранении восстановлении контекста как задачи так и функций, просто их, как я понимаю, нивелирует кэш.

Ответить | Правка | Наверх | Cообщить модератору

247. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Аноним (243), 13-Дек-18, 15:11 
> нет, не поэтому. В архитектуре x86_64 банально вдвое больше регистров общего назначения,
> так-что хотя-бы за счёт этого - гораздо больше можно провести вычислений
> не производя чтение/запись из/в память.

И еще гарантированный SSE2, так что можно и пачку SSE2 регистров еще приплюсовать.

> 4G адресного пространства. Плюс, конечно, ОС должна знать и не выделять
> память сверх этого лимита.

Выделить более 4 гигз при 32 битах - еще ухитриться надо. Потому что вся математика к этому очень недружелюбна.

> Кстати у 64-х разрядных программ и ОС есть и свои отрицательные моменты
> - как минимум вдвое большее потребление памяти при сохранении восстановлении контекста
> как задачи так и функций, просто их, как я понимаю, нивелирует кэш.

Реально потребление растет процентов на 15-30. Вот никто и не хочет возиться. Тем более что юзерам будет периодически падать на бошку внезапный рояль с 20 этажа, в виде например падающего граф. редактора и проч, совершенно независимо от того сколько памяти воткнуто в комп.

Ответить | Правка | Наверх | Cообщить модератору

260. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +/
Сообщение от Q2Wemail (?), 13-Дек-18, 15:45 
У меня на 32-х битах всё работает быстро, а на 64-х свопится при трёх вкладках с джирой.
Вот это вот факт.

А то, что некоторые могут купить себе вагон памяти, сути дела для меня не меняет.

Ответить | Правка | К родителю #174 | Наверх | Cообщить модератору

289. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +1 +/
Сообщение от Аноним (289), 13-Дек-18, 17:23 
http://lurkmore.to/УМВР
Ответить | Правка | Наверх | Cообщить модератору

229. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  –1 +/
Сообщение от meantraitor (?), 13-Дек-18, 13:47 
> При прочих равных 32-разрядный софт почти всегда лучше, быстрее и экономнее для ресурсов.

Заканчивайте уже с этой ерундой. Это не так, если, конечно, у программистов руки растут
откуда надо. К примеру, изо всех SPEC CPU2006 (26, что ли, их всего) только одна выиграла от
x32. Других примеров, когда x32 кому-то помогло, я не знаю.
Далее, если-таки вам в приложении нужно много указателей, но не нужно много памяти, то вам-таки
необязательно использовать указатели ;)
Возьмем, к примеру, компиляторный бэкенд, если вы знаете, что это такое. Казалось бы, в
компиляторах все на указателях (см. LLVM). Однако же, когда мы портировали один такой бэкенд
с 32- на 64-бита, потребление памяти у него увеличилось не более 10%, а работать он стал быстрее.
А все потому, что его изначально писали люди с мозгами и прямыми руками.

А не pointer-heavy приложения выигрывают от 64 бит обычно за счет большего числа регистров (и их размера) и передачи параметров через регистры, а не стек. Не говоря уже про SIMD.

Ответить | Правка | К родителю #51 | Наверх | Cообщить модератору

136. "Разработчики ядра Linux обсуждают вопрос удаления субархитек..."  +2 +/
Сообщение от Акакжев (?), 13-Дек-18, 08:12 
> пересобрал под него, не знаю, хромиум? Или firefox?

# V8 upstream said they won't support x32, bug #423815

Ответить | Правка | К родителю #43 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру