Профиль: Аноним (вход | регистрация) неRU opennet.me  
The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Однострочное изменение в GCC привело к ускорению на 12% в одном тесте и замедлению на 14% в другом"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Однострочное изменение в GCC привело к ускорению на 12% в одном тесте и замедлению на 14% в другом"  +/
Сообщение от opennews (??), 24-Июн-26, 19:03 
Инженер из компании Intel внёс в набор компиляторов GCC однострочное изменение, увеличивающее вес неверного предсказания ветвления на процессорах x86. Изменение позволило повысить производительность генерируемого кода при прохождении теста 544.nab_r  на  12.7% при включении в  оптимизаций "-O2 -mtune=graniterapids" для CPU Intel Granite Rapids/Xeon 6 и на 12.1% при включении в оптимизаций "-O2 -mtune=znver5" на CPU AMD Zen5...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=65757

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

2. Сообщение от Аноним (2), 24-Июн-26, 19:14   –13 +/
Инженер из интел ускорил интел и замедлил амд? It's fine.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #3

3. Сообщение от Аноним (3), 24-Июн-26, 19:17   +5 +/
Вы хоть осильте прочитать то, "комментаторы".
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2 Ответы: #4, #5, #10, #19

4. Сообщение от Аноним (2), 24-Июн-26, 19:20   +2 +/
-mtune=znver5

what seems to be the officer, problems?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3 Ответы: #8

5. Сообщение от Аноним (5), 24-Июн-26, 19:20   +/
Но именно это там и написано.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3 Ответы: #6, #7

6. Сообщение от Аноним (6), 24-Июн-26, 19:21   +/
Нет
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5 Ответы: #22

7. Сообщение от Аноним (3), 24-Июн-26, 19:23   +1 +/
Повышение для CPU Intel Granite Rapids/Xeon 6 на 12.7%
Повышение на 12.1% при включении в оптимизаций на CPU AMD Zen5
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5 Ответы: #9

8. Сообщение от Rev (ok), 24-Июн-26, 19:24   +/
А ещё замедлило и дженерик x86:
-mtune=generic -march=x86-64-v3
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4 Ответы: #21

9. Сообщение от Аноним (2), 24-Июн-26, 19:39   +1 +/
это для теста 544.nab_r, прочитайте про тест Hint в третьем абзаце
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #7 Ответы: #11

10. Сообщение от Аноним (10), 24-Июн-26, 19:48   +/
Да, автор изначального комментария не прочитал текст полностью, но я в голосину проорал с его комментария
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3 Ответы: #14

11. Сообщение от Аноним (3), 24-Июн-26, 19:48   –1 +/
Да я всё прочитал и заголовок и четыре абзаца текста.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #9 Ответы: #18

13. Сообщение от хрю (?), 24-Июн-26, 20:33   +/
>struct processor_costs i386_cost = {    /* 386 specific costs */
>struct processor_costs i486_cost = {    /* 486 specific costs */
>struct processor_costs pentium_cost = {

Внушает +)))

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #17, #20

14. Сообщение от Аноним (14), 24-Июн-26, 20:37   +/
Автор читал оригинальную переписку. Проблема обнаружилась на AMD, где представитель компании ответил, что они OK с этим.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #10

17. Сообщение от Аноним (17), 24-Июн-26, 20:56   +1 +/
> Внушает +)))

Да не, там еще и высокоуровневые оптимизации есть, правда на диалекте лиспа:


/* Optimize (X + (X >> (prec - 1))) ^ (X >> (prec - 1)) into abs (X).  */
(simplify
(bit_xor:c (plus:c @0 (rshift@2 @0 INTEGER_CST@1)) @2)
(if (ANY_INTEGRAL_TYPE_P (TREE_TYPE (@0))
      && !TYPE_UNSIGNED (TREE_TYPE (@0))
      && wi::to_widest (@1) == element_precision (TREE_TYPE (@0)) - 1)
  (abs @0)))

и высокоуровневое описание железок на нем же:
https://github.com/gcc-mirror/gcc/blob/master/gcc/config/gcn...
https://github.com/gcc-mirror/gcc/blob/master/gcc/config/arm...
и промежуточные представления типа GIMPLE и RTL с оптимизацией там же.

Вот на этом фоне особенно з̵а̵б̵а̵в̵л̵я̵ю̵т̵ внушают классические опеннетные разглагольствования на тему "сишечка потому и быстрая, потому что простая и любой настоящий ш̵о̵т̵л̵а̵н̵д̵е̵ц̵ погроммист может предсказать геренируемый машинный код!" 😀

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #13

18. Сообщение от Аноним (2), 24-Июн-26, 20:59    Скрыто ботом-модератором+1 +/
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #11

19. Сообщение от Аноним (21), 24-Июн-26, 21:06   +/
> на 30% медленнее при сборке с опциями "-march=generic -mtune=znver5"
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3

20. Сообщение от Аноним (3), 24-Июн-26, 21:07   +/
https://en.wikipedia.org/wiki/GNU_Compiler_Collection#Archit...
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #13

21. Сообщение от Аноним (21), 24-Июн-26, 21:07   +/
> А ещё замедлило и дженерик x86

Какое необычное нововведение от инженера интела!

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8 Ответы: #24

22. Сообщение от Аноним (21), 24-Июн-26, 21:08   +/
... на 30% медленнее при сборке с опциями "-march=generic -mtune=znver5"
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6

23. Сообщение от Bottle (?), 24-Июн-26, 21:09   +/
То есть аппаратура стала настолько сложной, что в ней неспособны досконально разобраться даже штатные инженеры?
Как мы должны читать эту новость?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #25

24. Сообщение от Аноним (3), 24-Июн-26, 21:10   +/
А вы представитель сообщества и уже предложили свои изменения ?
Думали комментарием отделаться, нет уж идите пишите!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #21

25. Сообщение от Ivan_83 (ok), 24-Июн-26, 21:35   +/
Проблема в том что процессоры сильно разные, и что на одном даёт ускорение на другом приводит в замедлению.
В итоге авторы софта если совсем упарываются то могут кучу оптимизированных версий кода иметь под разные процы, а авторы компиляторов стараются делать как в среднем лучше.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #23


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2026 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру