The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Опубликован Vortex 3.0, открытый GPGPU на базе архитектуры RISC-V

09.06.2026 16:40 (MSK)

Доступен выпуск проекта Vortex 3.0, развивающего открытый GPGPU на базе архитектуры набора команд RISC-V, рассчитанный на выполнение параллельных вычислений с использованием API OpenCL и модели выполнения SIMT (Single Instruction, Multiple Threads). Проект также может быть использован при проведении исследований в области 3D-графики и при разработке новых архитектур GPU. Схемы, описания аппаратных блоков на языке Verilog, симулятор, драйверы и сопутствующая проектная документация распространяются под лицензией Apache 2.0.

Основу GPGPU составляет типовой ISA RISC-V, расширенный дополнительными инструкциями для поддержки функций GPU и управления потоками. Изменения в архитектуре набора команд RISC-V сведены к минимуму и по возможности используются уже имеющиеся векторные инструкции. Среди дополнительных инструкций: "tex" для ускорения обработки текстур; vx_rast для управления растеризацией, vx_rop для обработки фрагментов, глубины и прозрачности; vx_imadd для выполнения операции "умножить и сложить"; vx_wspawn, vx_split, vx_join, vx_tmc и vx_bar для активации групп потоков (wavefront), параллельно выполняемых SIMD Engine.

Развиваемый GPGPU поддерживает 32- и 64-разрядные архитектуры набора команд RISC-V RV32IMF и RV64IMAFD, и может включать опциональную разделяемую память, кэши уровней L1, L2 и L3, а также настраиваемое число ядер, блоков задач (warps) и потоков. В свою очередь для каждого ядра предусмотрена возможность включения настраиваемого числа ALU, FPU, LSU и SFU. Для создания прототипов могут использоваться FPGA Xilinx и Altera, а для симуляции работы чипа применяться Verilator (Verilog-симулятор), RTLSIM (симуляция RTL) и SimX (программная симуляция).

Для разработки приложений предлагается инструментарий, включающий адаптированные для работы с Vortex варианты PoCL (компилятор и runtime OpenCL), LLVM/Clang, GCC и Binutils. Проектом поддерживается спецификация OpenCL 1.2 и через трансляцию в OpenCL реализована поддержка промежуточного представления шейдеров SPIR-V.

Среди изменений в Vortex 3.0:

  • Добавлен аппаратный графический стек, включающий блоки для растеризации, наложения текстур и слияния вывода (OM - Output Merger). Для Mesa на базе реализованного графического стека и программного растеризатора lavapipe подготовлен Vulkan-драйвер vortexpipe.
  • Расширены возможности тензорного ядра, предназначенного для ускорения выполнения моделей машинного обучения, в котором реализована поддержка структурной разрежённости (structured sparsity) для сжатия весовых матриц.
  • Реализована операция WGMMA (warpgroup-level matrix multiplication) для умножения матриц в асинхронном режиме.
  • Добавлен движок DXA (Data Transfer Acceleration) для ускорения передачи данных из глобальной в локальную память.
  • Реализована новая архитектура на базе процессора команд (CP, Command Processor) и аппаратного планировщика вычислительных ядер (KMU - Kernel Management Unit), позволяющая вынести на сторону чипа операции диспетчеризации вычислительных потоков.
  • Предложена новая runtime-библиотека, работающая в неблокирующем режиме и предоставляющая абстракции, транслируемые в аппаратные асинхронно выполняемые команды. Поддерживаются очереди, события, модули и синхронизация на базе асинхронных барьеров с семантикой arrive/wait/event.
  • Добавлена поддержка укороченных инструкций RISC-V (RVC).
  • Реализована аппаратная поддержка атомарных операций (Hardware Atomics).
  • Полностью переработан FPU и предложены новые блоки умножителей (Wallace-tree, Folded-radix) и сумматоров (Kogge-Stone).
  • Добавлен стек виртуальной памяти на базе блока управления памятью (MMU) с поддержкой 32-битной архитектуры виртуальной адресации SV32.
  • Поддержка RISC-V расширения Zicond c реализацией условных операций.
  • Интегрировано управление тактовой частотой (clock gating).
  • Реализована поддержка языка HIP (Heterogeneous Interface for Portability) через фреймворк chipStar, транслирующий HIP в SPIR-V.
  • Обеспечена полноценная интеграция с симулятором GEM5 и добавлена поддержка симулятора SimX на архитектуре TLM (Transaction-Level Modeling).
  • Добавлена поддержка инструментариев Synopsys и Yosys для синтеза логики для производства чипов, а также поддержка использования библиотек стандартных элементов ASAP7 (7nm), SAED14 (14nm) и NanGate (15nm).
  • Эталонный инструментарий обновлён до LLVM 20 и POCL 7.0.


  1. Главная ссылка к новости (https://github.com/vortexgpgpu...)
  2. OpenNews: Компания AMD открыла модуль ядра GIM для виртуализации GPU
  3. OpenNews: NVIDIA опубликовала движок PhysX 5.6.0 и открыла код Flow GPU
  4. OpenNews: Проект VeriGPU развивает открытый GPU на языке Verilog
  5. OpenNews: Представлен RV64X, открытый GPU на базе технологий RISC-V
  6. OpenNews: Открытый GPU Nyuzi задействован для научных исследований
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/65652-vortex
Ключевые слова: vortex, gpu, riscv
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (8) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.2, Аноним (2), 17:09, 09/06/2026 [ответить]  
  • +/
    >Проектом поддерживается спецификация OpenCL 1.2

    Маловато будет...
    https://en.wikipedia.org/wiki/OpenCL#Version_support

     
     
  • 2.5, Фамилия (?), 19:35, 09/06/2026 [^] [^^] [^^^] [ответить]  
  • +/
    Там же на вики написано, что 3.0 основывается на 1.2. Всё что сверх 1.2 - опциональные фичи:
    > OpenCL 1.2 functionality has become a mandatory baseline, while all OpenCL 2.x and OpenCL 3.0 features were made optional.

    Так что нормально. Базу реализовали - значит уже можно работать.

     

  • 1.4, Аноним (4), 19:25, 09/06/2026 [ответить]  
  • +/
    Осталось немного: где заказать в железе?
     
     
  • 2.6, 12yoexpert (ok), 19:39, 09/06/2026 [^] [^^] [^^^] [ответить]  
  • +/
    там же, где и все подобные проекты
     
  • 2.8, Аноним (-), 19:48, 09/06/2026 [^] [^^] [^^^] [ответить]  
  • +/
    >  Осталось немного: где заказать в железе?

    А где денег хватит - там и заказывай. Хоть на TSMC, если бабок на пуск в производства хватает. Просто они на мелочи не размениваются и денег потребуется - изрядно.

     
  • 2.9, Фамилия (?), 19:49, 09/06/2026 [^] [^^] [^^^] [ответить]  
  • +/
    Чтобы это было в железе, надо чтобы кто-то сделал трансляцию в требуемый техпроцесс. Вам какой? 90 нм, 65 нм, ... Может, 1 нм, чего уж мелочится?

    Хорошо, с техпроцессом определились. Что теперь? Осталось всего лишь сделать заказ!
    Вам сколько миллионов чипов? 1, 10, 100? Ок, пусть 100 миллионов будет.

    Ждём...

    И так, пластины готовы. Надо бы их нарезать. Ну ладно, там нам и нарежут. Ну или в крайнем случае сами ножничками аккуратно.

    Окей. Предположим, что нам ещё и закорпусировали и отбраковали.

    Всё, вот они чипы, готовые к запайке. Не 100 миллионов, потому что брак и всё такое.

    Дальше что?

    Надо бы печатную платку под чип сделать. Напаять туда память, питание... С памятью-то определились уже? Как нет? Ну ладно, пусть будет топовая GDDR7.

    Ну всё, фух. Пропустим мелочи, пусть уже всё на печатной плате с PCI-E 8.0 x16.
    Ура!

    Предположим, там и драйвера под винду уже написаны.

    Всё, вставили карточку, скачали и установили дрова.
    Запускаем крузис и о да, 5 FPS.

    Ах да, с вас 10 миллиардов долларов.

     
  • 2.10, Аноним (2), 19:52, 09/06/2026 [^] [^^] [^^^] [ответить]  
  • +/
    >где заказать в железе?

    Если не секрет, для каких задач хотите взять ?

     

  • 1.7, Аноним (-), 19:47, 09/06/2026 [ответить]  
  • +/
    > Интегрировано управление тактовой частотой (clock gating).

    Вообще-то это - отключение клока совсем. Для экономии питания ессно.

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2026 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру