Вычислитель с ультравысокой многопоточностью "Политехник - РСК ПетаСтрим"

Задача повышения производительности вычислительных систем решается посредством применения различных ускорителей вычислений и роста их многопоточности. В 2013 году компания "РСК Технологии" представила инновационную вычислительную систему, построенную на базе сопроцессоров Intel Xeon Phi. Совместимость команд этого процессора с командами процессоров архитектуры x86 значительно упрощает задачу адаптации исходного кода громадного числа приложений архитектуре такого суперкомпьютера.

Вычислитель "Политехник - РСК ПетаСтрим" - первая в России масштабная реализация архитектуры многопоточного вычислителя на сопроцессорах Intel Xeon Phi. Он включает в себя:

  • 288 однопроцессорных узлов с пиковой производительностью 1 ТФлопс каждый;
  • 17280 многопоточных ядер общего назначения (69120) потоков), поддерживающих векторную обработку данных посредством аппаратно реализованных инструкций FMA (Fused Multiply-Accumulate);
  • оперативная память узла - 8 ГБ, GDDR5; суммарный объём оперативной памяти системы 2304 ГБ;
  • конструктивно 8 узлов объединены в один корпус и образуют вычислительный модуль;
  • все модули объединены сетm. InfiniBand в группу с неблокируемыми обменами;
  • узлы системы имеют доступ к единой системе хранения СКЦ через сеть InfiniBand;
  • пропускная способность между двумя узлами модуля системы на тесте MPI OSU или Intel MPI Benchmarks не менее 6 ГБ/с;
  • число передаваемых сообщений между двумя узлами модуля на тесте MPI OSU составляет не менее 15 миллионов в секунду;
  • пиковая производительность вычислительной системы - 288 ТФлопс;
  • пиковое энергопотребление не более 100 кВт;
  • отвод теплопритоков реализуется посредством прямого жидкостного охлаждения.

На суперкомпьютере "Политехник - РСК ПетаСтрим" особенно эффективно выполняются приложения, оптимизированные для работы с большом количеством потоков. Именно такая система была необходима для решения задачи численного моделирования процессов столкновения и эволюции галактик, выполненном на этом компьютере сотрудниками ИВМиМГ СО РАН. Разработанный ими код AstroPhi показал 75% эффективность масштабирования (отношение идеального и реального времен расчета при использовании n процессоров Intel Xeon Phi), а задействованные при решении задачи 224 узла обеспечили поддержку более 50 000 потоков.
Путь к экзафлопсу, скорее всего, лежит через вычислители на процессорах с ультравысокопоточной архитектурой, которая реализована в системе "Политехник - РСК ПетаСтрим". Подтверждением этому служит проект Aurora, предусматривающий создание к 2019 году суперкомпьютера производительностью близкой к 200 ПФлопс на сопроцессорах Intel Xeon Phi.