Группа компаний РСК, ведущий российский разработчик и
интегратор инновационных высокоплотных и энергоэффективных
решений для высокопроизводительных вычислений (HPC,
high-performance computing), центров обработки данных (ЦОД),
облачных платформ и систем хранения данных «по требованию» (storage-on-demand),
впервые принимает участие в статусе Бронзового спонсора в
виртуальной всемирной конференции Flash Memory Summit 2020.
РСК уже более двух лет, с 2018 года, является разработчиком,
производителем и интегратором интеллектуальных систем
хранения данных «по требованию» (RSC Data Storage-on-Demand).
Такие системы уже установлены в Объединенном институте
ядерных исследований (ОИЯИ, Дубна), в Санкт-Петербургском
политехническом университете Петра Великого (СПбПУ) и
Межведомственном суперкомпьютерном центре Российской
академии наук (МСЦ РАН).
На данный момент две системы производства РСК являются
единственными представителями России в мировом рейтинге
IO500 самых высокопроизводительных систем хранения данных –
суперкомпьютер «Говорун» с системой хранения данных РСК в
ОИЯИ занимает 17-е место в этом списке, а суперкомпьютер
«Политехник – РСК Торнадо» в СПбПУ находится на 22-й
позиции. Столь хороших результатов удалось достичь благодаря
применению в обеих проектах уникальной технологии создания
масштабируемых распределённых и компонуемых «по требованию»
систем хранения данных RSC Data Storage-on-demand на основе
твердотельных дисков Intel SSD и Intel Optane SSD с
интерфейсами NVMe. Уместно напомнить, что суперкомпьютер
«Говорун» еще в июне 2018 г., сразу после установки и
запуска в эксплуатацию в ОИЯИ, занял высокое 9-е место в
мировом рейтинге IO500.
На FMS 2020 группа компаний РСК объявила о поддержке в своих
решениях RSC Data Storage-on-Demand новой кластерной
файловой системы с открытым кодом DAOS (Distributed
Asynchronous Object Storage) корпорации Intel. Теперь стало
возможным построение не только многослойных систем хранения
данных на базе файловой операционной системы Lustre в
архитектуре Composable Disaggregated Infrastructure и гибкое
управление пулами дисков с интерфейсом NVMe, но и включение
в такие слои высокопроизводительных компонент на основе DAOS.
Долгие годы, несмотря на рост номинальной производительности
устройств хранения данных, прирост обеспечивался, в
основном, за счет повышения производительности
последовательных операций чтения-записи. Использование DAOS
позволяет уйти от ограничений старых подходов к построению
высокопроизводительных систем хранения данных, связанных с
работой протокола TCP/IP, архитектурой ядра ОС Linux и ряда
других узких мест, ликвидировав так называемые «бутылочные
горлышки» для работы в тех случаях, когда приложению
необходим высокоскоростной произвольный доступ к данным.
Реализованные до настоящего момента решения на основе DAOS
требовали жестко определенного – на уровне установленной
аппаратной конфигурации – соотношения между процессорными
ресурсами, наличием энергонезависимой памяти с произвольным
доступом (Intel® Optane™ DC Persistent Memory, PMEM),
твердотельных накопителей с интерфейсом NVMe. В рамках
платформы «РСК БазИС» можно применить компонуемый подход для
управления DAOS, разделив сервера с PMEM и сервера с
устройствами NVMe в пулы, объединённые быстрой сетевой
фабрикой. Оснащение серверов высокопроизводительными
адаптерами с поддержкой RDMA с одной стороны, накопителями с
интерфейсом NVMe и части серверов – энергонезависимой
памятью Intel® Optane™ DC Persistent Memorу с другой,
позволяет произвести такую дезагрегацию и дальнейшую
компоновку «по запросу» без снижения производительности.
Какие преимущества дает такой подход? Во-первых, он
позволяет уйти от жесткого соотношения накопителей PMEM/NVMe
в серверах хранения. Во-вторых, он позволяет значительно
увеличить допустимый объем системы хранения данных. Сегодня
требования к объему PMEM в DAOS – не менее 6% от объема
локальных накопителей с интерфейсом NVMe – серьезно
ограничивают максимальное полезное количество дисков на один
сервер хранения. При этом, благодаря компонуемости,
неиспользуемые в какой-то момент времени диски можно
подключить к другому серверу на основе DAOS или Lustre.
Помимо этого, можно вообще разделить сервера с DAOS и
сервера c накопителями NVMe на два пула, тем самым
максимально устранив ограничения аппаратной архитектуры
сервера (ограниченного возможностями шины PCIe, используемой
как накопителями, так и сетевыми адаптерами, а также
физических ограничений шасси сервера по размещению
дополнительных устройств и их охлаждению).
Эти подходы будут раскрыты в докладе РСК на сессии DUG (DAOS
User Group), которая состоится 19 ноября во время крупнейшей
всемирной виртуальной конференции-выставки SC20 по
суперкомпьютерным технологиям и решениям.