Опытная партия памяти UPMEM была представлена летом прошлого года. Разработчик выпустил 8-Гбайт модули DDR4-2400 RDIMM (ECC), каждый из которых опирался на 4-Гбит микросхемы DRAM с 8 встроенными процессорами DPU (data processing unit). То есть каждый модуль такой памяти был вооружён 128 процессорами для первичной обработки данных прямо на кристаллах памяти.
Важно отметить, что память UPMEM полностью совместима с имеющимся оборудованием. Модификации требуют только некоторые программные библиотеки, но они не очень большие, всего несколько сотен строк кода. Зато потом штатные платформы на процессорах Intel Xeon могут получить многократный рост производительности и снижение итогового энергопотребления без увеличения объёма памяти.
Свежим пресс-релизом разработчик поделился бенчмарками работы системы с процессорами Intel Xeon на памяти UPMEM в приложении для анализа генома человека и при индексном поиске. Работа инструмента GATK (Genome Analysis Toolkit) для составления генетической карты и анализа отклонений на массиве памяти UPMEM прошла в 10 раз быстрее, чем на аналогичном по объёму массиве обычной памяти DDR4.
Поскольку фрагменты генома обрабатывались прямо в памяти, это привело к росту пропускной способности в 11 раз. Всё вместе сопровождалось снижением потребления в 6 раз в пересчёте на пропускную способность. При этом надо отметить, что модуль UPMEM потребляет в два раза больше энергии, чем обычный модуль памяти без встроенных процессоров.
Запуск индексного поиска также показал преимущество встроенной в память первичной обработки данных. На массиве памяти UPMEM запрос распараллеливался по всем чипам и там обрабатывался встроенными процессорами вместо того, чтобы загружать данные в центральный процессор и только там их обрабатывать. Как результат, задержки в обработке снизились в 35 раз, а пропускная способность выросла в 11 раз. Потребление при выполнении этой задачи оказалось также в 6 раз меньше, чем с использованием обычной памяти.
Результаты реальных тестов памяти UPMEM оказались несколько меньше теоретически обоснованных. Ранее разработчик заявлял о 10-кратном снижении потребления, тогда как на деле потребление снизилось в 6 раз. Но даже это выглядит превосходным результатом. При этом скорость работы приложений выросла на порядок, что окажет услугу учёным и человечеству при расшифровке генома и ускорит поиск информации удалёнными клиентами.