Британская фармацевтическая компания GSK воспользовалась возможностями самого большого в мире процессора компании Cerebras для изучения процессов эпигеномики — функции, контролирующей экспрессию генов или её отсутствие, и понимание того, в каких клетках происходят те или иные генетические изменения. Раскрытие механизмов эпигеномики поможет найти лекарства от множества неизлечимых болезней, с чем ИИ на новых системах могут справиться лучше человека.
Процессор Cerebras WSE-1 (16 нм) и новейший WSE-2 (7 нм) — это невообразимые до недавнего времени решения, каждый из которых изготавливается целиком из одной 300-мм кремниевой пластины. Небольшой кластер из таких процессоров способен обслуживать ИИ-модели, сравнимые по возможностям с мозгом человека. Добавьте к этому, например, базу данных по генетике, и на выходе получится система, которая способна проанализировать такой объём данных, который один человек и даже большие коллективы учёных в обозримом масштабе времени не смогут осознать.
Компания GSK воспользовалась для анализа генома и его динамики во времени системой на первом поколении процессоров Cerebras и ждёт систему второго поколения в третьем квартале этого года. Сообщается, что с помощью системы CS-1 процесс обучения EBERT (перепрофилированной нейросетевой модели BERT или «эпигеномной» BERT) занял 2,5 дня по сравнению с 24 днями на 16-узловом кластере GPU. Новая система, как ожидается, удвоит скорость обработки данных.
Исследователи утверждают, что после обучения EBERT «достигла наивысшей точности предсказания на четырёх из 13 наборов данных в промышленном эталоне под названием ENCODE-DREAM». Модель заняла третье место в общем рейтинге, и исследователи говорят, что результаты «очень многообещающие».
Проблема в том, что эпигеном человека огромен и требует колоссальных вычислительных ресурсов для моделирования или изучения на высоком уровне с помощью обычных методов. ИИ даёт возможность сократить этот путь. Предыдущие исследования дали достаточно реальных примеров влияния эпигеномики, чтобы научить компьютер делать то же самое на базе модели. Затем эта модель может быть использована для прогнозирования множества важных биологических процессов.
Источник 3dnews