AWS объявила о запуске модели потребления EC2 Capacity Blocks for ML, которая предоставляет предприятиям возможность резервирования доступа к ускорителям вычислений для работы с ИИ. Эта модель предназначена для обработки кратковременных рабочих нагрузок в области ИИ.
Amazon EC2 Capacity Blocks for Machine Learning позволяет клиентам зарезервировать ускорители NVIDIA H100 для работы с машинным обучением. Они могут указать желаемый размер кластера, период использования и AWS предоставит им доступ к необходимым ресурсам. Это позволяет клиентам получить более эффективное использование ресурсов и снизить затраты, а также повышает предсказуемость доступности ресурсов для AWS.
Amazon EC2 Capacity Blocks предлагает кластеры с различным количеством инстансов EC2 P5, от 1 до 64. Эти кластеры можно зарезервировать на период от 1 до 14 дней. Они идеально подходят для обучения, тюнинга моделей ИИ, краткосрочных экспериментов и обработки пиковых нагрузок. Например, их можно использовать при запуске нового продукта.
Аналитик Constellation Research Inc. Хольгер Мюллер высоко оценил новую модель потребления AWS, назвав ее инновационным решением, которое позволяет максимально эффективно использовать ограниченные ресурсы ускорителей вычислений. Он отметил, что этот подход напоминает модель, используемую в мейнфреймах в 1970-х годах. В то время доступ к ресурсам распределялся между сотнями пользователей с разными рабочими нагрузками в зависимости от времени.
Чтобы воспользоваться новым решением AWS, клиенты могут использовать консоль AWS, интерфейс командной строки (CLI) или Software Development Kit (SDK). Оплата производится только за время, на которое были зарезервированы ресурсы. На данный момент решение доступно в регионе Восток США (Огайо), но в будущем планируется его расширение на другие регионы и зоны AWS.
Источник servernews