NVIDIA и Mistral AI анонсировали языковую модель Mistral NeMo 12B для корпоративного использования

NVIDIA и французская компания Mistral AI представили большую языковую модель (LLM) Mistral NeMo 12B, разработанную специально для решения разнообразных задач корпоративного уровня, таких как создание чат-ботов, обобщение данных и работа с программным кодом.

Модель Mistral NeMo 12B содержит 12 миллиардов параметров и использует контекстное окно размером в 128 тысяч токенов. Для инференса используется формат данных FP8, что, согласно утверждениям разработчиков, позволяет уменьшить объём необходимой памяти и ускорить развёртывание без потери точности ответов.

Во время обучения модели использовалась библиотека Megatron-LM, которая является частью платформы NVIDIA NeMo. Было задействовано 3072 ускорителя NVIDIA H100 на платформе DGX Cloud. Сообщается, что Mistral NeMo 12B успешно решает сложные задачи, такие как многоходовые диалоги, математические проблемы и программирование. Эта модель обладает «здравым смыслом» и «мировыми знаниями». В целом, отмечается точность и надёжность работы модели в различных приложениях.

Модель выпущена под лицензией Apache 2.0 и предлагается в виде NIM-контейнера. По словам разработчиков, внедрение LLM занимает всего несколько минут, а не дней. Для запуска модели достаточно одного ускорителя NVIDIA L40S, GeForce RTX 4090 или RTX 4500. Основные преимущества использования NIM включают высокую эффективность, низкую стоимость вычислений, безопасность и конфиденциальность.

По материалам:

servernews

Вам может понравиться

Пн	Вт	Ср	Чт	Пт	Сб	Вс
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Главные новости

NVIDIA представила NVQLink для объединения квантовых и графических вычислений, поддерживая 17 разработчиков квантовых компьютеров и девять научных лабораторий

IBM добилась прорыва в квантовых вычислениях

Представлен суперчип NVIDIA GB10 для DGX Spark, разработанный совместно с MediaTek

NVIDIA и Mistral AI анонсировали языковую модель Mistral NeMo 12B для корпоративного использования

Главные новости

НОВОСТИ ПО ТЕМЕ:

Добавить комментарий Отменить ответ

Вам может понравиться