Компания Tesla в ходе конференции по компьютерному зрению и распознаванию образов CVPR 2021 обнародовала информацию о новом вычислительном комплексе, который используется для обучения ИИ-моделей, отвечающих за работу средств автопилотирования в электромобилях.
Система, о которой идёт речь, является третьим вычислительным кластером Tesla. Этот суперкомпьютер использует акселераторы NVIDIA A100 с тензорными ядрами, обеспечивающие высочайшую производительность при решении задач, связанных с алгоритмами ИИ и глубокого обучения. Теоретическое пиковое быстродействие этой системы достигает 1,8 Эфлопс (FP16).
Кластер содержит 720 узлов, каждый из которых оборудован восемью ускорителями A100 с 80 Гбайт памяти. Таким образом, в общей сложности задействованы 5760 акселераторов. Комплекс имеет NVMe-хранилище для «горячих» данных суммарной ёмкостью 10 Пбайт и с пропускной способностью 1,6 Тбайт/с. Узлы объединены сетевой фабрикой на 640 Тбит/с.
По оценкам компании, уровень производительности системы позволяет ей войти в пятёрку самых быстрых суперкомпьютеров нынешнего рейтинга TOP500. Между тем Tesla продолжает работы над следующим суперкомпьютером экзафлопсного класса Dojo, который тоже может стать одним из лидеров следующего списка TOP500. Эту систему планируется запустить в эксплуатацию к концу текущего года.