Развитие искусственного интеллекта стимулирует производителей чипов непрерывно улучшать процессоры для повышения производительности и эффективности. Согласно информации из SCMP, учёные из Университета Цинхуа создали первый в мире оптический чип для задач ИИ. Этот чип получил название Taichi II, и его работа основана на использовании света, что делает моделирование и обучение более эффективными.
Новый чип базируется на предыдущей модели Taichi, которая, по утверждению разработчиков, более чем в 1000 раз превосходит по производительности процессор NVIDIA H100. Если для работы Taichi требовались электронные компоненты, то после выпуска второй версии чипа потребность в них отпала.
Исследователи утверждают, что их разработка стала значительным шагом вперёд в направлении широкого применения оптических вычислений в экспериментах. Это позволит удовлетворить постоянно растущую потребность в высокопроизводительных и энергоэффективных вычислительных мощностях.
Согласно проведённым тестам, мощность Taichi-II значительно превышает мощность своего предшественника. Это ускоряет обучение оптических сетей с миллионами параметров и повышает точность задач классификации на 40%. В области визуализации сложных сценариев энергоэффективность Taichi-II при слабом освещении улучшилась на шесть порядков.
Разработчики отмечают, что традиционные методы оптического ИИ обычно включают в себя эмуляцию электронных искусственных нейронных сетей на основе фотонной архитектуры (основанной на свете), разработанной на электронных компьютерах.
«Из-за несовершенства системы и сложности распространения световых волн идеально точное моделирование общей оптической системы невозможно, и между автономной моделью и реальной системой всегда возникает несоответствие», — рассказали учёные.
Для решения этих проблем команда создала метод, в котором интенсивный процесс компьютерного обучения выполняется прямо на оптическом чипе, благодаря чему большая часть машинного обучения может происходить параллельно. Они назвали этот метод «обучение в полностью прямом режиме» (FFM).
«Эта архитектура обеспечивает высокоточное обучение и поддерживает обучение крупномасштабных сетей», — пишет Сюэ Чживэй, ведущий автор исследования.
Технология FFM использует преимущества доступных на рынке высокоскоростных оптических модуляторов и детекторов и может превзойти графические процессоры в вопросах ускоренного обучения.
По материалам:
trashbox