Meta* объявила о новом методе сжатия аудио EnCodec, основанном на технологиях искусственного интеллекта. Он обеспечивает 10-кратное сжатие со скоростью 64 кбит/с без потери качества. По словам компании, этот метод также может значительно улучшить качество звучания речи при соединениях с низкой пропускной способностью.
Компания описывает EnCodec как трёхступенчатую систему. Сначала идёт преобразование несжатых данных в специальный формат с более низким битрейтом. Затем алгоритм сжимает полученный формат до необходимого размера, при этом сохраняя наиболее важную информацию, которая позже будет использована для восстановления исходного сигнала. И, наконец, кодек преобразует сжатые данные обратно в аудио в режиме реального времени, используя нейронную сеть.
Стоит отметить, что использование нейронной сети для подобных целей — далеко не ново. Однако исследователи Meta* полагают, что они стали первыми, кто применил данную технологию к стереозвуку с частотой 48 кГц, что особенно характерно для музыкальных файлов в интернете.
Также компания отметила важную роль EnCodec в метавселенной — в конечном счёте она принесёт «богатый опыт работы, не требуя значительного улучшения пропускной способности». Но пока технология находится на стадии исследования.
*Компания Meta признана экстремистской организацией на территории РФ
Источник 4pda