На первой конференции разработчиков компания OpenAI представила GPT-4 Turbo — усовершенствованную версию своей флагманской крупномасштабной языковой модели. Разработчики OpenAI утверждают, что новая GPT-4 Turbo мощнее GPT-4 и в то же время дешевле.
Языковая модель GPT-4 Turbo выпускается в двух версиях: предназначенная для анализа текста и понимающая контекст изображений, а также текст. С сегодняшнего дня модель для анализа текста доступна в виде предварительной версии через API. Компания обещает, что обе версии нейронной сети будут доступны широкой публике «в течение нескольких недель».
Стоимость GPT-4 Turbo составляет 0,01 долл. за 1 000 входных лексем (примерно 750 слов) и 0,03 долл. за 1 000 выходных лексем. Входные лексемы представляют собой фрагменты необработанного текста. Например, слово «fantastic» разбивается на лексемы «fan», «tas» и «tic». Выходные лексемы — это лексемы, сгенерированные моделью на основе входных лексем. Стоимость GPT-4 Turbo для обработки изображений зависит от размера изображения. Например, стоимость изображения размером 1080 x 1080 пикселей, обработанного GPT-4 Turbo, составляет 0,00765 долл.
«Мы оптимизировали производительность, поэтому можем предлагать GPT-4 Turbo по цене в три раза дешевле для входных токенов и в два раза дешевле для выходных токенов по сравнению с GPT-4», — сообщила OpenAI в своём блоге.
Для GPT-4 Turbo обновлена база знаний: языковая модель GPT-4 обучена на веб-данных до сентября 2021 года; предел знаний для GPT-4 Turbo — апрель 2023 года. Иными словами, запросы, связанные с недавними событиями (до апреля 2023 года), нейронная сеть отвечает точнее. На основе многочисленных примеров из Интернета GPT-4 Turbo была обучена предсказывать вероятность появления определенных слов на основе закономерностей, связанных с семантическим контекстом окружающего текста. Например, если типичное электронное письмо имеет вид «Я с нетерпением жду… .», то GPT-4 turbo будет заканчивать его словами «. . ваш ответ».
В то же время модель GPT-4 Turbo обладает расширенным контекстным окном (объемом текста, учитываемого в процессе генерации). Контекстное окно модели GPT-4 Turbo составляет 128 000 фраз, что в четыре раза больше, чем у GPT-4. Это самое большое контекстное окно среди всех представленных на рынке моделей ИИ. Оно превышает контекстное окно модели Claude 2 компании Anthropic, которая поддерживает до 100 000 лексем. Контекстное окно в 128 тыс. токенов примерно равно 100 тыс. слов или 300 страницам текста, что эквивалентно роману Эмили Бронте «Грозовой перевал», «Путешествиям Гулливера» Джонатана Свифта, «Гарри Поттер и узник» Дж.К. Роулинг и «Бэтмен: Скайфолл». Potter and the Prisoner of Azkaban», которые имеют одинаковую длину.
Модель GPT-4 Turbo генерирует корректный формат JSON, который, по мнению OpenAI, полезен для веб-приложений, передающих данные, например, для тех, которые отправляют данные с сервера на клиент для отображения на веб-странице. Вся настройка GPT-4 Turbo является более гибкой, что полезно для разработчиков. Более подробную информацию можно найти в блоге OpenAI.
«GPT-4 Turbo работает лучше, чем наши предыдущие модели, при выполнении задач, требующих тщательного следования инструкциям, таких как генерация определённых форматов (например, “всегда отвечать в XML”). Кроме того, GPT-4 Turbo с большей вероятностью вернёт правильные параметры функции», — сообщает компания.
GPT-4 Turbo также может быть интегрирован с DALL-E 3, функциями синтеза речи и визуального распознавания для расширения спектра приложений искусственного интеллекта.
OpenAI также объявила, что будет предоставлять гарантии защиты авторских прав бизнес-пользователям в рамках своей программы Copyright Shield.
«Мы теперь будем защищать наших клиентов и оплачивать понесённые расходы, если они столкнутся с юридическими претензиями о нарушении авторских прав», — заявила компания в своём блоге.
Ранее аналогичные меры защиты пользователей своих моделей ИИ приняли компании Microsoft и Google. Защита авторских прав распространяется на общедоступные функции платформ разработчиков ChatGPT Enterprise и OpenAI.
В отличие от программы тонкой настройки для предшественника GPT-4 — GPT-3.5, компания инициировала программу тонкой настройки для GPT-4, чтобы предоставить разработчикам больше инструментов для настройки ИИ под конкретные задачи. По словам компании, программа тонкой настройки потребовала более тщательного контроля и руководства со стороны OpenAI, в основном из-за технических сложностей.
Компания также удвоила лимит скорости ввода/вывода токенов в минуту для всех платных пользователей GPT-4. Цены остались прежними: 0,03 долл. за входной токен и 0,06 долл. за выходной токен (для моделей GPT-4 с 8 000 контекстных окон) или 0,06 долл. за входной токен и 0,012 долл. за выходной токен (для моделей GPT-4 с 32 000 контекстных окон). (если 32 000 контекстных окон).
Источник 3dnews