Компания «Яндекс» открыла доступ к Instruct-версии обновлённой языковой модели YandexGPT 5 Lite, которую можно использовать как в некоммерческих, так и в коммерческих целях. Алгоритм будет полезен для разных людей, например, для разработчиков и исследователей, поскольку его можно сразу внедрить в собственный проект.
ИИ-модель не слишком требовательна к вычислительным ресурсам, поэтому её можно протестировать на собственном компьютере без необходимости использования дополнительного оборудования. Отмечается, что помимо предварительного обучения ИИ-модель прошла дополнительный этап настройки, благодаря чему она способна выполнять конкретные задачи по промптам (пользовательским инструкциям или запросам). Другая версия YandexGPT 5 Lite (Pretrain) не проходила этот этап, поэтому пользователям придётся дообучать её под свои задачи самостоятельно.
Результаты тестирования YandexGPT 5 Lite Instruct указывают на то, что алгоритм близок по результатам к китайской нейросети Qwen2.5-7B-Instruct и превосходит её при выполнении задач классификации и разметки текстов, в знании русской культуры и фактов, умении отвечать в заданном формате. Замеры «Яндекса» методом слепого сравнения (Side by Side) показали, что YandexGPT 5 Lite в 62 % случаев превосходит Qwen2.5-7B-Instruct и по качеству ответов сравнима с GPT-4o Mini в решении стандартных задач сервисов «Яндекса».
Вместе с этим была обновлена лицензия ИИ-модели, теперь её можно задействовать в любых целях, в том числе в коммерческих (при условии, что объём выходных токенов не превышает 10 млн в месяц). В компании считают, что такого объёма достаточно для чат-ботов на небольших и средних сайтах, генерации описаний товаров в интернет-магазинах с ограниченным ассортиментом, автоматизации ответов клиентам в сервисных центрах и др.
Модель YandexGPT 5 Lite включает 8 млрд параметров и поддерживает контекст до 32 тыс. токенов. По данным разработчиков, компактность и качество алгоритма, совместимость с библиотекой llama.cpp и поддержка формата GPT-Generated Unified Format делают возможным запуск ИИ-модели даже на персональных компьютерах. Разработчикам и исследователям Instruct-версия модели доступна на Hugging Face, а простые пользователи могут протестировать алгоритм в чате с «Алисой» (доступно 5 бесплатных запросов в день). Для бизнеса ИИ-модель доступна через соответствующий API в Yandex Cloud.