Наука и техника

Новый генератор изображений KOALA в 8 раз быстрее OpenAI

Южнокорейские учёные создали новый искусственный интеллект (ИИ), который способен генерировать изображения менее чем за две секунды. Инструмент, основанный на дистилляции знаний, по сути сжал генератор изображений Stable Diffusion XL, тем самым сократив число параметров с 2,56 миллиардов до 700 миллионов.

Это означает, что самая компактная версия ИИ под названием KOALA не требует дорогостоящего оборудования, но при этом работает быстро и качественно. Дистилляция знаний по сути позволила перенести знания из большой модели в маленькую без ущерба производительности, поэтому выполнение вычислений занимает гораздо меньше времени. Такой ИИ может позволить себе практически кто угодно, поскольку он требует всего 8 ГБ оперативной памяти и недорогую видеокарту для обработки запросов.

Сравнение других ИИ с KOALA.© ETRI

Команда продемонстрировала возможности своей системы ещё в декабре 2023 года, а затем сделала ИИ доступным через репозитарий с открытым исходным кодом. Всего было создано пять версий KOALA, три из которых генерируют изображения на основе текста, а две под названием Ko-LLaVA отвечают картинками на вопросы.

В итоге во время тестирования KOALA сгенерировала изображение на основе подсказки «астронавт, читающий книгу под луной на Марсе» за 1,6 секунды. Создатели нового ИИ утверждают, что их система намного быстрее DALL-E 2 от OpenAI: последняя сгенерировала изображение на основе той же подсказки за 12,3 секунды. Воодушевлённые своим успехом, разработчики планируют интегрировать KOALA в образовательные услуги и другие направления бизнеса.