Ресайзим с ИИ — как я отказался от AUTOMATIC1111 и InvokeAI в пользу Upscayl
Первое и до сих пор основное, для чего я использую ИИ в графике, — ресайз.
Еще на самом старте бума нейронок появилось множество сайтов, где необходимую картинку плюс-минус корректно увеличат в разы.
За пару лет ситуация не сильно изменилась. Нужно для оформления получить копию изображения в большом разрешении? Вбиваешь в поиск что-то в духе «ресайз AI» и начинается история «найди норм сайт, найди за тонной баннеров интерфейс, посмотри ролик, пока идет обработка, получи результат».
Схема рабочая, особенно, если это потребность возникает раз в год.
Более того, недавно был в одном копицентре — нужно было распечатать фото в рамку — так там, когда я попросил увеличить изображение без сильной потери в качестве, поступили ровно так же: залезли в поисковик и стали искать подходящее веб-решение.
Меня такой подход всегда не устраивал ровно по одной причине — мне это надо не раз в год. При оформлении статей логотипы и фото спикеров довольно часто не дотягивают до нужного качества и размера.
Сначала я приладил к этому AUTOMATIC1111 — это самый популярный интерфейс для локального Stable Diffusion. Но надолго меня не хватило. Мощное, но очень кривое для пользователя решения.
Потом перешел на InvokeAI. Это еще один визуальный интерфейс поверх Stable Diffusion. Красивый, без визуального скриптинга (причина, по которой я так и не дошел до освоения ComfyUI), плюс с кастомной загрузкой моделей.
Казалось бы — ну и сиди тут спокойно. Однако тут для меня образовался другой здоровый минус — параллельно работать Stable Diffusion и Photoshop (да, динозавр, я так пока и не освоил Figma, мне пока быстрее все сделать по-старинке) технически сложно. Оба жрут память как не в себе.
В итоге набрел на Upscayl. По факту — еще одна тулза-интерфейс поверх Stable Diffusion (вроде бы), но с одним маленьким нюансом: она умеет только ресайзить, все нужное вшито в ней по умолчанию, ресайзит на мощностях ПК быстро и особо не жрет мощности.
До возможностей ресайза Nano Banana 2 или ChatGPT 5.5. тут как до Луны, но если нужно просто вдвое увеличить разрешение картинки, по возможности сохранив (а зачастую улучшив) на прежнем уровне четкость и не тратя ценные токены, то самое то.
Ну и, конечно, меня очаровывает утилитарность приложения. Есть конкретная задача — делаю только ее. Надеюсь, подобных на базе ИИ будет только больше, поскольку от комбайнов устал.
Другое дело, что подобные решения, как правило, не развиваются. Тот же WinRAR, Audacity или MSI Afterburner как будто застыли во времени. Что 10 лет назад, что сейчас они выглядят и работают точно так же. Впрочем, можно ли называть это проблемой — тема для совсем другого разговора.