DeepSeek представила ИИ с открытым исходным кодом для генерации изображений, который превосходит DALL-E-3 от OpenAI

0
12

Китайская компания DeepSeek представила свой новый искусственный интеллект Janus-Pro, генерирующий изображения, который, как утверждается, превосходит лучшие конкурирующие модели, такие как DALL-E-3 от OpenAI. Модель с открытым исходным кодом впечатляет своей производительностью, достигнутой при меньших затратах на разработку, чем у крупных американских моделей, и при этом потребляет меньше энергии. Всего за два года работы компания может преодолеть монополию в индустрии ИИ.

Основанная в 2023 году исследовательским подразделением китайского хедж-фонда, компания DeepSeek занимается разработкой больших языковых моделей с целью достижения ИИ общего назначения (AGI). На прошлой неделе стартап сообщил о запуске своей сверхвысокопроизводительной модели R1 и чат-бота. По мнению пользователей, производительность и способность к рассуждениям этой модели сопоставимы с o1, последней публичной моделью OpenAI.

Производительность DeepSeek-R1 даже высоко оценил Сэм Альтман, генеральный директор OpenAI. «DeepSeek R1 — впечатляющая модель, особенно по сравнению с тем, что они могут предоставить за эту цену», — написал он на сайте X. «Очевидно, что мы собираемся предложить гораздо лучшие модели, и появление нового конкурента очень радует! Мы выпустим несколько новых вещей… Мне не терпится познакомить вас с AGI и не только».

Чат-бот DeepSeek с открытым исходным кодом или лицензией MIT (предоставляющей неограниченные права на использование и модификацию), включающий, помимо прочих функций, R1 и веб-поиск, вскоре после выхода стал самым скачиваемым бесплатным приложением в App Store, значительно превзойдя ChatGPT. Однако вскоре после этого компания объявила, что ограничивает регистрацию в связи с масштабной кибератакой. Однако пользователи, которые уже зарегистрировались, по-прежнему могли подключаться.

Это вызвало резкое падение акций американских технологических компаний, поскольку инвесторы опасались, что недорогие модели DeepSeek с открытым исходным кодом могут разрушить их монополию. Например, компания Nvidia, ведущий поставщик процессоров для искусственного интеллекта, всего за один день потеряла 589 миллиардов долларов рыночной стоимости, что стало крупнейшей однодневной потерей стоимости в США (впрочем, компания по-прежнему оценивается в несколько триллионов долларов).

Всего через несколько дней после запуска R1 DeepSeek представила свою новую модель генерации изображений, Janus-Po, которая, как утверждается, превосходит DALL-E 3 от OpenAI. Как и R1, Janus-Pro также является бесплатной и лицензируется по лицензии MIT. Она доступна через такие платформы разработки, как GitHub и Hugging Face.

Читать также:  Новые китайские спутники создают проблемы

«Сочетание расширенных возможностей, доступности с открытым исходным кодом и впечатляющей производительности делает его важным игроком в эволюции технологий искусственного интеллекта», — пишет компания на сайте Hugging Face.

Впечатляющая производительность по низкой цене

Модели DeepSeek входят в экосистему искусственного интеллекта с большим энтузиазмом, несмотря на то, что США ограничили количество чипов искусственного интеллекта, которые может импортировать Китай. Чтобы обойти это препятствие, инженеры компании разработали более мощные и гораздо менее требовательные к питанию алгоритмы, чем у конкурентов. Другими словами, они потребляют меньше вычислительной мощности, чем обычные алгоритмы, что упрощает их работу.

Генератор изображений доступен в нескольких размерах, от 1 до 7 миллиардов параметров. Это соответствует способности модели решать задачи, причем модели с большим количеством параметров обычно работают лучше. Как и все модели генерации изображений, он генерирует ответы на текстовые подсказки пользователей.

Однако линейка Janus-Pro была усовершенствована благодаря новым процессам обучения и более качественным данным. DeepSeek обучила модель на 72 миллионах высококачественных изображений, сбалансировав их с реальными данными. Это позволило получить более реалистичные и визуально более совершенные изображения, чем у конкурирующих моделей.

Хотя у пользователей нет доступа к этим обучающим данным, они могут консультироваться и изменять алгоритмы. «Эта модель генерирует изображения и превосходит DALL-E 3 от OpenAI и Stability AI от Stable Diffusion в нескольких тестах на производительность», — восторгается технологический предприниматель Брайан Роэммел в статье для The Independent.

DeepSeek также является важным шагом вперед с точки зрения конкурентоспособности: разработка его моделей обошлась менее чем в 6 миллионов долларов. Эти заявления ставят под сомнение необходимость астрономических циклов финансирования в этом секторе и рискуют и дальше отпугивать инвесторов.

Читайте все последние новости искусственного интеллекта на New-Science.ru