В ответ на ошеломительный успех DeepSeek бывшие инженеры Google и Apple запускают Oumi, новую платформу искусственного интеллекта с открытым исходным кодом и неограниченными возможностями. Ведь, несмотря на открытый исходный код, использование таких моделей, как Llama и DeepSeek-R1, по-прежнему связано с определенными условиями. Цель Oumi — снять эти ограничения и сделать технологию еще более доступной для исследователей, разработчиков и предприятий.
Недавняя популярность моделей ИИ от DeepSeek подчеркивает постоянно растущий спрос на недорогой ИИ с открытым исходным кодом. Существующие проприетарные модели, такие как OpenAI, очень ограничены, особенно для разработчиков.
С другой стороны, существует очень мало вариантов с открытым исходным кодом, которые действительно открыты и просты в использовании. Спрос на них настолько высок, что модели китайских стартапов вызвали резкое падение акций американских технологических компаний всего через несколько дней после их запуска.
Аспект открытого исходного кода (или лицензия MIT) гарантирует свободный доступ для пользователей, позволяя им использовать модели в различных целях без разрешения, изучать их компоненты, изменять их и свободно делиться ими. Таким образом, лицензия предоставляет разработчикам полный доступ к архитектуре ИИ и его возможностям.
Однако доступ к этим моделям зависит от определенных условий. Хотя пользователи могут использовать модели и внедрять их самостоятельно, они не знают, как именно они были разработаны. Например, код и конкретные обучающие данные для таких моделей, как R1 и Janus-Pro компании DeepSeek или Llama компании Meta*, не были раскрыты. В частности, не раскрываются методы обучения с подкреплением, несмотря на пометку open source.
Эти ограничения ограничивают возможности пользователей по пониманию и полноценному использованию моделей. Поэтому большинству исследователей приходится прилагать значительные усилия, чтобы понять, как воспроизвести текущие модели с открытым исходным кодом. Это ограничивает преимущества совместных исследований.
«Даже самые крупные компании не могут сделать это в одиночку», — сказал VentureBeat Оуссама Элачкар, соучредитель Oumi и бывший инженер по машинному обучению в Apple. «Внутри Apple мы работали изолированно, и в отрасли существует множество других изолированных подразделений. Должен быть лучший способ совместной разработки этих моделей».
В отличие от существующих моделей, Oumi предназначена для неограниченного доступа, в то время как доступ к моделям DeepSeek или Meta* зависит от условий. Oumi представляет собой единую среду, которая упрощает сложные рабочие процессы, необходимые для создания моделей ИИ. Таким образом, платформа предлагает исследователям и разработчикам полный набор инструментов для создания и развертывания базовых моделей. Запуск платформы поддержали 15 ведущих университетов и исследовательских институтов, включая Принстонский университет, Стэнфордский университет, Массачусетский технологический институт (MIT), Калифорнийский университет в Беркли, Оксфордский университет, Кембриджский университет, Университет Ватерлоо и Университет Карнеги-Меллон.
Несколько рабочих процессов в одной среде
Разработка базовой модели ИИ обычно требует параллельного выполнения 10 или более шагов. Однако Oumi использует совершенно иной подход, интегрируя инструменты и все необходимые рабочие процессы в единую среду. Это избавит исследователей от необходимости объединять компоненты, разработанные в разных средах.
«Нам не придется проходить через ад разработки открытого кода, чтобы понять, что можно объединить и что хорошо работает», — объясняет Манос Кукумидис, генеральный директор Oumi и бывший руководитель отдела разработки ИИ в Google Cloud.
Платформа поддерживает модели с количеством параметров от 10 миллионов до 405 миллиардов. Это позволит пользователям начать работу в небольших масштабах, например, с простых ноутбуков для начальных экспериментов. Затем, по мере развития моделей, они смогут использовать более крупные вычислительные системы, например университетские вычислительные кластеры или публичные облачные пространства, объединенные в единую среду Oumi.
Oumi также предлагает доступ к передовым методам обучения, таким как SFT, LoRA, QLoRA и DPO, которые обычно используются для обучения больших языковых моделей. Система совместима с текстовыми и мультимодальными моделями и имеет инструменты для синтеза и сохранения данных.
Кроме того, разработанные модели могут быть развернуты с использованием движков вывода нового поколения (позволяющих экспертным системам проводить логические рассуждения), таких, как vLLM и SGLang. Комплексные оценки можно проводить с помощью LLM-as-a-judge. Они предназначены для оценки текстовых ответов на основе инструкций в оценочной подсказке.
Бюджет всего 10 миллионов долларов
Для создания платформы Элачкар и его соучредители собрали стартовый фонд в размере 10 миллионов долларов — скромный, на первый взгляд, бюджет, но, по их мнению, более чем достаточный. Для сравнения: на разработку моделей DeepSeek потребовалось менее 6 миллионов долларов, в то время как крупным компаниям, таким как OpenAI и Meta*, потребовалось несколько миллиардов долларов.
В то время как OpenAI планирует инвестировать 500 миллиардов долларов в новые централизованные центры обработки данных ИИ, децентрализованный подход Oumi позволит значительно сократить расходы. «Идея о том, что для создания инфраструктуры ИИ нужны сотни миллиардов долларов, в корне неверна», — говорит Кукумидис. «Благодаря распределенным вычислениям между университетами и исследовательскими институтами мы можем добиться аналогичных или лучших результатов за меньшую сумму».
Oumi также планирует разработать предложения специально для предприятий, чтобы они могли внедрять свои модели. «Благодаря безусловной платформе с открытым исходным кодом мы не будем ограничивать таланты, мы будем поощрять эксперименты, а общество будет пожинать плоды», — заключает Ганеш Шринивасан, партнер Venrock, одной из организаций, возглавивших сбор средств на создание платформы.
Читайте все последние новости искусственного интеллекта на New-Science.ru