© New-science.ru
Привыкшая действовать максимально осторожно, компания Apple в очередной раз удивила общественность, опубликовав несколько больших языковых моделей (LLM) под названием «OpenELM», с открытым исходным кодом. Эти модели искусственного интеллекта, которые могут работать локально (например, исполняться непосредственно на смартфоне), были опубликованы в преддверии долгожданной ежегодной конференции компании. Они могут быть интегрированы в следующие операционные системы Apple.
В последнее время Apple, похоже, делает большие успехи в области генеративного ИИ после нескольких лет молчания. В январе, например, компания представила Ferret, ИИ, способный анализировать тексты и изображения, а затем генерировать соответствующую информацию на основе полученных данных.
На этой неделе компания из Купертино представила OpenELM (Open source Efficient Language Models) — серию «небольших» генеративных моделей ИИ, предназначенных для интеграции непосредственно в устройства. Однако более подробная информация о проекте будет раскрыта на предстоящей Всемирной конференции разработчиков Apple (WWDC), которая пройдет с 10 по 14 июня. Там же будут представлены обновления операционных систем iOS и macOS. По некоторым данным, OpenELM, скорее всего, будет официально запущен вместе с iOS 18 и macOS 15.
Маленькие LLM с открытым исходным кодом
OpenELM, проект Apple, уже доступен в нескольких версиях на платформе Hugging Face — совместном пространстве, специализирующемся на искусственном интеллекте и объединяющем разработчиков со всего мира. Компания также опубликовала выдержки из кода на платформе GitHub, чтобы разработчики могли использовать эти модели в своих собственных проектах.
Решение Apple сделать этот проект с открытым исходным кодом стало для некоторых неожиданностью, хотя другие технологические гиганты, такие как Meta (признана в РФ экстремистской организацией, её деятельность в стране запрещена), также делают ставку на открытый исходный код. Однако это не первый случай, когда Apple публикует исходный код. Более того, технические детали этих новых моделей были обнародованы на сервере предварительных публикаций arXiv.
OpenELM выпускается в нескольких конфигурациях, каждая из которых имеет разное количество параметров: 270 миллионов, 450 миллионов, 1,1 миллиарда и 3 миллиарда. Эти модели относительно скромны по сравнению с другими крупномасштабными моделями. Для сравнения, модель LLama 3 компании Meta имеет 70 миллиардов параметров (в разработке находится еще более крупная версия с 400 миллиардами параметров).
Однако уменьшенный размер моделей OpenELM не обязательно означает, что они менее эффективны. На самом деле эти технологии используют технику послойного масштабирования, что повышает точность результатов.
Локальное развертывание — главное преимущество
В соответствии с предыдущими слухами, ИИ будет развертываться локально, непосредственно на устройствах компании, что соответствует стратегии Apple, направленной на повышение автономности своих устройств, когда речь идет об ИИ. Такой подход также может привести к значительному снижению энергопотребления (на глобальном, а не локальном уровне), поскольку обработка данных будет происходить на устройствах, а не на удаленных серверах. Это также окажет непосредственное влияние на конфиденциальность.
Пользователи могут ожидать, что модели OpenELM будут интегрированы с различными функциями, что позволит им напрямую воспользоваться достижениями Apple в области искусственного интеллекта. Однако подробности того, как эти системы будут внедряться в продукты Apple, пока не раскрываются.