В последние несколько лет мир ИИ изменился от культуры открытого сотрудничества к культуре, сосредоточенной на строго охраняемых корпоративных системах. OpenAI – компания, название которой буквально включает «открытый» – начала скрывать свои самые мощные модели после 2019 года. Конкуренты, такие как Anthropic и Google, также разрабатывали передовой ИИ за пределами API, доступным только на их условиях. Этот закрытый подход частично оправдывался вопросами безопасности и бизнес-интересами, но оставил многих в сообществе оплакивающими утрату духа раннего открытого исходного кода.
Теперь этот дух снова поднимает голову. Новые модели Llama 4 от Meta сигнализируют о смелой попытке возродить открытый ИИ на высшем уровне – даже традиционно охраняемые игроки обращают на это внимание. Генеральный директор OpenAI Сэм Альтман недавно признал, что компания «стоит на неправильной стороне истории» в отношении открытых моделей и объявил о планах на создание «мощного нового открытого» варианта GPT-4. Кратко говоря, открытый ИИ возвращается в строй, и смысл и ценность термина «открытый» эволюционируют.
(Источник: Meta)
Llama 4: открытый конкурент Meta для GPT-4o, Claude и Gemini
Meta представила Llama 4 как еще один прямой вызов новым моделям от гигантов ИИ, позиционируя его как альтернативу с открытыми весами. Llama 4 предлагается в двух вариантах, доступных сегодня – Llama 4 Scout и Llama 4 Maverick – с впечатляющими техническими характеристиками. Оба являются моделями mixture-of-experts (MoE), которые активируют только часть своих параметров для каждого запроса, позволяя получать огромный общий размер без колоссальных затрат на время выполнения. Scout и Maverick имеют по 17 миллиардов «активных» параметров (часть, которая работает с любым данными), но благодаря MoE, Scout распределяет их среди 16 экспертов (всего 109 миллиардов параметров), а Maverick – среди 128 экспертов (400 миллиардов в сумме). Результат: модели Llama 4 демонстрируют потрясающую производительность – и делают это с уникальными преимуществами, которых даже у некоторых закрытых моделей нет.
Например, Llama 4 Scout предлагает впечатляющее окно контекста в 10 миллионов токенов, что в разы превышает большинство конкурентов. Это означает, что он может обрабатывать и анализировать действительно огромные документы или кодовые базы за один раз. Несмотря на свои размеры, Scout достаточно эффективен, чтобы работать на одном GPU H100 при высокой квантовании, что указывает на то, что разработчикам не потребуется суперкомпьютер для экспериментов с ним.
Тем временем Llama 4 Maverick настроен для максимальной производительности. Ранние испытания показывают, что Maverick соответствует или превышает лучших закрытых моделей по задачам рассуждения, программирования и зрения. На самом деле, Meta уже намекает на еще более крупного «соседа» – Llama 4 Behemoth, который все еще находится в процессе обучения и который внутри «перевышает GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Pro по нескольким STEM-бenchmark». Сообщение очевидно: открытые модели больше не являются второстепенными; Llama 4 нацелен на статус передовой модели.
Не менее важно, что Meta сразу же сделала Llama 4 доступным для загрузки и использования. Разработчики могут получить Scout и Maverick с официального сайта или из Hugging Face на условиях лицензии Llama 4 Community. Это означает, что любой – от гаражного хакера до компании из списка Fortune 500 – может заглянуть под капот, доработать модель под свои нужды и развернуть ее на своем оборудовании или в облаке. Это острая контрастирует с проприетарными предложениями, такими как GPT-4o от OpenAI или Claude 3.7 от Anthropic, которые предоставляются через платные API без доступа к основным весам.
Meta подчеркивает, что открытость Llama 4 направлена на расширение возможностей пользователей: «Мы делимся первыми моделями в стаде Llama 4, которые позволят людям создавать более индивидуализированные мультимодальные опыты». Другими словами, Llama 4 – это набор инструментов, предназначенный для разработчиков и исследователей по всему миру. Выпуская модели, которые могут соперничать с такими как GPT-4 и Claude по возможностям, Meta возрождает представление о том, что передовой ИИ не обязательно должен находиться за платной стеной.
(Источник: Meta)
Подлинный идеализм или стратегический ход?
Meta представляет Llama 4 в грандиозных, почти альтруистичных терминах. «Наша модель ИИ с открытым исходным кодом, Llama, была загружена более одного миллиарда раз», – объявил недавно генеральный директор Марк Цукерберг, добавляя, что «открытие ИИ моделей является необходимым для обеспечения доступа людей везде к преимуществам ИИ». Эта формулировка изображает Meta как проводника демократизированного ИИ – компании, готовой поделиться своими коронными моделями ради общего блага. И действительно, популярность семейства Llama подтверждает это: модели были загружены в огромных масштабах (выросли с 650 миллионов до 1 миллиарда в общей сложности всего за несколько месяцев), и ими уже пользуются такие компании, как Spotify, AT&T и DoorDash.
Meta с гордостью отмечает, что разработчики высоко ценят «прозрачность, настраиваемость и безопасность» наличия открытых моделей, которые они могут запускать сами, что «помогает достигать новых уровней креативности и инноваций», по сравнению с черными ящиками API. В принципе, это звучит как старая этика программного обеспечения с открытым исходным кодом (подумайте о Linux или Apache), применяемая к ИИ – бесспорная победа для сообщества.
Тем не менее, нельзя игнорировать стратегический расчет, стоящий за этой открытостью. Meta не является благотворительной организацией, и «открытый исходный код» в этом контексте имеет свои оговорки. Примечательно, что Llama 4 выпущен под специальной лицензией сообщества, а не стандартной разрешительной лицензией – поэтому, хотя веса модели бесплатны для использования, есть ограничения (например, определенные высокозатратные сценарии могут требовать разрешений, и лицензия является «проприетарной» в том смысле, что она разработана Meta). Это не соответствует официальному определению открытого исходного кода (OSI), что привело некоторых критиков к утверждению, что компании злоупотребляют этим термином.
На практике подход Meta часто описывается как «открытые веса» или «доступные исходные коды»: код и веса открыты, но Meta все еще сохраняет некоторый контроль и не раскрывает всего (например, тренировочные данные). Это не снижает полезность для пользователей, но свидетельствует о том, что Meta стратегически открыта – удерживает под контролем достаточно, чтобы защитить себя (и, возможно, свое конкурентное преимущество). Многие компании наклеивают этикетки «открытый код» на ИИ модели, скрывая ключевые детали, подрывая истинный дух открытости.
Почему Meta вообще открывает свои модели? Конкурентный ландшафт предлагает подсказки. Выпуск мощных моделей бесплатно может быстро создать широкую базу пользователей среди разработчиков и предприятий – Mistral AI, французский стартап, именно это и сделал, выпустив свои ранние открытые модели, чтобы завоевать доверие в качестве лаборатории высшего уровня.
Размещая Llama на рынке, Meta гарантирует, что ее технологии станут основополагающими в экосистеме ИИ, что может принести плоды в долгосрочной перспективе. Это классическая стратегия обхвата и расширения: если все используют вашу «открытую» модель, вы косвенно устанавливаете стандарты и, может быть, даже направляете людей к своим платформам (например, продукты искусственного интеллекта Meta используют Llama). Есть также элемент PR и позиционирования. Meta получает возможность играть роль благожелательного новатора, особенно в противоположность OpenAI, которая подверглась критике за свой закрытый подход. На самом деле, изменение взгляда OpenAI на открытые модели частично подчеркивает, насколько эффективным был шаг Meta.
После появления прорывной китайской открытой модели DeepSeek-R1 в январе и её превосходства над предыдущими моделями, Альтман указал, что OpenAI не хочет остаться на «неправильной стороне истории». Теперь OpenAI обещает открытую модель с сильными способностями рассуждения в будущем, подчеркивая изменение отношения. Трудно не заметить влияние Meta в этом сдвиге. Открытость Meta как бы подлинна, так и стратегична: она действительно расширяет доступ к ИИ, но это также хитрый ход, чтобы обойти конкурентов и сформировать будущее рынка на условиях Meta.
Последствия для разработчиков, предприятий и будущего ИИ
Для разработчиков возрождение открытых моделей, таких как Llama 4, является глотком свежего воздуха. Вместо того, чтобы быть запертыми в экосистеме единственного провайдера и платить сборы, теперь они могут запускать мощный ИИ на собственной инфраструктуре или настраивать его свободно.
Это огромный плюс для предприятий в чувствительных отраслях – таких как финансы, здравоохранение или государственные учреждения – которые опасаются вводить конфиденциальные данные в чужой черный ящик. С Llama 4 банк или больница могут развернуть передовую языковую модель за своим собственным фаерволом, настраивая ее на частные данные, без необходимости делиться токеном с внешними структурами. Есть также экономические преимущества. Поскольку сборы за использование на основе API для лучших моделей могут взлететь до небес, открытая модель не имеет затрат на пользовательский трафик – вы платите только за вычислительную мощность для ее запуска. Бизнесы, которые увеличивают объемы работы с ИИ, могут значительно сэкономить, выбрав открытое решение, которое они могут масштабировать внутри компании.
Неудивительно, что мы видим растущий интерес к открытым моделям со стороны предприятий; многие начинают осознавать, что контроль и безопасность открытого исходного кода ИИ лучше соответствуют их потребностям, чем закрытые услуги, созданные по принципу «один размер подходит всем».
Разработчики также извлекают выгоду из инноваций. Имея доступ к внутренним структурам модели, они могут тонко настраивать и улучшать ИИ для узкоспециализированных областей (право, биотехнологии, региональные языки – что угодно) так, как это никогда не может быть сделано закрытым API. Взрыв проектов, ориентированных на сообщество вокруг ранних моделей Llama – от чат-ботов, настроенных на медицинские знания, до хоббийных мобильных приложений с миниатюрными версиями – доказал, как открытые модели могут демократизировать эксперименты.
Тем не менее, возрождение открытых моделей также поднимает сложные вопросы. Происходит ли «демократизация», если только те, у кого есть значительные вычислительные ресурсы, могут запускать модель с 400 миллиардами параметров? Хотя Llama 4 Scout и Maverick снижают планку аппаратного обеспечения по сравнению с монолитными моделями, они все равно являются тяжеловесами – на что не остаются равнодушными некоторые разработчики, PC которых не справляются с ними без облачной помощи.
Надеемся, что такие техники, как сжатие моделей, дистилляция или меньшие экспертные варианты, помогут снизить мощность Llama 4 до более доступных размеров. Еще одной проблемой является злоупотребление. OpenAI и другие долго утверждали, что открытый доступ к мощным моделям может дать возможность злонамеренным актерам (для создания дезинформации, вредоносного кода и т.д.).
Эти опасения сохраняются: открытый Claude или GPT могут быть использованы неправильно без защитных фильтров, которые компании вводят на своих API. С другой стороны, сторонники утверждают, что открытость позволяет сообществу также выявлять и исправлять проблемы, делая модели более надежными и прозрачными со временем, чем любая секретная система. Есть доказательства, что сообщества открытых моделей серьезно относятся к безопасности, разрабатывая свои собственные меры безопасности и делясь лучшими практиками – но это продолжается в напряженной борьбе.
Что становится все более очевидным, так это то, что мы движемся к гибридному ландшафту ИИ, в котором открытые и закрытые модели сосуществуют, каждая влияя на другую. Закрытые поставщики, такие как OpenAI, Anthropic и Google, по-прежнему имеют преимущество в абсолютной производительности – пока. Действительно, по состоянию на конец 2024 года исследования показали, что открытые модели отстают примерно на год от лучших закрытых моделей по возможностям. Но этот разрыв быстро сокращается.
На сегодняшнем рынке «искусственный интеллект с открытым исходным кодом» больше не означает лишь хоббийные проекты или старые модели – он теперь находится в центре стратегий ИИ для крупных техногигантов и стартапов. Запуск Llama 4 от Meta – мощное напоминание о развивающейся ценности открытости. Это одновременно философская позиция за демократизацию технологий и тактический ход в отраслевой борьбе на высокие ставки. Для разработчиков и предприятий это открывает новые горизонты для инноваций и автономности, даже если это усложняет принятие решений с новыми компромиссами. А для более широкого экосистемы это порождает надежду, что преимущества ИИ не будут заперты в руках нескольких корпораций – если этика открытого исходного кода сохранит свои позиции.
Запись Искусственный интеллект с открытым исходным кодом наносит ответный удар с Llama 4 от Meta впервые появилась на Unite.AI.