Мега-модели не являются сутью вычислительного кризиса

Каждый раз, когда появляется новая модель ИИ — обновления GPT, DeepSeek, Gemini — люди поражаются ее размеру, сложности и, все чаще, вычислительным потребностям этих мега-моделей. Предположение заключается в том, что именно эти модели определяют потребности в ресурсах революции ИИ.

Это предположение ошибочно.

Да, большие модели нуждаются в вычислительных ресурсах. Но наибольшая нагрузка на инфраструктуру ИИ не исходит от нескольких мега-моделей — она приходит от тихой повсеместной экспансии моделей ИИ в различных отраслях, каждая из которых настроена на конкретные приложения и каждый из которых потребляет вычислительные ресурсы в беспрецедентных масштабах.

Несмотря на потенциальную конкуренцию “победитель забирает все” среди LLM, ландшафт ИИ в целом не централизуется — он фрагментируется. Каждая компания использует ИИ не просто для автоматизации процессов — они обучают, настраивают и разворачивают частные модели, адаптированные под свои нужды. Именно такая ситуация создаст спрос на инфраструктуру, к которому облачные провайдеры, предприятия и правительства не готовы.

Мы видели этот шаблон раньше. Облако не консолидировало IT-нагрузки; оно создало огромную гибридную экосистему. Сначала это была разрастание серверов. Затем — разрастание виртуальных машин. Теперь? Разрастание ИИ. Каждая волна вычислений привела к распространению, а не упрощению. ИИ не исключение.

Разрастание ИИ: Почему будущее ИИ — это миллион моделей, а не одна

Финансы, логистика, кибербезопасность, обслуживание клиентов, НИОКР — каждая из этих областей имеет свою собственную модель ИИ, оптимизированную для своей функции. Организации не обучают одну модель ИИ, чтобы управлять всем бизнесом. Они обучают тысячи. Это означает больше циклов обучения, больше вычислительных мощностей, больше потребности в хранении данных и больше разрастания инфраструктуры.

Это не теоретически. Даже в отраслях, которые традиционно осторожны в принятии технологий, инвестиции в ИИ ускоряются. В отчете McKinsey за 2024 год было установлено, что организации сейчас используют ИИ в среднем в трех бизнес-функциях, при этом производство, цепочка поставок и разработка продуктов ведут в этом направлении (McKinsey).

Здравоохранение — яркий пример. Navina, стартап, который интегрирует ИИ в электронные медицинские записи для извлечения клинических данных, только что привлек 55 миллионов долларов в рамках финансирования Series C от Goldman Sachs (Business Insider). Энергетика не исключение — лидеры отрасли создали Консорциум Open Power AI, чтобы внедрить оптимизацию ИИ в работу сетей и установок (Axios).

Нагрузка от вычислительных ресурсов, о которой никто не говорит

ИИ уже разрушает традиционные модели инфраструктуры. Представление о том, что облако может бесконечно масштабироваться для поддержки роста ИИ, глубоко ошибочно. ИИ не масштабируется, как традиционные нагрузки. Кривая спроса не плавная — она экспоненциальная, и гипермасштабируемые компании не успевают за изменениями.

  • Ограничения по энергии: теперь дата-центры, ориентированные на ИИ, строятся с учетом доступности энергии, а не только сетевой инфраструктуры.
  • Сетевые узкие места: гибридные IT-среды становятся непрактичными без автоматизации, что только усугубит нагрузки ИИ.
  • Экономическое давление: нагрузки ИИ могут потреблять миллионы в течение одного месяца, создавая финансовую непредсказуемость.

Дата-центры уже составляют 1% глобального потребления электроэнергии. В Ирландии они теперь потребляют 20% от национальной сети, доля, которая, как ожидается, значительно вырастет к 2030 году (IEA).

Добавьте к этому нарастающее давление на графические процессоры. Bain & Company недавно предупредила, что рост ИИ создает предпосылки для нехватки полупроводников, вызванной взрывным спросом на чипы для дата-центров (Bain).

Тем временем, проблема устойчивости ИИ растет. Анализ 2024 года в журнале Sustainable Cities and Society предостерегает, что широкое внедрение ИИ в здравоохранение может существенно увеличить потребление энергии и углеродные выбросы в секторе, если это не будет компенсировано целевыми эффективностями (ScienceDirect).

Разрастание ИИ больше, чем рынок — это вопрос государственной власти

Если вы думаете, что разрастание ИИ — это корпоративная проблема, подумайте еще раз. Главным фактором фрагментации ИИ не является частный сектор — это правительства и военные оборонные агентства, которые разворачивают ИИ в масштабах, с которыми не может сопоставиться ни один гипермасштабируемый провайдер или предприятие.

Только правительство США развернуло ИИ в более чем 700 приложениях в 27 агентствах, охватывающих аналитическую разведку, логистику и многое другое (FedTech Magazine).

Канада инвестирует до 700 миллионов долларов в расширение отечественных мощностей вычислений ИИ, объявляя национальный конкурс для укрепления инфраструктуры суверенных дата-центров (Innovation, Science and Economic Development Canada).

Также растут призывы к созданию “программы Аполлон” для инфраструктуры ИИ, подчеркивая переход ИИ от коммерческого преимущества к национальному императиву (MIT Technology Review).

Военный ИИ не будет эффективным, координированным или оптимизированным с точки зрения стоимости — он будет продиктован требованиями национальной безопасности, геополитической срочностью и необходимостью закрытых, суверенных систем ИИ. Даже если компании ограничивают разрастание ИИ, кто скажет правительствам замедлиться?

Потому что, когда речь идет о национальной безопасности, никто не останавливается, чтобы спросить, справится ли с этим энергетическая сеть.

Перейти к источнику
AI Daily

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *