Адаптация к эпохе рассуждений ИИ

Каждый, кто учился в колледже и готовился к экзаменам, знает, что впечатляющая способность к воспроизведению информации не является синонимом критического мышления.

Большие языковые модели (LLMs), которые впервые были выпущены в 2022 году, были впечатляющими, но ограниченными — как талантливые студенты, отличающиеся на экзаменах с множественным выбором, но сбивающиеся с толку, когда их просят защитить свою логику. Современные продвинутые модели рассуждений больше похожи на опытных аспирантов, которые могут ориентироваться в неоднозначности и возвращаться назад, когда это необходимо, тщательно разбираясь в проблемах с методическим подходом.

Системы ИИ, которые учатся, имитируя механизмы человеческого мозга, продолжают развиваться, и мы наблюдаем эволюцию моделей от механического воспроизведения к подлинному рассуждению. Эта способность знаменует собой новую главу в эволюции ИИ — и в том, что могут получить компании. Но чтобы реализовать этот огромный потенциал, организациям необходимо обеспечить наличие необходимой инфраструктуры и вычислительных ресурсов для поддержки развивающихся технологий.

Революция в рассуждениях

«Модели рассуждений качественно отличаются от ранних LLM», — говорит Прабхат Рам, партнер и архитектор AI/HPC в Microsoft, отмечая, что эти модели могут исследовать различные гипотезы, оценивать, являются ли ответы последовательно правильными, и соответственноadjust их подход. «Они в сущности создают внутреннее представление о дереве решений на основе тренировочных данных, с которыми они были знакомы, и исследуют, какое решение может быть лучшим.»

Этот адаптивный подход к решению проблем не лишен компромиссов. Ранние LLM выдавали результаты за миллисекунды, основываясь на статистическом сопоставлении шаблонов и вероятностном анализе. Это было — и до сих пор остается — эффективным для многих приложений, но не позволяет ИИ достаточно времени для тщательной оценки нескольких путей решения.

В более новых моделях длительное время вычисления во время вывода — секунд, минут или даже дольше — позволяет ИИ применять более сложное внутреннее обучение с подкреплением. Это открывает двери для многопроцессного решения задач и более нюансированного принятия решений.

Чтобы проиллюстрировать будущие случаи использования ИИ, способного на рассуждения, Рам предлагает пример ровера NASA, отправленного исследовать поверхность Марса. «Решения нужно принимать в каждый момент относительно того, какой путь выбрать, что исследовать, и должна быть определенная взаимосвязь риска и вознаграждения. ИИ должен быть в состоянии оценить: “Готов ли я прыгнуть со скалы? Или, если я изучаю этот камень, и у меня есть ограниченное количество времени и бюджета, действительно ли это тот, который научно более ценен?”» Успешное принятие таких решений могло бы привести к прорывным научным открытиям с ранее немыслимой скоростью и масштабом.

Способности рассуждения также являются важным этапом в распространении агентных систем ИИ: автономных приложений, которые выполняют задачи от имени пользователей, таких как планирование встреч или бронирование маршрутов поездок. «Независимо от того, просите ли вы ИИ сделать резервирование, предоставить краткое изложение литературы, сложить полотенце или поднять камень, он сначала должен в первую очередь понять окружающую среду — то, что мы называем восприятием — понять инструкции и затем перейти к этапу планирования и принятия решений», — объясняет Рам.

Корпоративные приложения ИИ систем, способных на рассуждения

Корпоративные приложения для ИИ, способных на рассуждения, далеко идущие. В здравоохранении IИ-системы рассуждений могут анализировать данные пациентов, медицинскую литературу и протоколы лечения для поддержки диагностических или лечебных решений. В научных исследованиях модели рассуждений могут формулировать гипотезы, разрабатывать экспериментальные протоколы и интерпретировать сложные результаты — потенциально ускоряя открытия в областях от материаловедения до фармацевтики. В финансовом анализе ИИ, способный на рассуждения, может помочь оценить инвестиционные возможности или стратегии расширения рынка, а также разработать рисковые профили или экономические прогнозы.

Вооруженные этими знаниями, своим опытом и эмоциональным интеллектом, врачи, исследователи и финансовые аналитики смогут принимать более обоснованные решения быстрее. Но прежде чем разместить эти системы в настоящем мире, необходимо обеспечить надежные механизмы защиты и управления, особенно в таких высокостратегических контекстах, как здравоохранение или автономные транспортные средства.

«Для самоуправляемого автомобиля есть реальные решения, которые необходимо принимать относительно того, поворачивать ли рулевое колесо влево или вправо, нажимать ли на газ или тормоз — вы абсолютно не хотите сбивать пешехода или попадать в аварию», — говорит Рам. «Способность рассуждать о ситуациях и принимать “оптимальное” решение — это то, что модели рассуждений должны будут делать в будущем.»

Инфраструктура, поддерживающая рассуждения ИИ

Для оптимальной работы модели рассуждений требуют значительно больше вычислительных ресурсов для вывода. Это создает явные проблемы масштабирования. В частности, поскольку время вывода моделей рассуждений может сильно варьироваться — от нескольких секунд до многих минут — балансировка нагрузки между этими различными задачами может быть сложной.

Преодоление этих трудностей требует тесного сотрудничества между поставщиками инфраструктуры и производителями аппаратного обеспечения, говорит Рам, говоря о сотрудничестве Microsoft с NVIDIA, которая вносит свою платформу ускоренных вычислений в продукты Microsoft, включая Azure AI.

«Когда мы думаем об Azure и о развертывании систем для обучения и вывода ИИ, мы действительно должны думать о всей системе в целом», — объясняет Рам. «Что вы собираетесь изменить в дата-центре? Что вы собираетесь делать с несколькими дата-центрами? Как вы собираетесь их подключить?» Эти соображения касаются надежности на всех уровнях: от ошибок памяти на уровне кремния до ошибок передачи по серверам, тепловых аномалий и даже проблем на уровне дата-центров, таких как колебания мощности — все эти проблемы требуют сложного мониторинга и быстрого реагирования.

Создавая целостную архитектуру системы, предназначенную для обработки колеблющихся требований ИИ, сотрудничество Microsoft и NVIDIA позволяет компаниям использовать мощь моделей рассуждений, не управляя подводной сложностью. В дополнение к выгодам по производительности такие партнерства позволяют компаниям не отставать от технологического ландшафта, который развивается с бешеной скоростью. «Скорость — это уникальная проблема в этой сфере», — говорит Рам. «Каждые три месяца появляется новая базовая модель. Аппаратное обеспечение также быстро эволюционирует — за последние четыре года мы развернули каждое поколение графических процессоров NVIDIA, а теперь NVIDIA GB200NVL72. Лидерство в этой области действительно требует очень тесного сотрудничества между Microsoft и NVIDIA, чтобы делиться дорожными картами, временными рамками и проектами в области аппаратного обеспечения, квалификациями и наборами для проверки, возникающими проблемами и так далее.»

Продвижение инфраструктуры ИИ, специально разработанной для рассуждений и агентных моделей, критично для того, чтобы предоставить ИИ, способный на рассуждения, более широкому кругу организаций. Без robust и доступной инфраструктуры преимущества моделей рассуждений останутся отданными компаниям с огромными вычислительными ресурсами.

Смотрев в будущее, эволюция ИИ-систем, способных на рассуждения, и поддерживающей их инфраструктуры, обещает еще большие достижения. Для Рама граница простирается за пределы корпоративных приложений к научным открытиям и прорывам, которые продвигают человечество вперед: «День, когда эти агентные системы смогут поддерживать научные исследования и предлагать новые гипотезы, которые могут привести к Нобелевской премии, я думаю, это будет тот день, когда мы можем сказать, что эта эволюция завершена.»

Чтобы узнать больше, пожалуйста, прочитайте Microsoft и NVIDIA ускоряют развитие и производительность ИИ, смотрите записи сессий конференции NVIDIA GTC AI по запросу и изучите области, связанные с решениями Azure AI и инфраструктурой Azure AI.

Этот контент был подготовлен Insights, специализированным контентным подразделением MIT Technology Review. Он не был написан редакционным персоналом MIT Technology Review.

Этот контент был полностью исследован, разработан и написан людьми — авторами, редакторами, аналитиками и иллюстраторами. Это включает написание опросов и сбор данных для опросов. Использование инструментов ИИ было ограничено вторичными производственными процессами, которые прошли тщательную проверку человеком.

Перейти к источнику
AI Daily

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *