Когда технологии стали доступными для всех
Когда-то технологии призывали «мобильные телефоны для всех» – и действительно, мобильныеcommunications перевернули бизнес (и мир). Сегодня эквивалент этого призыва – предоставить всем доступ к приложениям AI. Но настоящая сила AI заключается в его использовании для конкретных нужд бизнеса и организаций. Путь, проложенный китайским стартапом DeepSeek, показывает, как AI действительно может быть использован всеми, особенно теми, кто имеет ограниченный бюджет, чтобы удовлетворить свои специфические потребности. В самом деле, появление более доступного AI обещает изменить укоренившийся порядок, когда AI-решения часто остаются вне досягаемости для многих малых бизнесов и организаций из-за высоких затрат.
Большие языковые модели (LLMs) являются – или были – дорогостоящим предприятием, требующим доступа к огромным объемам данных, множеству мощных компьютеров для обработки данных и времени и ресурсов, затраченных на обучение модели. Но эти правила меняются. Работая с ограниченным бюджетом, DeepSeek разработал свою собственную LLM и приложение типа ChatGPT для запросов – с гораздо меньшими инвестициями, чем для подобных систем, построенных американскими и европейскими компаниями. Подход DeepSeek открывает окно в разработку LLM для малых организаций, у которых нет миллиардов на расходы. На самом деле, день может быть не так далек, когда большинство малых организаций смогут разрабатывать свои собственные LLM для удовлетворения своих конкретных нужд, обычно предоставляя более эффективное решение, чем общие LLM, такие как ChatGPT.
Хотя дебаты продолжаются относительно истинной стоимости DeepSeek, не только цена отличает его и подобные модели: это факт, что он полагался на менее совершенные микросхемы и более целенаправленный подход к обучению. Будучи китайской компанией, подверженной ограничениям экспорта из США, DeepSeek не мог получить доступ к современным Nvidia-чипам, которые обычно используются для мощной обработки, необходимой для разработки LLM, и, следовательно, был вынужден использовать менее мощные Nvidia H-800 чипы, которые не могут обрабатывать данные так быстро или эффективно.
Чтобы компенсировать недостаток мощности, DeepSeek принял другой, более целенаправленный и прямой подход к разработке своей LLM. Вместо того чтобы нагружать модель огромными объемами данных и полагаться на вычислительную мощность для размечивания и применения данных, DeepSeek сосредоточился на обучении, используя небольшое количество высококачественных «начальных» данных и применяя IRL (итеративное обучение с подкреплением, где алгоритм применяет данные в различных сценариях и учится на этом). Этот целенаправленный подход позволяет модели учиться быстрее, с меньшим количеством ошибок и меньшими потерями вычислительных ресурсов.
Похожим образом родители могут направлять конкретные движения ребенка, помогая ей успешно перевернуться в первый раз – вместо того чтобы оставлять ребенка наедине с этой задачей или учить ее более разнообразным движениям, которые теоретически могли бы помочь с переворотом – Data scientists, обучающие эти более целенаправленные AI модели, сосредоточиваются на том, что действительно необходимо для определенных задач и результатов. Такие модели, вероятно, не обладают такой широкой надежной применяемостью, как большие LLM, такие как ChatGPT, но на них можно полагаться для конкретных приложений, и они выполняют эти задачи с точностью и эффективностью. Даже критики DeepSeek признают, что его упрощенный подход к разработке значительно повысил эффективность, позволив ему добиться большего с меньшими затратами.
Этот подход ориентирован на предоставление AI лучших входных данных, чтобы он мог достичь своих целей наиболее умным и эффективным способом, и может быть ценным для любой организации, которая хочет разработать LLM для своих специфических нужд и задач. Такой подход становится все более ценным для малых бизнесов и организаций. Первый шаг – начать с правильных данных. Например, компания, которая хочет использовать AI для помощи своим командам продаж и маркетинга, должна обучить свою модель на тщательно отобранном наборе данных, сосредоточив внимание на продажах, стратегиях и метриках. Это не позволяет модели тратить время и вычислительные ресурсы на неуместную информацию. Кроме того, обучение должно быть структурировано по этапам, гарантируя, что модель освоит каждую задачу или концепцию, прежде чем переходить к следующей.
Это тоже имеет параллели в воспитании ребенка, как я сама узнала, став матерью несколько месяцев назад. В обоих случаях целенаправленный пошаговый подход помогает избежать расточительства ресурсов и уменьшает трение. Наконец, такой подход и в случае с малышами, и в случае с AI-моделями приводит к итеративному улучшению. С ростом ребенка или с тем, как модель учится больше, ее способности улучшаются. Это означает, что модели могут быть доработаны и улучшены, чтобы лучше справляться с реальными ситуациями.
Этот подход позволяет снизить затраты, предотвращая превращение AI-проектов в обременительные ресурсы, благодаря чему они становятся более доступными для меньших команд и организаций. Он также приводит к более быстрой производительности AI-моделей; и, поскольку модели не перегружены избыточными данными, их также можно настраивать для адаптации к новой информации и изменяющимся потребностям бизнеса – что особенно важно в конкурентных рынках.
Появление DeepSeek и мира более доступного, более эффективного AI – хотя изначально это вызвало панику в мире AI и на фондовых рынках – в целом является положительным развитием для сектора AI. Более высокая эффективность и более низкие затраты на AI, по крайней мере для определенных целенаправленных приложений, в конечном итоге приведут к более широкому использованию AI в целом, что способствует росту для всех: от разработчиков до производителей чипов и конечных пользователей. На самом деле, DeepSeek иллюстрирует парадокс Джевонса – когда большая эффективность, вероятно, приведет к большему использованию ресурса, а не к меньшему. Поскольку эта тенденция, похоже, будет продолжаться, малые бизнесы, сосредотачивающиеся на использовании AI для удовлетворения своих специфических нужд, также будут лучше подготованы для роста и успеха.
Пост Индивидуализированные LLM для каждого бизнеса? DeepSeek показывает нам путь впервые появился на Unite.AI.