Технологические компании и учёные давно боролись с рисками и выгодами разработки программного обеспечения с открытым исходным кодом. Но ажиотаж вокруг генеративного искусственного интеллекта придал этим дебатам новый смысл.
DeepSeek и другие китайские компании выпустили ряд недорогих моделей с открытым исходным кодом, конкурирующих с программным обеспечением ведущих американских разработчиков искусственного интеллекта. В ответ OpenAI, ведущая американская компания в области искусственного интеллекта, выпустила новую открытую модель, первую за шесть лет. Администрация Трампа призвала другие американские технологические компании последовать её примеру.
Вот что вам нужно знать.
Что такое открытый исходный код?
В целом, открытый исходный код относится к программному обеспечению с исходным кодом, который предоставляется в свободный доступ любому человеку для использования или модификации. Согласно Open Source Initiative (OSI), калифорнийской некоммерческой организации, выступающей за преимущества такого подхода к работе, чтобы считаться программным обеспечением с открытым исходным кодом, оно должно соответствовать определённым условиям распространения и доступа.
По словам OSI, для того чтобы модель ИИ считалась по-настоящему открытой, ее разработчики должны предоставить подробную информацию о данных, на которых она обучалась, и предоставить людям возможность изучать, использовать и модифицировать систему в любых целях.
Закрытый исходный код, напротив, относится к программному обеспечению и моделям, которые контролируются разработчиком, не могут быть изменены и обеспечивают меньшую прозрачность в отношении их технической основы.
Предлагают ли ведущие разработчики ИИ программное обеспечение с открытым исходным кодом?
Многие технологические компании позиционируют свое программное обеспечение ИИ как программное обеспечение с открытым исходным кодом; не все согласны с тем, что они соответствуют этому определению.
Meta Platforms Inc. , французский стартап Mistral , а теперь и DeepSeek выпустили модели ИИ, которые они называют открытым исходным кодом.
Но зачастую такие модели на самом деле являются моделями с открытыми весами. Это означает, что помимо предоставления самой модели и, возможно, части её исходного кода, компании раскрывают веса — то есть множество числовых значений, которые модель собрала и скорректировала в процессе обучения, что позволяет разработчикам лучше её настраивать, — но не раскрывают подробности о данных, фактически использованных для её обучения.
Например, Meta предоставляет весовые коэффициенты и часть исходного кода для своей серии ИИ-моделей Llama, но не предоставляет подробную информацию об обучающих данных. Ранее OSI уже критиковала Meta за условия лицензирования, которые включают определённые ограничения на коммерческое использование.
Аналогичным образом, в январе DeepSeek заявила, что выпустила свою новейшую систему R1 в качестве модели с открытым исходным кодом, но не предоставила ни кода, ни данных для обучения. Это вызвало вопросы о том, что именно компания могла использовать для создания своей модели.
Несмотря на слово «открытый» в названии, OpenAI не открывает исходный код большинства своих моделей. Однако вскоре после вирусного успеха DeepSeek генеральный директор OpenAI Сэм Альтман признал, что создателю ChatGPT необходимо «разработать другую стратегию открытого исходного кода». Он добавил: «Лично я считаю, что мы оказались на неправильной стороне истории».
В августе компания OpenAI выпустила две модели , GPT-oss-120b и GPT-oss-20b, представляющие собой системы с открытыми весами, аналогичные Llama. Модели доступны бесплатно на платформе Hugging Face, специализирующейся на хостинге программного обеспечения для ИИ. Модели могут имитировать процесс человеческого мышления и генерировать текст (но не изображения или видео) в ответ на запросы пользователя.
Каковы преимущества открытого исходного кода?
Сторонники открытого программного обеспечения обычно рекламируют его как более доступное для пользователей, поскольку оно не требует таких же лицензионных сборов. Более низкие цены открывают путь к более широкому внедрению ИИ, а снижение затрат на разработку способствует инновациям. Сторонники также отмечают, что такой подход повышает ответственность разработчиков, создающих мощные системы ИИ, предоставляя другим возможность лучше понимать, как работают модели.
Закрытые системы создают риск формирования рынка ИИ, на котором будет доминировать горстка влиятельных компаний. Аарон Леви , генеральный директор компании Box Inc. , занимающейся облачным хранением данных , заявил: «В мире очень дорогого и проприетарного ИИ поставщики ИИ могут и, вероятно, должны будут оставить всю экономическую выгоду себе, фактически лишая разработчиков и экосистему возможностей».
Для таких компаний, как Meta, открытый исходный код даёт дополнительное преимущество: популярность. Предоставляя другим разработчикам свободный доступ к своему программному обеспечению с открытым исходным кодом и возможность его дорабатывать, Meta смогла расширить своё влияние в экосистеме искусственного интеллекта.
Каковы риски открытых систем?
Критики программного обеспечения с открытым исходным кодом утверждают, что оно менее безопасно. Что касается ИИ, некоторые в США опасаются, что использование подобных моделей конкурентов, таких как Китай, представляет угрозу национальной безопасности , угрожая безопасности граждан. Например, модели, собирающие огромные объёмы пользовательских данных, могут использоваться для слежки. Кроме того, существуют опасения, что американские компании, предлагающие свои модели ИИ с различной степенью открытости, могут потенциально дать странам-конкурентам возможность использовать их для технологического превосходства над США.
Почему DeepSeek пошёл по «открытому» пути?
Выбрав более открытый подход (с некоторыми оговорками), DeepSeek, возможно, смягчил опасения пользователей по всему миру по поводу жёсткого контроля Китая над технологией. Стартап также, вероятно, расширил охват своего чат-бота на западных рынках, упростив другим разработчикам адаптацию базовой технологии под свои нужды.
Другими словами, DeepSeek фактически следовал той же схеме, которую использовала Meta для охвата большей части экосистемы ИИ — факт, который, похоже, не остался незамеченным генеральным директором Meta Марком Цукербергом .
«Это огромное геополитическое соревнование, и Китай в нём участвует изо всех сил», — заявил Цукерберг в интервью The Joe Rogan Experience . «Если и должна быть модель с открытым исходным кодом, которой будут пользоваться все, то мы должны выбрать американскую модель».
Так как же работает модель искусственного интеллекта DeepSeek?
Как и некоторые из последних моделей ведущих американских разработчиков, включая OpenAI и Google , DeepSeek R1 призван имитировать человеческие размышления над проблемами, тратя время на вычисление ответа, прежде чем отвечать на запросы пользователей. Однако версия DeepSeek, созданная на основе одной из недавно выпущенных моделей компании, V3, отличается от своих американских аналогов своей эффективностью.
Команда, стоящая за этим проектом, действовала инновационно. В то время как конкуренты использовали огромное количество мощных компьютерных чипов для создания аналогичных моделей ИИ, команда DeepSeek, похоже, нашла способы эффективно использовать относительно небольшое количество менее продвинутых чипов, к которым они имели доступ благодаря экспортному контролю США на самые современные чипы. Они активно использовали метод, известный как обучение с подкреплением, который вознаграждает систему за правильные ответы и наказывает за неправильные.
В США некоторые лидеры в области технологий и политики признали эти достижения, одновременно задаваясь вопросом о том, не построила ли китайская компания своего чат-бота на основе западных технологий, избежав тем самым огромных затрат на разработку крупных языковых моделей — строительных блоков чат-ботов.