Китайская компания DeepSeek представила открытую модель искусственного интеллекта, что совпало с действиями OpenAI, которая впервые за шесть лет также анонсировала аналогичную модель. Это событие стало значительным шагом на фоне растущих призывов американских компаний к открытию своих ИИ-технологий. Об этом сообщает Latvia Today.
Что такое открытая модель ИИ
Открытая модель или open source — это программное обеспечение, имеющее открытый код, доступный для просмотра и модификации. Все такие модели должны соответствовать строгим правилам распространения и доступности.
В контексте искусственного интеллекта это подразумевает, что разработчики обязаны раскрывать информацию о данных, на которых обучалась модель, а также позволять другим использовать, изменять и исследовать систему без ограничений.
Закрытые модели, напротив, не подлежат модификации, и их внутренние механизмы остаются непрозрачными.
Кто из техногигантов открывает свои модели
Несмотря на заявления некоторых компаний о предоставлении open source моделей, на практике не все из них действительно соответствуют этому определению. Например, компании Meta, французский стартап Mistral и DeepSeek предоставляют доступ только к так называемым «весам» моделей — числовым параметрам, полученным во время обучения, не раскрывая при этом данные о процессе обучения.
Meta ограничивает доступ к своему коду и данным, а ее лицензии накладывают ограничения на коммерческое использование. DeepSeek, заявив о запуске модели R1, не опубликовала ни код, ни обучающий набор, что вызывает сомнения по поводу уровня прозрачности.
Хотя OpenAI в своем названии имеет слово «открытый», фактически большинство ее моделей закрыты для доступа. В августе компания анонсировала публикацию двух open-weight моделей GPT-oss-120b и GPT-oss-20b на платформе Hugging Face, которые способны генерировать текст по запросам, но не работают с изображениями или видео.
Почему открытые модели набирают популярность
Преимущества открытого программного обеспечения заключаются в:
- доступности — возможность использования моделей без лицензионных платежей;
- прозрачности — возможность проверки работы системы;
- инновациях — снижение затрат ведет к развитию технологий;
- конкуренции — открытость помогает предотвратить монополию крупных компаний.
Компании, такие как Meta, смогли расширить своё влияние в области ИИ благодаря привлечению разработчиков через открытые модели.
Однако открытые модели представляют и риски:
- безопасность — модель может быть использована для вредоносных целей;
- шпионаж — пользовательские данные могут быть раскрыты враждебным организациям;
- техническое преимущество — другие страны могут использовать открытые разработки для создания собственных моделей.
Почему DeepSeek выбрала открытый путь
Открытие данных компанией DeepSeek помогло уменьшить опасения по поводу угрозы контроля Китая над технологиями, а также обеспечило иностранным разработчикам доступ к китайскому ИИ.
Следуя примеру Meta, она стремится укрепить свои позиции в глобальной экосистеме ИИ.
– Это большое геополитическое соревнование, и Китай очень активно в него включился. Если должна существовать общая открытая модель, мы должны стремиться, чтобы это была американская модель, — отметил основатель Meta Марк Цукерберг.
Модель DeepSeek R1, подобно разработкам OpenAI и Google, способна имитировать человеческое мышление, анализируя запросы перед формированием ответа, основываясь на предыдущей версии V3.
Для оптимизации работы без мощных чипов, запрещённых к экспорту в Китай, DeepSeek внедрила метод обучения с подкреплением, который предусматривает «награду» за верные ответы и «штраф» за ошибки.
Среди экспертов в США существует смешанная реакция. С одной стороны, отмечается инженерная эффективность разработки, с другой — подозрения, что DeepSeek могла воспользоваться западными разработками, обойдя значительные расходы на создание собственной модели.
Позиция Вашингтона в отношении открытых моделей ИИ
В 2024 году администрация Джо Байдена решила не вводить ограничения на открытые модели, однако оставила за собой возможность сделать это в будущем.
Администрация Дональда Трампа, в свою очередь, выразила поддержку открытым моделям и моделям с открытыми весами. В июльском AI Action Plan Белого дома подчеркивается, что такие системы могут стать глобальным стандартом в науке и бизнесе и имеют геостратегическое значение.