Китайская компания DeepSeek, одна из ведущих в сфере искусственного интеллекта, столкнулась с серьезными трудностями в реализации масштабного национального проекта по развитию отечественных технологий. Основанный на амбициях обеспечить технологическую независимость страны, проект по обучению новой модели R2 был задуман как значимый шаг вперед. Однако на этапе практической реализации возникли неожиданные преграды, связанные с использованием чипов Huawei Ascend, которые должны были стать основой для обучения модели.
Несмотря на настоятельные рекомендации китайских властей и стратегическую важность использования отечественного оборудования, команда DeepSeek столкнулась с критическими техническими проблемами. В отличие от результатов, достигаемых при использовании стандартных вычислительных систем, такие как графические процессоры Nvidia, китайские чипы оказались недостаточно мощными для выполнения интенсивных задач тренировки нейросетей. Обучение искусственного интеллекта — это очень ресурсозатный процесс, требующий высокой вычислительной мощности и стабильности работы аппаратного обеспечения. В данном случае, чипы Huawei Ascend не справлялись с этой нагрузкой, что привело к остановке проекта и срыву запланированного релиза на май.
Особенно важным моментом является различие между этапами обучения и использования модели. Обучение — это непрерывный и интенсивный процесс, требующий высокой вычислительной мощности, тогда как использование модели на практике — это уже более лёгкий этап, когда алгоритм работает с предварительно обученными весами. В случае с Huawei Ascend, чипы могли успешно выполнять вывод, то есть использование модели для предсказаний, но не выдерживали нагрузку при долгосрочной тренировке. Это расстроило все планы компании и подтвердило существующее отставание китайских решений от передовых западных технологий.
Даже специалисты Huawei, лично прибывшие в офис DeepSeek для оказания технической поддержки, не смогли устранить проблему. Этот факт подчеркивает, что отечественные разработки в области аппаратного обеспечения ещё не достигли уровня, необходимого для проведения полномасштабных научных и технологических экспериментов в сфере искусственного интеллекта. Признание руководства Huawei о необходимости использовать зарубежные графические процессоры должно было стать тревожным сигналом для китайских стратегов, демонстрируя технологическую зависимость и слабые стороны в национальной инфраструктуре.
Результатом этого кризиса стал возврат DeepSeek к использованию систем Nvidia, известных своей мощностью и надежностью в области обучения нейросетей. Это решение не только позволило продолжить работы над моделью R2, но и стало ярким примером борьбы между прагматизмом и национальными амбициями. Внутри компании ходили слухи о недовольстве основателя Вэньфэнь Ляна, который требует ускорить процессы и добиться действительно прорывных результатов. Он настаивает на разработке уникальных решений, способных заменить западные технологии и обеспечить независимость в области искусственного интеллекта.
Этот случай показывает, насколько сложно добиться технологического суверенитета и насколько важна надежная инфраструктура для развития высокотехнологичных проектов. Несмотря на значительный прогресс, Китай всё ещё отстает от Запада в области аппаратных решений для искусственного интеллекта. Взгляд на текущую ситуацию заставляет задуматься о необходимости дальнейших инвестиций в исследования, разработку собственных чипов и создание условий, при которых страны смогут самостоятельно обеспечивать свои технологические потребности. В будущем, чтобы достичь амбициозных целей, подобные проекты должны сочетать передовые разработки с надежной технической основой, что является ключевым фактором для успеха в высокотехнологичных областях.