На прошлой неделе акции полупроводниковых компаний, таких как Nvidia (NVDA – 1,71%), Advanced Micro Devices (AMD – 4,58%) и Micron Technology (MU – 0,82%), резко упали на новостях о том, что китайский стартап DeepSeek придумал, как обучать модели искусственного интеллекта (ИИ) за небольшую часть стоимости его американские аналоги.
Инвесторы были обеспокоены тем, что инновационный подход DeepSeek приведет к резкому падению спроса на графические процессоры (GPU) и другие компоненты центров обработки данных, которые являются ключевыми для разработки искусственного интеллекта. Однако эти опасения могут оказаться преувеличенными.
Meta Platforms (META 0,96%) является крупным покупателем чипов для искусственного интеллекта от Nvidia и AMD. 29 января генеральный директор Марк Цукерберг выступил с рядом комментариев, которые должны понравиться инвесторам, владеющим запасами оборудования для искусственного интеллекта.
Источник изображения: Getty Images.
Справочная информация о DeepSeek
Успешный китайский хедж-фонд высокого уровня уже много лет использует искусственный интеллект для создания торговых алгоритмов. В 2023 году компания выделила DeepSeek в отдельное подразделение, чтобы воспользоваться успехом других компаний, занимающихся исследованиями в области искусственного интеллекта, стоимость которых стремительно росла.
Паника на фондовом рынке на прошлой неделе была вызвана разработкой DeepSeek V3 large language model (LLM), которая по нескольким параметрам соответствует производительности последних моделей GPT-4o от ведущего американского стартапа в области искусственного интеллекта OpenAI. На первый взгляд, это не вызывает беспокойства, за исключением того, что DeepSeek утверждает, что потратил всего 5,6 миллиона долларов на подготовку версии 3, в то время как OpenAI потратил более 20 миллиардов долларов с 2015 года, чтобы достичь своей нынешней стадии.
Что еще более тревожит, DeepSeek не имеет доступа к новейшим графическим процессорам для центров обработки данных от Nvidia, поскольку правительство США запретило продавать их китайским фирмам. Это означает, что стартапу пришлось использовать более старые поколения, такие как H100 и маломощный H800, что указывает на возможность обучения ведущих моделей искусственного интеллекта без использования лучшего оборудования.
Чтобы компенсировать недостаток вычислительной производительности, DeepSeek внедрила инновации в области программного обеспечения, разработав более эффективные алгоритмы и методы ввода данных. Кроме того, компания внедрила методику, называемую дистилляцией, которая предполагает использование успешной модели для обучения своих собственных моделей меньшего размера. Это значительно ускоряет процесс обучения и требует гораздо меньших вычислительных мощностей.
Инвесторы обеспокоены тем, что если другие компании, занимающиеся ИИ, воспользуются подходом DeepSeek, им не нужно будет покупать столько графических процессоров у Nvidia или AMD. Это также снизит спрос на ведущие в отрасли решения Micron по производству памяти для центров обработки данных.
Nvidia, AMD и Micron способствуют революции в области ИИ
Графические процессоры Nvidia являются самыми популярными в мире для разработки моделей искусственного интеллекта.2025 финансовый год компании завершился 31 января, и, согласно прогнозам руководства, ее выручка, вероятно, более чем удвоилась до рекордных 128,6 миллиардов долларов (официальные результаты будут опубликованы 26 февраля). Если судить по последним кварталам, то около 88% этой выручки будет приходиться на сегмент центров обработки данных благодаря продажам графических процессоров.
Этот невероятный рост является причиной того, что за последние два года рыночная капитализация Nvidia увеличилась на 2,5 трлн долларов. Если спрос на чипы снизится, большая часть этой стоимости, скорее всего, исчезнет.
AMD стала достойным конкурентом Nvidia в сфере центров обработки данных. Компания планирует выпустить свой новый графический процессор MI350 позже в этом году, который, как ожидается, будет конкурировать с новейшими чипами Blackwell от Nvidia, ставшими золотым стандартом для обработки рабочих нагрузок искусственного интеллекта.
Но AMD также является ведущим поставщиком чипов искусственного интеллекта для персональных компьютеров, которые в будущем могут стать одним из основных сегментов роста. Поскольку LLM становятся дешевле и эффективнее, в конечном итоге их можно будет использовать на чипах меньшего размера внутри компьютеров и устройств, что снизит зависимость от внешних центров обработки данных.
Наконец, Micron часто упускают из виду как компанию, производящую чипы для искусственного интеллекта, но она играет важнейшую роль в отрасли. Память HBM3E (high-bandwidth memory) для центров обработки данных является лучшей в своем классе с точки зрения емкости и энергоэффективности, поэтому Nvidia использует ее в своих новейших графических процессорах Blackwell. Память хранит информацию в состоянии готовности, что позволяет графическому процессору мгновенно получать ее при необходимости, а поскольку рабочие нагрузки ИИ требуют больших объемов данных, это важная часть аппаратной головоломки.
Источник изображения: Getty Images.
Марк Цукерберг, возможно, развеял недавние опасения.
В течение 2024 года Meta Platforms потратила на чипы и инфраструктуру центров обработки данных колоссальные 39,2 миллиарда долларов, а в этом году планирует потратить еще 65 миллиардов долларов. Эти инвестиции помогают компании продвигать свои LLMS Llama, которые являются самыми популярными моделями с открытым исходным кодом в мире, с 600 миллионами загрузок. Llama 4 должна быть запущена в этом году, и генеральный директор Марк Цукерберг считает, что она может стать самой продвинутой в отрасли и превзойти по производительности даже лучшие модели с закрытым исходным кодом.
29 января компания Meta провела телефонную конференцию с аналитиками, посвященную четвертому кварталу 2024 года. Когда Цукерберга спросили о потенциальном влиянии DeepSeek, он сказал, что, вероятно, еще слишком рано определять, что это означает для капиталовложений в чипы и центры обработки данных. Однако, по его словам, даже если это приведет к снижению требований к мощности для обучения ИИ, это не значит, что компаниям потребуется меньше чипов.
Вместо этого, по его мнению, потенциал может перейти от обучения к логическому выводу, который представляет собой процесс, с помощью которого модели ИИ обрабатывают данные, поступающие от пользователей, и формируют ответы. Многие разработчики отходят от моделей обучения, используя бесконечные объемы данных, и вместо этого сосредотачиваются на возможностях “рассуждения”. Это называется масштабированием во время тестирования, и оно предполагает, что модели требуется дополнительное время на “обдумывание” перед выводом результатов, что приводит к более качественным ответам.
Логические рассуждения требуют больших вычислительных ресурсов, поэтому Цукерберг считает, что компаниям по-прежнему потребуется лучшая инфраструктура центров обработки данных, чтобы сохранить преимущество перед конкурентами. Кроме того, большинство программных продуктов для искусственного интеллекта еще не получили широкого распространения, и Цукерберг признает, что для обслуживания большого количества пользователей со временем потребуются дополнительные мощности центров обработки данных.
Таким образом, хотя трудно назвать точные цифры о том, как инновации DeepSeek изменят спрос на чипы, комментарии Цукерберга говорят о том, что у инвесторов в акции Nvidia, AMD и Micron нет причин для паники. На самом деле, есть даже основания для роста этих акций в долгосрочной перспективе.

