В прошлом году США агрессивно ограничили возможности Китая разрабатывать искусственный интеллект в военных целях, запретив продажу туда самых передовых американских чипов, используемых для обучения ИИ-систем.
Значительный прогресс в чипах, применяемых для разработки генеративного ИИ, означает, что последние американские технологии, доступные в Китае, мощнее всего, что было раньше. Это несмотря на то, что чипы были специально ослаблены для китайского рынка, чтобы ограничить их возможности, делая их менее эффективными, чем продукты, доступные в других частях мира.
Результатом стал резкий рост заказов китайских компаний на последние передовые американские процессоры. Ведущие интернет-компании Китая разместили заказы на чипы Nvidia на $5 млрд, графические процессоры которой стали рабочей лошадкой для обучения больших ИИ-моделей.
Влияние растущего глобального спроса на продукцию Nvidia, вероятно, будет подкреплять финансовые результаты производителя чипов за второй квартал, которые должны быть объявлены в среду.
Помимо отражения спроса на улучшенные чипы для обучения последних крупных языковых моделей интернет-компаний, ажиотаж также был вызван опасениями, что США могут еще больше ужесточить экспортный контроль, сделав даже эти ограниченные продукты недоступными в будущем.
Однако Билл Далли, главный научный сотрудник Nvidia, предположил, что экспортный контроль США окажет большее воздействие в будущем.
«По мере того, как требования для самых передовых ИИ-систем к обучению продолжают удваиваться каждые 6-12 месяцев, — сказал он, — разрыв между чипами, продаваемыми в Китае, и теми, которые доступны в остальном мире, будет быстро расти».
Ограничение скоростей обработки
Прошлогодние ограничения США на экспорт чипов были частью пакета мер, который включал запрет китайским клиентам покупать оборудование, необходимое для производства передовых чипов.
Вашингтон установил предел максимальной скорости обработки чипов, которые могут продаваться в Китае, а также скорость передачи данных чипами — критически важный фактор при обучении больших ИИ-моделей, работа с большим объемом данных, требующая соединения большого количества чипов.
Nvidia отреагировала ограничением скорости передачи данных в своих процессорах A100, на тот момент самых передовых графических процессорах компании, создав для Китая новый продукт A800, удовлетворяющий требованиям экспортного контроля.
В этом году компания последовала ограничениями скорости передачи данных для H100, своего нового и значительно более мощного процессора, специально разработанного для обучения больших языковых моделей, создав для китайского рынка версию H800.
Производитель чипов не раскрыл технические характеристики процессоров, сделанных для Китая, но компьютерные производители были открыты в деталях. Например, Lenovo рекламирует серверы с чипами H800, которые, по ее словам, идентичны H100, продаваемым в остальном мире, за исключением скорости передачи 400 гигабайт в секунду.
Это ниже установленного США предела 600 ГБ/с для экспорта чипов в Китай. Для сравнения, Nvidia заявила, что ее H100, поставки которого клиентам начались в этом году, имеет скорость передачи 900 ГБ/с.
Более низкая скорость передачи в Китае означает, что пользователи этих чипов сталкиваются с более долгими сроками обучения своих ИИ-систем по сравнению с клиентами Nvidia в других частях мира — важное ограничение, поскольку модели выросли в размерах.
Более длительные сроки обучения повышают затраты, поскольку чипам потребуется больше энергии, одна из крупнейших статей расходов при больших моделях.
Тем не менее, даже с этими ограничениями, чипы H800, продаваемые в Китае, мощнее всего, что было доступно где-либо еще до этого года, что привело к огромному спросу.
Чипы H800 в пять раз быстрее чипов A100, которые были самыми мощными графическими процессорами Nvidia, по словам Патрика Мурхеда, американского аналитика чипов из Moor Insights & Strategy.
Это означает, что китайские интернет-компании, которые обучали свои ИИ-модели с использованием самых современных чипов, купленных до американского экспортного контроля, по-прежнему могут ожидать большого улучшения производительности при покупке последних полупроводников, сказал он.
“Похоже, правительство США не хочет полностью останавливать разработки ИИ в Китае, а лишь затруднить их”, — сказал Мурхед.
Соотношение затрат и выгод
Многие китайские технологические компании все еще находятся на стадии предварительного обучения больших языковых моделей, что требует большой производительности от отдельных графических процессоров и высокой пропускной способности передачи данных.
Только чипы Nvidia могут обеспечить эффективность, необходимую для предварительного обучения, говорят китайские инженеры по ИИ. Производительность отдельных чипов серии 800, несмотря на ослабленную скорость передачи, все еще опережает другие чипы на рынке.
“Графические процессоры Nvidia могут показаться дорогими, но на самом деле являются наиболее экономически эффективным вариантом”, — сказал один инженер по ИИ из ведущей китайской интернет-компании.
Другие поставщики GPU предлагали более низкие цены и более своевременное обслуживание, но компания сочла, что затраты на обучение и разработку вырастут, и у нее будет дополнительное бремя неопределенности.
Предложение Nvidia включает экосистему программного обеспечения со своей вычислительной платформой Cuda (Compute Unified Device Architecture), которую компания создала в 2006 году и которая стала частью ИИ-инфраструктуры.
Аналитики отрасли считают, что китайские компании вскоре могут столкнуться с ограничениями скорости взаимосвязи между чипами серии 800. Это может помешать их способности работать с растущим объемом данных, необходимых для обучения ИИ, и они будут сдерживаться в углублении в исследования и разработку больших языковых моделей.
Чарли Чай, аналитик из Шанхая в 86Research, сравнил ситуацию со строительством многих заводов с перегруженными автомагистралями между ними. Даже компании, которые могут использовать ослабленные чипы, могут столкнуться с проблемами в течение следующих двух-трех лет, добавил он.