Anthropic раскрыл, как китайские AI-компании крадут данные у Claude и создают собственные LLM!



Перед этим напомню, что несколько дней назад я публиковал пост о том, что «из пяти ведущих AI-компаний мира по использованию API четыре принадлежат Китаю. AI-модели, созданные в Китае, дают результаты, близкие к Claude, а стоимость API примерно в 8-10 раз ниже. Именно поэтому их модели так широко используются в индустрии». Но как они достигли этой способности?

Давайте попробуем разобраться подробнее.

DeepSeek, Moonshot AI (Kimi) и MiniMax — против этих компаний Anthropic выдвинул обвинения: они устроили индустриальную атаку на модель Claude. То есть, они полностью скопировали расширенные возможности Claude и пытались обучить свои модели на этих данных. Для этого они создали около 24 тысяч фальшивых аккаунтов и взаимодействовали с Claude более 16 миллионов раз. Их целью было овладеть расширенными возможностями Claude: рассуждениями, поведением агента, навыками кодирования и использованием инструментов.

DeepSeek с помощью примерно полутора lakh взаимодействий пытался выявить внутреннюю логику или пошаговое рассуждение Claude. Более того, они использовали Claude как систему оценки своих моделей, чтобы судить о качестве выходных данных! В то же время, Moonshot AI совершил около 34 lakh взаимодействий, чтобы скопировать именно агентские рассуждения и использование инструментов. А наиболее агрессивной оказалась MiniMax: они совершили около 130 lakh взаимодействий, сосредоточившись на кодировании и оркестрации. Интересно, что когда Anthropic обнаруживал и блокировал их, они в течение 24 часов быстро переключались на новую модель Anthropic и снова начинали извлекать данные.

Весь этот процесс они организовали очень продуманно и децентрализованно. Чтобы избежать обнаружения, они использовали ротацию IP-адресов, совместные платежные методы и синхронизированную активность между тысячами аккаунтов. Такой уровень деятельности считается, по мнению экспертов, крупнейшей задокументированной кампанией по дистилляции AI-моделей.

За этим стоит интересный геополитический контекст. Несколько дней назад OpenAI предупредил правительство США в меморандуме, что китайские лаборатории косвенно пытаются получить доступ к моделям, находящимся на американской границе.

Но возникает вопрос: что они собираются делать, украдя столько данных?
Ответ: используя расширенные данные Claude, они сделают свои модели еще мощнее. Обработка таких огромных объемов данных требует больших дата-центров и суперкомпьютеров, что потребляет огромное количество электроэнергии. Удивительно, что только к 2025 году Китай добавил более 500 Гигаватт новой мощности, что почти в 10 раз больше, чем в США!

То есть, они планируют извлечь данные из американских AI-моделей и развернуть свою AI-инфраструктуру на индустриальном уровне. Пока что ни одна из трех обвиняемых китайских AI-компаний не опровергла публично обвинения в краже данных.
Посмотреть Оригинал
post-image
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$0.1Держатели:1
    0.00%
  • РК:$2.38KДержатели:2
    0.00%
  • РК:$0.1Держатели:1
    0.00%
  • РК:$2.38KДержатели:2
    0.00%
  • РК:$0.1Держатели:0
    0.00%
  • Закрепить