У глобальному контексті, що дедалі більше визначається технологічною конкуренцією між США та Китаєм, Ant Group, контрольована Alibaba, вживає значних кроків для зменшення своєї залежності від американських чіпів та стримування витрат на розробку моделей штучного інтелекту (AI).
Згідно з джерелами, близькими до компанії, Ant покладається на китайські напівпровідники для навчання своїх передових мовних моделей, використовуючи підхід, який обіцяє революціонізувати спосіб виробництва ШІ в азійській країні.
Стратегічний поворотний момент у навчанні моделей ШІ для Ant Group
Останніми місяцями Ant Group використовувала чіпи, постачені місцевими компаніями, зокрема підприємствами, пов'язаними з Alibaba та Huawei Technologies, для навчання своїх AI-моделей за допомогою техніки Mixture of Experts (MoE).
Такий підхід, що набуває все більшого поширення серед дослідників, дозволяє ефективно розподіляти завдання між різними «експертами» всередині моделі, підвищуючи її обчислювальну ефективність.
Джерела запевняють, що результати цих моделей не лише порівнянні з тими, що отримані за допомогою чіпів Nvidia H800. Однак у деяких тестах вони навіть перевищили продуктивність моделей, розроблених Meta.
Хоча Bloomberg News не перевіряла ці ціни самостійно, дані вказують на значний прогрес у спробах Китаю зменшити експлуатаційні витрати та знизити технологічну залежність.
Техніка MoE натхнена принципом спеціалізованої делегації: кожен підмодуль моделі відповідає за певну частину обробки, що дозволяє досягти більшої масштабованості та ефективності в порівнянні з традиційними підходами.
Окрім Ant Group, Google та китайський стартап з Ханчжоу DeepSeek також використовують цю методологію.
Ant підкреслив свою прихильність до наукового поширення, опублікувавши статтю, в якій підкреслюється мета масштабування моделей без використання високопродуктивних графічних процесорів.
Цей підхід стає вирішальним для компаній, які через високі витрати не можуть дозволити собі постійно використовувати апаратуру високої продуктивності.
Китай проти Сполучених Штатів: локальні чіпи проти американських GPU
Ініціатива Ant вписується в геополітичний контекст, у якому китайські технологічні компанії намагаються обійти обмеження США на експорт розвинутих чипів, таких як Nvidia H800.
Хоча це не найсучасніший чіп на ринку, H800 все ще є одним з найпотужніших GPU, доступних у Китаї.
Хоча Ant Group все ще підтримує частину свого виробництва ШІ на основі чіпів Nvidia, компанія поступово переходить до більш економічних і легкодоступних альтернатив. Як ті, що пропонуються AMD та китайськими виробниками.
Цей стратегічний вибір є відступом від бачення генерального директора Nvidia, Дженсена Хуана, згідно з яким компанії продовжуватимуть вимагати все більше обчислювальної потужності.
Згідно з Хуаном, інвестиції клієнтів не зменшаться, навіть з появою більш ефективних моделей, таких як DeepSeek R1. Це чітко контрастує з філософією, прийнятою Ant.
Однією з основних тем аналізу Ant є суттєве зниження вартості навчання AI-моделей
Згідно з опублікованим документом, навчання моделі на трильйоні токенів, базових одиницях, що використовуються для навчання, традиційно коштує близько 6,35 мільйона юанів ( приблизно 880 000 доларів ).
Завдяки використанню менш продуктивних чіпів, оптимізованих для методу MoE, вартість була знижена до 5,1 мільйона юанів.
Немаргінальне заощадження, яке може революціонізувати доступність до штучного інтелекту, особливо для стартапів та нових промислових секторів.
Моделі, розроблені Ling-Lite та Ling-Plus, були створені для застосування в таких сферах, як охорона здоров'я та фінанси, двох областях, де потужність ШІ може запропонувати конкретні та негайні рішення.
Точно в сфері охорони здоров'я Ant нещодавно придбав Haodf.com, одну з провідних онлайн-медичних платформ у Китаї. Таким чином, підтверджуючи свій інтерес до розширення пропозицій рішень на основі штучного інтелекту.
Серед існуючих послуг компанії також є Zhixiaobao, віртуальний помічник, та фінансовий консультаційний майданчик Maxiaocai.
“html Відкриття та майбутнє китайського штучного інтелекту “
Ще однією відмінною рисою стратегії Ant є вибір зробити свої моделі з відкритим вихідним кодом: Ling-Lite має 16,8 мільярдів параметрів, тоді як Ling-Plus досягає 290 мільярдів.
Щоб зробити порівняння, оцінюється, що GPT-4.5, розроблена компанією OpenAI, має близько 1,8 трильйона параметрів. Хоча вона закрита і недоступна для публіки. Дослідження, проведене Ant, не обходиться без викликів.
Те саме дослідження вказує на те, що під час навчання невеликі варіації в структурі моделей або в типі апаратного забезпечення можуть спричинити нестабільність у продуктивності, такі як сплески в рівнях помилок.
Структурна складність, яка підкреслює, як, незважаючи на прогрес, навіть найсучасніші моделі потребують постійної уваги.
Як зазначив Робін Ю, технічний директор технологічної компанії Шеншан Тек з Пекіна, важливими є не лише досягнуті результати в реальному світі:
“Якщо ви знайдете слабке місце, щоб перемогти найкращого майстра кунг-фу у світі, ви все ще виграли.”
Ефективна метафора, яка підкреслює цінність практичних застосувань у порівнянні з простим теоретичним порівнянням.
Ясно, що група Ant відіграє ключову роль у спробі Китаю стати більш технологічно автономним.
Таким чином, прагнучи до більш доступного ШІ, менш залежного від західного обладнання та потенційно більш ефективного для стратегічних промислових секторів майбутнього.
Виклик західним гігантам ШІ оголошено: не перевершити їх грубою силою, а інтелектом, ефективністю та стратегічним баченням.
Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
Ant Group зосереджується на китайських чипах, щоб зміцнити свою стратегію в штучному інтелекті (AI)
У глобальному контексті, що дедалі більше визначається технологічною конкуренцією між США та Китаєм, Ant Group, контрольована Alibaba, вживає значних кроків для зменшення своєї залежності від американських чіпів та стримування витрат на розробку моделей штучного інтелекту (AI).
Згідно з джерелами, близькими до компанії, Ant покладається на китайські напівпровідники для навчання своїх передових мовних моделей, використовуючи підхід, який обіцяє революціонізувати спосіб виробництва ШІ в азійській країні.
Стратегічний поворотний момент у навчанні моделей ШІ для Ant Group
Останніми місяцями Ant Group використовувала чіпи, постачені місцевими компаніями, зокрема підприємствами, пов'язаними з Alibaba та Huawei Technologies, для навчання своїх AI-моделей за допомогою техніки Mixture of Experts (MoE).
Такий підхід, що набуває все більшого поширення серед дослідників, дозволяє ефективно розподіляти завдання між різними «експертами» всередині моделі, підвищуючи її обчислювальну ефективність.
Джерела запевняють, що результати цих моделей не лише порівнянні з тими, що отримані за допомогою чіпів Nvidia H800. Однак у деяких тестах вони навіть перевищили продуктивність моделей, розроблених Meta.
Хоча Bloomberg News не перевіряла ці ціни самостійно, дані вказують на значний прогрес у спробах Китаю зменшити експлуатаційні витрати та знизити технологічну залежність.
Техніка MoE натхнена принципом спеціалізованої делегації: кожен підмодуль моделі відповідає за певну частину обробки, що дозволяє досягти більшої масштабованості та ефективності в порівнянні з традиційними підходами.
Окрім Ant Group, Google та китайський стартап з Ханчжоу DeepSeek також використовують цю методологію.
Ant підкреслив свою прихильність до наукового поширення, опублікувавши статтю, в якій підкреслюється мета масштабування моделей без використання високопродуктивних графічних процесорів.
Цей підхід стає вирішальним для компаній, які через високі витрати не можуть дозволити собі постійно використовувати апаратуру високої продуктивності.
Китай проти Сполучених Штатів: локальні чіпи проти американських GPU
Ініціатива Ant вписується в геополітичний контекст, у якому китайські технологічні компанії намагаються обійти обмеження США на експорт розвинутих чипів, таких як Nvidia H800.
Хоча це не найсучасніший чіп на ринку, H800 все ще є одним з найпотужніших GPU, доступних у Китаї.
Хоча Ant Group все ще підтримує частину свого виробництва ШІ на основі чіпів Nvidia, компанія поступово переходить до більш економічних і легкодоступних альтернатив. Як ті, що пропонуються AMD та китайськими виробниками.
Цей стратегічний вибір є відступом від бачення генерального директора Nvidia, Дженсена Хуана, згідно з яким компанії продовжуватимуть вимагати все більше обчислювальної потужності.
Згідно з Хуаном, інвестиції клієнтів не зменшаться, навіть з появою більш ефективних моделей, таких як DeepSeek R1. Це чітко контрастує з філософією, прийнятою Ant.
Однією з основних тем аналізу Ant є суттєве зниження вартості навчання AI-моделей
Згідно з опублікованим документом, навчання моделі на трильйоні токенів, базових одиницях, що використовуються для навчання, традиційно коштує близько 6,35 мільйона юанів ( приблизно 880 000 доларів ).
Завдяки використанню менш продуктивних чіпів, оптимізованих для методу MoE, вартість була знижена до 5,1 мільйона юанів.
Немаргінальне заощадження, яке може революціонізувати доступність до штучного інтелекту, особливо для стартапів та нових промислових секторів.
Моделі, розроблені Ling-Lite та Ling-Plus, були створені для застосування в таких сферах, як охорона здоров'я та фінанси, двох областях, де потужність ШІ може запропонувати конкретні та негайні рішення.
Точно в сфері охорони здоров'я Ant нещодавно придбав Haodf.com, одну з провідних онлайн-медичних платформ у Китаї. Таким чином, підтверджуючи свій інтерес до розширення пропозицій рішень на основі штучного інтелекту.
Серед існуючих послуг компанії також є Zhixiaobao, віртуальний помічник, та фінансовий консультаційний майданчик Maxiaocai.
“
html Відкриття та майбутнє китайського штучного інтелекту “
Ще однією відмінною рисою стратегії Ant є вибір зробити свої моделі з відкритим вихідним кодом: Ling-Lite має 16,8 мільярдів параметрів, тоді як Ling-Plus досягає 290 мільярдів.
Щоб зробити порівняння, оцінюється, що GPT-4.5, розроблена компанією OpenAI, має близько 1,8 трильйона параметрів. Хоча вона закрита і недоступна для публіки. Дослідження, проведене Ant, не обходиться без викликів.
Те саме дослідження вказує на те, що під час навчання невеликі варіації в структурі моделей або в типі апаратного забезпечення можуть спричинити нестабільність у продуктивності, такі як сплески в рівнях помилок.
Структурна складність, яка підкреслює, як, незважаючи на прогрес, навіть найсучасніші моделі потребують постійної уваги.
Як зазначив Робін Ю, технічний директор технологічної компанії Шеншан Тек з Пекіна, важливими є не лише досягнуті результати в реальному світі:
“Якщо ви знайдете слабке місце, щоб перемогти найкращого майстра кунг-фу у світі, ви все ще виграли.”
Ефективна метафора, яка підкреслює цінність практичних застосувань у порівнянні з простим теоретичним порівнянням.
Ясно, що група Ant відіграє ключову роль у спробі Китаю стати більш технологічно автономним.
Таким чином, прагнучи до більш доступного ШІ, менш залежного від західного обладнання та потенційно більш ефективного для стратегічних промислових секторів майбутнього.
Виклик західним гігантам ШІ оголошено: не перевершити їх грубою силою, а інтелектом, ефективністю та стратегічним баченням.