ตามแหล่งข่าวที่ใกล้ชิดกับบริษัท Ant กำลังพึ่งพาชิปเซมิคอนดักเตอร์ของจีนในการฝึกโมเดลภาษาขั้นสูง โดยใช้แนวทางที่สัญญาว่าจะปฏิวัติวิธีการผลิต AI ในประเทศเอเชีย
จุดเปลี่ยนเชิงกลยุทธ์ในการฝึกอบรมโมเดล AI สำหรับ Ant Group
ในช่วงไม่กี่เดือนที่ผ่านมา Ant Group ได้ใช้ชิปที่จัดหาโดยบริษัทท้องถิ่น รวมถึงหน่วยงานที่เชื่อมโยงกับ Alibaba และ Huawei Technologies เพื่อฝึกโมเดล AI ของตนโดยใช้เทคนิค Mixture of Experts (MoE)
แม้ว่า Ant Group จะยังคงรักษาส่วนหนึ่งของการผลิต AI บนพื้นฐานของชิป Nvidia แต่บริษัทกำลังเปลี่ยนไปสู่ทางเลือกที่ประหยัดและเข้าถึงได้ง่ายมากขึ้น เช่นเดียวกับที่มีให้โดย AMD และผู้ผลิตจีน
ทางเลือกเชิงกลยุทธ์นี้เป็นการเปลี่ยนแปลงจากวิสัยทัศน์ของ CEO ของ Nvidia, Jensen Huang, ตามที่เขากล่าวว่า บริษัทต่างๆ จะยังคงต้องการพลังการคำนวณมากขึ้นเรื่อยๆ
Ant Group มุ่งเน้นไปที่ชิปจีนเพื่อเสริมสร้างกลยุทธ์ในด้านปัญญาประดิษฐ์ (AI)
ในบริบทโลกที่มีการแข่งขันทางเทคโนโลยีระหว่างสหรัฐอเมริกาและจีนมากขึ้น กลุ่มแอนท์ซึ่งอยู่ภายใต้การควบคุมของอาลีบาบา กำลังดำเนินการอย่างสำคัญเพื่อลดการพึ่งพาชิปของอเมริกาและควบคุมต้นทุนในการพัฒนาโมเดลปัญญาประดิษฐ์ (AI)
ตามแหล่งข่าวที่ใกล้ชิดกับบริษัท Ant กำลังพึ่งพาชิปเซมิคอนดักเตอร์ของจีนในการฝึกโมเดลภาษาขั้นสูง โดยใช้แนวทางที่สัญญาว่าจะปฏิวัติวิธีการผลิต AI ในประเทศเอเชีย
จุดเปลี่ยนเชิงกลยุทธ์ในการฝึกอบรมโมเดล AI สำหรับ Ant Group
ในช่วงไม่กี่เดือนที่ผ่านมา Ant Group ได้ใช้ชิปที่จัดหาโดยบริษัทท้องถิ่น รวมถึงหน่วยงานที่เชื่อมโยงกับ Alibaba และ Huawei Technologies เพื่อฝึกโมเดล AI ของตนโดยใช้เทคนิค Mixture of Experts (MoE)
แนวทางนี้ ซึ่งกำลังได้รับความนิยมมากขึ้นในหมู่นักวิจัย ช่วยให้สามารถแบ่งงานได้อย่างมีประสิทธิภาพระหว่าง "experti" ที่แตกต่างกันภายในโมเดล ทำให้ประสิทธิภาพการคำนวณดีขึ้น.
แหล่งข่าวมั่นใจว่าผลลัพธ์ของโมเดลเหล่านี้ไม่เพียงแต่สามารถเปรียบเทียบได้กับผลลัพธ์ที่ได้จากชิป Nvidia H800 เท่านั้น อย่างไรก็ตาม ในการทดสอบบางอย่าง โมเดลเหล่านี้อาจจะมีประสิทธิภาพเหนือกว่าโมเดลที่พัฒนาโดย Meta ด้วยซ้ำไป
แม้ว่าบลูมเบิร์กนิวส์จะยังไม่ได้ตรวจสอบผลการดำเนินงานเหล่านี้อย่างอิสระ ข้อมูลแสดงให้เห็นถึงความก้าวหน้าอย่างมีนัยสำคัญในความพยายามของจีนในการลดต้นทุนการดำเนินงานและลดการพึ่งพาเทคโนโลยี.
เทคนิค MoE ได้รับแรงบันดาลใจจากหลักการของการมอบหมายเฉพาะทาง: โมดูลย่อยแต่ละโมดูลของโมเดลมีหน้าที่รับผิดชอบในส่วนที่เฉพาะเจาะจงของการประมวลผล ซึ่งช่วยให้สามารถขยายขนาดและเพิ่มประสิทธิภาพได้มากกว่าวิธีการแบบดั้งเดิม
นอกจาก Ant Group แล้ว Google และสตาร์ทอัพจีนจากหางโจว DeepSeek ก็ใช้ระเบียบวิธีนี้เช่นกัน.
Ant ได้เน้นย้ำถึงความมุ่งมั่นในการเผยแพร่ทางวิทยาศาสตร์โดยการตีพิมพ์เอกสารที่เน้นเป้าหมายในการขยายโมเดลโดยไม่ใช้ GPU ระดับสูง
วิธีการนี้มีความสำคัญอย่างยิ่งสำหรับบริษัทที่ไม่สามารถใช้ฮาร์ดแวร์ประสิทธิภาพสูงอย่างต่อเนื่องได้ เนื่องจากต้นทุนที่สูง
จีน vs สหรัฐอเมริกา: ชิปในประเทศต่อต้าน GPU ของอเมริกา
โครงการของ Ant สอดคล้องกับบริบททางภูมิศาสตร์การเมืองที่บริษัทเทคโนโลยีจีนกำลังพยายามหลีกเลี่ยงข้อจำกัดของสหรัฐอเมริกาในการส่งออกชิปขั้นสูง เช่น Nvidia H800
แม้ว่ามันจะไม่ใช่ชิปที่ทันสมัยที่สุดในตลาด H800 ยังคงเป็นหนึ่งใน GPU ที่ทรงพลังที่สุดที่มีอยู่ในประเทศจีน.
แม้ว่า Ant Group จะยังคงรักษาส่วนหนึ่งของการผลิต AI บนพื้นฐานของชิป Nvidia แต่บริษัทกำลังเปลี่ยนไปสู่ทางเลือกที่ประหยัดและเข้าถึงได้ง่ายมากขึ้น เช่นเดียวกับที่มีให้โดย AMD และผู้ผลิตจีน
ทางเลือกเชิงกลยุทธ์นี้เป็นการเปลี่ยนแปลงจากวิสัยทัศน์ของ CEO ของ Nvidia, Jensen Huang, ตามที่เขากล่าวว่า บริษัทต่างๆ จะยังคงต้องการพลังการคำนวณมากขึ้นเรื่อยๆ
ตามที่ฮวงกล่าว การลงทุนของลูกค้าจะไม่ลดลงแม้จะมีการเกิดขึ้นของโมเดลที่มีประสิทธิภาพมากขึ้น เช่น DeepSeek R1 ซึ่งแสดงให้เห็นความแตกต่างที่ชัดเจนกับปรัชญาที่ถูกนำมาใช้โดย Ant.
หนึ่งในจุดเด่นของการวิเคราะห์ของ Ant คือการลดลงอย่างมีนัยสำคัญในต้นทุนการฝึกอบรมโมเดล AI
ตามเอกสารที่เผยแพร่ การฝึกโมเดลด้วยข้อมูลหนึ่งล้านล้านโทเคน ซึ่งเป็นหน่วยพื้นฐานที่ใช้ในการเรียนรู้ โดยปกติจะมีค่าใช้จ่ายประมาณ 6.35 ล้านหยวน ( ประมาณ 880,000 ดอลลาร์ )
โดยการใช้ชิปที่มีประสิทธิภาพน้อยกว่า แต่ได้รับการปรับให้เหมาะสมสำหรับวิธี MoE ค่าใช้จ่ายลดลงเหลือ 5.1 ล้านหยวน.
การประหยัดที่ไม่เล็กน้อย ซึ่งอาจเปลี่ยนแปลงความสามารถในการเข้าถึงปัญญาประดิษฐ์ โดยเฉพาะสำหรับสตาร์ทอัพและอุตสาหกรรมที่เกิดใหม่
โมเดลที่พัฒนา ได้แก่ Ling-Lite และ Ling-Plus ได้ถูกออกแบบมาเพื่อใช้ในแอปพลิเคชันในบริบทต่างๆ เช่น การดูแลสุขภาพและการเงิน ซึ่งเป็นสองพื้นที่ที่พลังของ AI สามารถนำเสนอแนวทางแก้ไขที่เป็นรูปธรรมและทันทีทันใดได้
โดยเฉพาะในด้านการดูแลสุขภาพ Ant ได้เข้าซื้อกิจการ Haodf.com ซึ่งเป็นหนึ่งในแพลตฟอร์มการแพทย์ออนไลน์ชั้นนำในประเทศจีน ซึ่งยืนยันความสนใจในการขยายข้อเสนอของโซลูชันที่อิงจากปัญญาประดิษฐ์.
บริการที่มีอยู่ของบริษัทยังรวมถึง Zhixiaobao ผู้ช่วยเสมือน และแพลตฟอร์มให้คำปรึกษาทางการเงิน Maxiaocai.
“
html การเปิดและอนาคตของปัญญาประดิษฐ์ในจีน “
อีกจุดเด่นของกลยุทธ์ของ Ant คือการเลือกที่จะทำให้โมเดลของพวกเขาเป็นโอเพนซอร์ส: Ling-Lite มีพารามิเตอร์ 16.8 พันล้าน ในขณะที่ Ling-Plus มีพารามิเตอร์ 290 พันล้าน
ในการเปรียบเทียบคาดว่า GPT-4.5 ซึ่งเป็นรุ่นขั้นสูงที่พัฒนาโดย OpenAI มีพารามิเตอร์ประมาณ 1.8 ล้านล้านตัว แม้ว่าจะปิดและไม่สามารถเข้าถึงได้โดยสาธารณะ การวิจัยที่ดําเนินการโดย Ant ไม่ได้ปราศจากความท้าทาย
การศึกษานี้ชี้ให้เห็นว่าในระหว่างการฝึกอบรม ความแปรปรวนเล็กน้อยในโครงสร้างของโมเดลหรือในประเภทของฮาร์ดแวร์สามารถทำให้เกิดความไม่เสถียรในประสิทธิภาพ เช่น การเพิ่มขึ้นของอัตราความผิดพลาด
ปัญหาทางโครงสร้างที่เน้นว่า แม้จะมีความก้าวหน้า แต่โมเดลที่ทันสมัยที่สุดยังต้องการความสนใจอย่างต่อเนื่อง.
ตามที่สังเกตโดย Robin Yu, CTO ของบริษัทเทคโนโลยีในกรุงปักกิ่ง Shengshang Tech ผลลัพธ์ที่จับต้องได้ที่ได้รับในโลกจริงคือสิ่งที่มีความสำคัญอย่างแท้จริง:
“ถ้าคุณค้นพบจุดอ่อนเพื่อเอาชนะสุดยอดปรมาจารย์กังฟูในโลก คุณก็ยังชนะอยู่ดี”
อุปมาอุปไมยที่มีประสิทธิภาพที่เน้นถึงคุณค่าของการประยุกต์ใช้งานจริงเมื่อเปรียบเทียบกับการเปรียบเทียบเชิงทฤษฎีเพียงอย่างเดียว.
สิ่งที่ชัดเจนคือ Ant Group กำลังมีบทบาทสำคัญในการพยายามของจีนในการเป็นอิสระทางเทคโนโลยีมากขึ้น
การแสวงหาปัญญาประดิษฐ์ที่เข้าถึงได้มากขึ้น ซึ่งไม่พึ่งพาอุปกรณ์ฮาร์ดแวร์จากตะวันตก และอาจมีประสิทธิภาพมากขึ้นสำหรับภาคอุตสาหกรรมเชิงกลยุทธ์ในอนาคต.
ความท้าทายต่อยักษ์ใหญ่ AI ของตะวันตกได้เริ่มขึ้น: ไม่ใช่เพื่อให้เกินพวกเขาด้วยกำลัง แต่ด้วยปัญญา ประสิทธิภาพ และวิสัยทัศน์เชิงกลยุทธ์.