ChatGPTAI OpenAI telah ada selama tiga tahun. Medan perang yang sebenarnya telah bergeser ke daya komputasi, biaya, dan ekosistem. Pemenang atau pecundang utama mungkin bukan model itu sendiri, tetapi siapa yang dapat menjadikan AI sebagai sistem lengkap yang bekerja secara berkelanjutan. (Sinopsis: ChatGPT akan mendukung debit langsung PayPal pada tahun 2026, bagian terakhir dari teka-teki kerajaan e-commerce Openai) (Suplemen latar belakang: Browser asli Openai “ChatGPT Atlas” tiga fungsi utama sekaligus, agen AI dapat mengguncang hegemoni Chrome? Dari peluncuran ChatGPT pada 30 November 2022, hingga tepat tiga tahun sekarang, industri teknologi telah berkembang dengan kecepatan yang luar biasa. Pada saat itu, semua orang berpikir bahwa persaingan AI akan menjadi “perang model” murni: siapa pun yang memiliki parameter model yang lebih besar, data yang lebih tebal, dan daya komputasi yang lebih keras akan menjadi raja di pasar ini. Namun, tiga tahun kemudian, melihat ke belakang, saya menyadari bahwa imajinasi awal itu sebenarnya terlalu disederhanakan. Persaingan sebenarnya tidak pernah “siapa yang bisa membuat model terbesar”, tetapi “siapa yang bisa mengubah model menjadi sistem yang lengkap”. Seperangkat sistem yang dapat mendarat, dapat dikomersialkan, dapat membawa biaya, dapat mendukung konsumsi daya komputasi, dan dapat bertahan dalam alur kerja perusahaan. Dalam tiga tahun terakhir, kurva teknologi model besar hampir terlihat dengan mata telanjang, tetapi komersialisasi perusahaan AI tidak mengimbangi, dan bahkan lebih lambat dari yang diperkirakan banyak orang. Alasannya bukan karena tidak ada cukup teknologi, tetapi seluruh industri telah bergeser dari rasio model ke medan perang “siapa yang bisa menahan tekanan sebelum fajar”. Kekuatan model, catu daya komputasi, biaya inferensi, ekspektasi pengguna, keempat kurva ini naik liar pada saat yang sama, seperti busur yang penuh dengan tali. Dan setiap perusahaan AI berada di tali, yang dapat bertahan lama, bertahan, dan mendukung biaya, adalah pemenang sejati. Dari perlombaan senjata parametrik hingga perlombaan efisiensi Di tahun pertama AI, setiap orang hanya memiliki parameter di mata mereka. Semakin besar modelnya, semakin canggih; Semakin mahal, semakin mewah. Wacana arus utama pada saat itu bahkan menganggap kuantitas parameter sebagai semacam “martabat”, seolah-olah model super besar itu sendiri dapat mewakili kepemimpinan teknologi. Namun setelah 2024, situasinya mulai berubah secara halus. Perusahaan hanya menyadari setelah penyebaran yang sebenarnya bahwa tidak lagi penting bahwa modelnya tidak besar, yang penting adalah apakah model tersebut dapat menyelesaikan tugas “secara stabil, murah, dan cepat”. Peningkatan kecerdasan model itu sendiri tidak lagi linier seperti tahun-tahun sebelumnya; Kemajuan malah menjadi seperti tweak yang lambat. Semakin besar modelnya, semakin mengejutkan biaya inferensi, semakin tinggi ambang batas penerapan, dan semakin sedikit keinginan perusahaan untuk membayar. Sebaliknya, model kecil yang lebih efisien dilatih, dikompresi, dan dapat berjalan pada GPU biasa akan menjadi produk AI paling populer untuk perusahaan pada tahun 2025. Banyak perusahaan bahkan mulai mengganti API sumber tertutup secara internal dengan model sumber terbuka, bukan karena sumber terbuka lebih kuat, tetapi karena sumber terbuka menembus semua harapan dalam hal “harga/kinerja”. Persyaratan daya komputasi yang lebih rendah, kecepatan iterasi yang lebih cepat, dan metode penerapan yang lebih fleksibel telah membuat banyak perusahaan yang awalnya mengandalkan model sumber tertutup mulai berpikir: “Apakah kita benar-benar perlu membayar sebanyak itu?” “Bukankah 80% dari kemampuan model open source, ditambah penyetelan internal, cukup?” Persaingan model telah bergeser dari “perlombaan kekuatan” menjadi “perlombaan efisiensi”. Bukan siapa yang lebih kuat, tetapi siapa yang membuat bisnis lebih terjangkau. GPU bukan lagi perangkat keras, melainkan struktur kekuasaan Jika modelnya berubah dari mitos menjadi komoditas dalam tiga tahun, GPU langsung ditingkatkan menjadi “barang strategis” dalam tiga tahun ini. Ketakutan terbesar bagi perusahaan AI bukanlah karena modelnya tertinggal, tetapi GPU tidak cukup. Ketika model semakin besar, inferensi semakin besar, dan ekspektasi pengguna semakin tinggi, setiap perusahaan AI tergantung terbalik di rantai pasokan NVIDIA. Jika Anda tidak memiliki cukup chip, Anda tidak dapat melatih model baru; Jika chip tidak cukup, kecepatan inferensi tidak dapat ditingkatkan; Jika tidak ada cukup chip, tidak mungkin untuk memperluas basis pengguna; Tidak ada cukup chip, dan bahkan dana sulit untuk dikumpulkan, karena investor tahu dengan jelas: tanpa daya komputasi, tidak ada masa depan. Hal ini membuat persaingan AI menghadirkan keadaan yang sangat aneh: teknologi jelas maju, tetapi kemacetan ada pada daya, chip, dan rantai pasokan. Seluruh pasar tampaknya menginjak pedal gas dan mengerem pada saat yang sama, bergerak maju dengan kecepatan yang terengah-engah, tetapi celah chip apa pun dapat membuat perusahaan terhenti dalam sekejap. Ini adalah titik nyeri paling realistis dan tingkat terendah dari industri AI: Anda tidak bersaing dengan pesaing, Anda bersaing dengan rantai pasokan. Oleh karena itu, biaya inferensi telah menjadi garis hidup dan mati perusahaan. Semakin kuat modelnya, semakin mahal inferensinya, dan semakin banyak pengguna, semakin banyak kerugian Anda. Perusahaan AI menjadi model bisnis yang berlawanan dengan intuisi: semakin populer mereka, semakin banyak mereka kehilangan uang, dan semakin banyak orang menggunakannya, semakin berbahaya mereka. Itu sebabnya parit AI yang sebenarnya mulai menjadi jelas di sini. Tiga tahun kemudian, pasar akhirnya mencapai konsensus yang hampir brutal: kemampuan model itu sendiri bukan lagi parit yang paling penting. Karena model dapat disalin, dikompresi, disesuaikan, dan ditangkap oleh komunitas open source. Hanya ada dua hal yang benar-benar dapat membedakan pemenang dari yang kalah. Yang pertama adalah “distribusi” Perusahaan dengan pintu masuk tingkat sistem tidak memerlukan model terkuat untuk mendominasi pasar. Google menggunakan mesin pencari dan seluruh ekosistem untuk memastikan bahwa Gemini memiliki lalu lintas yang stabil, dan Microsoft menggunakan Windows dan Office untuk menjadikan Copilot sebagai pintu masuk alami ke dunia; Meta bahkan lebih gila, menjejalkan model open source langsung ke Instagram, WhatsApp, Facebook, dan secara langsung mendominasi distribusi. Distribusi adalah daya saing paling tradisional dan realistis dari dunia teknologi. Jika Anda memiliki pintu masuk, Anda memiliki hak untuk berbicara, itulah sebabnya unicorn seperti merek baru Openai, Perplexity, dan Manus saat ini berada di bawah tekanan yang meningkat. Yang kedua adalah “bisakah Anda membiarkan AI benar-benar melakukan sesuatu” Kemampuan obrolan telah lama bukan titik terang, dan multimodalitas tidak lagi langka. Yang benar-benar penting adalah apakah model dapat memanggil alat dengan benar, menulis program, menganalisis file, menghubungkan API, memecah tugas, dan menjadi pemain kerja nyata di perusahaan. Saat model berkembang menjadi “agen” yang dapat menyelesaikan proses, membuat keputusan, dan melakukan tugas sendiri, itu benar-benar produktif. Perusahaan yang dapat membangun rantai alat yang lengkap akan menjadi infrastruktur dasar yang tak tergantikan di masa depan, seperti platform cloud saat ini. Tiga tahun kemudian, parit akhirnya jelas: bukan siapa yang memiliki model terkuat, tetapi siapa yang dapat membuat AI menjadi seperangkat sistem kerja yang berfungsi dengan baik. Pola masa depan pasar AI secara bertahap menyimpang menjadi tiga ekosistem Saat kesenjangan dalam kemampuan model menyempit, tekanan pada daya komputasi meningkat, dan biaya menjadi intinya, perusahaan AI diam-diam dibagi menjadi tiga kubu, yang akan ada di masa depan, tetapi nasib mereka benar-benar berbeda. Yang pertama adalah raksasa tingkat platform, yang belum tentu memiliki model awal terkuat, tetapi mereka memiliki keunggulan ekosistem yang luar biasa dan peluru perak yang dapat mengejar ketinggalan nanti. Microsoft, Google, Meta, dan perusahaan-perusahaan ini memiliki portal distribusi global, memiliki cloud sendiri, memiliki cadangan GPU, memiliki saluran data, dan memiliki produk terintegrasi. Bagi mereka, model bukanlah produk, tetapi “alat yang melekat pada ekosistem.” Perusahaan seperti OpenAI, Anthropic, dan Mistral adalah pemain teknologi murni dengan kemampuan model terkemuka, tetapi mereka tidak memiliki OS, kurangnya ponsel, kurangnya mesin pencari, kurangnya platform sosial, dan kurangnya “distribusi”. Tidak peduli seberapa kuat model mereka, mereka juga perlu melekat pada ekosistem orang lain untuk menjangkau pengguna dalam jumlah besar. Dalam tiga tahun ke depan…
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
ChatGPT memasuki tahun ketiga: Perang model besar mencapai akhir, di mana sebenarnya parit pertahanannya?
ChatGPTAI OpenAI telah ada selama tiga tahun. Medan perang yang sebenarnya telah bergeser ke daya komputasi, biaya, dan ekosistem. Pemenang atau pecundang utama mungkin bukan model itu sendiri, tetapi siapa yang dapat menjadikan AI sebagai sistem lengkap yang bekerja secara berkelanjutan. (Sinopsis: ChatGPT akan mendukung debit langsung PayPal pada tahun 2026, bagian terakhir dari teka-teki kerajaan e-commerce Openai) (Suplemen latar belakang: Browser asli Openai “ChatGPT Atlas” tiga fungsi utama sekaligus, agen AI dapat mengguncang hegemoni Chrome? Dari peluncuran ChatGPT pada 30 November 2022, hingga tepat tiga tahun sekarang, industri teknologi telah berkembang dengan kecepatan yang luar biasa. Pada saat itu, semua orang berpikir bahwa persaingan AI akan menjadi “perang model” murni: siapa pun yang memiliki parameter model yang lebih besar, data yang lebih tebal, dan daya komputasi yang lebih keras akan menjadi raja di pasar ini. Namun, tiga tahun kemudian, melihat ke belakang, saya menyadari bahwa imajinasi awal itu sebenarnya terlalu disederhanakan. Persaingan sebenarnya tidak pernah “siapa yang bisa membuat model terbesar”, tetapi “siapa yang bisa mengubah model menjadi sistem yang lengkap”. Seperangkat sistem yang dapat mendarat, dapat dikomersialkan, dapat membawa biaya, dapat mendukung konsumsi daya komputasi, dan dapat bertahan dalam alur kerja perusahaan. Dalam tiga tahun terakhir, kurva teknologi model besar hampir terlihat dengan mata telanjang, tetapi komersialisasi perusahaan AI tidak mengimbangi, dan bahkan lebih lambat dari yang diperkirakan banyak orang. Alasannya bukan karena tidak ada cukup teknologi, tetapi seluruh industri telah bergeser dari rasio model ke medan perang “siapa yang bisa menahan tekanan sebelum fajar”. Kekuatan model, catu daya komputasi, biaya inferensi, ekspektasi pengguna, keempat kurva ini naik liar pada saat yang sama, seperti busur yang penuh dengan tali. Dan setiap perusahaan AI berada di tali, yang dapat bertahan lama, bertahan, dan mendukung biaya, adalah pemenang sejati. Dari perlombaan senjata parametrik hingga perlombaan efisiensi Di tahun pertama AI, setiap orang hanya memiliki parameter di mata mereka. Semakin besar modelnya, semakin canggih; Semakin mahal, semakin mewah. Wacana arus utama pada saat itu bahkan menganggap kuantitas parameter sebagai semacam “martabat”, seolah-olah model super besar itu sendiri dapat mewakili kepemimpinan teknologi. Namun setelah 2024, situasinya mulai berubah secara halus. Perusahaan hanya menyadari setelah penyebaran yang sebenarnya bahwa tidak lagi penting bahwa modelnya tidak besar, yang penting adalah apakah model tersebut dapat menyelesaikan tugas “secara stabil, murah, dan cepat”. Peningkatan kecerdasan model itu sendiri tidak lagi linier seperti tahun-tahun sebelumnya; Kemajuan malah menjadi seperti tweak yang lambat. Semakin besar modelnya, semakin mengejutkan biaya inferensi, semakin tinggi ambang batas penerapan, dan semakin sedikit keinginan perusahaan untuk membayar. Sebaliknya, model kecil yang lebih efisien dilatih, dikompresi, dan dapat berjalan pada GPU biasa akan menjadi produk AI paling populer untuk perusahaan pada tahun 2025. Banyak perusahaan bahkan mulai mengganti API sumber tertutup secara internal dengan model sumber terbuka, bukan karena sumber terbuka lebih kuat, tetapi karena sumber terbuka menembus semua harapan dalam hal “harga/kinerja”. Persyaratan daya komputasi yang lebih rendah, kecepatan iterasi yang lebih cepat, dan metode penerapan yang lebih fleksibel telah membuat banyak perusahaan yang awalnya mengandalkan model sumber tertutup mulai berpikir: “Apakah kita benar-benar perlu membayar sebanyak itu?” “Bukankah 80% dari kemampuan model open source, ditambah penyetelan internal, cukup?” Persaingan model telah bergeser dari “perlombaan kekuatan” menjadi “perlombaan efisiensi”. Bukan siapa yang lebih kuat, tetapi siapa yang membuat bisnis lebih terjangkau. GPU bukan lagi perangkat keras, melainkan struktur kekuasaan Jika modelnya berubah dari mitos menjadi komoditas dalam tiga tahun, GPU langsung ditingkatkan menjadi “barang strategis” dalam tiga tahun ini. Ketakutan terbesar bagi perusahaan AI bukanlah karena modelnya tertinggal, tetapi GPU tidak cukup. Ketika model semakin besar, inferensi semakin besar, dan ekspektasi pengguna semakin tinggi, setiap perusahaan AI tergantung terbalik di rantai pasokan NVIDIA. Jika Anda tidak memiliki cukup chip, Anda tidak dapat melatih model baru; Jika chip tidak cukup, kecepatan inferensi tidak dapat ditingkatkan; Jika tidak ada cukup chip, tidak mungkin untuk memperluas basis pengguna; Tidak ada cukup chip, dan bahkan dana sulit untuk dikumpulkan, karena investor tahu dengan jelas: tanpa daya komputasi, tidak ada masa depan. Hal ini membuat persaingan AI menghadirkan keadaan yang sangat aneh: teknologi jelas maju, tetapi kemacetan ada pada daya, chip, dan rantai pasokan. Seluruh pasar tampaknya menginjak pedal gas dan mengerem pada saat yang sama, bergerak maju dengan kecepatan yang terengah-engah, tetapi celah chip apa pun dapat membuat perusahaan terhenti dalam sekejap. Ini adalah titik nyeri paling realistis dan tingkat terendah dari industri AI: Anda tidak bersaing dengan pesaing, Anda bersaing dengan rantai pasokan. Oleh karena itu, biaya inferensi telah menjadi garis hidup dan mati perusahaan. Semakin kuat modelnya, semakin mahal inferensinya, dan semakin banyak pengguna, semakin banyak kerugian Anda. Perusahaan AI menjadi model bisnis yang berlawanan dengan intuisi: semakin populer mereka, semakin banyak mereka kehilangan uang, dan semakin banyak orang menggunakannya, semakin berbahaya mereka. Itu sebabnya parit AI yang sebenarnya mulai menjadi jelas di sini. Tiga tahun kemudian, pasar akhirnya mencapai konsensus yang hampir brutal: kemampuan model itu sendiri bukan lagi parit yang paling penting. Karena model dapat disalin, dikompresi, disesuaikan, dan ditangkap oleh komunitas open source. Hanya ada dua hal yang benar-benar dapat membedakan pemenang dari yang kalah. Yang pertama adalah “distribusi” Perusahaan dengan pintu masuk tingkat sistem tidak memerlukan model terkuat untuk mendominasi pasar. Google menggunakan mesin pencari dan seluruh ekosistem untuk memastikan bahwa Gemini memiliki lalu lintas yang stabil, dan Microsoft menggunakan Windows dan Office untuk menjadikan Copilot sebagai pintu masuk alami ke dunia; Meta bahkan lebih gila, menjejalkan model open source langsung ke Instagram, WhatsApp, Facebook, dan secara langsung mendominasi distribusi. Distribusi adalah daya saing paling tradisional dan realistis dari dunia teknologi. Jika Anda memiliki pintu masuk, Anda memiliki hak untuk berbicara, itulah sebabnya unicorn seperti merek baru Openai, Perplexity, dan Manus saat ini berada di bawah tekanan yang meningkat. Yang kedua adalah “bisakah Anda membiarkan AI benar-benar melakukan sesuatu” Kemampuan obrolan telah lama bukan titik terang, dan multimodalitas tidak lagi langka. Yang benar-benar penting adalah apakah model dapat memanggil alat dengan benar, menulis program, menganalisis file, menghubungkan API, memecah tugas, dan menjadi pemain kerja nyata di perusahaan. Saat model berkembang menjadi “agen” yang dapat menyelesaikan proses, membuat keputusan, dan melakukan tugas sendiri, itu benar-benar produktif. Perusahaan yang dapat membangun rantai alat yang lengkap akan menjadi infrastruktur dasar yang tak tergantikan di masa depan, seperti platform cloud saat ini. Tiga tahun kemudian, parit akhirnya jelas: bukan siapa yang memiliki model terkuat, tetapi siapa yang dapat membuat AI menjadi seperangkat sistem kerja yang berfungsi dengan baik. Pola masa depan pasar AI secara bertahap menyimpang menjadi tiga ekosistem Saat kesenjangan dalam kemampuan model menyempit, tekanan pada daya komputasi meningkat, dan biaya menjadi intinya, perusahaan AI diam-diam dibagi menjadi tiga kubu, yang akan ada di masa depan, tetapi nasib mereka benar-benar berbeda. Yang pertama adalah raksasa tingkat platform, yang belum tentu memiliki model awal terkuat, tetapi mereka memiliki keunggulan ekosistem yang luar biasa dan peluru perak yang dapat mengejar ketinggalan nanti. Microsoft, Google, Meta, dan perusahaan-perusahaan ini memiliki portal distribusi global, memiliki cloud sendiri, memiliki cadangan GPU, memiliki saluran data, dan memiliki produk terintegrasi. Bagi mereka, model bukanlah produk, tetapi “alat yang melekat pada ekosistem.” Perusahaan seperti OpenAI, Anthropic, dan Mistral adalah pemain teknologi murni dengan kemampuan model terkemuka, tetapi mereka tidak memiliki OS, kurangnya ponsel, kurangnya mesin pencari, kurangnya platform sosial, dan kurangnya “distribusi”. Tidak peduli seberapa kuat model mereka, mereka juga perlu melekat pada ekosistem orang lain untuk menjangkau pengguna dalam jumlah besar. Dalam tiga tahun ke depan…