Kapan raksasa baru akan lahir? Model besar menunggu "daerah aliran sungai"

Sumber| Zero One Finance

Penulis| Shen Zhuoyan

Sumber gambar: Dihasilkan oleh alat AI Tak Terbatas

Sejak 2023, kata terpanas di lingkaran teknologi adalah ChatGPT dan teknologi model skala besar di belakangnya.

Sebelumnya ada Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Pangu, HKUST Xunfei Xinghuo, dll. Baru-baru ini, Li Kaifu memasuki biro untuk mendirikan Zero One Wanwu, dan Volcano Engine meluncurkan "Volcano Ark". Hanya dalam beberapa bulan, telah menjadi tren bagi berbagai perusahaan untuk mengembangkan dan merilis aplikasi model skala besar.

Ada lebih dari 80 model skala besar domestik dengan skala parameter 1 miliar atau lebih, dan jumlahnya terus meningkat pesat. Suasana persiapan perang komersial seputar model besar sudah sangat kuat.

Apakah itu perusahaan raksasa besar atau perusahaan raksasa kecil, mereka semua membutuhkan tindakan seperti itu untuk menunjukkan kepekaan mereka terhadap teknologi mutakhir dan akumulasi jangka panjang mereka. Dengan meluncurkan aplikasi lebih awal, Anda dapat menguji data berharga tentang interaksi antara model besar dan pengguna satu hari sebelumnya, dan "mengumpulkan banyak makanan, dan gambarnya adalah raja" di kompetisi mendatang.

Kunci model besar adalah elemen bidang AI - algoritme, daya komputasi, data, dan skenario/aplikasi. Algoritma mewakili strategi, daya komputasi menentukan batas atas dan menetapkan ambang batas, dan data sama dengan jatah militer juga melambangkan perbedaan antara yang baik dan yang buruk. Selain ketiga elemen tersebut, scene/aplikasi mewakili arah pengiriman pasukan.

"Perang Seratus Model" akan segera pecah. Akankah perusahaan raksasa dengan semua elemen berkembang menjadi involusi kemampuan teknologi yang tak terbatas? Bisakah raksasa kecil di jalur vertikal mengkonsolidasikan posisi terdepan mereka dengan bantuan model besar? Di antara pemain baru yang mendapatkan tiket, siapa yang bisa menjadi penantang serius untuk dominasi industri?

Model umum skala besar "kekuatan DAS" belum muncul

Pemain model besar terutama dibagi menjadi tiga kategori: satu adalah Internet (Baidu, Ali, Tencent, dll.) Dan raksasa industri (China Telecom dan China Unicom, dll.) Perusahaan pintar (SenseTime, Yuncong, Guangyuewai, dll.) , dan kategori terakhir adalah lembaga penelitian ilmiah yang diwakili oleh Laboratorium Kecerdasan Buatan Shanghai, Universitas Fudan, Institut Teknologi Harbin, dll.

Menurut data publik, hingga awal Juli 2023, ada lebih dari 80 model berskala besar dengan parameter di atas 1 miliar di negara saya, dan masih terus meningkat pesat. Semakin besar model dengan jumlah parameter ini, semakin tinggi ambang persaingannya.

Sebagian besar model skala besar yang telah dirilis sejauh ini adalah model skala besar untuk keperluan umum.Ada dua alasan utama: satu adalah persaingan model skala besar masih belum jelas, dan tingkat teknis murni belum melebar kesenjangan generasi, dan pelaku industri memiliki peluang untuk mendominasi dunia; Model skala besar yang berorientasi pada aplikasi untuk publik belum muncul, dan ada kurangnya panduan arah yang jelas. Sebelum "momen Obrolan GPT" dari model skala besar domestik muncul, itu adalah pilihan aktif dan pasif untuk bergabung dengan model skala besar tujuan umum.

Terlebih lagi, sangat mungkin raksasa baru akan muncul dari bidang model besar.

Zhou Hongyi percaya bahwa model besar harus "universal", dan hanya penggunaan umum yang dapat memasuki ribuan rumah tangga, memberdayakan ratusan industri, dan memimpin revolusi baru kecerdasan buatan.

Apa yang belum selesai adalah berapa banyak investasi dan kerja sama yang dibutuhkan untuk menjadi pemimpin revolusi baru. Terlepas dari apakah model besar itu adalah pasar samudra biru atau samudra merah, pasti ada struktur ekologi tempat ikan besar dan ikan kecil bekerja sama.Namun, daerah aliran sungai antara ikan besar dan ikan kecil belum muncul.

Dilihat dari situasi saat ini, model besar dengan skala 1 miliar parameter dapat dianggap sebagai ambang batas untuk masuk, dan model besar dengan skala 10 miliar parameter dapat dianggap memiliki kemampuan bersaing di dunia, namun bahkan model besar dengan skala 100 miliar parameter masih jauh dari yang terbaik Tingkat debu terdepan.

Jumlah parameter bukanlah kekuatan luar biasa yang menentukan situasi medan perang. Faktor-faktor seperti kemampuan penjadwalan sumber daya, akumulasi pengalaman jangka panjang, dan investasi penelitian ilmiah yang besar semuanya merupakan perbedaan inti yang bertahan lama dalam kompetisi model skala besar.

Untuk membandingkan dengan Open AI, perlu dilihat bahwa di balik ledakan Chat GPT adalah dukungan komprehensif Microsoft dalam data, daya komputasi, dan dana yang sangat besar, sehingga telah mengumpulkan banyak uang di masa mendatang.

Model skala besar adalah industri investasi jangka panjang, yang berarti "membakar uang". Akumulasi daya komputasi, algoritme, dan data tidak tercapai dalam semalam. Setelah model dirilis, perlu pelatihan berulang dan iterasi yang gesit, dan akhirnya berkembang menjadi "tubuh dewasa".

Dalam lingkungan nyata, apakah pemain model besar didorong oleh teknologi atau keuntungan? Open AI adalah perusahaan model skala besar paling terkenal di dunia, bahkan dengan produk Chat GPT yang meledak, kemampuan komersialisasinya masih mengkhawatirkan. Sebagai perusahaan teknologi dengan nilai pasar mendekati US$30 miliar, ia akan menjadi pusat gelombang AI pada 2023. Pendapatan Open AI sejauh ini masih kurang dari US$200 juta.

Investasi awal hanyalah biaya awal, dan setiap pelatihan selanjutnya membutuhkan uang nyata Berapa banyak perusahaan yang dapat menerima pengembalian investasi yang menyedihkan dalam kompetisi model skala besar? Keberhasilan Chat GPT membuktikan bahwa model besar telah dibuka di jalur produk, namun bukan berarti sukses besar di tingkat komersial.

Setidaknya dalam hal rasio input-output, raksasa internet memiliki keunggulan relatif yang lebih besar, mereka memiliki motivasi dan sumber daya yang cukup untuk mendukung kerugian strategis pada tahap awal, seperti halnya Alibaba Cloud saat itu.

Adapun berapa lama waktu yang dibutuhkan untuk membakar uang dan kapan melihat pengembalian investasi yang memuaskan, perusahaan besar tidak tahu, begitu pula VC dari perusahaan baru. Ini adalah pertaruhan yang dapat keluar dari permainan kapan saja, dan chipnya bernilai miliaran dolar.

Untuk pemain model berskala besar yang "setiap orang memiliki kelebihannya masing-masing", pertama-tama mereka harus menjelajahi lapisan aplikasi dan membuka tes sesegera mungkin. Siapa yang dapat mengumpulkan lebih banyak data interaksi yang berharga akan menjadi titik puncak kompetisi berikutnya.

Kebutuhan vertikal dan kesulitan vertikal

Persaingan untuk model skala besar umum lebih pada persaingan untuk hak untuk merumuskan infrastruktur, sedangkan model skala besar vertikal bergantung pada model skala besar sumber terbuka atau antarmuka API dalam skenario khusus untuk membentuk daya saing yang berbeda dalam industri tersegmentasi, lebih fokus pada aplikasi skenario.

Di medan perang model skala besar tujuan umum, seiring berjalannya waktu, beberapa pemain yang lemah secara bertahap akan tertinggal, dan pada akhirnya hanya akan ada beberapa model skala besar tujuan umum, yang akan memainkan peran infrastruktur . Pada saat yang sama, model besar ini masih menghadapi masalah homogenitas, dan lapisan aplikasi masih bergantung pada model besar vertikal.

Model besar tujuan umum seperti kumpulan beberapa model besar vertikal.Semakin banyak skenario pelatihan, semakin kuat "keumuman" model besar tujuan umum.

Sebagai perusahaan pertama di China yang merilis produk mirip Chat GPT, Baidu memiliki kebutuhan mendesak akan lapisan aplikasi vertikal model berskala besar. Li Yanhong berkata: "Yang lebih penting daripada jumlah model besar adalah aplikasinya, yang merupakan terobosan dalam penerapan bidang vertikal. Poin kunci dari strategi persaingan internasional yang baru bukanlah berapa banyak model besar yang ada, tetapi berapa banyak asli aplikasi pada model besar. Aplikasi ini Sejauh mana efisiensi produksi ditingkatkan."

Menurut metafora Li Yanhong, model besar, terutama model besar untuk keperluan umum, seperti sistem operasi di era AI Semua aplikasi akan dikembangkan di sekitar model besar, di atasnya adalah lapisan aplikasi, termasuk berbagai aplikasi asli AI .

Dalam analisis terakhir, apa yang disebut "universal" hanyalah konsep relatif, dan tidak ada model tujuan umum yang sepenuhnya berlaku untuk semua bidang dan memiliki kedalaman industri yang memadai. Mengambil contoh Chat GPT, masih ada beberapa industri dengan tingkat toleransi kesalahan yang tinggi yang benar-benar banyak digunakan, bahkan jika solusi yang diberikan oleh model besar itu salah, kesalahannya terbatas pada kisaran yang relatif terbatas. Namun, dalam skenario seperti industri berat, kedirgantaraan, dan perawatan medis, kerugian yang disebabkan oleh kesalahan tidak dapat diukur, yaitu Chat GPT tidak dapat memenuhi persyaratan vertikal dan profesional dari skenario tertentu.

Untuk mempertimbangkan persyaratan vertikalitas dan profesionalisme, data merupakan kekurangan, dan terdapat lebih sedikit industri dengan kedalaman data yang memadai dan parit yang stabil. Apakah data industri ini mudah diperoleh dan apakah data yang diperoleh dapat memenuhi persyaratan industri tertentu yang selalu berubah sulit untuk dinilai secara spesifik.

Raksasa internet memiliki banyak data jaringan seperti e-commerce, jejaring sosial, dan pencarian, tetapi jenis datanya tidak cukup lengkap, dan kualitas datanya tidak terjamin. Korpus yang dapat dilatih dalam bahasa Mandarin masih membutuhkan banyak pekerjaan pertambangan.

Baru-baru ini, di bidang urusan pemerintahan, keamanan publik, dan perawatan medis, model skala besar vertikal diterapkan satu demi satu. Misalnya, Yunzhisheng mengembangkan sendiri model skala besar "gunung dan laut" di bidang perawatan medis cerdas, dikombinasikan dengan teknologi interaksi suara cerdas full-stack seperti pemrosesan sinyal suara ujung depan, pengenalan cetak suara, pengenalan ucapan, dan sintesis ucapan, diharapkan dapat meningkatkan efisiensi entri rekam medis elektronik dokter Lebih dari 400%, menghemat lebih dari 40% waktu konsultasi untuk satu pasien, dan meningkatkan efisiensi rawat jalan dokter lebih dari 66%.

Berdasarkan dokumen resminya sendiri, dokumen kebijakan, panduan urusan pemerintahan dan data lainnya sebagai data pelatihan profesional, TRS telah membuat model besar urusan pemerintahan.

Di bidang keuangan, Hang Seng Electronics akan mulai merencanakan dan merancang produk model keuangan skala besar pada akhir Maret 2023. Pada akhir Juni, Hang Seng Electronics dan anak perusahaannya Hang Seng Juyuan merilis produk keuangan intelijen digital baru berdasarkan teknologi model bahasa besar - asisten keuangan cerdas Photon dan platform penelitian investasi cerdas WarrenQ.

Tencent, raksasa Internet dengan banyak sumber daya industri, bertaruh di banyak sisi. Pada akhir Juni, Tencent mengumumkan solusi layanan MaaS yang mencakup 10 industri termasuk keuangan, wisata budaya, urusan pemerintahan, dan pendidikan, dengan total lebih dari 50 solusi.

Pada saat yang sama, data yang dibutuhkan oleh model besar vertikal seringkali tidak terbatas pada industri.Beberapa bisnis mungkin memerlukan integrasi data dari industri lain atau lebih.Pelatihan dan aplikasi model bergantung pada kerjasama lintas industri dari perusahaan atau sumber daya. dari raksasa internet.integrasikan.

**Kekuatan komputasi: Batu bata yang kuat terbang? **

Dalam demam emas di Amerika Serikat bagian barat pada abad ke-19, adalah peristiwa probabilistik bahwa para penggali emas benar-benar dapat menghasilkan uang, sementara penjual sekop menghasilkan uang adalah hasil yang tak terelakkan.

Dalam demam emas AI, situasi medan perang model besar masih belum jelas, dan para pemain masih maju, tetapi "penjual sekop" telah menang. Mengandalkan tren chip AI dan model besar, Nvidia telah memperlebar jarak dengan pesaingnya AMD, dan nilai pasarnya telah memasuki "klub triliunan dolar".

CEO Open AI Sam Altman mengusulkan versi baru Hukum Moore, yaitu kekuatan komputasi AI global akan berlipat ganda setiap 18 bulan. Mempertahankan perhitungan ini membutuhkan dukungan chip pelatihan AI, dan pangsa pasar Nvidia di area ini melebihi 90%.

Produk chip AI Nvidia dengan panik diambil oleh perusahaan teknologi besar di seluruh dunia: Pada Maret 2023, Microsoft mengumumkan bahwa mereka telah membantu OpenAI membangun pusat komputasi baru dengan puluhan ribu A100; pada bulan Mei, Google meluncurkan H100 dengan 26.000 keping. klaster komputasi ComputeEngineA3. Selain itu, menurut informasi dari China National Finance Securities, ByteDance telah memesan lebih dari US$1 miliar GPU tahun ini, dan diperkirakan ada 100.000 keping A100 dan H800 yang telah tiba dan belum datang. Puluhan ribu chip H800 juga digunakan dalam versi baru Tencent Cloud High Performance Computing Service Center yang dirilis oleh Tencent.

CFO Nvidia Kress mengatakan bahwa permintaan pasar saat ini untuk daya komputasi AI telah melebihi ekspektasi perusahaan untuk beberapa kuartal mendatang, dan terlalu banyak pesanan yang harus dipenuhi.

Tentu saja, percuma kita iri dengan uang yang dihasilkan Nvidia.

Jalur GPU domestik juga mengejar. Tidak hanya chip AI yang dikembangkan sendiri oleh raksasa Internet, seperti chip Baidu AI Kunlun, chip pemrosesan video Tencent "Canghai" dan chip AI "Zixiao", dll., Tetapi juga Teknologi Suiyuan, Tianshu Zhixin, Perusahaan baru seperti Moore Threads yang mengembangkan GPU tujuan umum.GPU tujuan umum digunakan untuk berbagai tugas tujuan umum, termasuk kemampuan komputasi yang sangat paralel dan inti komputasi skala besar. Juga telah terjadi kemajuan besar dalam beberapa tahun terakhir , dan kesenjangan dengan GPU berperforma tinggi secara bertahap menyempit.

Wu Hequan, seorang akademisi dari Akademi Teknik Tiongkok, menyarankan bahwa di bawah koordinasi rencana sains dan teknologi dan industri nasional, pembagian kerja yang masuk akal harus dibentuk untuk membentuk kekuatan komputasi bersama, dan platform daya komputasi nasional laboratorium harus dibuka untuk mendukung berbagai pelatihan model berskala besar. Pada saat yang sama, disarankan untuk membentuk aliansi daya komputasi untuk memusatkan GPU kelas atas yang ada. Sumber daya komputasi menyediakan daya komputasi yang diperlukan untuk pelatihan data model besar.

Selain GPU berkinerja tinggi, platform komputasi berbiaya rendah juga dianggap sebagai peluang pasar baru. Baru-baru ini, Jiuzhang Yunji mengungkapkan bahwa pihaknya akan terus bekerja sama dengan produsen cloud milik negara, memasukkan sejumlah besar pusat komputasi cerdas di pasar sebagai mitra, dan memberi pelanggan platform penelitian dan pengembangan model AI yang mengintegrasikan perangkat lunak dan perangkat keras. biaya pelanggan akan terkait dengan daya komputasi Tentu saja.

Daya komputasi adalah dasar untuk pengembangan model besar, dan itu adalah kondisi yang diperlukan tetapi bukan kondisi yang cukup.Peran maksimum yang dapat dimainkan oleh daya komputasi masih bergantung pada arah penggunaan. Hanya ketika inovasi algoritme, konstruksi sumber daya data, dan iterasi kerangka kerja pelatihan berjalan seiring, barulah mungkin untuk membuat "bata terbang yang kuat".

Kebijakan: Bimbingan dan regulasi pada saat-saat kritis

Periode ledakan AI bertepatan dengan momen kritis tata kelola algoritme dan pengarsipan algoritme di negara kita.

Sejak tahun 2021, "Guiding Opinions on Strengthening the Comprehensive Governance of Internet Information Service Algorithms" menempatkan manajemen pengarsipan algoritme sebagai bagian penting dari peningkatan sistem pengawasan. Peraturan Manajemen dengan jelas menetapkan atau menyebutkan bahwa "penyedia layanan rekomendasi algoritme dengan atribut opini publik atau kemampuan mobilisasi sosial harus melakukan prosedur pengarsipan."

Pada bulan April 2023, Administrasi Dunia Maya Tiongkok menyusun "Langkah Administratif untuk Layanan Kecerdasan Buatan Generatif (Draf untuk Komentar)" untuk konsultasi publik. Pada bulan Juni, "Rencana Kerja Legislatif Dewan Negara 2023" yang dikeluarkan oleh Dewan Negara menunjukkan bahwa rancangan undang-undang kecerdasan buatan telah disiapkan untuk diajukan ke Komite Tetap Kongres Rakyat Nasional untuk dibahas.

"Langkah Manajemen Layanan Kecerdasan Buatan Generatif (Draf untuk Komentar)" menyebutkan bahwa sebelum menggunakan produk kecerdasan buatan generatif untuk memberikan layanan kepada publik, harus dilaporkan ke Jaringan Negara sesuai dengan "Peraturan tentang Evaluasi Keamanan Informasi Internet Layanan dengan Atribut Opini Publik atau Kemampuan Mobilisasi Sosial". Departemen informasi harus mengajukan penilaian keamanan, dan melakukan prosedur pengajuan algoritme, modifikasi, dan pembatalan sesuai dengan "Peraturan Manajemen Rekomendasi Algoritma Layanan Informasi Internet".

Ini juga salah satu alasan mengapa tidak ada produk model skala besar yang tersedia untuk umum.

Profesor Chen Bing, wakil dekan Sekolah Hukum Universitas Nankai dan seorang peneliti khusus di Institut Riset Strategi Pengembangan Kecerdasan Buatan Generasi Baru China, percaya bahwa pra-regulasi tidak serta merta merusak inovasi teknologi, tetapi perlu dicatat bahwa karena sebelumnya tinjauan, itu akan meningkatkan jumlah perusahaan sampai batas tertentu.Jika ruang lingkup tinjauan sebelumnya tidak diatur dengan benar, itu dapat menghambat efisiensi penelitian dan pengembangan dan pelatihan produk AI generatif, dan secara obyektif menyebabkan perlambatan dalam pengembangan AI generatif.

Karena risiko kecerdasan buatan tidak dapat diperkirakan sebelumnya dengan sempurna, dan pengawasan setelah kejadian dapat menyebabkan kerusakan besar, negara saya saat ini mengadopsi pengawasan proses penuh atas pengembangan kecerdasan buatan.

Di bawah regulasi seluruh proses, biaya kepatuhan pemain model skala besar pasti akan meningkat, dan sistem pengarsipan catatan juga mendesak pemain dalam permainan untuk mencari pengarsipan catatan terlebih dahulu untuk mempromosikan produk ke pasar lebih awal, secara objektif. mempercepat kecepatan gelombang besar. Perbaikan undang-undang dan peraturan secara bertahap dibarengi dengan proses perombakan industri dan tertinggalnya yang lemah, yang juga dapat membawa momen menjernihkan awan ke matahari lebih awal.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)