Sumber: Zero State LT, Penulis: Zhuo Xinyue, Editor: Hu Zhanjia
Seberapa cepat model besar dari konsep hingga implementasi?
Konferensi Kecerdasan Buatan Dunia 2023 (WAIC 2023), acara paling menarik di kalangan teknologi baru-baru ini, memberikan jawaban yang mengejutkan semua orang: setengah tahun! Setengah tahun tidak terlalu lama untuk jalur teknologi apa pun, dan bahkan beberapa jalur hanya dalam tahap "bayi", tetapi jalur model skala besar telah menyelesaikan proses dari konsep hingga implementasi dalam waktu yang singkat.
Pada kuartal pertama tahun ini, industri masih membahas pertanyaan "apakah atau tidak". Pada kuartal kedua, tren berbagai pabrikan besar berkumpul untuk membuat model besar adalah para pemain menjawab "bagaimana melakukannya" .
Jawaban ini, pada intinya, telah difokuskan oleh lebih dari 30 produsen model skala besar yang berpartisipasi dalam konferensi WAIC-pertama memecahkan masalah teknis, diikuti implementasi adegan, dan akhirnya komersial dan skala.
"Sebelumnya, kesulitan dalam penerapan kecerdasan buatan lebih pada tingkat teknis, seperti bidang mengemudi otonom. Ini telah dikembangkan selama bertahun-tahun, tetapi komersialisasi masih menghalangi pemain untuk melihat fajar," kata orang dalam industri. setelah mengunjungi konferensi WAIC: "Relatif Namun, perlu dicatat bahwa persaingan pasar untuk model besar akan semakin ketat."
Dalam konferensi WAIC ini, lebih dari 30 perusahaan berfokus pada "pamer otot", termasuk raksasa seperti Baidu, Tencent, Ali, Huawei, dan JD.com, serta pemain di bidang vertikal seperti SenseTime dan NetEase.
Saat ini, muncul berita bahwa pemimpin satuan tugas standardisasi model skala besar pertama di negara saya dipegang bersama oleh Laboratorium Kecerdasan Buatan Shanghai dan Baidu, Huawei, Ali, dan perusahaan lain. Batch pertama dari perusahaan terpilih ini juga diberi " gelar Timnas”. ** Ada berbagai tanda bahwa pertempuran PK model skala besar dimensi tinggi yang dipimpin oleh "tim nasional" telah resmi dimulai. **
Dari "menari model grup" hingga "memimpin tim nasional"
Sejak awal tahun ini, model besar tidak diragukan lagi menjadi titik terpanas dalam teknologi, dan segera menjadi "tema utama" berbagai perusahaan. Tampaknya tidak ada pabrikan besar yang berani mengatakan secara terbuka bahwa mereka tidak akan terlibat dalam hal ini. Menurut statistik yang tidak lengkap, pada paruh pertama tahun ini, ada hampir seratus perusahaan yang secara resmi mengumumkan akan membuat model skala besar.
Perusahaan Internet besar seperti Ali, Baidu, Tencent, ByteDance, dan JD.com, perusahaan AI yang diwakili oleh iFlytek dan SenseTime, dan berbagai industri yang diwakili oleh perusahaan pendidikan seperti Kidswant dan perusahaan keuangan seperti Perusahaan Huashun telah memasuki permainan satu demi satu. .
Selain itu, ada peningkatan pesat di negara ini untuk memulai bisnis model skala besar AI.Banyak raksasa teknologi, eksekutif, dan mantan eksekutif pabrikan besar telah mengabdikan diri pada model skala besar untuk memulai bisnis baru. Misalnya, Wang Huiwen, salah satu pendiri Meituan asli, memasuki model besar AI dengan profil tinggi (saat ini, "Light Years Beyond" yang didirikan oleh perusahaan telah diakuisisi oleh Meituan); Li Kaifu, CEO Innovation Works, Wang Xiaochuan, pendiri Sohu, dan mantan perintis bisnis AI JD.com, Zhou Bowen, dan lainnya telah bergabung dengan gelombang kewirausahaan model besar AI. Meskipun adegan ini tidak spektakuler seperti "Perang Seribu Resimen" saat itu, itu cukup mengejutkan dunia luar untuk trek model skala besar yang membutuhkan ambang batas teknis yang sangat tinggi dari solusi kecerdasan buatan +.
Dalam beberapa tahun terakhir, jalur ke B sangat panas, dan permintaan untuk transformasi digital dan peningkatan perusahaan menjadi semakin kuat, dan pengurangan biaya serta peningkatan efisiensi juga menjadi tuntutan inti perusahaan. Bahkan banyak orang di industri percaya bahwa model berskala besar telah menjadi bidang yang paling menjanjikan untuk pertumbuhan bertahap dalam lingkaran teknologi. Dan ini telah menjadi salah satu alasan popularitas model besar yang cepat.
**Pada konferensi WAIC yang diadakan di Shanghai dari tanggal 6 hingga 8 Juli, lebih dari 30 perusahaan model skala besar berkompetisi untuk menampilkan tata letak dan pencapaian di tingkat model skala besar, yang juga menjadi peristiwa penting dalam perkembangan industri . **
Baidu, sebagai pabrikan pertama di China yang mengumumkan kecerdasan buatan All In, mendemonstrasikan gaya Wenxinyi-nya, salah satu "harta karun balai kota", di konferensi tersebut, memungkinkan setiap orang yang memasuki ruang pameran untuk menyadari bahwa setiap orang dapat "P- gambar". Huawei memindahkan Atlas 900 PoD A2 ke tempat kejadian untuk memamerkan kekuatan komputasi dasarnya di sisi perangkat keras; di sub-forum Alibaba Cloud, "Keluarga Tongyi" menambahkan model lukisan AI "Tongyi Wanxiang", yaitu Ali Ketiga produk model besar diumumkan dalam waktu tiga bulan.
Antusiasme industri terhadap model-model besar telah mempercepat pembentukan "tim nasional".
Pada tanggal 7 Juli, pada konferensi WACI 2023, standardisasi kecerdasan buatan nasional di bawah bimbingan Komite Standar Nasional mengumumkan bahwa pemimpin gugus tugas standardisasi model skala besar pertama negara saya akan dipegang bersama oleh Laboratorium Kecerdasan Buatan Shanghai dan Baidu, Huawei, Ali dan perusahaan lainnya. Sejak itu, "tim nasional" model besar telah berkumpul.
Padahal, pada awal Mei tahun ini, negara tersebut memulai pekerjaan terkait standardisasi model besar Grup khusus yang baru dibentuk akan melakukan standardisasi model besar, dengan tujuan mempromosikan kombinasi model besar dan praktik standardisasi. , dan mempromosikan pengembangan industri kecerdasan buatan pertumbuhan yang sehat. Sejak itu, trek model skala besar, yang berisik selama setengah tahun, secara resmi mengumumkan akan bergerak menuju standardisasi.
Para raksasa "bersaing", kompetisi lintasan memasuki pertarungan dimensi tinggi
Pada Konferensi Kecerdasan Buatan Dunia 2023, model besar ini layak menjadi "kelas atas".
Baidu Wenxin, Ali Tongyi, Huawei Pangu, Xunfei Xinghuo, Shangtang Ririxin, Netease Fuxi dan lebih dari 30 model skala besar semuanya diluncurkan. Di tempat konferensi, para raksasa meninggalkan konsep satu per satu, melangkah lebih dekat, dan memamerkan pencapaian masing-masing perusahaan.
Pada sore hari tanggal 7 Juli, di Huawei Developer Conference 2023 (Cloud), Zhang Pingan, Direktur Eksekutif Huawei dan CEO Huawei Cloud, mengumumkan bahwa Huawei Cloud Pangu Model 3.0 telah resmi dirilis. Dia juga mengatakan bahwa "model Pangu Huawei sangat sibuk, sibuk dengan hal-hal, dan tidak punya waktu untuk menulis puisi." Langkah ini juga dianggap menyiratkan bahwa model yang dirilis sebelumnya suka menulis puisi dan prosa pada konferensi pers. Karena Huawei berharap dapat menggunakan model besar Pangu untuk membantu berbagai industri, seperti keuangan, urusan pemerintahan, pertambangan, meteorologi, dll., daripada berfokus pada level model suara besar.
Dikatakan bahwa hingga saat ini, model besar Pangu telah diterapkan di bidang meteorologi, penelitian dan pengembangan medis, tenaga listrik, bahasa, dan bidang lainnya, dan telah menghasilkan banyak model besar dengan ratusan miliar parameter.
Zhou Jingren, CTO Alibaba Cloud, menyebutkan bahwa "tujuan utamanya adalah untuk mempromosikan kemakmuran model ekologi skala besar China, dan menyediakan layanan menyeluruh untuk perusahaan rintisan berskala besar." Jelas, ini melanjutkan konsep MaaS (Model as a Service) yang diajukan oleh Alibaba Cloud.
Baidu adalah pemain awal, dan model berskala besar Wenxin selalu menarik perhatian industri. Pada konferensi ini, Baidu Chief Technology Officer Wang Haifeng mengatakan bahwa Baidu kini telah ditingkatkan ke Wenxin Model 3.5. Efeknya meningkat 50%, kecepatan latihan meningkat 2 kali lipat, dan kecepatan penalaran meningkat 30 kali lipat.
Selain berita "tim nasional", perusahaan Internet besar seperti Tencent juga mempercepat proses model besar dari konsep hingga implementasi.
Dalam 20 hari terakhir, berita berat Tencent tentang model besar telah sering menyebar. Pada 19 Juni, dia secara terbuka mengungkapkan pemikirannya tentang model besar untuk pertama kalinya. Pada 26 Juni, dia mengungkapkan jaringan komputasi kinerja tinggi Xingmai yang dikembangkan sendiri untuk pertama kalinya. Pada 7 Juli, Wu Yunsheng, wakil presiden Tencent Cloud dan kepala Tencent Cloud Intelligence, memperkenalkan bahwa dalam hal inovasi aplikasi, kapabilitas model industri skala besar Tencent Cloud diterapkan pada skenario seperti kontrol risiko keuangan, terjemahan interaktif, dan layanan pelanggan cerdas digital, yang meningkatkan efisiensi aplikasi cerdas.
** Dapat dilihat bahwa dengan masuknya pabrikan dengan cepat, model skala besar domestik dengan cepat melewati tahap konsep, dan sekarang setiap perusahaan berfokus pada bagaimana mengimplementasikan dan mengkomersialkan. **
Dalam perang kenaikan yang telah dimulai, ambang batas telah dinaikkan dan kesulitan telah meningkat. Ini bukan tantangan kecil bagi pabrikan mana pun.
Buka "volume" ke segala arah untuk mendapatkan postur yang benar dari "dataran tinggi" model besar
Faktanya, meskipun model besar sangat populer, cukup sulit dari memasuki permainan hingga benar-benar mendarat dan mendorongnya ke pasar, dan banyak kesulitan telah muncul. Pendanaan, bakat, infrastruktur, skenario, dan komersialisasi telah menjadi "perlombaan rintangan" yang harus diatasi oleh setiap pemain.
Pada tahap awal pengembangan model besar, beberapa orang di industri mengatakan bahwa "model besar adalah permainan pabrikan besar", menyiratkan bahwa "model besar sangat mahal", dan hanya pabrikan besar yang mampu membelinya. Menurut statistik yang tidak lengkap dari Titanium Media, pada tahun 2022, Huawei akan menginvestasikan 161,5 miliar yuan untuk biaya R&D, menjadi perusahaan dengan investasi R&D terbanyak; diikuti oleh Tencent dengan 61,4 miliar yuan dan Alibaba dengan 55,5 miliar yuan. Dalam sepuluh tahun terakhir, Baidu telah menginvestasikan lebih dari 100 miliar yuan di bidang AI. Investasi tahunan dalam Litbang oleh pabrikan Internet besar telah memungkinkan mereka memiliki tim Litbang yang kuat dan menjadi "eselon satu" yang layak di jalur model berskala besar.
Tapi mereka tidak bisa membabi buta memasukkan tanpa mengharapkan imbalan apa pun. Dilihat dari dinamika saat ini, mereka semua mempercepat implementasi industri. Dana yang kuat diinvestasikan dalam penelitian dan pengembangan, dikomersialkan sesegera mungkin, dan kemudian diinvestasikan dalam pengembangan dan pelatihan model AI - ini adalah siklus yang mendukung pemain model skala besar.
Seperti yang dikatakan Li Qiang, wakil presiden Tencent dan presiden pemerintah dan bisnis perusahaan Tencent: "Di era model besar, data, jaringan, dan daya komputasi merupakan 'segitiga besi' dari infrastruktur yang mendasarinya." Pada saat yang sama, ia juga mengatakan, "Model untuk industri vertikal akan menjadi titik kritis dari nilai model skala besar." Implikasinya, modal dan teknologi hanyalah kondisi dan momentum yang diperlukan untuk memasuki model skala besar. industri, dan sorotan sebenarnya masih di tingkat pendaratan.
Bakat adalah bagian yang sangat penting dari kompetisi pendaratan model berskala besar.
Pada kuartal pertama tahun ini, berbagai perusahaan memulai "perang untuk bakat". Saat itu, Wang Huiwen menyatakan kesediaannya untuk mengambil 75% saham untuk mengundang talenta Litbang terbaik, dan Li Kaifu menyerukan untuk merekrut talenta kelas dunia di seluruh dunia.Baidu bersedia merekrut insinyur algoritme model skala besar AI dengan gaji bulanan 25-40k.40-70k gaji bulanan untuk merekrut pelatihan model skala besar dan insinyur algoritme. Pada saat yang sama, di situs rekrutmen, gaji produk model skala besar dan posisi operasi telah mencapai level gaji bulanan 35-60k.
Kedua, "infrastruktur" seperti algoritme, daya komputasi, dan data masih menjadi prioritas utama model besar. Menurut evaluasi 10 model AI besar di dalam dan luar negeri oleh institusi terkait, secara keseluruhan, model besar domestik melampaui model asing dalam hal pemahaman kata dan pertanyaan pengetahuan, yaitu model besar AI domestik [gf] 2f42[/gf]Kognisi dasar dan kemampuan belajar karakter [gf] 2f12[/gf] lebih kuat. Tetapi pada saat yang sama, perlu juga dicatat bahwa pada level data, pengembangan model besar membutuhkan kumpulan data pelatihan berkualitas tinggi.
Dalam hal daya komputasi, meskipun beberapa perusahaan teknologi terkemuka seperti Ali, Baidu, Tencent, dan Huawei telah menyelesaikan pembangunan pusat data di negara saya, dan pemain di bidang vertikal seperti SenseTime dan Megvii telah banyak berinvestasi, masih ada banyak kapasitas. Sedikit ruang untuk perbaikan.
Terakhir, ada skenario pendaratan dan komersialisasi.
Tingginya biaya komersialisasi dalam skenario subdivisi yang berbeda dan dalam industri yang berbeda juga merupakan masalah umum yang dihadapi oleh industri tersebut. Diperkirakan biaya pelatihan model besar antara US $ 2 juta dan US $ 12 juta Secara keseluruhan, ini akan memakan waktu untuk realisasi komersial model AI besar.
Pabrikan yang lebih pragmatis memilih untuk fokus pada beberapa kekuatan mereka. Misalnya, Tencent memimpin pendaratan di bidang keuangan dan pendidikan, dan layanan MaaS satu atap mengurangi beban perusahaan; setelah peningkatan model besar Baidu Wenxin, biayanya dikurangi menjadi 10% dari masa lalu. Hingga kini, Baidu Smart Cloud telah mencapai hasil pengujian yang baik di lebih dari 400 skenario dengan lebih dari 300 mitra ekologis. Huawei telah mulai bekerja keras di bidang pemerintahan dan perusahaannya sendiri ...
Terlihat bahwa pertarungan model besar tentang masa depan ini sedang berlangsung.
Tulis di akhir
Di bawah "perang model kelompok", setiap pemain harus memanfaatkan kesempatan itu, dan banyak orang menganggapnya sebagai bonus waktu. Hal ini bisa dimaklumi, di jalur yang semakin kompetitif ini, meski banyak kesulitan, model skala besar domestik masih bergerak ke arah teknis dan komersialisasi yang lebih lengkap dan pragmatis. ** Situasi persaingan industri semacam ini yang bersemangat dan praktis akan mempercepat laju pengembangan teknologi model skala besar negara saya dan mempromosikan peningkatan teknologi keseluruhan industri AI China. **
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
30 perusahaan bersaing untuk WAIC: model besar memasuki perang dimensi tinggi
Sumber: Zero State LT, Penulis: Zhuo Xinyue, Editor: Hu Zhanjia
Konferensi Kecerdasan Buatan Dunia 2023 (WAIC 2023), acara paling menarik di kalangan teknologi baru-baru ini, memberikan jawaban yang mengejutkan semua orang: setengah tahun! Setengah tahun tidak terlalu lama untuk jalur teknologi apa pun, dan bahkan beberapa jalur hanya dalam tahap "bayi", tetapi jalur model skala besar telah menyelesaikan proses dari konsep hingga implementasi dalam waktu yang singkat.
Pada kuartal pertama tahun ini, industri masih membahas pertanyaan "apakah atau tidak". Pada kuartal kedua, tren berbagai pabrikan besar berkumpul untuk membuat model besar adalah para pemain menjawab "bagaimana melakukannya" .
Jawaban ini, pada intinya, telah difokuskan oleh lebih dari 30 produsen model skala besar yang berpartisipasi dalam konferensi WAIC-pertama memecahkan masalah teknis, diikuti implementasi adegan, dan akhirnya komersial dan skala.
"Sebelumnya, kesulitan dalam penerapan kecerdasan buatan lebih pada tingkat teknis, seperti bidang mengemudi otonom. Ini telah dikembangkan selama bertahun-tahun, tetapi komersialisasi masih menghalangi pemain untuk melihat fajar," kata orang dalam industri. setelah mengunjungi konferensi WAIC: "Relatif Namun, perlu dicatat bahwa persaingan pasar untuk model besar akan semakin ketat."
Dalam konferensi WAIC ini, lebih dari 30 perusahaan berfokus pada "pamer otot", termasuk raksasa seperti Baidu, Tencent, Ali, Huawei, dan JD.com, serta pemain di bidang vertikal seperti SenseTime dan NetEase.
Saat ini, muncul berita bahwa pemimpin satuan tugas standardisasi model skala besar pertama di negara saya dipegang bersama oleh Laboratorium Kecerdasan Buatan Shanghai dan Baidu, Huawei, Ali, dan perusahaan lain. Batch pertama dari perusahaan terpilih ini juga diberi " gelar Timnas”. ** Ada berbagai tanda bahwa pertempuran PK model skala besar dimensi tinggi yang dipimpin oleh "tim nasional" telah resmi dimulai. **
Dari "menari model grup" hingga "memimpin tim nasional"
Sejak awal tahun ini, model besar tidak diragukan lagi menjadi titik terpanas dalam teknologi, dan segera menjadi "tema utama" berbagai perusahaan. Tampaknya tidak ada pabrikan besar yang berani mengatakan secara terbuka bahwa mereka tidak akan terlibat dalam hal ini. Menurut statistik yang tidak lengkap, pada paruh pertama tahun ini, ada hampir seratus perusahaan yang secara resmi mengumumkan akan membuat model skala besar.
Perusahaan Internet besar seperti Ali, Baidu, Tencent, ByteDance, dan JD.com, perusahaan AI yang diwakili oleh iFlytek dan SenseTime, dan berbagai industri yang diwakili oleh perusahaan pendidikan seperti Kidswant dan perusahaan keuangan seperti Perusahaan Huashun telah memasuki permainan satu demi satu. .
Selain itu, ada peningkatan pesat di negara ini untuk memulai bisnis model skala besar AI.Banyak raksasa teknologi, eksekutif, dan mantan eksekutif pabrikan besar telah mengabdikan diri pada model skala besar untuk memulai bisnis baru. Misalnya, Wang Huiwen, salah satu pendiri Meituan asli, memasuki model besar AI dengan profil tinggi (saat ini, "Light Years Beyond" yang didirikan oleh perusahaan telah diakuisisi oleh Meituan); Li Kaifu, CEO Innovation Works, Wang Xiaochuan, pendiri Sohu, dan mantan perintis bisnis AI JD.com, Zhou Bowen, dan lainnya telah bergabung dengan gelombang kewirausahaan model besar AI. Meskipun adegan ini tidak spektakuler seperti "Perang Seribu Resimen" saat itu, itu cukup mengejutkan dunia luar untuk trek model skala besar yang membutuhkan ambang batas teknis yang sangat tinggi dari solusi kecerdasan buatan +.
Dalam beberapa tahun terakhir, jalur ke B sangat panas, dan permintaan untuk transformasi digital dan peningkatan perusahaan menjadi semakin kuat, dan pengurangan biaya serta peningkatan efisiensi juga menjadi tuntutan inti perusahaan. Bahkan banyak orang di industri percaya bahwa model berskala besar telah menjadi bidang yang paling menjanjikan untuk pertumbuhan bertahap dalam lingkaran teknologi. Dan ini telah menjadi salah satu alasan popularitas model besar yang cepat.
**Pada konferensi WAIC yang diadakan di Shanghai dari tanggal 6 hingga 8 Juli, lebih dari 30 perusahaan model skala besar berkompetisi untuk menampilkan tata letak dan pencapaian di tingkat model skala besar, yang juga menjadi peristiwa penting dalam perkembangan industri . **
Baidu, sebagai pabrikan pertama di China yang mengumumkan kecerdasan buatan All In, mendemonstrasikan gaya Wenxinyi-nya, salah satu "harta karun balai kota", di konferensi tersebut, memungkinkan setiap orang yang memasuki ruang pameran untuk menyadari bahwa setiap orang dapat "P- gambar". Huawei memindahkan Atlas 900 PoD A2 ke tempat kejadian untuk memamerkan kekuatan komputasi dasarnya di sisi perangkat keras; di sub-forum Alibaba Cloud, "Keluarga Tongyi" menambahkan model lukisan AI "Tongyi Wanxiang", yaitu Ali Ketiga produk model besar diumumkan dalam waktu tiga bulan.
Antusiasme industri terhadap model-model besar telah mempercepat pembentukan "tim nasional".
Pada tanggal 7 Juli, pada konferensi WACI 2023, standardisasi kecerdasan buatan nasional di bawah bimbingan Komite Standar Nasional mengumumkan bahwa pemimpin gugus tugas standardisasi model skala besar pertama negara saya akan dipegang bersama oleh Laboratorium Kecerdasan Buatan Shanghai dan Baidu, Huawei, Ali dan perusahaan lainnya. Sejak itu, "tim nasional" model besar telah berkumpul.
Padahal, pada awal Mei tahun ini, negara tersebut memulai pekerjaan terkait standardisasi model besar Grup khusus yang baru dibentuk akan melakukan standardisasi model besar, dengan tujuan mempromosikan kombinasi model besar dan praktik standardisasi. , dan mempromosikan pengembangan industri kecerdasan buatan pertumbuhan yang sehat. Sejak itu, trek model skala besar, yang berisik selama setengah tahun, secara resmi mengumumkan akan bergerak menuju standardisasi.
Para raksasa "bersaing", kompetisi lintasan memasuki pertarungan dimensi tinggi
Pada Konferensi Kecerdasan Buatan Dunia 2023, model besar ini layak menjadi "kelas atas".
Baidu Wenxin, Ali Tongyi, Huawei Pangu, Xunfei Xinghuo, Shangtang Ririxin, Netease Fuxi dan lebih dari 30 model skala besar semuanya diluncurkan. Di tempat konferensi, para raksasa meninggalkan konsep satu per satu, melangkah lebih dekat, dan memamerkan pencapaian masing-masing perusahaan.
Pada sore hari tanggal 7 Juli, di Huawei Developer Conference 2023 (Cloud), Zhang Pingan, Direktur Eksekutif Huawei dan CEO Huawei Cloud, mengumumkan bahwa Huawei Cloud Pangu Model 3.0 telah resmi dirilis. Dia juga mengatakan bahwa "model Pangu Huawei sangat sibuk, sibuk dengan hal-hal, dan tidak punya waktu untuk menulis puisi." Langkah ini juga dianggap menyiratkan bahwa model yang dirilis sebelumnya suka menulis puisi dan prosa pada konferensi pers. Karena Huawei berharap dapat menggunakan model besar Pangu untuk membantu berbagai industri, seperti keuangan, urusan pemerintahan, pertambangan, meteorologi, dll., daripada berfokus pada level model suara besar.
Dikatakan bahwa hingga saat ini, model besar Pangu telah diterapkan di bidang meteorologi, penelitian dan pengembangan medis, tenaga listrik, bahasa, dan bidang lainnya, dan telah menghasilkan banyak model besar dengan ratusan miliar parameter.
Zhou Jingren, CTO Alibaba Cloud, menyebutkan bahwa "tujuan utamanya adalah untuk mempromosikan kemakmuran model ekologi skala besar China, dan menyediakan layanan menyeluruh untuk perusahaan rintisan berskala besar." Jelas, ini melanjutkan konsep MaaS (Model as a Service) yang diajukan oleh Alibaba Cloud.
Baidu adalah pemain awal, dan model berskala besar Wenxin selalu menarik perhatian industri. Pada konferensi ini, Baidu Chief Technology Officer Wang Haifeng mengatakan bahwa Baidu kini telah ditingkatkan ke Wenxin Model 3.5. Efeknya meningkat 50%, kecepatan latihan meningkat 2 kali lipat, dan kecepatan penalaran meningkat 30 kali lipat.
Selain berita "tim nasional", perusahaan Internet besar seperti Tencent juga mempercepat proses model besar dari konsep hingga implementasi.
Dalam 20 hari terakhir, berita berat Tencent tentang model besar telah sering menyebar. Pada 19 Juni, dia secara terbuka mengungkapkan pemikirannya tentang model besar untuk pertama kalinya. Pada 26 Juni, dia mengungkapkan jaringan komputasi kinerja tinggi Xingmai yang dikembangkan sendiri untuk pertama kalinya. Pada 7 Juli, Wu Yunsheng, wakil presiden Tencent Cloud dan kepala Tencent Cloud Intelligence, memperkenalkan bahwa dalam hal inovasi aplikasi, kapabilitas model industri skala besar Tencent Cloud diterapkan pada skenario seperti kontrol risiko keuangan, terjemahan interaktif, dan layanan pelanggan cerdas digital, yang meningkatkan efisiensi aplikasi cerdas.
** Dapat dilihat bahwa dengan masuknya pabrikan dengan cepat, model skala besar domestik dengan cepat melewati tahap konsep, dan sekarang setiap perusahaan berfokus pada bagaimana mengimplementasikan dan mengkomersialkan. **
Dalam perang kenaikan yang telah dimulai, ambang batas telah dinaikkan dan kesulitan telah meningkat. Ini bukan tantangan kecil bagi pabrikan mana pun.
Buka "volume" ke segala arah untuk mendapatkan postur yang benar dari "dataran tinggi" model besar
Faktanya, meskipun model besar sangat populer, cukup sulit dari memasuki permainan hingga benar-benar mendarat dan mendorongnya ke pasar, dan banyak kesulitan telah muncul. Pendanaan, bakat, infrastruktur, skenario, dan komersialisasi telah menjadi "perlombaan rintangan" yang harus diatasi oleh setiap pemain.
Pada tahap awal pengembangan model besar, beberapa orang di industri mengatakan bahwa "model besar adalah permainan pabrikan besar", menyiratkan bahwa "model besar sangat mahal", dan hanya pabrikan besar yang mampu membelinya. Menurut statistik yang tidak lengkap dari Titanium Media, pada tahun 2022, Huawei akan menginvestasikan 161,5 miliar yuan untuk biaya R&D, menjadi perusahaan dengan investasi R&D terbanyak; diikuti oleh Tencent dengan 61,4 miliar yuan dan Alibaba dengan 55,5 miliar yuan. Dalam sepuluh tahun terakhir, Baidu telah menginvestasikan lebih dari 100 miliar yuan di bidang AI. Investasi tahunan dalam Litbang oleh pabrikan Internet besar telah memungkinkan mereka memiliki tim Litbang yang kuat dan menjadi "eselon satu" yang layak di jalur model berskala besar.
Tapi mereka tidak bisa membabi buta memasukkan tanpa mengharapkan imbalan apa pun. Dilihat dari dinamika saat ini, mereka semua mempercepat implementasi industri. Dana yang kuat diinvestasikan dalam penelitian dan pengembangan, dikomersialkan sesegera mungkin, dan kemudian diinvestasikan dalam pengembangan dan pelatihan model AI - ini adalah siklus yang mendukung pemain model skala besar.
Seperti yang dikatakan Li Qiang, wakil presiden Tencent dan presiden pemerintah dan bisnis perusahaan Tencent: "Di era model besar, data, jaringan, dan daya komputasi merupakan 'segitiga besi' dari infrastruktur yang mendasarinya." Pada saat yang sama, ia juga mengatakan, "Model untuk industri vertikal akan menjadi titik kritis dari nilai model skala besar." Implikasinya, modal dan teknologi hanyalah kondisi dan momentum yang diperlukan untuk memasuki model skala besar. industri, dan sorotan sebenarnya masih di tingkat pendaratan.
Bakat adalah bagian yang sangat penting dari kompetisi pendaratan model berskala besar.
Pada kuartal pertama tahun ini, berbagai perusahaan memulai "perang untuk bakat". Saat itu, Wang Huiwen menyatakan kesediaannya untuk mengambil 75% saham untuk mengundang talenta Litbang terbaik, dan Li Kaifu menyerukan untuk merekrut talenta kelas dunia di seluruh dunia.Baidu bersedia merekrut insinyur algoritme model skala besar AI dengan gaji bulanan 25-40k.40-70k gaji bulanan untuk merekrut pelatihan model skala besar dan insinyur algoritme. Pada saat yang sama, di situs rekrutmen, gaji produk model skala besar dan posisi operasi telah mencapai level gaji bulanan 35-60k.
Kedua, "infrastruktur" seperti algoritme, daya komputasi, dan data masih menjadi prioritas utama model besar. Menurut evaluasi 10 model AI besar di dalam dan luar negeri oleh institusi terkait, secara keseluruhan, model besar domestik melampaui model asing dalam hal pemahaman kata dan pertanyaan pengetahuan, yaitu model besar AI domestik [gf] 2f42[/gf]Kognisi dasar dan kemampuan belajar karakter [gf] 2f12[/gf] lebih kuat. Tetapi pada saat yang sama, perlu juga dicatat bahwa pada level data, pengembangan model besar membutuhkan kumpulan data pelatihan berkualitas tinggi.
Dalam hal daya komputasi, meskipun beberapa perusahaan teknologi terkemuka seperti Ali, Baidu, Tencent, dan Huawei telah menyelesaikan pembangunan pusat data di negara saya, dan pemain di bidang vertikal seperti SenseTime dan Megvii telah banyak berinvestasi, masih ada banyak kapasitas. Sedikit ruang untuk perbaikan.
Terakhir, ada skenario pendaratan dan komersialisasi.
Tingginya biaya komersialisasi dalam skenario subdivisi yang berbeda dan dalam industri yang berbeda juga merupakan masalah umum yang dihadapi oleh industri tersebut. Diperkirakan biaya pelatihan model besar antara US $ 2 juta dan US $ 12 juta Secara keseluruhan, ini akan memakan waktu untuk realisasi komersial model AI besar.
Pabrikan yang lebih pragmatis memilih untuk fokus pada beberapa kekuatan mereka. Misalnya, Tencent memimpin pendaratan di bidang keuangan dan pendidikan, dan layanan MaaS satu atap mengurangi beban perusahaan; setelah peningkatan model besar Baidu Wenxin, biayanya dikurangi menjadi 10% dari masa lalu. Hingga kini, Baidu Smart Cloud telah mencapai hasil pengujian yang baik di lebih dari 400 skenario dengan lebih dari 300 mitra ekologis. Huawei telah mulai bekerja keras di bidang pemerintahan dan perusahaannya sendiri ...
Terlihat bahwa pertarungan model besar tentang masa depan ini sedang berlangsung.
Tulis di akhir
Di bawah "perang model kelompok", setiap pemain harus memanfaatkan kesempatan itu, dan banyak orang menganggapnya sebagai bonus waktu. Hal ini bisa dimaklumi, di jalur yang semakin kompetitif ini, meski banyak kesulitan, model skala besar domestik masih bergerak ke arah teknis dan komersialisasi yang lebih lengkap dan pragmatis. ** Situasi persaingan industri semacam ini yang bersemangat dan praktis akan mempercepat laju pengembangan teknologi model skala besar negara saya dan mempromosikan peningkatan teknologi keseluruhan industri AI China. **