"Wenxinyiyan tampaknya diluncurkan dengan tergesa-gesa. Saya pikir hal ini sama sekali bukan untuk menghasilkan uang, tetapi untuk mengejar ketinggalan dengan ledakan ChatGPT. Model besar industri inilah yang benar-benar dapat menghasilkan nilai komersial. " Tak lama setelah rilis Baidu Wenxinyiyan , Seorang mantan karyawan Baidu mengatakan kepada Titanium Media, "Ketika OpenAI tidak begitu populer tahun lalu, Tuan Wang (CTO Baidu Wang Haifeng) memimpin tim untuk membangun 10 model skala besar, termasuk model industri skala besar. Saat itu , tidak banyak perhatian di luar industri, tetapi jika Anda melihat tata letak Baidu sekarang, model industri besar sebenarnya adalah tata letak yang berwawasan ke depan, lebih awal dari OpenAI dan Microsoft."
Saat ini, setelah hiruk pikuk model skala besar tujuan umum, model industri secara bertahap mendapatkan daya tarik, yang juga menegaskan kenyataan ini: Model skala besar dasar seperti ChatGPT menghasilkan "tangisan", yang sebagian besar berperan dalam mendidik pasar dan membentuk kognisi , Kecerdasan buatan benar-benar akan diimplementasikan dan menghasilkan uang saat ini, tetapi juga tergantung pada model industri yang besar.
Bahkan di pasar luar negeri, ChatGPT, sebagai bagian dari atribut produk C-end, secara bertahap melemah. Menurut data SimilarWeb, tingkat pertumbuhan kunjungan ChatGPT pada tahap awal sangat mencengangkan. Tingkat pertumbuhan bulan-ke-bulan adalah 131,6 % di bulan Januari dan 62,5% di bulan Februari menjadi 55,8% di bulan Maret, dan melambat secara signifikan di bulan April, dengan tingkat pertumbuhan bulan ke bulan sebesar 12,6%. diperkirakan bahwa tingkat pertumbuhan bulan ke bulan di bulan Juni mungkin negatif.
“Saya yakin banyak dari kita yang sudah mencoba ChatGPT, dan saya yakin banyak orang yang mengesampingkannya setelah mencobanya, karena pada dasarnya terpisah dari pekerjaan kami saat ini, jadi kami meletakkannya setelah menggunakannya. Tapi saya masih berharap bahwa setiap orang tidak akan "bangun pagi dan mengejar episode terlambat", karena ini adalah revolusi paradigma yang akan membawa perubahan subversif." kata Wei Qing, Chief Technology Officer (CTO) Microsoft (China) sebelumnya.
Solusi sisi-B berdasarkan ChatGPT atau model besar adalah cara yang baik untuk menyelesaikan pemisahan antara model dan pemandangan besar.
Secara internasional, perusahaan besar seperti Microsoft dan Amazon juga mulai mencari jalur komersialisasi dari layanan tingkat perusahaan, dan mulai menjelajahi berbagai industri; di dalam negeri, Baidu, Alibaba, Tencent, dan Huawei semuanya mempercepat investasi di industri skala besar model. Selain itu, banyak pemimpin industri dan perusahaan pemula di seluruh dunia juga menjajaki prospek model industri berskala besar.Baru-baru ini, Komisi Sains dan Teknologi Kota Beijing dan Komite Manajemen Zhongguancun juga merilis batch pertama dari 10 kasus aplikasi model industri kecerdasan buatan berskala besar di Beijing. Selain itu, jumlah merger dan akuisisi rute teknologi terkait juga telah mencapai level tertinggi baru...
Tetapi jalur model skala besar masih jauh dari keramaian — dengan perkembangan pesat iterasi teknologi, semua lapisan masyarakat mengumpulkan kembali pengetahuan teknis dan membentuk model bisnis, dan semuanya baru saja dimulai.
Peningkatan: Perang Seribu Model
Jika model dasarnya adalah "perang seratus model", model skala besar industri adalah "perang seribu model". Sama seperti batang yang menumbuhkan cabang, setiap produsen model skala besar dasar dapat menginkubasi beberapa model skala besar industri .bulat.
"Meskipun setiap orang memiliki harapan yang tinggi untuk model berskala besar untuk keperluan umum, ini belum tentu merupakan solusi optimal untuk memenuhi kebutuhan skenario industri." Pada 19 Juni, pada Konferensi Model Skala Besar Industri Tencent Cloud, Wakil Eksekutif Senior Presiden Grup Tencent, Cloud dan Tang Daosheng, CEO Grup Bisnis Industri Cerdas, mengatakan.
Jika Hunyuan Assistant tidak merilisnya ke publik, Tencent memimpin dalam merilis model industri skala besar Mengandalkan platform Tencent Cloud TI untuk membangun pilihan model industri skala besar, ini memberi pelanggan satu- hentikan layanan MaaS dan bantu pelanggan korporat membangun model skala besar eksklusif dan aplikasi Cerdas. Diketahui dari Tencent bahwa Tencent akan merilis informasi resmi tentang model umum C-end di masa mendatang.
Serangkaian tindakan ini dapat dipahami sebagai, terlepas dari efek dan kemajuan model skala besar dasar Hunyuan, perilisan prioritas model skala besar industri merupakan langkah penting bagi Tencent untuk memastikan reputasinya sendiri dan merebut pelanggan pasar ketika pelanggan sangat membutuhkan.
Sebelumnya, Tian Qi, kepala ilmuwan di bidang kecerdasan buatan di Huawei Cloud, menyebutkan bahwa Huawei membagi model besar menjadi tiga level, L0, L1, L2, dan L0 yang oleh semua orang disebut sebagai model umum dasar, seperti GPT-3 , dalam model dasar L0 Berdasarkan , ditambah data industri, model besar industri yang diperoleh dengan pelatihan campuran adalah L1.
Kemudian, L1 dikerahkan untuk skenario subdivisi tertentu dari ribuan industri hilir, dan model tugas L2 dari skenario subdivisi diperoleh. Untuk mengurangi biaya produksi dan meningkatkan efisiensi sesegera mungkin, cara cepat menghasilkan model L2 dari yang besar model industri L1, dan Menyebarkan model L2 ke sisi perangkat, sisi edge, dan sisi cloud adalah masalah yang sangat penting.
Dapat dilihat dalam agenda Huawei Developer Conference yang akan datang pada bulan Juli, Huawei Cloud akan melakukan serangkaian interpretasi dan rilis tentang bagaimana model Pangu disempurnakan dari model dasar menjadi model industri.
Pada Alibaba Cloud Summit tahun ini, CTO Alibaba Cloud Zhou Jingren juga mengatakan, "Saat ini tidak semua perusahaan perlu memulai pelatihan dari awal, Anda juga tidak perlu setiap orang memulai dari awal untuk membuat berbagai korpus, termasuk sejumlah besar daya komputasi sumber daya, tumbuh dari awal Serangkaian penyesuaian model, kami berharap bahwa berdasarkan model Tongyi Qianwen hari ini, dikombinasikan dengan skenario perusahaan, sistem pengetahuan perusahaan, dan kebutuhan khusus perusahaan di industri, setiap model khusus perusahaan akan dihasilkan."
Microsoft juga membuat model industrinya sendiri. Pada bulan April, di Cina, versi internasional Microsoft Azure OpenAI Service merilis tiga set pertama skenario industri inovasi global Azure untuk e-commerce ritel, manufaktur, dan bidang asli digital, mengintegrasikan GPT-3 dan GPT-4 untuk pengguna perusahaan lokal yang akan pergi luar negeri. , Codex, DALL-E, dan ChatGPT tingkat perusahaan, lima layanan model skala besar, untuk membantu pelanggan perusahaan luar negeri Tiongkok mempercepat ekspansi mereka ke pasar global.
"Perang seribu model" akan segera pecah, tetapi masih terlalu dini untuk benar-benar memasuki tahap gelombang besar yang membasuh pasir. Secara keseluruhan, model skala besar masih dalam tahap pengembangan yang relatif awal. Meskipun model skala besar di industri terkonsentrasi, jelas ada lebih banyak ruang untuk trek ini.
Mengambil model besar industri keuangan sebagai contoh, dibagi menjadi beberapa bidang seperti perusahaan sekuritas, asuransi, bank, dan keuangan baru.Tugas hilir masing-masing bidang dibagi menjadi puluhan atau ratusan sub-tugas.
"Momen yang lebih penting adalah ketika berdasarkan model dasar, SFT dan mekanisme serta struktur lainnya dapat diadaptasi secara efisien untuk tugas hilir, dan ketika tugas hilir industri keuangan atau model industri lainnya memiliki efek skala." Di Alibaba Menurut untuk Chen Haiqing, kepala Pusat Bisnis Inovasi Moyuan, ini hanyalah awal dari model dan skenario besar industri untuk pelatihan berkelanjutan melalui beberapa data tidak terstruktur universal.
Pilihan yang masuk akal dan realistis
Jika suatu perusahaan ingin membuat model skala besar dasar dengan ratusan miliar parameter, diperlukan daya komputasi lebih dari 10.000 kartu dalam satu cluster mesin, tidak hanya kartu GPU, tetapi juga pemanfaatan sumber daya cluster GPU , yang tidak dapat dilakukan oleh sebagian besar perusahaan.
Model industri besar jelas lebih mudah direalisasikan, dan juga memiliki prospek aplikasi yang lebih luas.
"Model besar dapat memberdayakan ribuan industri, tetapi Anda harus memiliki pemahaman yang baik tentang skenario ribuan industri, dan Anda tidak dapat mengharapkan untuk melatih ratusan miliar atau triliunan model besar, yang dapat dengan mudah digunakan oleh pengguna perusahaan, " kata Zhou Ming, pendiri Teknologi Lanzhou. "Dari model umum ke model industri, perlu dilakukan mil terakhir untuk skenario pengguna."
Setelah menilai investasi yang diperlukan untuk model dasar skala besar dan menimbang pro dan kontra serta untung dan rugi, pelanggan perusahaan dengan cepat beralih ke model industri skala besar, dan pabrikan mencurahkan lebih banyak energi untuk itu.
Tang Daosheng terus terang berkata bahwa model skala besar tujuan umum saat ini umumnya dilatih berdasarkan literatur publik yang luas dan informasi jaringan.Informasi di Internet mungkin mengandung kesalahan, rumor, dan bias.Banyak pengetahuan profesional dan data industri tidak terakumulasi secara memadai, menghasilkan model industri-spesifik Akurasi dan akurasi tidak cukup, dan data "noise" terlalu besar.
Namun, dalam banyak skenario industri, pengguna memiliki persyaratan tinggi untuk layanan profesional yang disediakan oleh perusahaan, dan toleransi kesalahannya rendah. Begitu perusahaan memberikan informasi yang salah, hal itu dapat menyebabkan tanggung jawab hukum yang besar atau krisis hubungan masyarakat. Oleh karena itu, model berskala besar yang digunakan oleh perusahaan harus dapat dikontrol, dapat dilacak, dan dapat diperbaiki, serta harus diuji berulang kali dan sepenuhnya sebelum dapat diluncurkan.
"Kami percaya bahwa pelanggan memerlukan lebih banyak model industri khusus industri, ditambah dengan data perusahaan sendiri untuk pelatihan atau penyempurnaan, guna menciptakan layanan cerdas yang sangat praktis. Yang dibutuhkan perusahaan adalah benar-benar menyelesaikan masalah dalam skenario aktual. Memecahkan a masalah tertentu alih-alih menyelesaikan 70%-80% masalah dalam 100 adegan," kata Tang Daosheng.
Zhu Yong, wakil presiden Baidu Smart Cloud, juga berkata, "Dari situasi di dalam dan luar negeri, kita dapat melihat bahwa tidak banyak model serba guna. Beberapa pabrikan di pasar sebenarnya membuat model yang relatif kecil. Sebaliknya, , model domain itu khusus Penting, karena model umum hanya memiliki kemampuan pengetahuan umum, model domain dapat diselaraskan dengan ekspektasi tugas industri dan domain tertentu, dan memecahkan masalah bisnis yang sebenarnya.Proses ini sangat penting, tetapi biaya dan sumber daya yang diperlukan untuk proses ini jauh lebih sedikit daripada memulai dari awal Lakukan model umum yang mendasarinya."
Pada saat yang sama, ia juga menilai bahwa mungkin hanya ada beberapa model dasar (model umum yang mendasarinya) di masa depan, tetapi dikombinasikan dengan data di bidang profesional dan pengetahuan industri, banyak jenis model domain yang berbeda akan tumbuh di atasnya. Model domain ini akan sangat makmur di masa depan dan mendukung aplikasi domain lapisan atas yang makmur.
Mengambil model besar industri energi "State Grid-Baidu Wenxin" yang dibuat oleh Baidu Smart Cloud dan State Grid sebagai contoh, Baidu Smart Cloud, bersama dengan pakar State Grid, memperkenalkan sampel yang diakumulasikan oleh State Grid dalam bisnis listrik ke dalam model skala besar umum Data dan pengetahuan unik, dan dalam pelatihan, gabungkan pengalaman kedua belah pihak dalam algoritme pra-pelatihan dan bisnis dan algoritme di bidang daya, algoritme desain seperti diskriminasi entitas di bidang daya dan diskriminasi dokumen di bidang tenaga sebagai tugas pra-pelatihan, sehingga model besar Wenxin dapat mempelajari kekuatan secara mendalam Pengetahuan profesional, sehingga benar-benar menyelesaikan masalah bisnis praktis di bidang energi, dan mencapai tujuan untuk mengurangi biaya dan meningkatkan efisiensi.
Zhu Yong mengatakan bahwa perbedaan antara model umum dan model domain dapat dibandingkan dengan seseorang dengan pengetahuan luas yang telah kuliah, dia mungkin mengetahui beberapa pengetahuan medis, tetapi dia tidak dapat mendiagnosis pasien dan bukan seorang dokter profesional. . Model domainnya adalah mempelajari ilmu kedokteran secara mendalam atas dasar kemampuan umum yang kuat, dan menjadi dokter profesional yang dapat memberikan kontribusi nilai dalam bidang kedokteran.
Dari model umum dengan berbagai pengetahuan hingga model medis profesional, biaya sumber daya yang diperlukan dalam proses ini jauh lebih sedikit daripada membangun model besar umum dari awal, tetapi menekankan bahwa ada data profesional, harus ada Hal ini didorong oleh tugas-tugas di bidang profesional untuk merangsangnya menghasilkan kemampuan tersebut.
Bagaimana melakukan model industri
Model besar itu sendiri adalah hal baru, yang telah mengubah paradigma pengembangan perangkat lunak sebelumnya Produsen membutuhkan rantai alat dan platform baru untuk membantu pelanggan memoles model besar industri lebih awal dan lebih cepat.
Dengan munculnya era model besar, efisiensi mil terakhir akan sangat meningkat. Zhou Ming menyebutkan bahwa paradigma pengembangan perangkat lunak generasi baru sedang terbentuk, terutama berdasarkan fakta bahwa perusahaan menyediakan banyak mesin fungsional, dan pengguna sekarang menjadi asisten untuk meningkatkan efisiensi.Atas dasar ini, mudah untuk membuat aplikasi baru.
Ambil platform model skala besar Wenxin Qianfan sebagai contoh, ini adalah platform pengembangan model skala besar dan operasi layanan satu atap untuk pengembang perusahaan. Ini tidak hanya menyediakan model dasar (ERNIE-Bot) dan model besar sumber terbuka pihak ketiga, tetapi juga menyediakan berbagai alat pengembangan AI dan lingkungan pengembangan yang lengkap untuk memfasilitasi pelanggan agar mudah menggunakan dan mengembangkan aplikasi model besar.
Untuk manajemen data, SFT model otomatis, dan penerapan layanan penalaran cloud, produsen berharap dapat mewujudkan layanan kustomisasi model skala besar satu atap. Kemampuan platform pembuatan model berskala besar dari produsen yang berbeda pada dasarnya serupa, dan perbedaannya terletak pada kemudahan penggunaan, kualitas efek, serta perangkat lunak dan perangkat keras yang didukung.
“Membuat model besar memang tidak murah, tetapi hanya ada dua alasan mengapa layanan model besar pada akhirnya dapat dipromosikan: yang pertama adalah efek modelnya lebih baik, dan efek modelnya tidak bagus. Tak perlu dikatakan, yang kedua adalah biayanya." Baidu Xin Zhou, manajer umum Smart Cloud AI dan Big Data Platform, berkata.
Akibatnya, model industri harus bergantung pada model umum. Misalnya, dalam pendidikan umum, jika tidak ada model umum yang lebih baik, tidak mungkin membicarakan efek penerapannya di industri tertentu. Bloomberg GPT yang diluncurkan bersama oleh Bloomberg dan Johns Hopkins adalah contohnya.Dalam distribusi datanya, data model dasar umum menyumbang setengahnya, data publik dari industri keuangan menyumbang setengahnya, dan data Bloomberg sendiri menyumbang 0,6%.
"Agar model apa pun mencapai tingkat kecerdasan atau kemampuan dasar yang lebih baik, ia harus melatih model dasar dengan jumlah parameter yang relatif baik, dan kemudian mengintegrasikan beberapa data profesional industri ke dalam model dasar untuk membuat model industri." Xin kata Zhou.
Ide Baidu adalah meluncurkan "orang besar" (Wenxin Yiyan) dan platform alat yang sangat lengkap (Wenxin Qianfan), dan kemudian menyediakan layanan model yang berbeda sesuai dengan kebutuhan pelanggan yang sebenarnya untuk membantu pelanggan membuat pilihan yang paling hemat biaya. percaya bahwa harga tidak akan menjadi hambatan bagi perusahaan untuk merangkul model besar.
Selain biaya panggilan model dan biaya pelatihan, Baidu juga membantu perusahaan untuk lebih mengurangi biaya.Jika perusahaan hanya fokus pada bidang yang relatif sempit, Baidu juga memiliki versi dengan parameter yang relatif rendah, sehingga sambil memastikan efek model, penggunaan atau Biaya model pelatihan akan turun drastis.
Faktanya, tidak ada standar universal untuk biaya membangun model industri besar.
Pertama-tama, model besar dasar yang berbeda memiliki spesifikasi parameter yang berbeda, dan investasi dalam perangkat lunak dan perangkat keras harus berubah secara dinamis sesuai dengan parameter dasar dan kemampuan model. Jika parameternya puluhan miliar, kartu A100 juga dapat berjalan dan memulai tugas hilir.
Persyaratan skenario aplikasi yang relatif terkonsentrasi saat ini termasuk dalam kategori ini, seperti menjawab pertanyaan cerdas, menulis cerdas, dan kreasi cerdas dalam manajemen pengetahuan, serta skenario pemasaran pan-Internet dan persyaratan pembuatan kode.
Kedua, biaya terkait dengan jumlah data dan arah aplikasi. Harga model skala besar global saat ini didasarkan pada 1000 Token sebagai unit dasar. Jika tugas hilir suatu perusahaan sangat sederhana dan dapat dilakukan hanya dengan puluhan ribu token, maka biayanya sangat rendah dan hanya memerlukan sedikit kartu GPU. Jumlah data yang dibutuhkan untuk membangun model industri besar biasanya dalam G atau bahkan T, sehingga biaya pelatihan offlinenya akan sangat tinggi.
**Siapa yang menjalankan lomba? **
Pemain berbondong-bondong ke jalur model berskala besar.Kali ini, tidak hanya perusahaan Internet tingkat pertama, tetapi juga lebih banyak pemimpin industri dan perusahaan pemula yang bergabung.
Industri mana yang dapat memimpin dalam menerobos? Mungkin bisa dilihat dari industri dimana kasus kerjasama tersebut berada Seperti yang terlihat pada tabel di awal artikel, keuangan, perawatan medis, pendidikan, mengemudi otonom dan bidang lainnya sering digunakan.
Misalnya, ketika Alibaba Cloud merilis model besar Tongyi pada bulan April, diumumkan bahwa mereka telah meluncurkan eksplorasi kerja sama dengan sejumlah perusahaan. Batch pertama perusahaan kerja sama termasuk OPPO Andes Smart Cloud, Geely Automobile, Zhiji Automobile, Chery New Energy, Momo Zhixing, Swire Coca-Cola, Bosideng, Teknologi Kelapa Sawit, dll. Menurut laporan, industri keuangan, industri ritel, dan beberapa skenario dan industri berorientasi konsumen skala besar telah mengumpulkan banyak data publik dan data skenario, yang nyaman untuk membangun model khusus perusahaan atau industri.
Menurut informasi publik, jumlah model industri skala besar Baidu Wenxin telah mencapai 11, meliputi energi dan listrik, keuangan, kedirgantaraan, media, film dan televisi, mobil, manajemen perkotaan, gas, asuransi, manufaktur elektronik, dan ilmu sosial.
Batch pertama dari sepuluh kasus aplikasi model skala besar dalam industri kecerdasan buatan di Beijing yang dirilis pada 27 Juni melibatkan energi dan listrik, kesehatan medis, keuangan, mengemudi otonom, konstruksi, penelitian ilmiah, kehidupan, dan bidang tanya jawab. Dilaporkan bahwa selama periode dari 27 Juni hingga 30 Juli, Komisi Sains dan Teknologi Beijing dan Komite Manajemen Zhongguancun juga akan fokus pada bidang-bidang utama seperti tata kelola kota, kesehatan medis, penelitian ilmiah, keuangan cerdas, kehidupan cerdas, dan cerdas kota, dan subjek inovasi target di kota. , akan mengumpulkan lebih dari 80 proyek kasus aplikasi model skala besar industri.
Tetapi lebih banyak pelanggan menghadapi gelombang baru akumulasi pengetahuan dan proses pembelajaran.
"Ketika kami berkomunikasi dengan pelanggan, kami menemukan bahwa banyak pelanggan tidak tahu banyak tentang model industri, tetapi mereka akan mengambil inisiatif untuk menanyakan model industri Baidu." Li Jingqiu, Deputy General Manager, Baidu Smart Cloud AI Platform, mengatakan bahwa saat ini, ini akan secara khusus digabungkan dengan penggunaan perusahaan yang sebenarnya.Analisis kebutuhan produk dan pelanggan, seperti kemampuan seperti apa yang Anda inginkan untuk dimiliki model industri, sistem atau aplikasi apa yang akan digunakan, siapa yang akan menggunakan aplikasi ini, dan efek apa yang ingin Anda capai... Setelah mengajukan pertanyaan ini, Anda benar-benar akan menemukan pelanggan Yang dibutuhkan adalah model besar berdasarkan SFT rantai alat Wenxin Qianfan, atau model terlatih untuk industri. Yang terakhir membutuhkan setidaknya beberapa bulan, atau bahkan tahun lalu, untuk membangun dan menerapkan — mulai dari masalah teknis seperti pemrosesan data, alokasi sumber daya pada lapisan daya komputasi, hingga pelatihan jangka panjang tentang data umum di industri.
Dari hiruk pikuk model skala besar dasar hingga awal model skala besar industri, memasuki paruh kedua tahun 2023, transformasi bisnis nyata akan dipercepat.
Menarik juga untuk membandingkan jalur pabrikan dalam negeri seperti Baidu dan OpenAI/Microsoft di bidang model skala besar.Ketika ChatGPT menunjukkan popularitas tingkat fenomena global, beberapa suara mempertanyakan mengapa China tidak dapat memproduksi ChatGPT.Tentu saja, ada adalah lingkungan teknis Pada akhirnya, banyak orang masih memiliki konsensus yang dangkal- "AI China lebih condong ke aplikasi bisnis dan kemampuan komersialisasi." Terus terang, AI China kurang sabar dan ingin menghasilkan uang.
Namun di sisi lain, pasar adalah kekuatan pendorong terbesar untuk perkembangan teknologi, dan penguasaan waktu serta ritme telah menciptakan hasil yang berbeda. Ambil model industri skala besar sebagai contoh.Microsoft sedang menunggu kematangan teknologi lebih lanjut, atau merasa bahwa waktunya belum tiba, dan ini sudah terlambat.Produsen dalam negeri dengan cepat beralih dari basis besar- model skala hingga model industri berskala besar.Memiliki vitalitas yang langgeng.
Tersesat di timur, dipanen murbei, dari segi hasil, bukan hal yang buruk model besar industri dalam negeri berlari kencang.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Model industri, buka bukunya!
Sumber: Titanium Media, Pengarang: Zhang Shuai
"Wenxinyiyan tampaknya diluncurkan dengan tergesa-gesa. Saya pikir hal ini sama sekali bukan untuk menghasilkan uang, tetapi untuk mengejar ketinggalan dengan ledakan ChatGPT. Model besar industri inilah yang benar-benar dapat menghasilkan nilai komersial. " Tak lama setelah rilis Baidu Wenxinyiyan , Seorang mantan karyawan Baidu mengatakan kepada Titanium Media, "Ketika OpenAI tidak begitu populer tahun lalu, Tuan Wang (CTO Baidu Wang Haifeng) memimpin tim untuk membangun 10 model skala besar, termasuk model industri skala besar. Saat itu , tidak banyak perhatian di luar industri, tetapi jika Anda melihat tata letak Baidu sekarang, model industri besar sebenarnya adalah tata letak yang berwawasan ke depan, lebih awal dari OpenAI dan Microsoft."
Saat ini, setelah hiruk pikuk model skala besar tujuan umum, model industri secara bertahap mendapatkan daya tarik, yang juga menegaskan kenyataan ini: Model skala besar dasar seperti ChatGPT menghasilkan "tangisan", yang sebagian besar berperan dalam mendidik pasar dan membentuk kognisi , Kecerdasan buatan benar-benar akan diimplementasikan dan menghasilkan uang saat ini, tetapi juga tergantung pada model industri yang besar.
Bahkan di pasar luar negeri, ChatGPT, sebagai bagian dari atribut produk C-end, secara bertahap melemah. Menurut data SimilarWeb, tingkat pertumbuhan kunjungan ChatGPT pada tahap awal sangat mencengangkan. Tingkat pertumbuhan bulan-ke-bulan adalah 131,6 % di bulan Januari dan 62,5% di bulan Februari menjadi 55,8% di bulan Maret, dan melambat secara signifikan di bulan April, dengan tingkat pertumbuhan bulan ke bulan sebesar 12,6%. diperkirakan bahwa tingkat pertumbuhan bulan ke bulan di bulan Juni mungkin negatif.
“Saya yakin banyak dari kita yang sudah mencoba ChatGPT, dan saya yakin banyak orang yang mengesampingkannya setelah mencobanya, karena pada dasarnya terpisah dari pekerjaan kami saat ini, jadi kami meletakkannya setelah menggunakannya. Tapi saya masih berharap bahwa setiap orang tidak akan "bangun pagi dan mengejar episode terlambat", karena ini adalah revolusi paradigma yang akan membawa perubahan subversif." kata Wei Qing, Chief Technology Officer (CTO) Microsoft (China) sebelumnya.
Solusi sisi-B berdasarkan ChatGPT atau model besar adalah cara yang baik untuk menyelesaikan pemisahan antara model dan pemandangan besar.
Secara internasional, perusahaan besar seperti Microsoft dan Amazon juga mulai mencari jalur komersialisasi dari layanan tingkat perusahaan, dan mulai menjelajahi berbagai industri; di dalam negeri, Baidu, Alibaba, Tencent, dan Huawei semuanya mempercepat investasi di industri skala besar model. Selain itu, banyak pemimpin industri dan perusahaan pemula di seluruh dunia juga menjajaki prospek model industri berskala besar.Baru-baru ini, Komisi Sains dan Teknologi Kota Beijing dan Komite Manajemen Zhongguancun juga merilis batch pertama dari 10 kasus aplikasi model industri kecerdasan buatan berskala besar di Beijing. Selain itu, jumlah merger dan akuisisi rute teknologi terkait juga telah mencapai level tertinggi baru...
Peningkatan: Perang Seribu Model
Jika model dasarnya adalah "perang seratus model", model skala besar industri adalah "perang seribu model". Sama seperti batang yang menumbuhkan cabang, setiap produsen model skala besar dasar dapat menginkubasi beberapa model skala besar industri .bulat.
"Meskipun setiap orang memiliki harapan yang tinggi untuk model berskala besar untuk keperluan umum, ini belum tentu merupakan solusi optimal untuk memenuhi kebutuhan skenario industri." Pada 19 Juni, pada Konferensi Model Skala Besar Industri Tencent Cloud, Wakil Eksekutif Senior Presiden Grup Tencent, Cloud dan Tang Daosheng, CEO Grup Bisnis Industri Cerdas, mengatakan.
Jika Hunyuan Assistant tidak merilisnya ke publik, Tencent memimpin dalam merilis model industri skala besar Mengandalkan platform Tencent Cloud TI untuk membangun pilihan model industri skala besar, ini memberi pelanggan satu- hentikan layanan MaaS dan bantu pelanggan korporat membangun model skala besar eksklusif dan aplikasi Cerdas. Diketahui dari Tencent bahwa Tencent akan merilis informasi resmi tentang model umum C-end di masa mendatang.
Serangkaian tindakan ini dapat dipahami sebagai, terlepas dari efek dan kemajuan model skala besar dasar Hunyuan, perilisan prioritas model skala besar industri merupakan langkah penting bagi Tencent untuk memastikan reputasinya sendiri dan merebut pelanggan pasar ketika pelanggan sangat membutuhkan.
Sebelumnya, Tian Qi, kepala ilmuwan di bidang kecerdasan buatan di Huawei Cloud, menyebutkan bahwa Huawei membagi model besar menjadi tiga level, L0, L1, L2, dan L0 yang oleh semua orang disebut sebagai model umum dasar, seperti GPT-3 , dalam model dasar L0 Berdasarkan , ditambah data industri, model besar industri yang diperoleh dengan pelatihan campuran adalah L1.
Kemudian, L1 dikerahkan untuk skenario subdivisi tertentu dari ribuan industri hilir, dan model tugas L2 dari skenario subdivisi diperoleh. Untuk mengurangi biaya produksi dan meningkatkan efisiensi sesegera mungkin, cara cepat menghasilkan model L2 dari yang besar model industri L1, dan Menyebarkan model L2 ke sisi perangkat, sisi edge, dan sisi cloud adalah masalah yang sangat penting.
Dapat dilihat dalam agenda Huawei Developer Conference yang akan datang pada bulan Juli, Huawei Cloud akan melakukan serangkaian interpretasi dan rilis tentang bagaimana model Pangu disempurnakan dari model dasar menjadi model industri.
Pada Alibaba Cloud Summit tahun ini, CTO Alibaba Cloud Zhou Jingren juga mengatakan, "Saat ini tidak semua perusahaan perlu memulai pelatihan dari awal, Anda juga tidak perlu setiap orang memulai dari awal untuk membuat berbagai korpus, termasuk sejumlah besar daya komputasi sumber daya, tumbuh dari awal Serangkaian penyesuaian model, kami berharap bahwa berdasarkan model Tongyi Qianwen hari ini, dikombinasikan dengan skenario perusahaan, sistem pengetahuan perusahaan, dan kebutuhan khusus perusahaan di industri, setiap model khusus perusahaan akan dihasilkan."
Microsoft juga membuat model industrinya sendiri. Pada bulan April, di Cina, versi internasional Microsoft Azure OpenAI Service merilis tiga set pertama skenario industri inovasi global Azure untuk e-commerce ritel, manufaktur, dan bidang asli digital, mengintegrasikan GPT-3 dan GPT-4 untuk pengguna perusahaan lokal yang akan pergi luar negeri. , Codex, DALL-E, dan ChatGPT tingkat perusahaan, lima layanan model skala besar, untuk membantu pelanggan perusahaan luar negeri Tiongkok mempercepat ekspansi mereka ke pasar global.
"Perang seribu model" akan segera pecah, tetapi masih terlalu dini untuk benar-benar memasuki tahap gelombang besar yang membasuh pasir. Secara keseluruhan, model skala besar masih dalam tahap pengembangan yang relatif awal. Meskipun model skala besar di industri terkonsentrasi, jelas ada lebih banyak ruang untuk trek ini.
Mengambil model besar industri keuangan sebagai contoh, dibagi menjadi beberapa bidang seperti perusahaan sekuritas, asuransi, bank, dan keuangan baru.Tugas hilir masing-masing bidang dibagi menjadi puluhan atau ratusan sub-tugas.
"Momen yang lebih penting adalah ketika berdasarkan model dasar, SFT dan mekanisme serta struktur lainnya dapat diadaptasi secara efisien untuk tugas hilir, dan ketika tugas hilir industri keuangan atau model industri lainnya memiliki efek skala." Di Alibaba Menurut untuk Chen Haiqing, kepala Pusat Bisnis Inovasi Moyuan, ini hanyalah awal dari model dan skenario besar industri untuk pelatihan berkelanjutan melalui beberapa data tidak terstruktur universal.
Pilihan yang masuk akal dan realistis
Jika suatu perusahaan ingin membuat model skala besar dasar dengan ratusan miliar parameter, diperlukan daya komputasi lebih dari 10.000 kartu dalam satu cluster mesin, tidak hanya kartu GPU, tetapi juga pemanfaatan sumber daya cluster GPU , yang tidak dapat dilakukan oleh sebagian besar perusahaan.
Model industri besar jelas lebih mudah direalisasikan, dan juga memiliki prospek aplikasi yang lebih luas.
"Model besar dapat memberdayakan ribuan industri, tetapi Anda harus memiliki pemahaman yang baik tentang skenario ribuan industri, dan Anda tidak dapat mengharapkan untuk melatih ratusan miliar atau triliunan model besar, yang dapat dengan mudah digunakan oleh pengguna perusahaan, " kata Zhou Ming, pendiri Teknologi Lanzhou. "Dari model umum ke model industri, perlu dilakukan mil terakhir untuk skenario pengguna."
Setelah menilai investasi yang diperlukan untuk model dasar skala besar dan menimbang pro dan kontra serta untung dan rugi, pelanggan perusahaan dengan cepat beralih ke model industri skala besar, dan pabrikan mencurahkan lebih banyak energi untuk itu.
Tang Daosheng terus terang berkata bahwa model skala besar tujuan umum saat ini umumnya dilatih berdasarkan literatur publik yang luas dan informasi jaringan.Informasi di Internet mungkin mengandung kesalahan, rumor, dan bias.Banyak pengetahuan profesional dan data industri tidak terakumulasi secara memadai, menghasilkan model industri-spesifik Akurasi dan akurasi tidak cukup, dan data "noise" terlalu besar.
Namun, dalam banyak skenario industri, pengguna memiliki persyaratan tinggi untuk layanan profesional yang disediakan oleh perusahaan, dan toleransi kesalahannya rendah. Begitu perusahaan memberikan informasi yang salah, hal itu dapat menyebabkan tanggung jawab hukum yang besar atau krisis hubungan masyarakat. Oleh karena itu, model berskala besar yang digunakan oleh perusahaan harus dapat dikontrol, dapat dilacak, dan dapat diperbaiki, serta harus diuji berulang kali dan sepenuhnya sebelum dapat diluncurkan.
"Kami percaya bahwa pelanggan memerlukan lebih banyak model industri khusus industri, ditambah dengan data perusahaan sendiri untuk pelatihan atau penyempurnaan, guna menciptakan layanan cerdas yang sangat praktis. Yang dibutuhkan perusahaan adalah benar-benar menyelesaikan masalah dalam skenario aktual. Memecahkan a masalah tertentu alih-alih menyelesaikan 70%-80% masalah dalam 100 adegan," kata Tang Daosheng.
Zhu Yong, wakil presiden Baidu Smart Cloud, juga berkata, "Dari situasi di dalam dan luar negeri, kita dapat melihat bahwa tidak banyak model serba guna. Beberapa pabrikan di pasar sebenarnya membuat model yang relatif kecil. Sebaliknya, , model domain itu khusus Penting, karena model umum hanya memiliki kemampuan pengetahuan umum, model domain dapat diselaraskan dengan ekspektasi tugas industri dan domain tertentu, dan memecahkan masalah bisnis yang sebenarnya.Proses ini sangat penting, tetapi biaya dan sumber daya yang diperlukan untuk proses ini jauh lebih sedikit daripada memulai dari awal Lakukan model umum yang mendasarinya."
Pada saat yang sama, ia juga menilai bahwa mungkin hanya ada beberapa model dasar (model umum yang mendasarinya) di masa depan, tetapi dikombinasikan dengan data di bidang profesional dan pengetahuan industri, banyak jenis model domain yang berbeda akan tumbuh di atasnya. Model domain ini akan sangat makmur di masa depan dan mendukung aplikasi domain lapisan atas yang makmur.
Mengambil model besar industri energi "State Grid-Baidu Wenxin" yang dibuat oleh Baidu Smart Cloud dan State Grid sebagai contoh, Baidu Smart Cloud, bersama dengan pakar State Grid, memperkenalkan sampel yang diakumulasikan oleh State Grid dalam bisnis listrik ke dalam model skala besar umum Data dan pengetahuan unik, dan dalam pelatihan, gabungkan pengalaman kedua belah pihak dalam algoritme pra-pelatihan dan bisnis dan algoritme di bidang daya, algoritme desain seperti diskriminasi entitas di bidang daya dan diskriminasi dokumen di bidang tenaga sebagai tugas pra-pelatihan, sehingga model besar Wenxin dapat mempelajari kekuatan secara mendalam Pengetahuan profesional, sehingga benar-benar menyelesaikan masalah bisnis praktis di bidang energi, dan mencapai tujuan untuk mengurangi biaya dan meningkatkan efisiensi.
Zhu Yong mengatakan bahwa perbedaan antara model umum dan model domain dapat dibandingkan dengan seseorang dengan pengetahuan luas yang telah kuliah, dia mungkin mengetahui beberapa pengetahuan medis, tetapi dia tidak dapat mendiagnosis pasien dan bukan seorang dokter profesional. . Model domainnya adalah mempelajari ilmu kedokteran secara mendalam atas dasar kemampuan umum yang kuat, dan menjadi dokter profesional yang dapat memberikan kontribusi nilai dalam bidang kedokteran.
Dari model umum dengan berbagai pengetahuan hingga model medis profesional, biaya sumber daya yang diperlukan dalam proses ini jauh lebih sedikit daripada membangun model besar umum dari awal, tetapi menekankan bahwa ada data profesional, harus ada Hal ini didorong oleh tugas-tugas di bidang profesional untuk merangsangnya menghasilkan kemampuan tersebut.
Bagaimana melakukan model industri
Model besar itu sendiri adalah hal baru, yang telah mengubah paradigma pengembangan perangkat lunak sebelumnya Produsen membutuhkan rantai alat dan platform baru untuk membantu pelanggan memoles model besar industri lebih awal dan lebih cepat.
Dengan munculnya era model besar, efisiensi mil terakhir akan sangat meningkat. Zhou Ming menyebutkan bahwa paradigma pengembangan perangkat lunak generasi baru sedang terbentuk, terutama berdasarkan fakta bahwa perusahaan menyediakan banyak mesin fungsional, dan pengguna sekarang menjadi asisten untuk meningkatkan efisiensi.Atas dasar ini, mudah untuk membuat aplikasi baru.
Ambil platform model skala besar Wenxin Qianfan sebagai contoh, ini adalah platform pengembangan model skala besar dan operasi layanan satu atap untuk pengembang perusahaan. Ini tidak hanya menyediakan model dasar (ERNIE-Bot) dan model besar sumber terbuka pihak ketiga, tetapi juga menyediakan berbagai alat pengembangan AI dan lingkungan pengembangan yang lengkap untuk memfasilitasi pelanggan agar mudah menggunakan dan mengembangkan aplikasi model besar.
Untuk manajemen data, SFT model otomatis, dan penerapan layanan penalaran cloud, produsen berharap dapat mewujudkan layanan kustomisasi model skala besar satu atap. Kemampuan platform pembuatan model berskala besar dari produsen yang berbeda pada dasarnya serupa, dan perbedaannya terletak pada kemudahan penggunaan, kualitas efek, serta perangkat lunak dan perangkat keras yang didukung.
“Membuat model besar memang tidak murah, tetapi hanya ada dua alasan mengapa layanan model besar pada akhirnya dapat dipromosikan: yang pertama adalah efek modelnya lebih baik, dan efek modelnya tidak bagus. Tak perlu dikatakan, yang kedua adalah biayanya." Baidu Xin Zhou, manajer umum Smart Cloud AI dan Big Data Platform, berkata.
Akibatnya, model industri harus bergantung pada model umum. Misalnya, dalam pendidikan umum, jika tidak ada model umum yang lebih baik, tidak mungkin membicarakan efek penerapannya di industri tertentu. Bloomberg GPT yang diluncurkan bersama oleh Bloomberg dan Johns Hopkins adalah contohnya.Dalam distribusi datanya, data model dasar umum menyumbang setengahnya, data publik dari industri keuangan menyumbang setengahnya, dan data Bloomberg sendiri menyumbang 0,6%.
"Agar model apa pun mencapai tingkat kecerdasan atau kemampuan dasar yang lebih baik, ia harus melatih model dasar dengan jumlah parameter yang relatif baik, dan kemudian mengintegrasikan beberapa data profesional industri ke dalam model dasar untuk membuat model industri." Xin kata Zhou.
Ide Baidu adalah meluncurkan "orang besar" (Wenxin Yiyan) dan platform alat yang sangat lengkap (Wenxin Qianfan), dan kemudian menyediakan layanan model yang berbeda sesuai dengan kebutuhan pelanggan yang sebenarnya untuk membantu pelanggan membuat pilihan yang paling hemat biaya. percaya bahwa harga tidak akan menjadi hambatan bagi perusahaan untuk merangkul model besar.
Selain biaya panggilan model dan biaya pelatihan, Baidu juga membantu perusahaan untuk lebih mengurangi biaya.Jika perusahaan hanya fokus pada bidang yang relatif sempit, Baidu juga memiliki versi dengan parameter yang relatif rendah, sehingga sambil memastikan efek model, penggunaan atau Biaya model pelatihan akan turun drastis.
Faktanya, tidak ada standar universal untuk biaya membangun model industri besar.
Pertama-tama, model besar dasar yang berbeda memiliki spesifikasi parameter yang berbeda, dan investasi dalam perangkat lunak dan perangkat keras harus berubah secara dinamis sesuai dengan parameter dasar dan kemampuan model. Jika parameternya puluhan miliar, kartu A100 juga dapat berjalan dan memulai tugas hilir.
Persyaratan skenario aplikasi yang relatif terkonsentrasi saat ini termasuk dalam kategori ini, seperti menjawab pertanyaan cerdas, menulis cerdas, dan kreasi cerdas dalam manajemen pengetahuan, serta skenario pemasaran pan-Internet dan persyaratan pembuatan kode.
Kedua, biaya terkait dengan jumlah data dan arah aplikasi. Harga model skala besar global saat ini didasarkan pada 1000 Token sebagai unit dasar. Jika tugas hilir suatu perusahaan sangat sederhana dan dapat dilakukan hanya dengan puluhan ribu token, maka biayanya sangat rendah dan hanya memerlukan sedikit kartu GPU. Jumlah data yang dibutuhkan untuk membangun model industri besar biasanya dalam G atau bahkan T, sehingga biaya pelatihan offlinenya akan sangat tinggi.
**Siapa yang menjalankan lomba? **
Pemain berbondong-bondong ke jalur model berskala besar.Kali ini, tidak hanya perusahaan Internet tingkat pertama, tetapi juga lebih banyak pemimpin industri dan perusahaan pemula yang bergabung.
Industri mana yang dapat memimpin dalam menerobos? Mungkin bisa dilihat dari industri dimana kasus kerjasama tersebut berada Seperti yang terlihat pada tabel di awal artikel, keuangan, perawatan medis, pendidikan, mengemudi otonom dan bidang lainnya sering digunakan.
Misalnya, ketika Alibaba Cloud merilis model besar Tongyi pada bulan April, diumumkan bahwa mereka telah meluncurkan eksplorasi kerja sama dengan sejumlah perusahaan. Batch pertama perusahaan kerja sama termasuk OPPO Andes Smart Cloud, Geely Automobile, Zhiji Automobile, Chery New Energy, Momo Zhixing, Swire Coca-Cola, Bosideng, Teknologi Kelapa Sawit, dll. Menurut laporan, industri keuangan, industri ritel, dan beberapa skenario dan industri berorientasi konsumen skala besar telah mengumpulkan banyak data publik dan data skenario, yang nyaman untuk membangun model khusus perusahaan atau industri.
Menurut informasi publik, jumlah model industri skala besar Baidu Wenxin telah mencapai 11, meliputi energi dan listrik, keuangan, kedirgantaraan, media, film dan televisi, mobil, manajemen perkotaan, gas, asuransi, manufaktur elektronik, dan ilmu sosial.
Batch pertama dari sepuluh kasus aplikasi model skala besar dalam industri kecerdasan buatan di Beijing yang dirilis pada 27 Juni melibatkan energi dan listrik, kesehatan medis, keuangan, mengemudi otonom, konstruksi, penelitian ilmiah, kehidupan, dan bidang tanya jawab. Dilaporkan bahwa selama periode dari 27 Juni hingga 30 Juli, Komisi Sains dan Teknologi Beijing dan Komite Manajemen Zhongguancun juga akan fokus pada bidang-bidang utama seperti tata kelola kota, kesehatan medis, penelitian ilmiah, keuangan cerdas, kehidupan cerdas, dan cerdas kota, dan subjek inovasi target di kota. , akan mengumpulkan lebih dari 80 proyek kasus aplikasi model skala besar industri.
"Ketika kami berkomunikasi dengan pelanggan, kami menemukan bahwa banyak pelanggan tidak tahu banyak tentang model industri, tetapi mereka akan mengambil inisiatif untuk menanyakan model industri Baidu." Li Jingqiu, Deputy General Manager, Baidu Smart Cloud AI Platform, mengatakan bahwa saat ini, ini akan secara khusus digabungkan dengan penggunaan perusahaan yang sebenarnya.Analisis kebutuhan produk dan pelanggan, seperti kemampuan seperti apa yang Anda inginkan untuk dimiliki model industri, sistem atau aplikasi apa yang akan digunakan, siapa yang akan menggunakan aplikasi ini, dan efek apa yang ingin Anda capai... Setelah mengajukan pertanyaan ini, Anda benar-benar akan menemukan pelanggan Yang dibutuhkan adalah model besar berdasarkan SFT rantai alat Wenxin Qianfan, atau model terlatih untuk industri. Yang terakhir membutuhkan setidaknya beberapa bulan, atau bahkan tahun lalu, untuk membangun dan menerapkan — mulai dari masalah teknis seperti pemrosesan data, alokasi sumber daya pada lapisan daya komputasi, hingga pelatihan jangka panjang tentang data umum di industri.
Dari hiruk pikuk model skala besar dasar hingga awal model skala besar industri, memasuki paruh kedua tahun 2023, transformasi bisnis nyata akan dipercepat.
Menarik juga untuk membandingkan jalur pabrikan dalam negeri seperti Baidu dan OpenAI/Microsoft di bidang model skala besar.Ketika ChatGPT menunjukkan popularitas tingkat fenomena global, beberapa suara mempertanyakan mengapa China tidak dapat memproduksi ChatGPT.Tentu saja, ada adalah lingkungan teknis Pada akhirnya, banyak orang masih memiliki konsensus yang dangkal- "AI China lebih condong ke aplikasi bisnis dan kemampuan komersialisasi." Terus terang, AI China kurang sabar dan ingin menghasilkan uang.
Namun di sisi lain, pasar adalah kekuatan pendorong terbesar untuk perkembangan teknologi, dan penguasaan waktu serta ritme telah menciptakan hasil yang berbeda. Ambil model industri skala besar sebagai contoh.Microsoft sedang menunggu kematangan teknologi lebih lanjut, atau merasa bahwa waktunya belum tiba, dan ini sudah terlambat.Produsen dalam negeri dengan cepat beralih dari basis besar- model skala hingga model industri berskala besar.Memiliki vitalitas yang langgeng.
Tersesat di timur, dipanen murbei, dari segi hasil, bukan hal yang buruk model besar industri dalam negeri berlari kencang.