Görsel kaynağı: Unbounded AI tarafından oluşturuldu
"Wenxinyiyan aceleyle piyasaya sürülüyor gibi görünüyor. Bence bu şey hiç para kazanmak için değil, ChatGPT patlamasına yetişmek için. Endüstrinin büyük modeli, gerçekten ticari değer üretebilen şeydir." Baidu'nun piyasaya sürülmesinden kısa bir süre sonra Eski bir Baidu çalışanı olan Wenxinyiyan, Titanium Media'ya şunları söyledi: "OpenAI geçen yıl o kadar popüler değilken, Bay Wang (Baidu CTO'su Wang Haifeng), büyük ölçekli endüstri modelleri de dahil olmak üzere 10 büyük ölçekli model oluşturmak için bir ekibe liderlik etti. O zamanlar , endüstri dışında pek ilgi yoktu, ancak şimdi Baidu'nun düzenine bakarsanız, büyük endüstri modeli aslında ileriye dönük bir düzendir, OpenAI ve Microsoft'tan daha eskidir."
Bugün, genel amaçlı büyük ölçekli modellerin koşuşturmacasından sonra, endüstri modelleri yavaş yavaş ilgi görüyor ve bu da şu gerçeği doğruluyor: ChatGPT gibi temel büyük ölçekli modeller, "ağlamayı" kazanıyor ve bu, büyük ölçüde eğitimde rol oynuyor. pazar ve bilişin şekillendirilmesi, Yapay zekanın gerçekten uygulanıp uygulanmayacağı ve mevcut paranın kazanılacağı, aynı zamanda endüstrinin büyük modeline de bağlıdır.
Yurtdışı pazarlarda bile C-end ürünlerin bir parçası olan ChatGPT giderek zayıfladı.SlikeeWeb verilerine göre ChatGPT'nin erken dönemdeki ziyaretlerinin büyüme oranı şaşırtıcıydı.Aylık büyüme oranı 131,6 oldu. Ocak'ta %62,5, Şubat'ta %62,5 Mart'ta %55,8'di ve Nisan'da önemli ölçüde yavaşlayarak aylık %12,6'lık büyüme oranı Mayıs'ta bu rakam %2,8'e yükseldi ve Haziran ayında aylık bazda büyüme oranının negatif olması bekleniyor.
"Birçoğumuzun ChatGPT'yi denediğine inanıyorum ve birçok kişinin denedikten sonra onu bir kenara bıraktığına inanıyorum, çünkü şu anda temelde işimizden ayrı, bu yüzden kullandıktan sonra bırakıyoruz. Ama yine de umarım Microsoft (Çin) Baş Teknoloji Sorumlusu (CTO) Wei Qing daha önce, herkesin "erken kalkıp geç bölümü yakalamayacağını" çünkü bu, yıkıcı değişiklikler getirecek bir paradigma devrimi olduğunu söyledi.
ChatGPT veya büyük modellere dayalı B tarafı çözümü, büyük modeller ve sahneler arasındaki ayrımı çözmenin iyi bir yoludur.
Uluslararası alanda, Microsoft ve Amazon gibi büyük şirketler de kurumsal düzeydeki hizmetlerden ticarileştirme yolları aramaya ve birden çok sektörü keşfetmeye başladılar; yurt içinde Baidu, Alibaba, Tencent ve Huawei, tümü büyük ölçekli sanayi yatırımlarını hızlandırıyor. modeller. Buna ek olarak, dünya çapında birçok endüstri lideri ve yeni kurulan şirket de büyük ölçekli endüstri modelleri olasılığını araştırıyor.Son zamanlarda, Pekin Belediye Bilim ve Teknoloji Komisyonu ve Zhongguancun Yönetim Komitesi de 10 uygulama vakasından oluşan ilk partiyi yayınladı. Pekin'deki büyük ölçekli yapay zeka endüstri modelleri. Ayrıca, ilgili teknoloji yollarının birleşme ve satın alma miktarı da yeni rekorlara ulaştı...
Ancak büyük ölçekli model parkuru kalabalık olmaktan çok uzak; teknolojik yinelemenin hızlı gelişimiyle birlikte, hayatın her kesimi teknik bilgiyi yeniden biriktiriyor ve iş modellerini şekillendiriyor ve her şey daha yeni başladı.
Yükseltme: Bin Model Savaşı
Temel model bir "yüz model savaş" ise, endüstrinin büyük ölçekli modeli bir "bin model savaş" olur. Tıpkı gövdenin dalları büyütmesi gibi, her temel büyük ölçekli model üreticisi, birkaç büyük ölçekli endüstri modelini kuluçkalayabilir. oybirliğiyle.
"Herkesin genel amaçlı büyük ölçekli modelden yüksek beklentileri olsa da, endüstri senaryolarının ihtiyaçlarını karşılamak için en uygun çözüm olmayabilir." 19 Haziran'da Tencent Bulut Endüstrisi Büyük Ölçekli Model Konferansında, Kıdemli Yönetici Yardımcısı Tencent Group Başkanı Cloud ve Smart Industry Business Group CEO'su Tang Daosheng, şunları söyledi:
Hunyuan Assistant'ın bunu halka yayınlamaması durumunda, Tencent büyük ölçekli endüstri modellerinin piyasaya sürülmesinde liderliği ele aldı. -MaaS hizmetlerini durdurun ve kurumsal müşterilerin özel büyük ölçekli modeller ve Akıllı uygulama oluşturmasına yardımcı olun. Tencent'in ilerleyen zamanlarda C-end'in genel modeli hakkında resmi bilgiler yayınlayacağı öğrenildi.
Bu önlemler dizisi, Hunyuan temel büyük ölçekli modelinin etkisi ve ilerlemesinden bağımsız olarak, endüstri büyük ölçekli modelinin öncelikli olarak piyasaya sürülmesinin, Tencent'in kendi itibarını sağlaması ve pazardaki müşterileri ele geçirmesi için gerekli bir hareket olduğu şeklinde anlaşılabilir. müşterilerin acil ihtiyacı var.
Daha önce Huawei Cloud'da yapay zeka alanında baş bilim insanı olan Tian Qi, Huawei'nin büyük modeli L0, L1, L2 ve L0 olmak üzere üç seviyeye ayırdığından bahsetmişti. , temel modelde L0 , artı endüstri verileri temelinde, karma eğitimle elde edilen endüstri büyük modeli L1'dir.
Ardından, L1 aşağı yönde binlerce endüstrinin belirli alt bölüm senaryoları için konuşlandırılır ve alt bölüm senaryolarının görev modeli L2 elde edilir. endüstri modeli L1 ve L2 modelinin cihaz tarafına, uç tarafa ve bulut tarafına dağıtılması çok önemli bir konudur.
Temmuz ayında yapılacak olan Huawei Geliştirici Konferansı'nın gündeminde Huawei Cloud'un Pangu modelinin temel bir modelden endüstri modeline nasıl rafine edildiğine dair bir dizi yorum ve yayın gerçekleştireceği görülüyor.
Bu yılki Alibaba Bulut Zirvesi'nde, Alibaba Bulut CTO'su Zhou Jingren ayrıca, "Bugün tüm şirketlerin eğitime sıfırdan başlaması gerekmiyor, herkesin de çok sayıda bilgi işlem gücü de dahil olmak üzere çeşitli derlemler oluşturmak için sıfırdan başlamasına ihtiyacınız yok. Kaynaklar, sıfırdan büyümek için Modelin bir dizi özelleştirmesi, bugünün Tongyi Qianwen modeline dayalı olarak, kuruluşun senaryosu, kurumsal bilgi sistemi ve kuruluşun sektördeki özel ihtiyaçları ile birlikte, her işletmeye özel modelin oluşturulacak."
Microsoft ayrıca kendi endüstri modelini yapıyor. Nisan ayında, Çin'de Microsoft Azure OpenAI Service'in uluslararası sürümü, perakende e-ticaret, üretim ve dijital yerel alanlar için Azure küresel inovasyon endüstrisi senaryolarının ilk üç setini yayınladı ve yerel kurumsal kullanıcılar için GPT-3 ve GPT-4'ü entegre etti. , Codex, DALL-E ve kurumsal düzeyde ChatGPT, beş büyük ölçekli model hizmeti, Çinli denizaşırı kurumsal müşterilerin küresel pazara açılmalarını hızlandırmalarına yardımcı oluyor.
"Bin model savaşı" patlamak üzere, ancak kumu yıkayan büyük dalgaların aşamasına gerçekten girmek için henüz çok erken. Genel olarak, büyük ölçekli modeller hala nispeten erken bir geliştirme aşamasında. Sektörde büyük ölçekli modeller yoğunlaşmış durumda, bu parkur için daha çok yer olduğu aşikar.
Finans endüstrisinin geniş modelini örnek alarak, menkul kıymet şirketleri, sigorta, bankalar ve yeni finans gibi farklı alanlara bölünmüştür.Her alanın alt görevleri düzinelerce veya yüzlerce alt göreve bölünmüştür.
"Daha önemli olan an, temel modele dayalı olarak, SFT ve diğer mekanizmalar ve yapıların aşağı yönlü görevlere verimli bir şekilde uyarlanabildiği ve finans endüstrisinin veya diğer endüstri modellerinin aşağı yönlü görevlerinin bir ölçek etkisine sahip olduğu zamandır." Alibaba'ya göre Moyuan İnovasyon İş Merkezi başkanı Chen Haiqing, bazı evrensel yapılandırılmamış veriler aracılığıyla sürekli eğitim için endüstrinin büyük modellerinin ve senaryolarının yalnızca başlangıcıdır.
Mantıklı ve gerçekçi bir seçim
Bir kuruluş, yüz milyarlarca parametreye sahip büyük ölçekli temel bir model oluşturmak istiyorsa, tek makineli bir kümede 10.000'den fazla kartın bilgi işlem gücüne, yalnızca bir GPU kartına değil, aynı zamanda GPU kümesi kaynaklarının kullanımına da ihtiyaç duyar. , çoğu şirketin yapamadığı.
Büyük endüstri modelinin gerçekleştirilmesi açıkça daha kolaydır ve aynı zamanda daha geniş bir uygulama beklentisine sahiptir.
"Büyük modeller binlerce endüstriyi güçlendirebilir, ancak binlerce endüstrinin senaryolarını iyi anlamalısınız ve kurumsal kullanıcılar tarafından kolayca kullanılabilen yüz milyarlarca veya trilyonlarca büyük modeli eğitmeyi bekleyemezsiniz. " dedi Lanzhou Technology'nin kurucusu Zhou Ming. "Genel modelden endüstri modeline, kullanıcının senaryosu için son mili yapmak gerekiyor."
Temel büyük ölçekli model için gereken yatırımı değerlendirdikten ve artıları ve eksileri, kazançları ve kayıpları tarttıktan sonra, kurumsal müşteriler hızla büyük ölçekli endüstri modeline yöneldi ve üreticiler buna daha fazla enerji ayırdı.
Tang Daosheng, açık bir şekilde, mevcut genel amaçlı büyük ölçekli modellerin genellikle kapsamlı halk literatürüne ve ağ bilgilerine dayalı olarak eğitildiğini söyledi.İnternetteki bilgiler hatalar, söylentiler ve önyargılar içerebilir.Birçok profesyonel bilgi ve endüstri verileri yetersiz bir şekilde birikmiştir. Sonuç olarak, modelin sektöre özgü Doğruluğu ve doğruluğu yeterli değildir ve veri "gürültüsü" çok büyüktür.
Ancak birçok endüstriyel senaryoda, kullanıcıların işletmeler tarafından sağlanan profesyonel hizmetler için yüksek gereksinimleri vardır ve hata toleransları düşüktür. Bir şirket yanlış bilgi verdiğinde, bu büyük bir yasal sorumluluğa veya halkla ilişkiler krizine neden olabilir. Bu nedenle, işletmelerin kullandığı büyük ölçekli modeller kontrol edilebilir, izlenebilir ve düzeltilebilir olmalı ve kullanıma sunulmadan önce tekrar tekrar ve eksiksiz olarak test edilmelidir.
"Son derece pratik akıllı hizmetler oluşturmak için müşterilerin eğitim veya ince ayar için şirketin kendi verileriyle birleştirilmiş daha sektöre özgü sektör modellerine ihtiyaç duyduğuna inanıyoruz. Şirketlerin ihtiyacı olan, sorunu gerçek senaryolarda gerçekten çözmek. 100 sahnede sorunun %70-%80'ini çözmek yerine belirli bir sorun." Tang Daosheng söyledi.
Baidu Smart Cloud'un başkan yardımcısı Zhu Yong da, "Yurtiçi ve yurtdışındaki duruma bakıldığında, çok fazla genel amaçlı model olmadığını görebiliriz. Piyasadaki bazı üreticiler aslında nispeten küçük modeller üretiyor. Tam tersine , etki alanı modelleri özeldir Önemli, çünkü genel model yalnızca genel bilgi yeteneğine sahiptir, etki alanı modeli belirli endüstrilerin ve alanların görev beklentileri ile uyumlu hale getirilebilir ve işletmenin gerçek sorunlarını çözebilir. Bu süreç çok önemlidir, ancak bu süreç için gereken maliyet ve kaynaklar, temeldeki genel modeli sıfırdan yapmaya göre çok daha azdır."
Aynı zamanda, gelecekte yalnızca birkaç temel model (genel modellerin altında yatan) olabileceğine, ancak profesyonel alandaki verilerle ve sektördeki teknik bilgiyle birleştiğinde, üzerinde birçok farklı türde alan modelinin büyüyeceğine karar verdi. Bu domain modelleri gelecekte çok başarılı olacak ve üst katmanı destekleyecektir.Bereketli domain uygulamaları.
Baidu Smart Cloud ve State Grid tarafından oluşturulan enerji endüstrisinin büyük modelini "State Grid-Baidu Wenxin" örnek alarak, Baidu Smart Cloud, State Grid uzmanlarıyla birlikte, State Grid'in güç işinde biriktirdiği örnekleri piyasaya sundu. genel büyük ölçekli model Veri ve benzersiz bilgi ve eğitimde, her iki tarafın eğitim öncesi algoritmadaki deneyimlerini ve güç alanındaki iş ve algoritmayı, güç alanında varlık ayrımcılığı ve belge ayrımcılığı gibi tasarım algoritmalarını birleştirir. güç alanında ön eğitim görevleri olarak, böylece Wenxin büyük modeli, enerji alanındaki pratik iş sorunlarını gerçekten çözmek ve maliyetleri düşürme ve verimliliği artırma amacına ulaşmak için derinlemesine güç Profesyonel bilgisini öğrenebilir.
Zhu Yong, genel model ile alan modeli arasındaki farkın, üniversiteye gitmiş geniş bir bilgi yelpazesine sahip bir kişiyle karşılaştırılabileceğini söyledi.Biraz tıbbi bilgi biliyor olabilir, ancak hastalara teşhis koyamaz ve profesyonel bir doktor değildir. . Alan modeli, güçlü bir genel yetenek temelinde tıbbi bilgiyi derinlemesine öğrenmek ve tıp alanında değer katabilecek profesyonel bir doktor olmaktır.
Geniş bir bilgi yelpazesine sahip genel bir modelden profesyonel bir tıbbi modele kadar, bu süreçte ihtiyaç duyulan kaynakların maliyeti sıfırdan genel bir büyük model oluşturmaya göre çok daha azdır, ancak profesyonel veriler olduğunu, olması gerektiğini vurgular. Onu bu tür yetenekler üretmeye teşvik etmek için profesyonel alandaki görevler tarafından yönlendirilir.
Endüstri modeli nasıl yapılır
Büyük modelin kendisi, önceki yazılım geliştirme paradigmasını değiştiren yeni bir şeydir.Üreticiler, müşterilerin sektördeki büyük modeli daha erken ve daha hızlı cilalamasına yardımcı olmak için yeni bir araç zincirine ve platforma ihtiyaç duyar.
Büyük model çağının gelişiyle, son milin verimliliği büyük ölçüde artırılacaktır. Zhou Ming, temel olarak işletmelerin birçok işlevsel motor sağlaması ve kullanıcıların artık verimliliği artırmak için yardımcı olmaları gerçeğine dayanan yeni nesil bir yazılım geliştirme paradigmasının şekillendiğini belirtti.Bu temelde, yeni bir uygulama oluşturmak kolaydır.
Wenxin Qianfan büyük ölçekli model platformunu örnek olarak alın, kurumsal geliştiriciler için tek duraklı büyük ölçekli model geliştirme ve hizmet operasyon platformudur. Yalnızca temel modeli (ERNIE-Bot) ve üçüncü taraf açık kaynaklı büyük modelleri sağlamakla kalmaz, aynı zamanda müşterilerin büyük model uygulamalarını kolayca kullanmasını ve geliştirmesini kolaylaştırmak için çeşitli yapay zeka geliştirme araçları ve eksiksiz bir geliştirme ortamı sağlar.
Veri yönetimi, otomatikleştirilmiş model SFT ve akıl yürütme hizmetlerinin bulut dağıtımı için üreticiler tek elden büyük ölçekli model özelleştirme hizmetleri gerçekleştirmeyi umuyor. Farklı üreticilerin büyük ölçekli model oluşturma platformlarının yetenekleri temel olarak benzerdir ve fark, kullanım kolaylığı, efektin kalitesi ve desteklenen yazılım ve donanımda yatmaktadır.
"Büyük bir model yapmak gerçekten de ucuz değil, ancak sonunda büyük model hizmetinin teşvik edilebilmesinin yalnızca iki nedeni var: Birincisi, modelin etkisinin daha iyi olması ve modelin etkisinin iyi olmaması. Söylemeye gerek yok, ikincisi maliyet." Smart Cloud AI ve Big Data Platform genel müdürü Baidu Xin Zhou söyledi.
Aslında, endüstri modeli genel modele dayanmalıdır. Örneğin genel eğitimde daha iyi bir genel model yoksa belirli bir sektördeki uygulama etkisinden bahsetmek imkansızdır. Bloomberg ve Johns Hopkins'in ortaklaşa başlattığı Bloomberg GPT buna bir örnektir.Veri dağılımının yarısını genel temel model verileri, yarısını finans sektörünün kamuya açık verileri ve %0,6'sını Bloomberg'in kendi verileri oluşturmaktadır.
"Herhangi bir modelin daha iyi bir zeka düzeyine veya temel yeteneklere ulaşması için, temel modeli nispeten iyi sayıda parametreyle eğitmesi ve ardından bir endüstri modeli yapmak için bazı endüstri profesyonel verilerini temel modele entegre etmesi gerekir." Xin Zhou dedi.
Baidu'nun fikri, bir "büyük adam" (Wenxin Yiyan) ve çok eksiksiz bir araç platformu (Wenxin Qianfan) başlatmak ve ardından müşterilerin en uygun maliyetli seçimi yapmalarına yardımcı olmak için müşterilerin gerçek ihtiyaçlarına göre farklılaştırılmış model hizmetleri sunmaktır. fiyatların büyük modelleri benimsemeleri için şirketler için bir darboğaz olmayacağına inanıyoruz.
Baidu, modelleme maliyetleri ve eğitim maliyetlerine ek olarak, şirketlerin maliyetleri daha da düşürmelerine yardımcı oluyor.Şirketler yalnızca nispeten dar alanlarına odaklanırsa, Baidu'nun nispeten düşük parametrelere sahip bir versiyonu da var, böylece modelin etkisini sağlarken, veya Eğitim modellerinin maliyeti önemli ölçüde düşecektir.
Aslında, büyük bir endüstri modeli oluşturmanın maliyeti için evrensel bir standart yoktur.
Her şeyden önce, farklı temel büyük modeller farklı parametre özelliklerine sahiptir ve yazılım ve donanıma yapılan yatırım, modelin temel parametrelerine ve yeteneklerine göre dinamik olarak değişmelidir. Parametre on milyarlarcaysa, bir A100 kartı aşağı akış görevlerini de çalıştırabilir ve başlatabilir.
Akıllı soru yanıtlama, akıllı yazma ve bilgi yönetiminde akıllı oluşturma gibi mevcut nispeten yoğun uygulama senaryosu gereksinimlerinin yanı sıra pan-İnternet pazarlama senaryoları ve kod oluşturma gereksinimleri bu kategoriye girer.
İkincisi, maliyet, veri miktarı ve uygulama yönü ile ilgilidir. Mevcut küresel büyük ölçekli model fiyatlandırması, temel birim olarak 1000 Token'a dayanmaktadır. Bir işletmenin aşağı akış görevleri çok basitse ve yalnızca on binlerce jetonla yapılabiliyorsa, maliyeti çok düşüktür ve çok az GPU kartı gerektirir. Büyük bir endüstri modeli oluşturmak için gereken veri miktarı genellikle G veya hatta T'dir, bu nedenle çevrimdışı eğitim maliyeti çok yüksek olacaktır.
**Yarışı kim yönetiyor? **
Oyuncular büyük ölçekli model parkuruna akın etti.Bu sefer sadece birinci sınıf İnternet şirketleri değil, aynı zamanda daha fazla endüstri lideri ve start-up şirket katıldı.
Hangi sektörler kırılmada başı çekebilir? Belki de işbirliği olgusunun yer aldığı sektörden de görülebilmektedir.Makalenin başındaki tabloda da görüldüğü üzere finans, tıbbi bakım, eğitim, otonom sürüş ve diğer alanlar sıklıkla kullanılmaktadır.
Örneğin, Alibaba Cloud, Nisan ayında Tongyi büyük modelini piyasaya sürdüğünde, bir dizi şirketle işbirlikçi keşifler başlattığını duyurdu.İlk işbirlikçi şirketler grubu arasında OPPO Andes Smart Cloud, Geely Automobile, Zhiji Automobile, Chery New Energy, Momo Zhixing, Swire Coca-Cola, Bosideng, Palm Technology, vb. Raporlara göre, finans sektörü, perakende sektörü ve bazı büyük ölçekli tüketici odaklı senaryolar ve sektörler, kurumsal veya sektöre özel modeller oluşturmak için uygun olan çok sayıda genel veri ve senaryo verisi biriktirdi.
Kamuoyuna verilen bilgilere göre, Baidu Wenxin'in enerji ve elektrik, finans, havacılık, medya, film ve televizyon, otomobil, kentsel yönetim, gaz, sigorta, elektronik üretimi ve sosyal bilimleri kapsayan büyük ölçekli endüstri modellerinin sayısı 11'e ulaştı.
27 Haziran'da Pekin'de yayınlanan yapay zeka endüstrisinde on büyük ölçekli model uygulama vakasından oluşan ilk grup, enerji ve elektrik, tıbbi sağlık, finans, otonom sürüş, inşaat, bilimsel araştırma, yaşam ve soru-cevap alanlarını içeriyor. 27 Haziran'dan 30 Temmuz'a kadar Pekin Bilim ve Teknoloji Komisyonu ve Zhongguancun Yönetim Komitesi'nin de kentsel yönetişim, tıbbi sağlık, bilimsel araştırma, akıllı finans, akıllı yaşam ve akıllı gibi kilit alanlara odaklanacağı bildirildi. , 80'den fazla endüstri büyük ölçekli model uygulama vaka projesi toplayacak.
Ancak daha fazla müşteri, yeni bir bilgi birikimi ve öğrenme süreci dalgasıyla karşı karşıya.
Baidu Smart Cloud AI Platform genel müdür yardımcısı Li Jingqiu, "Müşterilerle iletişim kurduğumuzda, birçok müşterinin endüstri modelleri hakkında fazla bir şey bilmediğini ancak Baidu'nun endüstri modellerini istemek için inisiyatif kullanacaklarını gördük." şu anda işletmelerin fiili kullanımı ile özel olarak birleştirilecektir.Endüstri modelinin ne tür yeteneklere sahip olmasını istiyorsunuz, hangi sistem veya uygulamaları kullanacaksınız, kimler kullanacak gibi ürün ve müşterilerin ihtiyaçlarını analiz edin. bu uygulamalar ve hangi etkileri elde etmeyi umuyorsunuz... Bu soruları sorduktan sonra, gerçekten müşteri bulacaksınız. İhtiyaç duyulan, Wenxin Qianfan'ın takım zinciri SFT'sine dayalı büyük bir model veya endüstri için önceden eğitilmiş bir modeldir. Veri işleme, bilgi işlem güç katmanında kaynak tahsisi gibi teknik sorunlardan sektördeki yaygın verilerle ilgili uzun vadeli eğitime kadar ikincisinin oluşturulması ve dağıtılması için en az birkaç ay, hatta geçen yıl gerekir.
Temel büyük ölçekli modelin koşuşturmacasından sektörün büyük ölçekli modelinin başlangıcına kadar, 2023'ün ikinci yarısına girerken gerçek bir iş dönüşümü hızlanacak.
Baidu ve OpenAI/Microsoft gibi yerli üreticilerin büyük ölçekli modeller alanındaki yollarını karşılaştırmak da ilginç.ChatGPT küresel fenomen düzeyinde popülerlik gösterince bazı sesler Çin'in neden ChatGPT üretemediğini sorguladı. sonuçta, birçok insan hala yüzeysel bir fikir birliğine sahip: "Çin'in yapay zekası iş uygulamalarına ve ticarileştirme yeteneklerine daha yatkın." Açıkça söylemek gerekirse, Çin'in yapay zekasının daha az sabrı var ve para kazanmak istiyor.
Ama öte yandan pazar, teknolojik gelişmenin en büyük itici gücü, zamanın ve ritmin kavranması farklı sonuçlar doğurmuştur. Örnek olarak büyük ölçekli endüstri modelini ele alalım.Microsoft ya teknolojinin daha da olgunlaşmasını bekliyor ya da zamanın henüz gelmediğini düşünüyor ve çok geç.Yerli üreticiler hızla temel büyük- ölçekli modelden büyük ölçekli endüstri modeline.Kalıcı canlılığa sahip olun.
Doğuda kaybolan, dutta hasat edilen, sonuçlar açısından, yerli sanayinin büyük modellerinin hızlı koşması kötü bir şey değil.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Endüstri modeli, kitabı açın!
Kaynak: Titanium Media, Yazar: Zhang Shuai
"Wenxinyiyan aceleyle piyasaya sürülüyor gibi görünüyor. Bence bu şey hiç para kazanmak için değil, ChatGPT patlamasına yetişmek için. Endüstrinin büyük modeli, gerçekten ticari değer üretebilen şeydir." Baidu'nun piyasaya sürülmesinden kısa bir süre sonra Eski bir Baidu çalışanı olan Wenxinyiyan, Titanium Media'ya şunları söyledi: "OpenAI geçen yıl o kadar popüler değilken, Bay Wang (Baidu CTO'su Wang Haifeng), büyük ölçekli endüstri modelleri de dahil olmak üzere 10 büyük ölçekli model oluşturmak için bir ekibe liderlik etti. O zamanlar , endüstri dışında pek ilgi yoktu, ancak şimdi Baidu'nun düzenine bakarsanız, büyük endüstri modeli aslında ileriye dönük bir düzendir, OpenAI ve Microsoft'tan daha eskidir."
Bugün, genel amaçlı büyük ölçekli modellerin koşuşturmacasından sonra, endüstri modelleri yavaş yavaş ilgi görüyor ve bu da şu gerçeği doğruluyor: ChatGPT gibi temel büyük ölçekli modeller, "ağlamayı" kazanıyor ve bu, büyük ölçüde eğitimde rol oynuyor. pazar ve bilişin şekillendirilmesi, Yapay zekanın gerçekten uygulanıp uygulanmayacağı ve mevcut paranın kazanılacağı, aynı zamanda endüstrinin büyük modeline de bağlıdır.
Yurtdışı pazarlarda bile C-end ürünlerin bir parçası olan ChatGPT giderek zayıfladı.SlikeeWeb verilerine göre ChatGPT'nin erken dönemdeki ziyaretlerinin büyüme oranı şaşırtıcıydı.Aylık büyüme oranı 131,6 oldu. Ocak'ta %62,5, Şubat'ta %62,5 Mart'ta %55,8'di ve Nisan'da önemli ölçüde yavaşlayarak aylık %12,6'lık büyüme oranı Mayıs'ta bu rakam %2,8'e yükseldi ve Haziran ayında aylık bazda büyüme oranının negatif olması bekleniyor.
"Birçoğumuzun ChatGPT'yi denediğine inanıyorum ve birçok kişinin denedikten sonra onu bir kenara bıraktığına inanıyorum, çünkü şu anda temelde işimizden ayrı, bu yüzden kullandıktan sonra bırakıyoruz. Ama yine de umarım Microsoft (Çin) Baş Teknoloji Sorumlusu (CTO) Wei Qing daha önce, herkesin "erken kalkıp geç bölümü yakalamayacağını" çünkü bu, yıkıcı değişiklikler getirecek bir paradigma devrimi olduğunu söyledi.
ChatGPT veya büyük modellere dayalı B tarafı çözümü, büyük modeller ve sahneler arasındaki ayrımı çözmenin iyi bir yoludur.
Uluslararası alanda, Microsoft ve Amazon gibi büyük şirketler de kurumsal düzeydeki hizmetlerden ticarileştirme yolları aramaya ve birden çok sektörü keşfetmeye başladılar; yurt içinde Baidu, Alibaba, Tencent ve Huawei, tümü büyük ölçekli sanayi yatırımlarını hızlandırıyor. modeller. Buna ek olarak, dünya çapında birçok endüstri lideri ve yeni kurulan şirket de büyük ölçekli endüstri modelleri olasılığını araştırıyor.Son zamanlarda, Pekin Belediye Bilim ve Teknoloji Komisyonu ve Zhongguancun Yönetim Komitesi de 10 uygulama vakasından oluşan ilk partiyi yayınladı. Pekin'deki büyük ölçekli yapay zeka endüstri modelleri. Ayrıca, ilgili teknoloji yollarının birleşme ve satın alma miktarı da yeni rekorlara ulaştı...
Yükseltme: Bin Model Savaşı
Temel model bir "yüz model savaş" ise, endüstrinin büyük ölçekli modeli bir "bin model savaş" olur. Tıpkı gövdenin dalları büyütmesi gibi, her temel büyük ölçekli model üreticisi, birkaç büyük ölçekli endüstri modelini kuluçkalayabilir. oybirliğiyle.
"Herkesin genel amaçlı büyük ölçekli modelden yüksek beklentileri olsa da, endüstri senaryolarının ihtiyaçlarını karşılamak için en uygun çözüm olmayabilir." 19 Haziran'da Tencent Bulut Endüstrisi Büyük Ölçekli Model Konferansında, Kıdemli Yönetici Yardımcısı Tencent Group Başkanı Cloud ve Smart Industry Business Group CEO'su Tang Daosheng, şunları söyledi:
Hunyuan Assistant'ın bunu halka yayınlamaması durumunda, Tencent büyük ölçekli endüstri modellerinin piyasaya sürülmesinde liderliği ele aldı. -MaaS hizmetlerini durdurun ve kurumsal müşterilerin özel büyük ölçekli modeller ve Akıllı uygulama oluşturmasına yardımcı olun. Tencent'in ilerleyen zamanlarda C-end'in genel modeli hakkında resmi bilgiler yayınlayacağı öğrenildi.
Bu önlemler dizisi, Hunyuan temel büyük ölçekli modelinin etkisi ve ilerlemesinden bağımsız olarak, endüstri büyük ölçekli modelinin öncelikli olarak piyasaya sürülmesinin, Tencent'in kendi itibarını sağlaması ve pazardaki müşterileri ele geçirmesi için gerekli bir hareket olduğu şeklinde anlaşılabilir. müşterilerin acil ihtiyacı var.
Daha önce Huawei Cloud'da yapay zeka alanında baş bilim insanı olan Tian Qi, Huawei'nin büyük modeli L0, L1, L2 ve L0 olmak üzere üç seviyeye ayırdığından bahsetmişti. , temel modelde L0 , artı endüstri verileri temelinde, karma eğitimle elde edilen endüstri büyük modeli L1'dir.
Ardından, L1 aşağı yönde binlerce endüstrinin belirli alt bölüm senaryoları için konuşlandırılır ve alt bölüm senaryolarının görev modeli L2 elde edilir. endüstri modeli L1 ve L2 modelinin cihaz tarafına, uç tarafa ve bulut tarafına dağıtılması çok önemli bir konudur.
Temmuz ayında yapılacak olan Huawei Geliştirici Konferansı'nın gündeminde Huawei Cloud'un Pangu modelinin temel bir modelden endüstri modeline nasıl rafine edildiğine dair bir dizi yorum ve yayın gerçekleştireceği görülüyor.
Bu yılki Alibaba Bulut Zirvesi'nde, Alibaba Bulut CTO'su Zhou Jingren ayrıca, "Bugün tüm şirketlerin eğitime sıfırdan başlaması gerekmiyor, herkesin de çok sayıda bilgi işlem gücü de dahil olmak üzere çeşitli derlemler oluşturmak için sıfırdan başlamasına ihtiyacınız yok. Kaynaklar, sıfırdan büyümek için Modelin bir dizi özelleştirmesi, bugünün Tongyi Qianwen modeline dayalı olarak, kuruluşun senaryosu, kurumsal bilgi sistemi ve kuruluşun sektördeki özel ihtiyaçları ile birlikte, her işletmeye özel modelin oluşturulacak."
Microsoft ayrıca kendi endüstri modelini yapıyor. Nisan ayında, Çin'de Microsoft Azure OpenAI Service'in uluslararası sürümü, perakende e-ticaret, üretim ve dijital yerel alanlar için Azure küresel inovasyon endüstrisi senaryolarının ilk üç setini yayınladı ve yerel kurumsal kullanıcılar için GPT-3 ve GPT-4'ü entegre etti. , Codex, DALL-E ve kurumsal düzeyde ChatGPT, beş büyük ölçekli model hizmeti, Çinli denizaşırı kurumsal müşterilerin küresel pazara açılmalarını hızlandırmalarına yardımcı oluyor.
"Bin model savaşı" patlamak üzere, ancak kumu yıkayan büyük dalgaların aşamasına gerçekten girmek için henüz çok erken. Genel olarak, büyük ölçekli modeller hala nispeten erken bir geliştirme aşamasında. Sektörde büyük ölçekli modeller yoğunlaşmış durumda, bu parkur için daha çok yer olduğu aşikar.
Finans endüstrisinin geniş modelini örnek alarak, menkul kıymet şirketleri, sigorta, bankalar ve yeni finans gibi farklı alanlara bölünmüştür.Her alanın alt görevleri düzinelerce veya yüzlerce alt göreve bölünmüştür.
"Daha önemli olan an, temel modele dayalı olarak, SFT ve diğer mekanizmalar ve yapıların aşağı yönlü görevlere verimli bir şekilde uyarlanabildiği ve finans endüstrisinin veya diğer endüstri modellerinin aşağı yönlü görevlerinin bir ölçek etkisine sahip olduğu zamandır." Alibaba'ya göre Moyuan İnovasyon İş Merkezi başkanı Chen Haiqing, bazı evrensel yapılandırılmamış veriler aracılığıyla sürekli eğitim için endüstrinin büyük modellerinin ve senaryolarının yalnızca başlangıcıdır.
Mantıklı ve gerçekçi bir seçim
Bir kuruluş, yüz milyarlarca parametreye sahip büyük ölçekli temel bir model oluşturmak istiyorsa, tek makineli bir kümede 10.000'den fazla kartın bilgi işlem gücüne, yalnızca bir GPU kartına değil, aynı zamanda GPU kümesi kaynaklarının kullanımına da ihtiyaç duyar. , çoğu şirketin yapamadığı.
Büyük endüstri modelinin gerçekleştirilmesi açıkça daha kolaydır ve aynı zamanda daha geniş bir uygulama beklentisine sahiptir.
"Büyük modeller binlerce endüstriyi güçlendirebilir, ancak binlerce endüstrinin senaryolarını iyi anlamalısınız ve kurumsal kullanıcılar tarafından kolayca kullanılabilen yüz milyarlarca veya trilyonlarca büyük modeli eğitmeyi bekleyemezsiniz. " dedi Lanzhou Technology'nin kurucusu Zhou Ming. "Genel modelden endüstri modeline, kullanıcının senaryosu için son mili yapmak gerekiyor."
Temel büyük ölçekli model için gereken yatırımı değerlendirdikten ve artıları ve eksileri, kazançları ve kayıpları tarttıktan sonra, kurumsal müşteriler hızla büyük ölçekli endüstri modeline yöneldi ve üreticiler buna daha fazla enerji ayırdı.
Tang Daosheng, açık bir şekilde, mevcut genel amaçlı büyük ölçekli modellerin genellikle kapsamlı halk literatürüne ve ağ bilgilerine dayalı olarak eğitildiğini söyledi.İnternetteki bilgiler hatalar, söylentiler ve önyargılar içerebilir.Birçok profesyonel bilgi ve endüstri verileri yetersiz bir şekilde birikmiştir. Sonuç olarak, modelin sektöre özgü Doğruluğu ve doğruluğu yeterli değildir ve veri "gürültüsü" çok büyüktür.
Ancak birçok endüstriyel senaryoda, kullanıcıların işletmeler tarafından sağlanan profesyonel hizmetler için yüksek gereksinimleri vardır ve hata toleransları düşüktür. Bir şirket yanlış bilgi verdiğinde, bu büyük bir yasal sorumluluğa veya halkla ilişkiler krizine neden olabilir. Bu nedenle, işletmelerin kullandığı büyük ölçekli modeller kontrol edilebilir, izlenebilir ve düzeltilebilir olmalı ve kullanıma sunulmadan önce tekrar tekrar ve eksiksiz olarak test edilmelidir.
"Son derece pratik akıllı hizmetler oluşturmak için müşterilerin eğitim veya ince ayar için şirketin kendi verileriyle birleştirilmiş daha sektöre özgü sektör modellerine ihtiyaç duyduğuna inanıyoruz. Şirketlerin ihtiyacı olan, sorunu gerçek senaryolarda gerçekten çözmek. 100 sahnede sorunun %70-%80'ini çözmek yerine belirli bir sorun." Tang Daosheng söyledi.
Baidu Smart Cloud'un başkan yardımcısı Zhu Yong da, "Yurtiçi ve yurtdışındaki duruma bakıldığında, çok fazla genel amaçlı model olmadığını görebiliriz. Piyasadaki bazı üreticiler aslında nispeten küçük modeller üretiyor. Tam tersine , etki alanı modelleri özeldir Önemli, çünkü genel model yalnızca genel bilgi yeteneğine sahiptir, etki alanı modeli belirli endüstrilerin ve alanların görev beklentileri ile uyumlu hale getirilebilir ve işletmenin gerçek sorunlarını çözebilir. Bu süreç çok önemlidir, ancak bu süreç için gereken maliyet ve kaynaklar, temeldeki genel modeli sıfırdan yapmaya göre çok daha azdır."
Aynı zamanda, gelecekte yalnızca birkaç temel model (genel modellerin altında yatan) olabileceğine, ancak profesyonel alandaki verilerle ve sektördeki teknik bilgiyle birleştiğinde, üzerinde birçok farklı türde alan modelinin büyüyeceğine karar verdi. Bu domain modelleri gelecekte çok başarılı olacak ve üst katmanı destekleyecektir.Bereketli domain uygulamaları.
Baidu Smart Cloud ve State Grid tarafından oluşturulan enerji endüstrisinin büyük modelini "State Grid-Baidu Wenxin" örnek alarak, Baidu Smart Cloud, State Grid uzmanlarıyla birlikte, State Grid'in güç işinde biriktirdiği örnekleri piyasaya sundu. genel büyük ölçekli model Veri ve benzersiz bilgi ve eğitimde, her iki tarafın eğitim öncesi algoritmadaki deneyimlerini ve güç alanındaki iş ve algoritmayı, güç alanında varlık ayrımcılığı ve belge ayrımcılığı gibi tasarım algoritmalarını birleştirir. güç alanında ön eğitim görevleri olarak, böylece Wenxin büyük modeli, enerji alanındaki pratik iş sorunlarını gerçekten çözmek ve maliyetleri düşürme ve verimliliği artırma amacına ulaşmak için derinlemesine güç Profesyonel bilgisini öğrenebilir.
Zhu Yong, genel model ile alan modeli arasındaki farkın, üniversiteye gitmiş geniş bir bilgi yelpazesine sahip bir kişiyle karşılaştırılabileceğini söyledi.Biraz tıbbi bilgi biliyor olabilir, ancak hastalara teşhis koyamaz ve profesyonel bir doktor değildir. . Alan modeli, güçlü bir genel yetenek temelinde tıbbi bilgiyi derinlemesine öğrenmek ve tıp alanında değer katabilecek profesyonel bir doktor olmaktır.
Geniş bir bilgi yelpazesine sahip genel bir modelden profesyonel bir tıbbi modele kadar, bu süreçte ihtiyaç duyulan kaynakların maliyeti sıfırdan genel bir büyük model oluşturmaya göre çok daha azdır, ancak profesyonel veriler olduğunu, olması gerektiğini vurgular. Onu bu tür yetenekler üretmeye teşvik etmek için profesyonel alandaki görevler tarafından yönlendirilir.
Endüstri modeli nasıl yapılır
Büyük modelin kendisi, önceki yazılım geliştirme paradigmasını değiştiren yeni bir şeydir.Üreticiler, müşterilerin sektördeki büyük modeli daha erken ve daha hızlı cilalamasına yardımcı olmak için yeni bir araç zincirine ve platforma ihtiyaç duyar.
Büyük model çağının gelişiyle, son milin verimliliği büyük ölçüde artırılacaktır. Zhou Ming, temel olarak işletmelerin birçok işlevsel motor sağlaması ve kullanıcıların artık verimliliği artırmak için yardımcı olmaları gerçeğine dayanan yeni nesil bir yazılım geliştirme paradigmasının şekillendiğini belirtti.Bu temelde, yeni bir uygulama oluşturmak kolaydır.
Wenxin Qianfan büyük ölçekli model platformunu örnek olarak alın, kurumsal geliştiriciler için tek duraklı büyük ölçekli model geliştirme ve hizmet operasyon platformudur. Yalnızca temel modeli (ERNIE-Bot) ve üçüncü taraf açık kaynaklı büyük modelleri sağlamakla kalmaz, aynı zamanda müşterilerin büyük model uygulamalarını kolayca kullanmasını ve geliştirmesini kolaylaştırmak için çeşitli yapay zeka geliştirme araçları ve eksiksiz bir geliştirme ortamı sağlar.
Veri yönetimi, otomatikleştirilmiş model SFT ve akıl yürütme hizmetlerinin bulut dağıtımı için üreticiler tek elden büyük ölçekli model özelleştirme hizmetleri gerçekleştirmeyi umuyor. Farklı üreticilerin büyük ölçekli model oluşturma platformlarının yetenekleri temel olarak benzerdir ve fark, kullanım kolaylığı, efektin kalitesi ve desteklenen yazılım ve donanımda yatmaktadır.
"Büyük bir model yapmak gerçekten de ucuz değil, ancak sonunda büyük model hizmetinin teşvik edilebilmesinin yalnızca iki nedeni var: Birincisi, modelin etkisinin daha iyi olması ve modelin etkisinin iyi olmaması. Söylemeye gerek yok, ikincisi maliyet." Smart Cloud AI ve Big Data Platform genel müdürü Baidu Xin Zhou söyledi.
Aslında, endüstri modeli genel modele dayanmalıdır. Örneğin genel eğitimde daha iyi bir genel model yoksa belirli bir sektördeki uygulama etkisinden bahsetmek imkansızdır. Bloomberg ve Johns Hopkins'in ortaklaşa başlattığı Bloomberg GPT buna bir örnektir.Veri dağılımının yarısını genel temel model verileri, yarısını finans sektörünün kamuya açık verileri ve %0,6'sını Bloomberg'in kendi verileri oluşturmaktadır.
"Herhangi bir modelin daha iyi bir zeka düzeyine veya temel yeteneklere ulaşması için, temel modeli nispeten iyi sayıda parametreyle eğitmesi ve ardından bir endüstri modeli yapmak için bazı endüstri profesyonel verilerini temel modele entegre etmesi gerekir." Xin Zhou dedi.
Baidu'nun fikri, bir "büyük adam" (Wenxin Yiyan) ve çok eksiksiz bir araç platformu (Wenxin Qianfan) başlatmak ve ardından müşterilerin en uygun maliyetli seçimi yapmalarına yardımcı olmak için müşterilerin gerçek ihtiyaçlarına göre farklılaştırılmış model hizmetleri sunmaktır. fiyatların büyük modelleri benimsemeleri için şirketler için bir darboğaz olmayacağına inanıyoruz.
Baidu, modelleme maliyetleri ve eğitim maliyetlerine ek olarak, şirketlerin maliyetleri daha da düşürmelerine yardımcı oluyor.Şirketler yalnızca nispeten dar alanlarına odaklanırsa, Baidu'nun nispeten düşük parametrelere sahip bir versiyonu da var, böylece modelin etkisini sağlarken, veya Eğitim modellerinin maliyeti önemli ölçüde düşecektir.
Aslında, büyük bir endüstri modeli oluşturmanın maliyeti için evrensel bir standart yoktur.
Her şeyden önce, farklı temel büyük modeller farklı parametre özelliklerine sahiptir ve yazılım ve donanıma yapılan yatırım, modelin temel parametrelerine ve yeteneklerine göre dinamik olarak değişmelidir. Parametre on milyarlarcaysa, bir A100 kartı aşağı akış görevlerini de çalıştırabilir ve başlatabilir.
Akıllı soru yanıtlama, akıllı yazma ve bilgi yönetiminde akıllı oluşturma gibi mevcut nispeten yoğun uygulama senaryosu gereksinimlerinin yanı sıra pan-İnternet pazarlama senaryoları ve kod oluşturma gereksinimleri bu kategoriye girer.
İkincisi, maliyet, veri miktarı ve uygulama yönü ile ilgilidir. Mevcut küresel büyük ölçekli model fiyatlandırması, temel birim olarak 1000 Token'a dayanmaktadır. Bir işletmenin aşağı akış görevleri çok basitse ve yalnızca on binlerce jetonla yapılabiliyorsa, maliyeti çok düşüktür ve çok az GPU kartı gerektirir. Büyük bir endüstri modeli oluşturmak için gereken veri miktarı genellikle G veya hatta T'dir, bu nedenle çevrimdışı eğitim maliyeti çok yüksek olacaktır.
**Yarışı kim yönetiyor? **
Oyuncular büyük ölçekli model parkuruna akın etti.Bu sefer sadece birinci sınıf İnternet şirketleri değil, aynı zamanda daha fazla endüstri lideri ve start-up şirket katıldı.
Hangi sektörler kırılmada başı çekebilir? Belki de işbirliği olgusunun yer aldığı sektörden de görülebilmektedir.Makalenin başındaki tabloda da görüldüğü üzere finans, tıbbi bakım, eğitim, otonom sürüş ve diğer alanlar sıklıkla kullanılmaktadır.
Örneğin, Alibaba Cloud, Nisan ayında Tongyi büyük modelini piyasaya sürdüğünde, bir dizi şirketle işbirlikçi keşifler başlattığını duyurdu.İlk işbirlikçi şirketler grubu arasında OPPO Andes Smart Cloud, Geely Automobile, Zhiji Automobile, Chery New Energy, Momo Zhixing, Swire Coca-Cola, Bosideng, Palm Technology, vb. Raporlara göre, finans sektörü, perakende sektörü ve bazı büyük ölçekli tüketici odaklı senaryolar ve sektörler, kurumsal veya sektöre özel modeller oluşturmak için uygun olan çok sayıda genel veri ve senaryo verisi biriktirdi.
Kamuoyuna verilen bilgilere göre, Baidu Wenxin'in enerji ve elektrik, finans, havacılık, medya, film ve televizyon, otomobil, kentsel yönetim, gaz, sigorta, elektronik üretimi ve sosyal bilimleri kapsayan büyük ölçekli endüstri modellerinin sayısı 11'e ulaştı.
27 Haziran'da Pekin'de yayınlanan yapay zeka endüstrisinde on büyük ölçekli model uygulama vakasından oluşan ilk grup, enerji ve elektrik, tıbbi sağlık, finans, otonom sürüş, inşaat, bilimsel araştırma, yaşam ve soru-cevap alanlarını içeriyor. 27 Haziran'dan 30 Temmuz'a kadar Pekin Bilim ve Teknoloji Komisyonu ve Zhongguancun Yönetim Komitesi'nin de kentsel yönetişim, tıbbi sağlık, bilimsel araştırma, akıllı finans, akıllı yaşam ve akıllı gibi kilit alanlara odaklanacağı bildirildi. , 80'den fazla endüstri büyük ölçekli model uygulama vaka projesi toplayacak.
Baidu Smart Cloud AI Platform genel müdür yardımcısı Li Jingqiu, "Müşterilerle iletişim kurduğumuzda, birçok müşterinin endüstri modelleri hakkında fazla bir şey bilmediğini ancak Baidu'nun endüstri modellerini istemek için inisiyatif kullanacaklarını gördük." şu anda işletmelerin fiili kullanımı ile özel olarak birleştirilecektir.Endüstri modelinin ne tür yeteneklere sahip olmasını istiyorsunuz, hangi sistem veya uygulamaları kullanacaksınız, kimler kullanacak gibi ürün ve müşterilerin ihtiyaçlarını analiz edin. bu uygulamalar ve hangi etkileri elde etmeyi umuyorsunuz... Bu soruları sorduktan sonra, gerçekten müşteri bulacaksınız. İhtiyaç duyulan, Wenxin Qianfan'ın takım zinciri SFT'sine dayalı büyük bir model veya endüstri için önceden eğitilmiş bir modeldir. Veri işleme, bilgi işlem güç katmanında kaynak tahsisi gibi teknik sorunlardan sektördeki yaygın verilerle ilgili uzun vadeli eğitime kadar ikincisinin oluşturulması ve dağıtılması için en az birkaç ay, hatta geçen yıl gerekir.
Temel büyük ölçekli modelin koşuşturmacasından sektörün büyük ölçekli modelinin başlangıcına kadar, 2023'ün ikinci yarısına girerken gerçek bir iş dönüşümü hızlanacak.
Baidu ve OpenAI/Microsoft gibi yerli üreticilerin büyük ölçekli modeller alanındaki yollarını karşılaştırmak da ilginç.ChatGPT küresel fenomen düzeyinde popülerlik gösterince bazı sesler Çin'in neden ChatGPT üretemediğini sorguladı. sonuçta, birçok insan hala yüzeysel bir fikir birliğine sahip: "Çin'in yapay zekası iş uygulamalarına ve ticarileştirme yeteneklerine daha yatkın." Açıkça söylemek gerekirse, Çin'in yapay zekasının daha az sabrı var ve para kazanmak istiyor.
Ama öte yandan pazar, teknolojik gelişmenin en büyük itici gücü, zamanın ve ritmin kavranması farklı sonuçlar doğurmuştur. Örnek olarak büyük ölçekli endüstri modelini ele alalım.Microsoft ya teknolojinin daha da olgunlaşmasını bekliyor ya da zamanın henüz gelmediğini düşünüyor ve çok geç.Yerli üreticiler hızla temel büyük- ölçekli modelden büyük ölçekli endüstri modeline.Kalıcı canlılığa sahip olun.
Doğuda kaybolan, dutta hasat edilen, sonuçlar açısından, yerli sanayinin büyük modellerinin hızlı koşması kötü bir şey değil.