Yeni dev ne zaman doğacak? Büyük model "havzayı" bekliyor

Kaynak| Sıfır Bir Finans

Yazar| Shen Zhuoyan

Resim kaynağı: Unbounded AI aracı tarafından oluşturulmuştur

2023'ten beri teknoloji çemberindeki en sıcak kelime ChatGPT ve arkasındaki büyük ölçekli model teknolojisi.

Daha önce Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Pangu, HKUST Xunfei Xinghuo, vb. Sadece birkaç ay içinde, çeşitli işletmeler için büyük ölçekli model uygulamaları geliştirip piyasaya sürmek bir trend haline geldi.

1 milyar ve üzeri parametre ölçeğine sahip 80'den fazla yerli büyük ölçekli model var ve sayı hızla artmaya devam ediyor. Büyük modeller etrafında bir ticari savaş için hazırlık atmosferi şimdiden son derece güçlü.

İster büyük bir dev şirket, ister küçük bir dev şirket olsun, hepsinin ileri teknolojiye olan hassasiyetlerini ve uzun vadeli birikimlerini göstermek için bu tür eylemlere ihtiyacı var. Uygulamayı daha önce başlatarak, büyük model ile kullanıcı arasındaki etkileşime ilişkin değerli verileri bir gün önce test edebilir ve gelecekteki yarışmada "çok fazla yiyecek biriktirebilir ve resim kraldır".

Büyük modelin anahtarı, AI alan öğeleridir - algoritmalar, bilgi işlem gücü, veriler ve senaryolar/uygulamalar. Algoritmalar stratejileri temsil eder, bilgi işlem gücü üst sınırı belirler ve bir eşik belirler ve veri eşittir askeri tayın aynı zamanda iyi ve kötü arasındaki ayrımı sembolize eder. Üç öğeye ek olarak sahne/uygulama, birliklerin sevk edildiği yönü temsil eder.

"Yüz Model Savaşı" patlak vermek üzere, tüm unsurlarıyla dev bir şirket, teknolojik yeteneklerin sonsuz bir evrimine dönüşecek mi? Dikey yoldaki küçük devler, büyük modeller yardımıyla lider konumlarını pekiştirebilecekler mi? Bilet alan yeni oyuncular arasında kimler endüstri hakimiyeti için ciddi bir rakip olabilir?

Genel büyük ölçekli model "güç havzası" henüz ortaya çıkmadı

Büyük modellerin oyuncuları temel olarak üç kategoriye ayrılır: biri İnternet (Baidu, Ali, Tencent, vb.) ve endüstri devleri (China Telecom ve China Unicom, vb.) Akıllı şirketler (SenseTime, Yuncong, Guangyuewai, vb.) ve son kategori Şanghay Yapay Zeka Laboratuvarı, Fudan Üniversitesi, Harbin Teknoloji Enstitüsü vb. tarafından temsil edilen bilimsel araştırma enstitüleridir.

Kamu verilerine göre 2023 Temmuz ayı başı itibariyle ülkemde 1 milyarın üzerinde parametreye sahip 80'den fazla büyük ölçekli model var ve bunlar hızla artmaya devam ediyor. Bu miktarda parametreye sahip daha büyük modeller, rekabet eşiği o kadar yüksek olacaktır.

Şimdiye kadar piyasaya sürülen büyük ölçekli modellerin çoğu genel amaçlı büyük ölçekli modellerdir.Birincisi, büyük ölçekli modellerin rekabetinin hala belirsiz olması ve tamamen teknik seviyenin genişlememesidir. nesil farkı ve sektör katılımcılarının dünyaya hakim olma fırsatı var; Halk için uygulamaya yönelik büyük ölçekli model henüz ortaya çıkmadı ve net bir yönlendirme eksikliği var. yerli büyük ölçekli model ortaya çıktığında, genel amaçlı büyük ölçekli modele katılmak hem aktif hem de pasif bir seçimdir.

Ayrıca büyük modeller alanından yeni bir devin çıkması çok muhtemel.

Zhou Hongyi, büyük modellerin "evrensel" olması gerektiğine ve yalnızca genel kullanımın binlerce haneye girebileceğine, yüzlerce endüstriyi güçlendirebileceğine ve yeni yapay zeka devrimine öncülük edebileceğine inanıyor.

Yarım kalan, yeni devrimin lideri olmak için ne kadar yatırım ve işbirliği gerektiğidir. Büyük model ister mavi okyanus ister kızıl okyanus pazarı olsun, büyük balığın önderlik ettiği ve küçük balığın iş birliği yaptığı bir ekolojik yapının olması gerekir.Ancak büyük balık ile küçük balık arasındaki havza henüz ortaya çıkmamıştır.

Mevcut duruma bakılırsa 1 milyar parametrelik büyük bir modelin giriş eşiği, 10 milyar parametrelik büyük bir modelin ise dünyada rekabet edebilecek bir model olarak kabul edilebileceği ancak 100 milyar parametre ölçeğine sahip büyük bir model bile en iyisi olmaktan uzak, lider toz seviyesi.

Parametrelerin miktarı, savaş alanı durumunu belirleyen ezici bir güç değildir.Kaynak planlama yetenekleri, uzun vadeli deneyim birikimi ve büyük bilimsel araştırma yatırımı gibi faktörlerin tümü, büyük ölçekli model rekabetinde uzun süredir devam eden temel farklılıklardır.

Açık Yapay Zeka ile kıyaslama yapmak için, Chat GPT'deki patlamanın arkasında Microsoft'un veri, bilgi işlem gücü ve büyük fonlardaki kapsamlı desteğinin olduğunu görmek gerekir, böylece gelecekte çok para biriktirmiştir.

Büyük ölçekli modeller, basitçe "yanan para" anlamına gelen uzun vadeli yatırım endüstrileridir. Bilgi işlem gücü, algoritmalar ve veri birikimi bir gecede elde edilmez.Model yayınlandıktan sonra, tekrarlanan eğitim ve çevik iterasyonlara ihtiyaç duyar ve sonunda "olgun bir bedene" dönüşür.

Gerçek ortamda büyük modelin oyuncusunu teknoloji mi yoksa kâr mı yönlendiriyor? Open AI, dünyanın en ünlü büyük ölçekli model şirketidir.Patlayıcı ürün Chat GPT ile bile, ticarileştirme yeteneği hala endişe vericidir. Piyasa değeri 30 milyar ABD dolarına yaklaşan bir teknoloji şirketi olarak 2023'te yapay zeka dalgasının merkezinde yer alacak. Açık yapay zekanın şu ana kadarki geliri hala 200 milyon ABD dolarının altında.

İlk yatırım yalnızca ilk maliyettir ve sonraki her eğitim gerçek para gerektirir.Büyük ölçekli model yarışmasında kaç şirket acınası yatırım getirisini kabul edebilir? Chat GPT'nin başarısı, büyük modelin ürün yolunun açıldığını kanıtlıyor ancak ticari düzeyde büyük bir başarı anlamına gelmiyor.

En azından girdi-çıktı oranı açısından, İnternet devleri göreceli olarak daha büyük bir avantaja sahip, tıpkı o zamanki Alibaba Cloud gibi erken aşamadaki stratejik kayıpları desteklemek için yeterli motivasyona ve kaynağa sahipler.

Parayı yakmanın ne kadar süreceği ve tatmin edici bir yatırım getirisinin ne zaman görüleceği konusunda büyük şirketler ve yeni kurulan şirketlerin VC'leri bilmiyor. Bu, oyunu her an terk edebilecek bir kumar ve fişler milyarlarca dolar.

"Herkesin kendine göre avantajları vardır" diyen büyük ölçekli model oyuncuları için, öncelikle uygulama katmanını keşfetmeli ve bir an önce testi açmalıdırlar. Kimin daha değerli etkileşim verileri biriktirebileceği, bir sonraki yarışmanın kırılma noktası olacaktır.

Dikey ihtiyaçlar ve dikey zorluklar

Genel büyük ölçekli modeller için rekabet daha çok altyapıyı formüle etme hakkı için rekabetle ilgiliyken, dikey büyük ölçekli model, bölümlere ayrılmış endüstrilerde farklılaştırılmış rekabet gücü oluşturmak için belirli senaryolarda açık kaynaklı büyük ölçekli modellere veya API arayüzlerine dayanır. senaryo uygulamasına daha fazla odaklanmak.

Genel amaçlı büyük ölçekli modellerin savaş alanında, zaman geçtikçe, zayıf olan bazı oyuncular yavaş yavaş geride kalacak ve sonunda altyapı rolünü oynayacak yalnızca birkaç genel amaçlı büyük ölçekli model olacak. . Aynı zamanda, bu büyük modeller hala homojenlik sorunuyla karşı karşıyadır ve uygulama katmanı hala dikey büyük modellere bağlıdır.

Genel amaçlı büyük model, birden çok dikey büyük modelin bir koleksiyonu gibidir. Ne kadar çok eğitim senaryosu olursa, genel amaçlı büyük modelin "genelliği" o kadar güçlü olur.

Çin'de Chat GPT benzeri ürünleri piyasaya süren ilk şirket olarak Baidu'nun büyük ölçekli model dikey uygulama katmanlarına acil bir ihtiyacı var. Li Yanhong şunları söyledi: "Dikey alanların uygulanmasında bir çığır açan uygulama, büyük modellerin sayısından daha önemli. Yeni uluslararası rekabet stratejisinin kilit noktası, kaç tane büyük model olduğu değil, ne kadar yerli olduğu. büyük modellerdeki uygulamalar Bu uygulamalar Üretim verimliliği ne ölçüde iyileştirildi."

Li Yanhong'un metaforuna göre büyük modeller, özellikle genel amaçlı büyük modeller, AI çağındaki işletim sistemi gibidir.Tüm uygulamalar, üzerinde çeşitli AI yerel uygulamaları da dahil olmak üzere uygulama katmanı olan büyük model etrafında geliştirilecektir. .

Son tahlilde, sözde "evrensel" sadece göreceli bir kavramdır ve tüm alanlara tamamen uygulanabilir ve yeterli endüstri derinliğine sahip genel amaçlı bir model yoktur. Chat GPT'yi örnek alırsak, hata toleransı yüksek olan bazı endüstriler gerçekten yaygın olarak kullanılmaktadır.Büyük modelin verdiği çözüm yanlış olsa bile, hata nispeten sınırlı bir aralıkla sınırlıdır. Ancak ağır sanayi, havacılık ve tıbbi bakım gibi senaryolarda bir hatanın neden olduğu kayıp ölçülemez, yani Chat GPT belirli senaryoların dikey ve profesyonel gereksinimlerini karşılayamaz.

Dikeylik ve profesyonellik gerekliliklerini hesaba katmak için, veriler bir kusurdur ve yeterli veri derinliğine ve istikrarlı bir hendeğe sahip daha az endüstri vardır. Bu endüstrilerin verilerinin elde edilmesinin kolay olup olmadığı ve elde edilen verilerin belirli endüstrilerin sürekli değişen gereksinimlerini karşılayıp karşılamadığını özel olarak değerlendirmek zordur.

İnternet devleri, e-ticaret, sosyal ağlar ve arama gibi büyük miktarda ağ verisine sahiptir, ancak veri türleri yeterince kapsamlı değildir ve verilerin kalitesi garanti edilmez.Eğitim için kullanılabilecek Çin külliyatı hala çok fazla madencilik çalışması gerekiyor.

Son zamanlarda, devlet işleri, kamu güvenliği ve tıbbi bakım alanlarında dikey büyük ölçekli modeller birbiri ardına uygulanmaktadır. Örneğin Yunzhisheng, ön uç ses sinyali işleme, ses izi tanıma, konuşma tanıma gibi tam yığın akıllı ses etkileşimi teknolojileriyle birlikte akıllı tıbbi bakım alanında "dağ ve deniz" büyük ölçekli modelini kendisi geliştirdi. konuşma sentezinin, doktorların elektronik tıbbi kayıt girişi verimliliğini %400'den fazla artırması, tek bir hasta için konsültasyon süresinden %40'tan fazla tasarruf sağlaması ve doktorun ayakta tedavi verimliliğini %66'dan fazla artırması bekleniyor.

TRS, kendi resmi belgelerine, politika belgelerine, devlet işleri kılavuzlarına ve mesleki eğitim verileri olarak diğer verilere dayanarak, büyük bir devlet işleri modeli oluşturmuştur.

Finansal alanda, Hang Seng Electronics, 2023 Mart ayının sonunda finansal büyük ölçekli model ürünleri planlamaya ve tasarlamaya başlayacak. Haziran ayının sonunda, Hang Seng Electronics ve yan kuruluşu Hang Seng Juyuan, büyük dil modeli teknolojisine dayalı yeni bir dijital zeka finansal ürünü piyasaya sürdü - akıllı finansal asistan Photon ve yeni geliştirilmiş akıllı yatırım araştırma platformu WarrenQ.

Birden fazla endüstri kaynağına sahip bir İnternet devi olan Tencent, birden çok tarafa bahis yapıyor. Haziran sonunda Tencent, finans, kültür turizmi, devlet işleri ve eğitim dahil 10 sektörü kapsayan ve toplam 50'den fazla çözüm içeren MaaS hizmet çözümlerini duyurdu.

Aynı zamanda, dikey büyük modelin gerektirdiği veriler genellikle sektörle sınırlı değildir.Bazı işletmeler, başka veya daha fazla sektörden veri entegrasyonu gerektirebilir.Model eğitimi ve uygulaması, işletmelerin veya kaynakların sektörler arası işbirliğine bağlıdır. İnternet devlerinin entegrasyonu.

**Bilgisayar gücü: Güçlü tuğlalar uçar mı? **

  1. yüzyılda Amerika Birleşik Devletleri'nin batısındaki altına hücumda, altın avcılarının gerçekten para kazanabilmesi olasılıksal bir olayken, kürekçilerin para kazanması kaçınılmaz bir sonuçtu.

AI altına hücumda, büyük modelin savaş alanı durumu hala belirsiz ve oyuncular hala ilerliyor, ancak "kürek satıcısı" çoktan kazandı. AI yongaları ve büyük modellerin trendine güvenen Nvidia, rakibi AMD ile aradaki farkı açtı ve piyasa değeri "trilyon dolarlar kulübüne" girdi.

Open AI CEO'su Sam Altman, Moore Yasasının yeni bir versiyonunu önerdi, yani küresel AI'nın bilgi işlem gücü her 18 ayda bir ikiye katlanacak. Bu hesaplamaların sürdürülebilmesi için AI eğitim çiplerinin desteği gerekiyor ve Nvidia'nın bu alandaki pazar payı %90'ı aşıyor.

Nvidia'nın AI çip ürünleri, dünyanın dört bir yanındaki büyük teknoloji şirketleri tarafından çılgınca yakalandı: Mart 2023'te Microsoft, OpenAI'nin on binlerce A100 ile yeni bir bilgi işlem merkezi kurmasına yardım ettiğini duyurdu; Mayıs ayında Google, 26.000 parça ile bir H100 piyasaya sürdü. bilgi işlem kümesi ComputeEngineA3. Ayrıca China National Finance Securities'den alınan bilgilere göre, ByteDance bu yıl 1 milyar ABD dolarından fazla GPU siparişi verdi ve gelen ve gelmeyen 100.000 adet A100 ve H800 olduğu tahmin ediliyor. Tencent Bulut Yüksek Performanslı Bilgi İşlem Hizmet Merkezi'nin Tencent tarafından piyasaya sürülen yeni sürümünde de on binlerce H800 yongası kullanılıyor.

Nvidia CFO'su Kress, AI bilgi işlem gücüne yönelik mevcut pazar talebinin şirketin önümüzdeki birkaç çeyrek için beklentilerini aştığını ve yerine getirilmesi gereken çok fazla sipariş olduğunu söyledi.

Nvidia'nın kazandığı paraya imrenmemiz elbette ki faydasızdır.

Yerli GPU yolu da yetişiyor Baidu AI çipi Kunlun, Tencent video işleme çipi "Canghai" ve AI çipi "Zixiao" vb. Gibi yalnızca İnternet devlerinin kendi geliştirdiği AI yongaları yok. genel amaçlı GPU'lar geliştiren Genel amaçlı GPU'lar, son derece paralel bilgi işlem yetenekleri ve büyük ölçekli bilgi işlem çekirdekleri dahil olmak üzere çeşitli genel amaçlı görevler için kullanılır. Ayrıca son yıllarda büyük ilerleme kaydedilmiştir ve yüksek performanslı GPU'lar ile aradaki boşluk giderek daralmaktadır.

Çin Mühendislik Akademisi'nden bir akademisyen olan Wu Hequan, ulusal bilim ve teknoloji ve endüstriyel planların koordinasyonu altında, ortak bir bilgi işlem gücü oluşturmak için makul bir işbölümü oluşturulması gerektiğini ve ulusal bilgi işlem gücü platformunun oluşturulması gerektiğini öne sürdü. çeşitli büyük ölçekli model eğitimlerini desteklemek için laboratuvar açılmalıdır.Aynı zamanda, mevcut üst düzey GPU'lara konsantre olmak için bir bilgi işlem gücü ittifakı oluşturulması önerilmektedir.Bilgi işlem kaynakları, büyük model veri eğitimi için gereken bilgi işlem gücünü sağlar.

Yüksek performanslı GPU'lara ek olarak, daha düşük maliyetli bilgi işlem platformları da yeni pazar fırsatları olarak kabul edilir. Son zamanlarda Jiuzhang Yunji, devlete ait bulut üreticileriyle işbirliğine devam edeceğini ve pazardaki çok sayıda akıllı bilgi işlem merkezini ortak olarak dahil edeceğini ve müşterilere yazılım ve donanımı entegre eden bir yapay zeka modeli araştırma ve geliştirme platformu sağlayacağını açıkladı. müşterilerin maliyeti bilgi işlem gücüne bağlı olacaktır.

Hesaplama gücü, büyük modellerin geliştirilmesinin temelidir ve gerekli bir koşuldur ancak yeterli bir koşul değildir.Bilgisayar gücünün oynayabileceği maksimum rol, yine de kullanım yönüne bağlıdır. Yalnızca algoritma yeniliği, veri kaynağı oluşturma ve eğitim çerçevesi yinelemesi el ele gittiğinde, "uçan güçlü tuğlalar" oluşturmak mümkün olabilir.

Politika: Kritik anlarda rehberlik ve düzenleme

AI patlamasının yaşandığı dönem, ülkemizde algoritma yönetişiminin ve algoritma dosyalamanın kritik anına denk geliyor.

2021 gibi erken bir tarihte, "İnternet Bilgi Hizmeti Algoritmalarının Kapsamlı Yönetişiminin Güçlendirilmesine İlişkin Kılavuz Görüşler", algoritma dosyalama yönetimini denetim sisteminin iyileştirilmesinin önemli bir parçası olarak ortaya koymaktadır. kamuoyu nitelikleri veya sosyal seferberlik yetenekleri dosyalama işlemlerini gerçekleştirir."

Nisan 2023'te Çin Siber Uzay İdaresi, halkın katılımı için "Üretken Yapay Zeka Hizmetleri için İdari Tedbirler (Yorum Taslağı)" taslağını hazırladı. Haziran ayında Danıştay tarafından yayınlanan "Devlet Konseyi'nin 2023 Yasama Çalışma Planı", yapay zeka yasası taslağının Ulusal Halk Kongresi Daimi Komitesi'ne sunulmak üzere hazırlandığını gösterdi.

“Üretken Yapay Zeka Hizmet Yönetim Tedbirleri (Yorum Taslağı)”, halka hizmet sunmak için üretken yapay zeka ürünlerinin kullanılmadan önce “İnternet Bilgilerinin Güvenlik Değerlendirmesine İlişkin Yönetmelik” uyarınca Devlet Şebekesine bildirilmesi gerektiğini belirtti. Kamuoyu Nitelikli veya Toplumsal Seferberlik Kabiliyeti Olan Hizmetler". Bilgi İşlem Daire Başkanlığı, "İnternet Bilgi Hizmeti Algoritma Öneri Yönetimi Yönetmeliği" uyarınca güvenlik değerlendirmesi başvurusunda bulunarak, algoritma dosyalama, değişiklik ve iptal dosyalama işlemlerini gerçekleştirir.

Bu aynı zamanda halka açık büyük ölçekli model ürünlerin bulunmamasının nedenlerinden biridir.

Nankai Üniversitesi Hukuk Fakültesi dekan yardımcısı ve Çin Yeni Nesil Yapay Zeka Geliştirme Stratejisi Araştırma Enstitüsü'nde özel araştırmacı olan Profesör Chen Bing, ön düzenlemenin mutlaka teknolojik yeniliğe zarar vermeyeceğine inanıyor, ancak önceden gözden geçirme, işletme sayısını bir ölçüde artıracaktır.Önceden gözden geçirme kapsamı uygun şekilde belirlenmezse, üretken yapay zeka ürünlerinin araştırma, geliştirme ve eğitim verimliliğini engelleyebilir ve objektif olarak geliştirmede yavaşlamaya yol açabilir. üretken AI.

Yapay zekanın riskleri önceden tam olarak tahmin edilemediğinden ve olaydan sonraki denetim çok büyük zararlara yol açabileceğinden, ülkem şu anda yapay zekanın geliştirilmesinde tam süreç denetimini benimsiyor.

Tüm sürecin düzenlenmesi altında, büyük ölçekli model oynatıcıların uyum maliyeti şüphesiz artacaktır ve kayıt dosyalama sistemi ayrıca oyundaki oyuncuları, ürünleri piyasaya daha önce objektif olarak tanıtmak için önce kayıt dosyalama aramaya teşvik eder. büyük dalgaların hızını hızlandırıyor. Yasaların ve düzenlemelerin kademeli olarak iyileştirilmesine, endüstri değişikliği süreci ve zayıfların geride bırakılması eşlik ediyor, bu da bulutları güneşe açma anını daha erken getirebilir.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)