現実の環境では、ビッグモデルのプレイヤーはテクノロジーによって動かされるのでしょうか、それとも利益によって動かされるのでしょうか? Open AI は世界で最も有名な大規模モデル会社ですが、Chat GPT という爆発的な製品を持っていますが、その商品化能力にはまだ不安があります。時価総額が 300 億米ドルに迫るテクノロジー企業として、同社は 2023 年には AI の波の中心となるでしょう。オープン AI のこれまでの収益はまだ 2 億米ドル未満です。
金融分野では、ハンセン電子は2023年3月末に金融大型モデル製品の企画・設計を開始する。 6月末、Hang Seng Electronicsとその子会社Hang Seng Juyuanは、大規模言語モデル技術に基づく新しいデジタルインテリジェンス金融製品、金融インテリジェントアシスタントPhotonと新しくアップグレードされたインテリジェント投資調査プラットフォームWarrenQをリリースしました。
Open AI CEO の Sam Altman 氏は、ムーアの法則の新バージョン、つまり世界的な AI のコンピューティング能力が 18 か月ごとに 2 倍になることを提案しました。これらの計算を維持するには AI トレーニング チップのサポートが必要であり、この分野における Nvidia の市場シェアは 90% を超えています。
Nvidia の AI チップ製品は、世界中の大手テクノロジー企業によって熱狂的に注目されました。2023 年 3 月、Microsoft は、OpenAI による数万個の A100 を備えた新しいコンピューティング センターの構築を支援したと発表しました。5 月には、Google が 26,000 個の A100 を備えた H100 を発売しました。コンピューティング クラスター ComputeEngineA3。さらに、中国国家金融証券の情報によると、バイトダンスは今年10億ドル以上のGPUを発注しており、A100とH800の到着済みと未到着が10万個あると推定されている。数万個の H800 チップは、テンセントがリリースした Tencent Cloud High Performance Computing Service Center の新バージョンでも使用されています。
南開大学法学部副学部長であり、中国新世代人工知能開発戦略研究所の特別研究員であるチェン・ビン教授は、事前規制は必ずしも技術革新に損害を与えるわけではないと考えているが、事前規制により、事前審査の範囲が適切に設定されないと、生成型 AI 製品の研究開発や教育の効率が阻害され、客観的に見て開発の停滞につながる可能性があります。生成AI。
新たな巨人はいつ誕生するのか?大型モデルが“分水嶺”を待つ
出典| ゼロワン ファイナンス
著者| 沈卓燕
2023 年以降、テクノロジー界で最も注目されている言葉は、ChatGPT とその背後にある大規模モデル テクノロジーです。
以前は、Baidu Wenxin Yiyan、Alibaba Cloud Tongyi Qianwen、Huawei Pangu、HKUST Xunfei Xinghuoなどがいた。最近、Li Kaifuが入局してZero One Wanwuを設立し、Volcano Engineが「Volcano Ark」を立ち上げた。わずか数か月の間に、さまざまな企業が大規模なモデル アプリケーションを開発、リリースすることがトレンドになりました。
パラメータ規模10億以上の大規模モデルは国内に80以上あり、その数は今も急速に増加している。大型モデルを巡る商業戦争の準備雰囲気はすでに非常に高まっている。
大手企業であっても、小さな巨大企業であっても、最先端のテクノロジーに対する敏感さと長期的な蓄積を示すためには、こうした行動が必要です。アプリケーションをより早く起動することで、大型モデルとユーザーの間のインタラクションに関する貴重なデータを 1 日早くテストでき、将来の競争では「たくさんの食べ物を蓄積し、写真が王様」になります。
ビッグモデルの鍵となるのは、アルゴリズム、計算能力、データ、シナリオ/アプリケーションといった AI 分野の要素です。アルゴリズムは戦略を表し、計算能力は上限を決定してしきい値を設定し、データと兵糧は善悪の区別を象徴するものでもあります。 3つの要素に加えて、出兵の方向性を表すのが場面・用途です。
まさに“百機種戦争”が勃発しようとしている あらゆる要素を備えた巨大企業は技術力を無限に進化させることができるのか?垂直軌道上の小さな巨人は、大型モデルの助けを借りて主導的な地位を固めることができるでしょうか?チケットを獲得した新規プレーヤーの中で、業界の優位性を争う有力な候補者は誰でしょうか?
一般的な大型モデル「強度流域」はまだ登場していません
大型モデルのプレーヤーは主に 3 つのカテゴリに分類されます。 1 つはインターネット (Baidu、Ali、Tencent など) と業界大手 (China Telecom、China Unicom など) スマート企業 (SenseTime、Yuncong、Guangyuewai など) 、最後のカテゴリは、上海人工知能研究所、復旦大学、ハルビン工業大学などに代表される科学研究機関です。
公開データによると、2023 年 7 月初旬の時点で、我が国にはパラメーターが 10 億を超える大規模モデルが 80 を超え、依然として急速に増加しています。この量のパラメータを持つモデルが大規模であればあるほど、競争の敷居は高くなります。
これまでに発売された大型モデルの多くは汎用大型モデルであり、その理由は大きく2つあり、1つは大型モデルの競争がまだ不透明であること、純粋に技術レベルが広がっていないことである。世代間のギャップがあり、業界参加者が世界を支配する機会がある 一般向けのアプリケーション指向の大規模モデルがまだ登場しておらず、明確な方向性の指針が欠如している国産の大型モデルが登場した場合、汎用の大型モデルに加わることは積極的かつ消極的な選択となります。
さらに、大型模型の分野からも新たな巨人が出現する可能性が高い。
Zhou Honyi 氏は、大型モデルは「ユニバーサル」である必要があり、一般的な使用のみが数千の家庭に導入され、数百の業界に力を与え、人工知能の新たな革命をリードできると信じています。
まだやり残されているのは、新たな革命のリーダーになるためにどれだけの投資と協力が必要かということだ。ビッグモデルがブルーオーシャンかレッドオーシャン市場かに関わらず、大きな魚がリードし、小さな魚が協力する生態構造がなければなりませんが、大きな魚と小さな魚の分水嶺はまだ現れていません。
現状から判断すると、10億パラメータ規模の大規模モデルが参入の敷居と考えられ、100億パラメータ規模の大規模モデルであれば世界で戦える実力があると考えられるが、 1,000 億パラメータのスケールを持つ大規模なモデルであっても、最高とは程遠く、塵の中でもトップクラスのレベルです。
パラメータの量は戦場の状況を決定する圧倒的な力ではなく、リソースのスケジューリング能力、長期的な経験の蓄積、多額の科学研究への投資などの要素はすべて、大規模モデルの競争における長年にわたる核心的な違いです。
Open AI とのベンチマークを行うには、Chat GPT の爆発的な普及の背後には、Microsoft のデータ、コンピューティング能力、および膨大な資金に関する包括的なサポートがあり、将来的に多額の資金を蓄積していることを確認する必要があります。
大型モデルは長期投資産業であり、簡単に言えば「お金を燃やす」ことを意味します。コンピューティングパワー、アルゴリズム、データの蓄積は一朝一夕に達成できるものではなく、モデルのリリース後もトレーニングとアジャイルなイテレーションを繰り返し、最終的に「成熟した体」に進化します。
現実の環境では、ビッグモデルのプレイヤーはテクノロジーによって動かされるのでしょうか、それとも利益によって動かされるのでしょうか? Open AI は世界で最も有名な大規模モデル会社ですが、Chat GPT という爆発的な製品を持っていますが、その商品化能力にはまだ不安があります。時価総額が 300 億米ドルに迫るテクノロジー企業として、同社は 2023 年には AI の波の中心となるでしょう。オープン AI のこれまでの収益はまだ 2 億米ドル未満です。
初期投資は初期費用のみで、その後のトレーニングには毎回リアルマネーが必要となるが、大規模モデルコンペティションでの悲惨な投資収益率を受け入れることができる企業がどれだけあるだろうか。 Chat GPT の成功は、大型モデルが製品の道に開かれたことを証明していますが、商業レベルで大きな成功を意味するわけではありません。
少なくとも産業投入と産出の比率の点では、インターネット大手のほうが相対的に有利であり、当時のアリババクラウドと同様に、初期段階での戦略的損失を補うだけの十分な動機とリソースを持っている。
お金を燃やすのにどれくらいの時間がかかるのか、そしていつ満足のいく投資収益率が得られるのかについては、大企業も、新興企業のベンチャーキャピタルも知りません。これは、いつでもゲームを終了できるギャンブルであり、チップは数十億ドルです。
「誰にでもそれぞれの利点がある」という大規模モデルプレイヤーは、まずはアプリケーション層を探索し、できるだけ早くテストを開始し、誰がより貴重なインタラクションデータを蓄積できるかが、次の競争の分岐点となるだろう。
垂直的なニーズと垂直的な困難
一般的な大規模モデルの競争は、インフラストラクチャを構築する権利をめぐる競争であるのに対し、垂直型大規模モデルは、特定のシナリオでオープンソースの大規模モデルまたは API インターフェイスに依存して、セグメント化された業界で差別化された競争力を形成します。シナリオの適用に重点を置いています。
汎用大型機の戦場では、時間の経過とともに一部の弱いプレイヤーが徐々に遅れをとり、最終的にはインフラの役割を担う汎用大型機が数台だけになる。同時に、これらの大規模モデルは依然として均一性の問題に直面しており、アプリケーション層は依然として垂直型大規模モデルに依存しています。
汎用大モデルは複数の縦長大モデルを集めたようなもので、学習シナリオが増えるほど汎用性が強くなります。
Chat GPT のような製品をリリースした中国初の企業である Baidu は、大規模モデルの垂直アプリケーション層を緊急に必要としています。 Li Yanhong氏は、「大型モデルの数よりも重要なのは応用であり、これは垂直分野の応用における画期的な進歩である。新しい国際競争戦略の重要な点は、大型モデルがどれだけあるかではなく、ネイティブモデルがどれだけあるかである」と述べた。大型モデルでの応用例 これらの応用例 生産効率はどの程度向上しましたか?」
Li Yanhong 氏の比喩によれば、大規模モデル、特に汎用大規模モデルは AI 時代のオペレーティング システムに似ており、すべてのアプリケーションは大規模モデルを中心に開発され、その上にさまざまな AI ネイティブ アプリケーションを含むアプリケーション層が存在します。 。
結局のところ、いわゆる「ユニバーサル」とは相対的な概念にすぎず、あらゆる分野に完全に適用でき、十分な業界深度を備えた汎用モデルは存在しません。 Chat GPTを例に挙げると、実際に広く使われているのは依然としてフォールトトレランスの高い一部の業界であり、たとえ大規模なモデルによって与えられた解が間違っていたとしても、誤差は比較的限られた範囲に限定されます。しかし、重工業、航空宇宙、医療などのシナリオでは、ミスによる損失は計り知れず、Chat GPT では特定のシナリオの垂直的および専門的要件を満たすことができません。
垂直性と専門性の要件を考慮すると、データには欠陥があり、十分なデータ深さと安定した堀を備えた業界は少なくなります。これらの業界のデータが入手しやすいかどうか、また、取得したデータが特定の業界の刻々と変化する要件に対応できるかどうかを具体的に評価することは困難です。
インターネット大手は、電子商取引、ソーシャル ネットワーキング、検索などの大量のネットワーク データを保有していますが、データの種類は十分に網羅されておらず、データの品質も保証されていません。たくさんの採掘作業。
近年、政務、治安、医療などの分野で、縦型の大規模モデルが次々と導入されている。たとえば、Yunzhisheng は、フロントエンドの音声信号処理、声紋認識、音声認識、音声合成により、医師の電子カルテ入力効率が400%以上向上し、一人の患者の診察時間が40%以上節約され、医師の外来効率が66%以上向上することが期待されています。
TRS は、独自の公文書、政策文書、政務ガイドなどを専門的なトレーニング データとして基に、政務の大規模なモデルを作成しました。
金融分野では、ハンセン電子は2023年3月末に金融大型モデル製品の企画・設計を開始する。 6月末、Hang Seng Electronicsとその子会社Hang Seng Juyuanは、大規模言語モデル技術に基づく新しいデジタルインテリジェンス金融製品、金融インテリジェントアシスタントPhotonと新しくアップグレードされたインテリジェント投資調査プラットフォームWarrenQをリリースしました。
複数の業界リソースを持つインターネット大手の Tencent は、さまざまな側面に賭けています。テンセントは6月下旬、金融、文化観光、政府事務、教育など10業界をカバーし、合計50以上のソリューションを持つMaaSサービスソリューションを発表した。
同時に、垂直大規模モデルで必要なデータは、多くの場合、その業界に限定されません。一部のビジネスでは、別の業界または複数の業界からのデータ統合が必要になる場合があります。モデルのトレーニングと適用は、企業の業界間の協力やリソースに依存します。インターネット巨人の統合。
**コンピューティング能力: 強力なレンガは飛ぶでしょうか? **
19世紀のアメリカ西部のゴールドラッシュでは、金を掘る人が実際に儲かるのは確率論的な出来事でしたが、シャベル売りが儲かるのは必然の結果でした。
AIのゴールドラッシュでは、大型モデルの戦況はいまだ不透明で、プレイヤーはまだ先を進んでいますが、すでに「スコップ売り」が勝利しています。 AIチップや大型モデルの動向を頼りに、NVIDIAは競合AMDとの差を広げ、時価総額は「兆ドルクラブ」に入った。
Open AI CEO の Sam Altman 氏は、ムーアの法則の新バージョン、つまり世界的な AI のコンピューティング能力が 18 か月ごとに 2 倍になることを提案しました。これらの計算を維持するには AI トレーニング チップのサポートが必要であり、この分野における Nvidia の市場シェアは 90% を超えています。
Nvidia の AI チップ製品は、世界中の大手テクノロジー企業によって熱狂的に注目されました。2023 年 3 月、Microsoft は、OpenAI による数万個の A100 を備えた新しいコンピューティング センターの構築を支援したと発表しました。5 月には、Google が 26,000 個の A100 を備えた H100 を発売しました。コンピューティング クラスター ComputeEngineA3。さらに、中国国家金融証券の情報によると、バイトダンスは今年10億ドル以上のGPUを発注しており、A100とH800の到着済みと未到着が10万個あると推定されている。数万個の H800 チップは、テンセントがリリースした Tencent Cloud High Performance Computing Service Center の新バージョンでも使用されています。
NvidiaのCFOクレス氏は、AIコンピューティング能力に対する現在の市場需要は、今後数四半期における同社の予想を上回っており、対応するには注文が多すぎると述べた。
もちろん、Nvidia が稼いでいるお金を羨むのは無駄です。
国内GPUトラックも追いついており、Baidu AIチップKunlun、Tencentビデオ処理チップ「Canghai」、AIチップ「Zixiao」などのインターネット大手自社開発AIチップだけでなく、Suyuan Technology、 Tianshu Zhixin, 汎用 GPU を開発する Moore Threads などの新興企業 汎用 GPU は、高度な並列コンピューティング機能や大規模なコンピューティング コアなど、さまざまな汎用タスクに使用されます。 , 高性能GPUとの差は徐々に縮まりつつあります。
中国工程院の院士、呉和泉氏は、国家科学技術と産業計画の調整の下、合理的な分業を形成して共同コンピューティングパワーと国家コンピューティングパワープラットフォームを形成すべきであると提案した。さまざまな大規模モデルのトレーニングをサポートするために、ラボを開設する必要があります。同時に、既存のハイエンド GPU を集中させるためにコンピューティング能力アライアンスを形成することが提案されています。コンピューティング リソースは、大規模モデル データのトレーニングに必要なコンピューティング能力を提供します。
高性能 GPU に加えて、低コストのコンピューティング プラットフォームも新たな市場機会と考えられています。最近、Jiuzhang Yunji は、国有クラウド メーカーとの協力を継続し、市場の多数のインテリジェント コンピューティング センターをパートナーとして含め、ソフトウェアとハードウェアを統合した AI モデルの研究開発プラットフォームを顧客に提供することを明らかにしました。顧客のコストはコンピューティング能力に関係します。
大規模モデルの開発の基盤となる計算能力は必要条件ではありますが、十分条件ではなく、その利用の方向性によってその最大の役割が左右されます。アルゴリズムの革新、データ リソースの構築、トレーニング フレームワークの反復が連携して行われた場合にのみ、「強力な飛行レンガ」を作成することが可能になります。
ポリシー: 重要な瞬間における指導と規制
AI の爆発的流行の時期は、我が国におけるアルゴリズムのガバナンスとアルゴリズムの申請の重要な時期と一致しています。
早ければ2021年にも「インターネット情報サービスのアルゴリズムの総合的なガバナンスの強化に関する指導意見」において、アルゴリズムの届出管理が監督体制の整備の重要な一環として位置づけられ、管理規程に「アルゴリズム推奨サービス事業者は、世論の属性または社会的動員能力が申請手続きを実行するものとする。」
中国サイバースペース局は2023年4月に「生成型人工知能サービスに関する行政措置(意見募集草案)」を草案し、公開諮問に供した。 6月、国務院が発表した「2023年国務院立法作業計画」は、人工知能法案が全国人民代表大会常務委員会に審議のために提出される準備ができていることを示した。
「生成型人工知能サービス管理措置(意見募集草案)」では、生成型人工知能製品を公衆にサービスを提供するために使用する前に、「インターネット情報の安全性評価に関する規則」に従って国家ネットワークに報告する必要があると述べられています。情報部門は、「インターネット情報サービスアルゴリズム推奨管理規程」に基づき、安全性評価の申請、アルゴリズムの届出、変更、取消しの届出手続きを行うものとする。
これも大型モデルの製品が世に出ていない理由の一つです。
南開大学法学部副学部長であり、中国新世代人工知能開発戦略研究所の特別研究員であるチェン・ビン教授は、事前規制は必ずしも技術革新に損害を与えるわけではないと考えているが、事前規制により、事前審査の範囲が適切に設定されないと、生成型 AI 製品の研究開発や教育の効率が阻害され、客観的に見て開発の停滞につながる可能性があります。生成AI。
人工知能のリスクを事前に完全に予測することは不可能であり、事後の監視は多大な損害を引き起こす可能性があるため、我が国は現在、人工知能の開発の全過程監視を採用しています。
プロセス全体の規制の下では、大型モデルプレーヤーのコンプライアンスコストは間違いなく増加します。また、記録提出システムは、ゲーム内のプレーヤーに、製品をより早く市場に投入するために記録提出を優先するよう促します。 、客観的に大きな波の速度が速くなります。法規制の段階的な整備は業界の再編を伴い弱者が取り残され、雲が晴れる瞬間が早まる可能性もある。