大型モデルが地面に落ちたら、まずは探索がロールの王様

元のソース: NoNoise

「チャイナスピード」を再解釈した大型モデル。 Baidu が今年 3 月に中国で最初の GPT に似た製品をリリースして以来、わずか 3 か月の間に、パラメータ規模が 10 億を超える大型モデル 79 個が中国で生産されました。

「中国人工知能大規模モデル地図研究報告書」はまた、米国と中国がリリースした汎用大規模モデルの合計数が世界のリリース数の80%を占めているという別の観察視点も提供している。中国と米国のテクノロジー企業が、世界を席巻するこの生成型 AI 革命の主な推進者となりつつあることは明らかです。

Open AI と Microsoft の共同キャンプは、爆弾の王様として知られる Office Family Bucket や AI言語学習プラットフォーム Duolingo のトレーニング、およびモルガン スタンレーの数十万ページに及ぶナレッジ ベース、および不正行為と戦うための決済サービス プラットフォーム Stripe の最新ソリューション。これらのランディング ケースは、B サイドと C サイドの両方をカバーします。これに対し、国産大型モデルの打ち上げ速度をめぐる争いは終わったばかりで、大規模な実用化はまだ途上にある。

道路のこのセクションは非常に困難ですが、重要です。 Baidu の CEO、Robin Li 氏は最近の会議で、「新しい国際競争戦略の重要なポイントは、国が大規模モデルをどれだけ保有しているかではなく、大規模モデルにネイティブ AI アプリケーションがどれだけ搭載されているか、そしてそれらのアプリケーションがどれくらいあるかだ」と強調しました。生産効率が向上しました。」

公開情報によると、最前線を走る文信宜燕は、自動車やエネルギー・電力など複数のtoB分野をカバーする11の大規模産業モデルを立ち上げている。

このとき、誰が大型モデルからCアプリケーションへのファーストショットを開始できるかが注目される。これは商用アプリケーションの「リング」であり、PPT レベルの「印刷」ではないことに注意してください。

出典:「中国人工知能大型モデル地図研究報告書」

Cエンドユーザーの視点から見ると、「NoNoise」は教育と検索の両方の分野にチャンスがあると考えています。教育は言うまでもなく、AI学習機などの端末ハードウェアの売れ筋からもわかりますが、大きなモデルにお金を払うだけのグループであることを理解するのは難しいことではありません。親である必要があります。検索に関しては、GPT を備えた新しい Bing により、Microsoft CEO のナデラ氏は、Google を「踊らせたのは Microsoft である」と誇らしげに言うことができます。これは、大きなモデルが検索にどれだけの想像力の余地をもたらすかを示しています。検索は世界最大の AI アプリケーション シナリオです。

同時に、この見通しを見据えた百度も、日夜「錬金術」に精力的に取り組んでいる。バイドゥは、「AI Partner」などの生成型 AI 製品の集中的な発売を通じて、新時代への探求を加速し、市場リーダーとしての地位を維持したいと考えています。

ここで疑問が生じます。検索は大規模モデルの大規模適用の最初のショットを起動するのでしょうか?

01 検索ボックスに隠されたいくつかの真実

この質問に答える前に、検索と大規模モデルの間の関係の性質を定義する必要があります。

ChatGPT の誕生後、Google、Baidu、その他の検索大手は打倒され、Open AI が検索業界のゲームチェンジャーになるだろうと信じる声がありました。

最も有名な代表者はマイクロソフトの共同創設者ビル・ゲイツです。同氏は今年の初めに、将来トップAI企業はAIパーソナルアシスタントに取り組むことになり、ユーザーは二度と検索ウェブサイトやアマゾンにアクセスすることはなくなるだろうと予測した。ゲイツ氏は2019年9月以前からオープンAIの技術的能力に疑問を抱いていたが、マスク氏からも「AIに対する理解が非常に限られている」と批判されていた。

内部の検索大手は明らかに異なる見解を持っている。 「ChatGPT が解決する必要がある問題の多くは、検索が解決する必要がある問題であり、目的は同じであるため、これにより Baidu の立場が強化されるはずだと思います。」 「New Wise Leader Time」と呼ばれる最近のコラム インタビューで、Baidu は述べています。副社長兼検索プラットフォーム責任者のシャオ・ヤン氏が独自の判断を下した。 2004 年に Baidu に入社して以来、Xiao Yang は検索業界の 20 年間の発展を目の当たりにしてきました。

進化の観点から見ると、検索エンジンは情報取得効率の問題を解決するために生まれ、質問から回答までの最短経路をユーザーに提供します。以前は、アルゴリズムが登場するまでは、同様の検索タスクが「ブリタニカ百科事典」やインターネット イエロー ページなどの情報ツールによって実行されていました。

機械がタスクを実行するための前提条件は、検索ボックスの背後にあるニーズを「理解する」ことであるため、アルゴリズムにより検索エンジンは自然に AI 遺伝子を持つことができます。

ただ、段階が違えば、情報のマッチング方法が異なるだけです。

Xiao Yang の 2004 年の業界参入を例に挙げると、当時は検索エンジンはまだキーワード検索の時代で、ユーザーは図書館で本を検索するように検索ボックスにキーワードを入力し、正確に一致するものを見つける必要がありました。 Web ページのキーワードやコンテンツを常に変更することで、

当時、Baidu Search の PM も社内でコンペを開催し、目的の情報をより早く見つける方法を模索していました。

その後、ユーザーの要求はキーワード検索から質問へとどんどん強くなり、検索は非対称マッチング、つまりユーザーが質問すると、検索エンジンが専門家に相談するのと同じような答えが返ってくるものへと進化しました。たとえば、ユーザーが「明日の天気はどうですか?」と尋ねた場合、答えは「雷雨で短時間の強風が吹く」という可能性があります。この回答には質問と交差するキーワードはまったくありません。

このマッチング モードでは、検索エンジンがユーザーの質問とネットワーク全体のコンテンツの両方をより深く「理解」する必要があります。

これはおそらく、2013 年にバイドゥ、グーグル、マイクロソフトが、何としても「ディープラーニングの父」ジェフ・ヒントン教授の会社の買収入札に参加した理由を説明しているだろう。

当時、ヒントン教授はディープ ニューラル ネットワーク テクノロジーで大きな進歩を遂げたばかりで、検索大手はこのテクノロジーの可能性を嗅ぎつけた最初の企業グループでした。ディープ ラーニングは検索効率の向上に期待されています。今にして思えば、検索はディープ ラーニングの最も初期のアプリケーション ランディング シナリオも提供していました。 Baidu と Google はディープラーニングを導入した最初のテクノロジー巨人であり、Baidu Brain と Google Brain は後にトップの AI オープン プラットフォームになりました。

写真: ジェフ・ヒントン

2018 年から 2019 年にかけて、ディープ ラーニングが新たな急速な発展を迎え、検索エンジンのセマンティック変換は進化し続けています。 Google や Baidu などの検索大手の大きな言語モデルはますます大きくなり、モデルの機能もますます強化され、インテリジェントな検索エンジンのプロトタイプが形になりました。 Baidu を例に挙げると、2019 年に Wenxin Large Model 1.0 をリリースし、それ以来バージョン 2.0 と 3.0 を繰り返してきました。

これらの蓄積に基づいて、ChatGPT のリリース後、Google と Baidu はすぐに Bard と Wenxinyiyan をリリースすることができました。外部の世界では一夜にして成長したように見える大規模なモデル製品は、実際には検索大手による長年のビジネス慣行の産物です。

ChatGPTに脚光を奪われた後、GoogleのCEOサンダー・ピチャイ氏はインタビューで「実際、AIモデルは10年以上存在していた」と語った。

Baidu の創設者で会長兼 CEO の Li Yanhong 氏も、どの企業であっても、これほど大規模な言語モデル (Wen Xin Yi Yan) を数か月で作成することは不可能であると、公開演説で何度も強調しました。 「ディープラーニングと自然言語処理には何年もの継続と蓄積が必要であり、それを高速化する方法はありません。」

02 検索の変化

検索エンジンは今日まで発展し、世界最大の AI アプリケーション シナリオと成功したビジネス モデルになりました。

技術進化の観点から見ると、検索が大規模モデルによって覆されたと結論付けるのは難しいようです。狭義の検索が単なる「検索ボックス」である場合、広義の検索はユーザーの表現と機械のフィードバックのプロセスであり、検索ボックスとダイアログ ボックスは人間とコンピューターの相互作用の異なる形式にすぎません。

これは、Xiao Yang が GPT と検索エンジンは同じ目標を持っていると述べた理由の背後にある根本的な論理でもあります。検索にはマシュー効果があり、より多くのユーザー、テクノロジー、データ、およびコンピューティング能力を持つ企業は、より優れた製品効果を得ることができるため、大規模なモデルであっても、競争環境において主要な検索エンジンがより有利な立場に置かれることになります。

世界でローカル検索エンジンを持っているのは米国、中国、ロシア、韓国の 4 か国だけであるのも無理はありません。インターネットのインフラストラクチャとして、後発企業がこのパターンを覆すことは困難です。もちろん、EU は依然として悪を信じていません。2022 年には、Google に代わる EU 独自のオープン検索エンジンの構築に 5,800 万元を費やしましたが、それ以上の情報はまだありません。

基本の大型モデルも同様の特性を持っており、前を走る人はどんどん速く走っていきます。 「Baidu は片手に検索を持ち、もう一方の手には大規模モデルや生成 AI 技術を持っています。それは、イーティアン ソードとドラゴン サーベルを同時に持つようなものです。2 つの剣を組み合わせることで、より大きな価値が生まれます。」 Xiao Yang氏はまた、トップの検索エンジンがこれを理由に競争に手を緩めることはできず、ユーザーエクスペリエンスを急速に変える必要があると認めた。

「実際はとてもシンプルです。ユーザーを満足させればユーザーは残ります。ユーザーに満足させられると感じさせれば、新しいユーザーがやって来ます。ユーザーを不満にさせれば、ユーザーは離れていきます。」

Li Yanhong の言葉を借りれば、次のとおりです。ユーザーのニーズの表現を決して抑制してはなりません。

ユーザーの要求表現の高度化にはテクノロジーの高度化によってしか応えられません。生成AIの登場以前は、より口語的であいまいな表現が増えたり、画像や動画情報の検索需要が高まるなど、ユーザーのニーズを表現する方法はますます豊かかつ多様になってきました。

この点で、検索エンジン大手は、後の GPT-4 と同様に、意味論的推論モデルに基づいてクロスモーダル機能を強化しました。

大規模な言語モデルの出現により、検索エンジンもよりインテリジェントな段階に到達しました。つまり、検索エンジンは、ユーザーの話を聞いたり読んだり、理解できるようになりました。 Google では 100,000 件の答えが得られるが、図書館員なら最も正確な答えをくれる、という冗談がよく言われていました。現在、大規模なモデルにより、検索エンジンはより問題解決が可能になり、一般化された検索生成エクスペリエンスに向けて進化し始めています。

業界リーダーである Baidu が探索した最新の一連の道から、この進化傾向の始まりがわかります。

百度は自らを「ロールアップ」することで、社内の目に見えないOKRを検索する際の「非常に満足」の割合を高めた。

いわゆる極度の満足度は、ユーザーが質問した後、検索エンジンによって与えられる最初の答えが問題を解決できるかどうかを確認することです。

最初の答えはテキスト形式だけでなくビデオ形式でもあり、検索エンジンはビデオから重要な要約を抽出できます。たとえば、親が子供たちに絵を描くことを教えるアート漫画を見つけたい場合、これまでは閲覧、選別、判断、要約に時間を費やしていました。現在、Baidu Search はユーザーの複数の回答を分類し、各回答が言及された回数をマークできるようになり、各回答にはより豊富なコンテンツも含まれるため、保護者のエネルギーが大幅に節約されます。

もう 1 つの興味深い調査は、「権威ある回答」です。 ChatGPT の出現後、人々は衝撃を受け、すぐにそれが真面目な態度でナンセンスなことも話すことに気づきました。コンピュータの「幻想」の存在により、一部のコンテンツの信頼性に疑問が生じます。 Baidu 検索の新機能では、信頼性を高めるために書籍を引用して質問に直接回答できます。

ある質問をすると、検索エンジンがその質問がどの本に書かれているかを教えてくれて、さらに詳しく読んでくれるという、AI時代の図書館司書の役割に相当します。

Xiao Yang 氏は、Baidu 検索が「非常に満足」のデータに注目していることを明らかにしました。半年前には「最初の満足」の割合はわずか 40% でしたが、現在では 70% に達しています。そして、データの変化から判断すると、ユーザーは検索エクスペリエンスの向上に対して喜んでお金を払っていることがわかります。今年の初め以来、Baidu 検索には毎日 5,000 万件以上の新しい質問と回答が追加されています。

検索の世代間変化の一環として、聞いて見ることができる「AIパートナー」も重要な位置を占めています。 Baidu は、今年 5 月末のモバイル エコロジー カンファレンスで、「AI パートナー」を社内でテストできる能力を初めて実証しました。

オンサイトのデモ表示では、単なるチャットボットの対話インターフェイスではなく、ユーザーが回答の重要なポイントをマークしたり、信頼できる情報源を提供したり、文書の概要を要約したり、さまざまなツールやサービスの呼び出しをサポートしたり、画像や写真を作成したりすることもできます。ユーザーの意図に応じたコピーライティング。

この「AI パートナー」はまだ社内テスト段階であるとのことですが、ユーザーの多くのニーズがエンジニアを驚かせており、今後も「AI パートナー」の機能は進化していくことが予想されます。

しかし、将来がビル・ゲイツが予測したAIパーソナルアシスタントの時代に突入するかどうかは、最終的には検索エンジンと大規模モデルの統合の度合いにかかっています。この道は課題に満ちていますが、想像力によって黄金で舗装されています。

03 新しいストーリー

昨年のメディアでのやりとりで、シャオヤンはある質問について語った。「捜索が最後まで終わったら、何のために戦うのか?」

業界では、検索はインターネット分野で最も難しいビジネスの 1 つであると認識されており、単純な検索ボックスですが、非常にオープンなシステムでもあります。しかし、市場には挑戦者が不足することはありませんでした。過去2年間、ByteやHuaweiなどが関連ビジネスを積極的に展開してきた。当時、ChatGPT はまだ破壊的な変化をもたらしていませんでした。

当時の Xiao Yang の答えは、結局のところ、ユーザーの理解、テクノロジーへの投資、究極の検索を達成する能力のために戦わなければならない、というものでした。今日では、大規模なモデルのインテリジェンスが出現し、誰もが同時に究極の方向性を確認できるようになり、検索して経験を生み出し、さらには意思決定を支援することもできます。

こうした進化は、ユーザーの新たなニーズを刺激し続けています。

この大型モデルは、Baidu 検索に新たな物語をもたらします。これまで、Baidu はニーズの「出発点」にすぎず、ユーザーは情報を取得した後、他の Web サイトやアプリに移動して、電子商取引、地域生活、コンテンツ作成などのサービス シナリオを取得していました。

サービス価値を高めるために、Baidu は小規模プログラム、Baijiahao およびその他の製品のレイアウトを通じて検索コンテンツ エコロジーを継続的に充実させ、ユーザーがワンストップで問題を解決し、閉ループ サービスを享受できるようにしたいと考えています。世界の検索業界を見ると、この環境に優しい戦略的レイアウトには優れた価値があります。

しかし、大規模モデルが登場するまでは、ツール製品にはユーザーの粘着性や滞在時間の長さという課題があるため、理想的な環境に優しい閉ループを完成させるには、より長い時間と忍耐が必要になるでしょう。

大規模なモデルは、質問をし、答えを見つけ、意思決定を行うというプロセス全体を実行する閉ループの形成を加速し、その結果、検索エンジンは商業的な想像力をさらに高めることができます。これがいわゆる「二刀流合体」の商品価値なのだろう。

人工知能のより革新的なアプリケーションを統合した後、検索エンジンがより動的なエコシステムを構築する可能性があることはほぼ予見可能です。

百度などの企業が今年集中的に示した「武器庫」と「ロードマップ」から判断すると、検索の主役が転覆されることはなく、むしろ破壊的イノベーションの主要な参加者として技術変革を推進し続けるだろう。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)