私をプログラマーと呼ばないでください。私は「AI エンジニア」です、マスク氏: 自然言語プログラミングを開始します

巴比特_

2023-07-02 01:39:35

出典: ハート・オブ・ザ・マシン

**今後10年で最も需要が高い職業は「AIエンジニア」？ **

ChatGPTの登場後、人々は「あらゆる産業がAIによって再形成され、一部の仕事は代替され、一部の仕事は形を変えるだろう」と予測しました。 AIを構築するプログラマーとしての彼らのキャリアはどのようなものになるのでしょうか？

最近、事態はスペクトラムにあるようで、エンジニアや学者のグループが「AI エンジニア」という概念を呼びかけ、次のような多くの反応を受け取りました。

GPT-4 などの大規模な言語モデルの一般化と強力な機能により、私たちの働き方はすぐに AI を使った作業に変わる可能性があり、人工知能のペースに追いつくこと自体がフルタイムの仕事になります。

この「AIエンジニア」はフルスタックエンジニアと機械学習エンジニアの中間に位置し、バックエンドエンジニアの一角を占め、大規模なモデルの構築に注力すると言われています。現在はまだ定義段階にありますが、白熱した議論から判断すると、ChatGPT 革命の速度は非常に速いため、着陸はそう遠くないはずです。

このアイデアが出てくるとすぐに、AI 分野の大物たちがすぐにコメントしました。 OpenAI の科学者であり、テスラ社の元 AI および自動運転部門責任者である Andrej Karpathy 氏もこれに同意します。「大規模なモデルは、まったく新しい抽象化と専門化の層を作成します。これまで私はそれを『ヒントエンジニア』と呼んできましたが、今では単なるヒントの問題ではありません。」

さらに、彼は次の 4 つの主要な点を指摘しました。

これまでの機械学習の作業では通常、アルゴリズムをゼロからトレーニングする必要があり、その結果のパフォーマンスは通常限られていました。
大規模モデルのトレーニングは従来の機械学習とは大きく異なり、前者のシステムは負荷が大きいため、スーパーコンピューター上での Transformer の大規模トレーニングに重点を置くために新しい役割が分割されました。
数値的には、AI エンジニアの数は機械学習エンジニア/大規模モデルエンジニアの数よりもはるかに多い可能性があります。
この役割で成功するためにトレーニングは必要ありません。

それを読んだ後、マスク氏は次のようにも述べた。

このポジションは需要が高く、重要であり、参入障壁も低いため、刺激的でもあり、不安でもあります。

議論の中で、候補として「コグニティブエンジニア」や「AIシステムエンジニア」などの名前を挙げる人もいたが、NVIDIAのAI科学者ジム・ファン氏は、この新たな職業は従来のツール1.0から、ニューラルネットワーク 2.0、そして勾配アーキテクチャなしの 3.0 を経て、最終的に自己トレーニングの GPT シリーズのバージョン 4.0 を待ちました。

この点に関して、ウィスコンシン大学の助教授であるセバスチャン・ラシュカ氏は、これは一般アシスタントにのみ適しており、ほとんどの企業では「一般」は必要ないと述べた。

さまざまな名称や定義が挙げられていますが、この「AIエンジニア」とはどのような職種なのか見てみましょう。

私たちは、基本モデルやオープンソースの大規模モデルと API の画期的な機能によって促進される、応用 AI における 10 年に 1 度の変化を目の当たりにしています。

2013 年に研究チームが達成するのに 5 年の歳月を要した AI タスクは、2023 年には API、文書、そして余った午後だけが必要になります。

ただし、違いを生むのは細部です。AI の応用と製品化の課題には終わりがありません。

モデルには、最大の GPT-4 および Claude モデルから、オープンソースの Huggingface、LLaMA などのモデルまであります。
最も一般的なリンク、検索、ベクター検索ツール (LangChain、LlamaIndex、Pinecone など) から自律エージェントの新興分野 (Auto-GPT や BabyAGI など) までのツール。
技術的には、毎日提出される新しい論文、モデル、テクニックの数は、関心と資金によって指数関数的に増加しており、そのすべてを理解するのがほぼフルタイムの仕事になっているほどです。

この状況を真剣に受け止めるなら、フルタイムの仕事として考慮されるべきです。その結果、ソフトウェアエンジニアリングは、人工知能のアプリケーションに特化し、「サイト信頼性エンジニア」(SRE)、「DevOps エンジニア」、「データエンジニア」などの新興スタックを効果的に活用する新しい分野を生み出すことになります。「分析エンジニア」の登場。

この役割の真新しい (そしてあまり素晴らしくない) バージョンは、人工知能エンジニアであるようです。

すべてのスタートアップが AI の使用について話し合うための何らかの Slack チャネルを持っていることはわかっていますが、間もなくそれらのチャネルは非公式のグループから正式なチームに移行するでしょう。現在、何千人ものソフトウェアエンジニアが AI API と OSS モデルの作成に取り組んでおり、勤務時間中であろうと夜間や週末であろうと、社内の Slack や独立した Discord で、全員が AI エンジニアという 1 つの肩書きの下で専門化され、集中化されています。

これは、今後 10 年間で最も需要の高いエンジニアリングの仕事となる可能性があります。

AI エンジニアは、Microsoft や Google などのテクノロジー大手から、Figma、Vercel、Notion などの大手スタートアップ企業、Simon Willison、Pieter Levels、Riley Goodside などの独立系開発者まで、どこにでもいます。彼らは、Anthropic でのエンジニアリング業務で年間 30 万ドルを稼ぎ、OpenAI でソフトウェアを構築して年間 90 万ドルを稼いでいます。彼らは自由な週末をAGI Houseでアイデアを熟考し、Redditの/r/LocalLLaMAサブレディットでヒントを共有して過ごします。

これらすべてに共通しているのは、人工知能の進歩を、ほぼ一夜にして何百万人もの人々が使用する実用的な製品に変換する能力です。そして、その中には博士号の称号はありません。 AI 製品を提供する場合、研究者ではなくエンジニアが必要です。

AI エンジニアと ML エンジニアの大逆転

Indeed ウェブサイト上の一連のデータによると、機械学習エンジニアのポジションの数は AI エンジニアの 10 倍ですが、それに比べて AI 分野の成長率は速く、これは逆転が起こり、AI エンジニアの数は ML エンジニアの数倍になるでしょう。

HN Who's Hiring (雇用主が求人情報を投稿するためのプラットフォームを提供する Hacker News の毎月の投稿) カテゴリ別の月間雇用動向

AI と ML の違いに関する議論は終わりがありませんが、慎重です。また、AI ソフトウェアは一般のソフトウェアエンジニアでも構築できることもわかっています。しかし、最近、議論は別の問題を中心に展開しています。つまり、Hacker News の人気スレッド「AI エンジニアリングに参入する方法」が広く関心を集めています。この人気の投稿は、依然として市場に存在する基本的な制限原理も示しています。各ポジション間の距離はまだ非常に良好です。

*Hacker News の 2023 年 6 月の投稿のスクリーンショット: 「AI エンジニアリングに参加する方法」のトップ投票回答。 *

これまで、多くの人が AI エンジニアリングを ML エンジニアリングまたはデータエンジニアリングの一形態として考えていたため、誰かがその分野に参入する方法を尋ねると、上記の回答のように、同じ前提条件を推奨する傾向がありました。多くの人は Andrew Ng の Coursera を勧めますコース。しかし、これらの有能な AI エンジニアの中に、Coursera の Wu Enda のコースを完了した人は一人もおらず、PyTorch に精通しておらず、Data Lake と Data Warehouse の違いも知りません。

近い将来、フォードモデル T の設計図を読んで運転を学び始めるのと同じように、Transformer の論文「注意こそが必要だ」を読んで AI エンジニアリングを学び始めようと提案する人は誰もいないでしょう。もちろん、テクノロジーの基礎と歴史的発展を理解することは役立ち、思考と効率を向上させる方法を見つけるのに役立ちます。しかし、実際に製品を使用して、実際の体験を通じてその特性を学ぶこともできます。

AI エンジニアと ML エンジニアの逆転は一夜にして起こるものではありません。また、データサイエンスと機械学習の優れた背景を持つ人にとって、エンジニアリングと AI エンジニアリングは長い間良いものとは思えないかもしれません。しかし、時間の経過とともに、需要と供給の経済学が普及し、AI エンジニアリングに対する人々の見方も変化するでしょう。

なぜAIエンジニアが台頭するのか？

モデルレベルでは、多くの基本モデルが強力なコンテキスト学習とゼロサンプル転送機能を備えた少数ショット学習器となり、モデルのパフォーマンスがトレーニングモデルの当初の意図を超えることがよくあります。言い換えれば、これらのモデルを作成する人は、モデルの機能の範囲を完全には理解していません。また、LLM (大規模言語モデル) の専門家でない人でも、モデルをさらに操作し、研究で過小評価されている領域にモデルを適用することで、これらの機能を発見して活用できます。

人材レベルでは、Microsoft、Google、Meta、および大規模な基礎モデル研究所が希少な研究人材を独占しており、「サービスとしての AI 研究」のための API を提供しています。この種の研究者を雇うことはできないかもしれませんが、彼らのサービスを借りることはできます。現在、世界中に約 5,000 人の LLM 研究者と 5,000 万人のソフトウェアエンジニアがいます。この供給制約により、人材の需要を満たすために「中間」カテゴリーの AI エンジニアが台頭することが予想されます。

ハードウェアレベルでは、大手テクノロジー企業や機関が GPU を大量に買いだめしており、もちろん OpenAI と Microsoft が最初に買い占めましたが、Stability AI は 4,000 個の GPU クラスターを強調することで、スタートアップ向けの GPU 競争を開始しました。

さらに、Inflection (13 億ドル)、Mistral (1 億 1,300 万ドル)、Reka (5,800 万ドル)、Poolside (2,600 万ドル)、Contextual (2,000 万ドル) などのいくつかの新興スタートアップ企業は、自社を所有するためのシードラウンドで巨額の資金調達を開始しています。独自のハードウェア設備。

米国のテクノロジー企業幹部で投資家のナット・フリードマン氏は、投資先のスタートアップのサポートに特化した10エクサフロップスの計算能力を備えた1億ドル規模のGPUクラスターであるアンドロメダ構想も発表した。 API 環境の反対側では、より多くの AI エンジニアがモデルをトレーニングするだけでなく、モデルを使用できるようになります。

効率の面では、単一のドメイン固有のモデルをトレーニングして本番環境に導入する前に、データサイエンティストや機械学習エンジニアに面倒なデータ収集を実行させる代わりに、プロダクトマネージャーやソフトウェアエンジニアは、LLM と対話することで製品のアイデアを構築および検証できます。

後者 (データ、ML エンジニア) の数が前者 (AI エンジニア) の数を 100 ～ 1000 倍上回り、LLM と対話して作業する方法により、従来の機械学習よりも 10 ～ 100 倍高速化できるとします。その結果、AI エンジニアは以前より 10,000 倍のコストで AI 製品を検証できるようになります。

ソフトウェアレベルでは、Python から Java への変更が行われます。データと AI の世界は、LangChain、LlamaIndex、Guardrails などの最初の AI エンジニアリングツールと同様に、伝統的に Python を中心にしてきました。ただし、Java 開発者は少なくとも Python 開発者と同数存在するはずなので、LangChain.js や Transformers.js から Vercel の新しい AI SDK に至るまで、ツールはこの方向にますます拡張されています。 Java の市場全体の規模と機会は印象的です。

サブグループがまったく異なる背景を持ち、まったく異なる言語を話し、まったく異なる製品を作り、まったく異なるツールを使用するたびに、最終的には独自のグループに分裂することになります。

ソフトウェア 2.0 からソフトウェア 3.0 への進化におけるコードの役割

6 年前、Andrej Karpathy 氏は Software 2.0 について説明する非常に影響力のある記事を書き、論理を正確にモデル化する手書きのプログラミング言語の古典的なスタックと、近似論理機械学習ニューラルネットワークの新しいスタックを対比させました。この記事では、ソフトウェアは人間がモデル化できるよりも多くの問題を解決できることを示しています。

今年、カルパシー氏は続けて、最も注目されている新しいプログラミング言語は英語であると投稿しました。生成型 AI からのヒントは、多くの場合英語で人間が設計したコードとして理解され、LLM によって解釈され、最終的には彼のグラフのギャップを埋めることができるからです。灰色の領域。

*注意: ソフトウェア 1.0 のクラシックスタック (ソフトウェア 1.0) は、Python、C++、およびその他の言語で書かれています。ソフトウェア 2.0 はニューラルネットワークの重みを使用して作成されましたが、重みが多数あるため、このコードの作成プロセスには誰も関与していませんでした。 *

昨年、エンジニアリングが人気のトピックとなり、人々は GPT-3 と安定拡散を仕事に適用し始めました。人々は AI スタートアップが OpenAI ラッパーであることを嘲笑し、ヒントインジェクションやリバースヒントエンジニアリングに対する LLM アプリケーションの脆弱性を心配しています。

しかし、2023 年の非常に重要なテーマは、2 億米ドルを超える巨大なラングチェーンから Nvidia が支援するボイジャーに至るまで、人間によって書かれたコードの役割を再確立することであり、コードの生成と再利用の重要性を示しています。エンジニアリングは過大評価され、根強いものですが、ソフトウェア 3.0 アプリケーションにおけるソフトウェア 1.0 パラダイムの再出現は、数多くのスタートアップにとって大きなチャンスであると同時に新たなスペースでもあります。

人間のエンジニアがAIを活用することを学び、AIがエンジニアリングの仕事をますます引き継いでいくと、将来振り返ってみると、両者の違いを見分けるのが難しくなるでしょう。