Bana programcı deme, ben bir "AI mühendisiyim", Musk: Doğal dil programlamaya başla

2023-07-02 01:39:35

Kaynak: Makinenin Kalbi

**Önümüzdeki on yılda en çok talep gören meslek "Yapay zeka mühendisi" mi? **

ChatGPT'nin ortaya çıkmasından sonra, insanlar "tüm sektörlerin yapay zeka tarafından yeniden şekillendirileceğini", bazı işlerin yerini alacağını ve bazı işlerin de şekil değiştireceğini öngördü. AI oluşturan programcılar olarak kariyerleri nasıl olacak?

Bir grup mühendis ve akademisyen, "AI mühendisi" kavramını seslendi ve birçok yanıt aldı:

GPT-4 gibi büyük dil modellerinin genelleştirme ve güçlü yetenekleri nedeniyle, çalışma şeklimiz yakında yapay zeka ile çalışmaya dönüşebilir ve yapay zekanın hızına ayak uydurmak başlı başına tam zamanlı bir iştir.

Bu "AI mühendisinin" tam yığın mühendis ile makine öğrenimi mühendisi arasında olduğu, arka uç mühendisinin bir kısmını işgal ettiği ve büyük modellerin yapımına odaklandığı söyleniyor. Şimdi hala tanım aşamasında, ancak hararetli tartışmalara bakılırsa, inişten çok uzak olmamalı, sonuçta ChatGPT devriminin hızı çok hızlı.

Fikir ortaya çıkar çıkmaz, yapay zeka alanındaki büyük V'ler hemen yorum yaptı. Bir OpenAI bilim adamı ve Tesla'nın eski AI ve otonom sürüş başkanı Andrej Karpathy de aynı fikirde. "Büyük modeller tamamen yeni bir soyutlama ve uzmanlık katmanı yaratıyor, şimdiye kadar buna 'ipucu mühendisleri' adını verdim, ama şimdi mesele sadece bir ipucu meselesi değil."

Ayrıca dört ana noktaya işaret etti:

Geçmişteki makine öğrenimi çalışmaları, genellikle sıfırdan eğitim algoritmaları içeriyordu ve sonuçların performansı genellikle sınırlıydı.
Büyük ölçekli model eğitimi, geleneksel makine öğreniminden çok farklıdır. Eski sistemin büyük bir iş yükü vardır ve süper bilgisayarlarda büyük ölçekli Transformer eğitimine odaklanmak için yeni bir rol bölünmüştür.
Sayısal olarak, yapay zeka mühendislerinin sayısı, makine öğrenimi mühendislerinin/büyük model mühendislerinin sayısından çok daha fazla olabilir.
Bu rolde başarılı olmak için herhangi bir eğitime ihtiyacınız yok.

Okuduktan sonra Musk şunları da söyledi:

Pozisyon yüksek talep görüyor, önemli ve giriş engelleri düşük, heyecan verici ve endişeli görünüyor.

Tartışma sırasında bazı kişiler aday olarak "bilişsel mühendis" ve "AI sistem mühendisi" gibi isimler de önerdi. Nvidia AI bilim adamı Jim Fan, bu yeni ortaya çıkan mesleğin "gradyan olmayan mühendis" olarak adlandırılması gerektiğine inanıyor - geleneksel araçlar 1.0'dan , nöral ağ 2.0 ve ardından gradyan mimarisi olmayan 3.0'a, nihayet GPT kendi kendine eğitim serisi 4.0 sürümünü bekledik.

Bu konuda Wisconsin Üniversitesi'nde yardımcı doçent olan Sebastian Raschka, bunun yalnızca genel asistanlar için uygun olduğunu ve çoğu işletme için "genel" e ihtiyacınız olmadığını söyledi.

Pek çok isim ve tanım verildi, bakalım bu "Yapay Zeka mühendisi" nasıl bir konum?

Temel modellerin ve açık kaynaklı büyük modellerin ve API'lerin çığır açan yetenekleriyle desteklenen, uygulamalı yapay zekada on yılda bir görülen bir değişime tanık oluyoruz.

2013'te beş yıl süren yapay zeka görevleri ve bir araştırma ekibinin tamamlaması için artık yalnızca API'ler, belgeler ve 2023'te boş bir öğleden sonra gerekiyor.

Ancak, farkı yaratan ayrıntılardır - yapay zekayı uygulama ve ürünleştirmenin zorlukları sonsuzdur:

Model üzerinde en büyük GPT-4 ve Claude modelinden, açık kaynak Huggingface, LLaMA ve diğer modellere kadar;
En popüler bağlama, geri alma ve vektör arama araçlarından (LangChain, LlamaIndex ve Pinecone gibi) gelişmekte olan otonom aracılara (Auto-GPT ve BabyAGI gibi) kadar araçlar;
Teknik olarak, her gün sunulan yeni makalelerin, modellerin ve tekniklerin sayısı ilgi ve finansmanla katlanarak arttı ve hepsini anlamak neredeyse tam zamanlı bir iş haline geldi.

Bu durum ciddiye alınırsa tam zamanlı bir iş olarak kabul edilmelidir. Sonuç olarak, yazılım mühendisliği, "Site Güvenilirlik Mühendisleri" (SRE'ler), "DevOps Mühendisleri", "Veri Mühendisleri" gibi yapay zekanın uygulanmasına adanmış ve ortaya çıkan yığını etkin bir şekilde kullanan yeni bir alt disiplin ortaya çıkaracak ve aynısı "analitik mühendislerin" ortaya çıkışı.

Bu rolün yepyeni (ve en az harika) versiyonu şuna benziyor: yapay zeka mühendisi.

Her girişimin yapay zeka kullanımını tartışmak için bir tür Slack kanalı olduğunu biliyoruz ve yakında bu kanallar resmi olmayan gruplardan resmi ekiplere geçiş yapacak. Binlerce yazılım mühendisi şu anda yapay zeka API'lerini ve OSS modellerini, ofis saatlerinde veya akşamları ve hafta sonları, kurumsal Slacks'te veya bağımsız Discord'larda tek bir başlık altında profesyonelleştirilmiş ve merkezileştirilmiş olarak üretmek için çalışıyor: AI mühendisi.

Bu muhtemelen önümüzdeki on yılda en çok talep gören mühendislik işi olacak.

AI mühendisleri, Microsoft ve Google gibi teknoloji devlerinden Figma, Vercel ve Notion gibi önde gelen girişimlere ve Simon Willison, Pieter Levels ve Riley Goodside gibi bağımsız geliştiricilere kadar her yerde bulunabilir. Anthropic'teki mühendislik uygulamaları için yılda 300.000 dolar ve OpenAI'de yazılım geliştirmek için yılda 900.000 dolar kazanıyorlar. Boş hafta sonlarını AGI House'da fikirler üzerinde kafa yorarak ve Reddit'te /r/LocalLLaMA alt dizininde ipuçları paylaşarak geçiriyorlar.

Hepsinin ortak noktası, yapay zekadaki gelişmeleri neredeyse bir gecede milyonlarca insan tarafından kullanılan pratik ürünlere çevirebilme yeteneğidir. Ve içinde bir doktora unvanı görmüyorsunuz. Yapay zeka ürünleri sunarken araştırmacılara değil, mühendislere ihtiyacınız var.

Yapay zeka mühendisleri ve makine öğrenimi mühendislerinin büyük değişimi

Indeed web sitesinde yer alan bir dizi veri, makine öğrenimi mühendislerinin pozisyon sayısının yapay zeka mühendislerinin 10 katı olduğunu ancak buna kıyasla yapay zeka alanındaki büyüme oranının daha hızlı olduğunu gösteriyor ve bunun daha da artacağı tahmin ediliyor. orantı beş yıl içinde olacak Tersine çevirme gerçekleşir ve makine öğrenimi mühendislerinin sayısından kat kat fazla yapay zeka mühendisi olacaktır.

HN Who's Hiring (işverenlerin iş ilanlarını yayınlamaları için bir platform sağlayan Hacker News'te aylık bir gönderidir) Kategoriye Göre Aylık İstihdam Eğilimleri

Yapay zeka ve makine öğrenimi arasındaki farklar hakkındaki tartışma bitmek bilmese de ihtiyatlı oldu. Yapay zeka yazılımının sıradan yazılım mühendisleri tarafından oluşturulabileceğini de biliyoruz. Ancak son zamanlarda tartışmalar başka bir konu etrafında dönüyor, yani Hacker News'teki popüler bir başlık olan "Yapay zeka mühendisliğine nasıl girilir" geniş bir ilgi uyandırdı. Bu popüler gönderi aynı zamanda piyasada hala var olan temel sınırlama ilkelerini de gösteriyor. her pozisyon arasında hala çok iyi.

*Hacker News'teki Haziran 2023 gönderisinin ekran görüntüsü: "Yapay Zeka Mühendisliğine Nasıl Girilir" En Çok Oylanan Yanıtlar. *

Şimdiye kadar birçok kişi yapay zeka mühendisliğini makine öğrenimi mühendisliğinin veya veri mühendisliğinin bir biçimi olarak düşündü, bu nedenle birileri bir alana nasıl girileceğini sorduğunda, yukarıdaki yanıtlarda olduğu gibi aynı ön koşulları önerme eğilimindeler, birçok kişi Andrew Ng'nin Coursera'sını tavsiye ediyor kurs. Ancak bu etkili AI mühendislerinden hiçbiri Wu Enda'nın Coursera kursunu tamamlamadı, PyTorch'a aşina değiller ve Data Lake (Data Lake) ile Data Warehouse (Data Warehouse) arasındaki farkı bilmiyorlar.

Yakın gelecekte hiç kimse, sizin Model T Ford'un planlarını okuyarak araba kullanmayı öğrenmeye başlamayacağınız gibi, Transformer'ın "Dikkat Tek İhtiyacınız Olan Tek Şeydir" makalesini okuyarak yapay zeka mühendisliğini öğrenmeye başlamanızı önermeyecektir. Elbette, düşüncenizi ve verimliliğinizi geliştirmenin yollarını bulmanıza yardımcı olabilecek teknolojinin temellerini ve tarihsel gelişimini anlamak yararlıdır. Ancak bazen ürünleri, özelliklerini pratik deneyim yoluyla öğrenmek için de kullanabilirsiniz.

Yapay zeka mühendisleri ve makine öğrenimi mühendislerinin tersine dönmesi bir gecede olmayacak ve iyi bir veri bilimi ve makine öğrenimi geçmişi olan biri için mühendislik ve yapay zeka mühendisliği uzun süre iyi görünmeyebilir. Bununla birlikte, zamanla talep ve arz ekonomisi hakim olacak ve insanların yapay zeka mühendisliğine ilişkin görüşleri değişecektir.

Yapay zeka mühendisleri neden yükselecek?

Model düzeyinde, birçok temel model artık güçlü bağlam öğrenimi ve sıfır örnek aktarım yetenekleri ile az sayıda öğrenen modeldir.Modelin performansı genellikle eğitim modelinin orijinal amacını aşar. Başka bir deyişle, bu modelleri oluşturan kişiler, modellerin yeteneklerinin kapsamını tam olarak bilmiyorlar. LLM (Büyük Dil Modeli) uzmanı olmayanlar da, modelle daha fazla etkileşim kurarak ve araştırma tarafından hafife alınan alanlara uygulayarak bu yetenekleri keşfedebilir ve kullanabilir.

Yetenek düzeyinde, Microsoft, Google, Meta ve büyük temel model laboratuvarları, kıt araştırma yeteneklerini tekelleştirdi ve "hizmet olarak yapay zeka araştırması" için API'ler sağlıyorlar. Bu tür bir araştırmacıyı işe alamayabilirsiniz, ancak hizmetlerini kiralayabilirsiniz. Şu anda dünya çapında yaklaşık 5.000 LLM araştırmacısı ve 50 milyon yazılım mühendisi var. Bu tedarik kısıtlaması, "orta" kategorideki yapay zeka mühendislerinin yetenek talebini karşılamak için yükseleceğini zorunlu kılıyor.

Donanım düzeyinde, büyük teknoloji şirketleri ve kurumları büyük miktarlarda GPU stokladı.Tabii bunu ilk yapan OpenAI ve Microsoft oldu, ancak Stability AI, 4.000 GPU kümesini vurgulayarak yeni başlayanlar için GPU rekabetini başlattı.

Buna ek olarak, Inflection (1,3 Milyar Dolar), Mistral (113 Milyon Dolar), Reka (58 Milyon Dolar), Havuz Kenarı (26 Milyon Dolar) ve Contextual (20 Milyon Dolar) gibi bazı yeni girişimler, genellikle büyük meblağlar toplamaya başladılar. Kendi donanım tesisleri.

ABD teknoloji yöneticisi ve yatırımcı Nat Friedman, yatırım yaptığı girişimleri desteklemeye adanmış 10 exaflop bilgi işlem gücüne sahip 100 milyon dolarlık bir GPU kümesi olan Andromeda girişimini bile duyurdu. API manzarasının diğer tarafında, daha fazla yapay zeka mühendisi modelleri yalnızca eğitmekle kalmayıp kullanabilecek.

Verimlilik açısından, veri bilimcilerin ve makine öğrenimi mühendislerinin, alana özgü tek bir modeli eğitmeden ve onu üretime geçirmeden önce sıkıcı veri toplama işlemini gerçekleştirmesini gerektirmek yerine, ürün yöneticileri ve yazılım mühendisleri, LLM ile etkileşim kurarak ürün fikirleri oluşturabilir ve doğrulayabilir.

Diyelim ki ikincisi (veri, makine öğrenimi mühendisleri) öncekinden (AI mühendisleri) 100 ila 1000 kat daha fazla ve LLM ile etkileşim kurarak çalışma şekliniz sizi geleneksel makine öğreniminden 10 ila 100 kat daha hızlı hale getirecek. Sonuç olarak, yapay zeka mühendisleri, yapay zeka ürünlerini öncekinden 10.000 kat daha ucuza doğrulayabilecek.

Yazılım düzeyinde, Python'dan Java'ya geçişler olacaktır. LangChain, LlamaIndex ve Guardrails gibi ilk yapay zeka mühendislik araçları gibi veri ve yapay zeka dünyası da geleneksel olarak Python'un etrafında toplanmıştır. Bununla birlikte, en az Python geliştiricileri kadar Java geliştiricisi olmalıdır, bu nedenle araçlar, LangChain.js ve Transformers.js'den Vercel'in yeni AI SDK'sına kadar bu yönde giderek genişliyor. Pazarın genel boyutu ve Java fırsatı etkileyici.

Ne zaman bir alt grup tamamen farklı bir geçmişe sahip olarak ortaya çıksa, tamamen farklı bir dil konuşsa, tamamen farklı bir ürün yapsa, tamamen farklı bir araç kullansa, sonunda kendi gruplarına bölünürler.

Yazılım 2.0'dan yazılım 3.0'a geçişte kodun rolü

6 yıl önce, Andrej Karpathy, mantığı doğru bir şekilde modelleyen klasik el yazısı programlama dilleri yığınlarını yeni yaklaşık mantık makine öğrenimi sinir ağları yığınlarıyla karşılaştıran Software 2.0'ı açıklayan çok etkili bir makale yazdı. Makale, yazılımın insanların modelleyebileceğinden çok daha fazla sorunu çözebileceğini gösteriyor.

Bu yıl Karpathy, en yeni programlama dilinin İngilizce olduğunu, çünkü üretici yapay zekadan gelen ipuçlarının insan tarafından tasarlanmış kod olarak anlaşılabileceğini ve çoğu durumda İngilizce olarak anlaşılabileceğini ve LLM'ler tarafından yorumlanabileceğini ve sonunda çizelgesindeki boşlukları doldurduğunu bildirdi. gri alan.

*Not: Klasik Yazılım 1.0 yığını (Yazılım 1.0) Python, C++ ve diğer dillerde yazılmıştır. Yazılım 2.0, sinir ağı ağırlıkları kullanılarak yazılmıştır ve pek çok ağırlık olduğu için bu kodu yazma sürecine kimse dahil olmamıştır. *

Geçen yıl Mühendislik popüler bir konu haline geldi ve insanlar çalışmak için GPT-3 ve Stable Difusion'ı uygulamaya başladı. İnsanlar yapay zeka girişimlerini OpenAI paketleyicileri olarak alay ediyor ve LLM uygulamalarının ipucu enjeksiyonu ve ters ipucu mühendisliğine karşı savunmasızlığından endişe ediyor.

Ancak 2023'teki çok önemli bir tema, 200 milyon ABD dolarını aşan dev Langchain'den Nvidia tarafından desteklenen Voyager'a kadar insanlar tarafından yazılan kodun rolünün yeniden tesis edilmesiyle ilgili olup, kod oluşturma ve yeniden kullanmanın önemini göstermektedir. Mühendislik hem abartılı hem de ısrarcı, ancak Software 1.0 paradigmasının Software 3.0 uygulamalarında yeniden ortaya çıkması hem büyük bir fırsat hem de çok sayıda girişim için yeni bir alan:

İnsan mühendisler yapay zekayı kullanmayı öğrendikçe ve yapay zeka mühendislik işlerini giderek daha fazla devraldıkça, gelecekte geriye dönüp baktığımızda ikisi arasındaki farkı söylemek zor olacak.

Referans içeriği:

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Reward
like
Comment
Share

Comment

0/400

No comments

Topic
1/3
1Alpha Points System Opens
19229 Popularity
2Crypto Market Rebound
147568 Popularity
3SEC Crypto Project
3026 Popularity
4CandyDrop Airdrop Event 6.0
96166 Popularity
5White House Crypto Report
81750 Popularity

sitemap

Bana programcı deme, ben bir "AI mühendisiyim", Musk: Doğal dil programlamaya başla

Yapay zeka mühendisleri ve makine öğrenimi mühendislerinin büyük değişimi

**Yapay zeka mühendisleri neden yükselecek? **

Yazılım 2.0'dan yazılım 3.0'a geçişte kodun rolü

Yapay zeka mühendisleri neden yükselecek?