Đừng gọi tôi là lập trình viên, tôi là "kỹ sư AI", Musk: Bắt đầu lăn lộn lập trình ngôn ngữ tự nhiên

Nguồn: Trái Tim Máy

**Nghề có nhu cầu cao nhất trong 10 năm tới là "kỹ sư AI"? **

Sau khi ChatGPT xuất hiện, mọi người đã dự đoán rằng "tất cả các ngành sẽ được định hình lại bởi AI", một số công việc sẽ được thay thế và một số công việc sẽ thay đổi hình thức. Sự nghiệp của họ sẽ như thế nào với tư cách là những lập trình viên xây dựng AI?

Gần đây, mọi thứ dường như đang trở nên phổ biến, một nhóm kỹ sư và học giả đã đưa ra khái niệm "kỹ sư AI" và nhận được nhiều phản hồi:

Do tính khái quát và khả năng mạnh mẽ của các mô hình ngôn ngữ lớn như GPT-4, cách chúng ta làm việc có thể sớm thay đổi sang làm việc với AI và bản thân việc theo kịp tốc độ của trí tuệ nhân tạo đã là một công việc toàn thời gian.

Người ta nói rằng "kỹ sư AI" này nằm giữa kỹ sư toàn diện và kỹ sư máy học, chiếm một phần của kỹ sư phụ trợ và tập trung vào việc xây dựng các mô hình lớn. Bây giờ nó vẫn đang trong giai đoạn định nghĩa, nhưng xét từ các cuộc thảo luận sôi nổi, nó sẽ không còn xa nữa, xét cho cùng, tốc độ của cuộc cách mạng ChatGPT là quá nhanh.

Ngay khi ý tưởng được đưa ra, các Vs lớn trong lĩnh vực AI đã nhanh chóng bình luận. Andrej Karpathy, một nhà khoa học OpenAI và là cựu giám đốc AI và lái xe tự động tại Tesla, đồng ý. "Các mô hình lớn tạo ra một lớp trừu tượng và chuyên môn hóa hoàn toàn mới, cho đến nay tôi vẫn gọi nó là 'kỹ sư gợi ý', nhưng giờ đây không chỉ là vấn đề gợi ý."

Ngoài ra, ông chỉ ra bốn điểm chính:

  • Công việc học máy trước đây thường bao gồm các thuật toán đào tạo từ đầu và kết quả thường có hiệu suất hạn chế.
  • Đào tạo mô hình quy mô lớn rất khác với học máy truyền thống, hệ thống cũ có khối lượng công việc lớn và vai trò mới đã được phân chia để tập trung vào đào tạo Transformer quy mô lớn trên siêu máy tính.
  • Về số lượng, số lượng kỹ sư AI có thể cao hơn nhiều so với kỹ sư máy học/kỹ sư mô hình lớn.
  • Bạn không cần bất kỳ khóa đào tạo nào để thành công trong vai trò này.

Sau khi đọc nó, Musk cũng nói:

Vị trí đang có nhu cầu cao, quan trọng và ít rào cản gia nhập. Có vẻ thú vị và lo lắng.

Trong cuộc thảo luận, một số người cũng đề xuất những cái tên như "kỹ sư nhận thức" và "kỹ sư hệ thống AI" Nhà khoa học AI của Nvidia, Jim Fan, tin rằng nghề mới nổi này nên được gọi là "kỹ sư không có độ dốc" - từ các công cụ truyền thống 1.0, đến mạng thần kinh 2.0, rồi đến 3.0 không có kiến trúc gradient, cuối cùng chúng tôi đã chờ đợi phiên bản 4.0 của loạt bài tự đào tạo GPT.

Về vấn đề này, Sebastian Raschka, trợ lý giáo sư tại Đại học Wisconsin, cho rằng điều này chỉ phù hợp với các trợ lý chung, còn đối với hầu hết các doanh nghiệp, bạn không cần "tướng".

Có rất nhiều tên gọi và định nghĩa được đưa ra, chúng ta hãy cùng xem “kỹ sư AI” này là vị trí như thế nào?

Chúng ta đang chứng kiến sự thay đổi một lần trong thập kỷ của AI ứng dụng, được thúc đẩy bởi khả năng đột phá của các mô hình cơ bản cũng như các mô hình và API lớn nguồn mở.

Các nhiệm vụ AI đã mất 5 năm và một nhóm nghiên cứu để hoàn thành vào năm 2013 giờ chỉ cần API, tài liệu và một buổi chiều rảnh rỗi vào năm 2023.

Tuy nhiên, chính những chi tiết tạo nên sự khác biệt – những thách thức trong việc áp dụng và sản xuất AI là vô tận:

  • Về mô hình, có từ mô hình GPT-4 và Claude lớn nhất, đến mã nguồn mở Huggingface, LLaMA và các mô hình khác;
  • Các công cụ, từ các công cụ liên kết, lập chỉ mục và tìm kiếm vector phổ biến nhất (chẳng hạn như LangChain, LlamaIndex và Pinecone) đến lĩnh vực tác nhân tự trị mới nổi (chẳng hạn như Auto-GPT và BabyAGI);
  • Về mặt kỹ thuật, số lượng bài báo, mô hình và kỹ thuật mới được gửi mỗi ngày đã tăng theo cấp số nhân cùng với sự quan tâm và tài trợ, đến mức việc hiểu tất cả về nó gần như trở thành một công việc toàn thời gian.

Nếu tình trạng này được coi là nghiêm túc, nó nên được coi là một công việc toàn thời gian. Do đó, công nghệ phần mềm sẽ tạo ra một phân ngành mới dành riêng cho ứng dụng trí tuệ nhân tạo và sử dụng hiệu quả ngăn xếp mới nổi, như "Kỹ sư độ tin cậy của trang web" (SRE), "Kỹ sư DevOps", "Kỹ sư dữ liệu" và Điều tương tự cũng đúng đối với sự xuất hiện của các "kỹ sư phân tích".

Phiên bản hoàn toàn mới (và ít tuyệt vời nhất) của vai trò này dường như là: kỹ sư trí tuệ nhân tạo.

Chúng tôi biết rằng mọi công ty khởi nghiệp đều có một số loại kênh Slack để thảo luận về việc sử dụng AI và các kênh đó sẽ sớm chuyển từ các nhóm không chính thức sang các nhóm chính thức. Hàng nghìn kỹ sư phần mềm hiện đang làm việc để sản xuất các mô hình OSS và API AI, cho dù trong giờ hành chính hay buổi tối và cuối tuần, trong Slacks của công ty hay Discords độc lập, tất cả đều được chuyên nghiệp hóa và tập trung dưới một chức danh: kỹ sư AI.

Đây có thể là công việc kỹ thuật có nhu cầu cao nhất trong thập kỷ tới.

Các kỹ sư AI sẽ được tìm thấy ở khắp mọi nơi, từ những gã khổng lồ công nghệ như Microsoft và Google, đến những công ty khởi nghiệp hàng đầu như Figma, Vercel và Notion, cho đến những nhà phát triển độc lập như Simon Willison, Pieter Levels và Riley Goodside. Họ kiếm được 300.000 đô la một năm cho hoạt động kỹ thuật của mình tại Anthropic và 900.000 đô la một năm cho việc xây dựng phần mềm tại OpenAI. Họ dành những ngày cuối tuần rảnh rỗi để cân nhắc các ý tưởng tại AGI House và chia sẻ các mẹo trên subreddit /r/LocalLLaMA trên Reddit.

Điểm chung của tất cả chúng là khả năng biến những tiến bộ trong trí tuệ nhân tạo thành các sản phẩm thực tế được sử dụng bởi hàng triệu người gần như chỉ sau một đêm. Và trong đó, bạn không thấy có chức danh Tiến sĩ. Khi cung cấp các sản phẩm AI, bạn cần các kỹ sư chứ không phải các nhà nghiên cứu.

Sự đảo ngược lớn của các kỹ sư AI và kỹ sư ML

Một bộ số liệu trên trang web Indeed cho thấy số lượng vị trí kỹ sư máy học gấp 10 lần kỹ sư AI, nhưng nếu so sánh thì tốc độ tăng trưởng trong lĩnh vực AI nhanh hơn, và người ta dự đoán rằng tỷ lệ này sẽ trong vòng 5 năm. Sự đảo ngược xảy ra và sẽ có số lượng kỹ sư AI nhiều gấp nhiều lần so với kỹ sư ML.

HN Who's Hiring (là bài đăng hàng tháng trên Hacker News cung cấp nền tảng cho nhà tuyển dụng đăng tin tuyển dụng) Xu hướng Việc làm Hàng tháng theo Danh mục

Cuộc tranh luận về sự khác biệt giữa AI và ML là vô tận, nhưng vẫn thận trọng. Chúng tôi cũng biết rằng phần mềm AI có thể được xây dựng bởi các kỹ sư phần mềm thông thường. Tuy nhiên, gần đây, các cuộc thảo luận đã xoay quanh một vấn đề khác, đó là một chủ đề phổ biến trên Hacker News "Làm thế nào để tham gia vào kỹ thuật AI" đã thu hút sự quan tâm rộng rãi. Bài đăng phổ biến này cũng minh họa các nguyên tắc giới hạn cơ bản vẫn tồn tại trên thị trường, Sự khác biệt giữa từng vị trí vẫn rất ổn.

*Ảnh chụp màn hình một bài đăng vào tháng 6 năm 2023 trên Hacker News: "Làm thế nào để tham gia vào kỹ thuật AI" Các câu trả lời được bình chọn hàng đầu. *

Cho đến nay, nhiều người nghĩ về kỹ thuật AI như một dạng kỹ thuật ML hoặc kỹ thuật dữ liệu, vì vậy khi ai đó hỏi làm thế nào để tham gia vào một lĩnh vực nào đó, họ có xu hướng đề xuất các điều kiện tiên quyết giống như trong các câu trả lời ở trên, nhiều người đề xuất Khóa học của Andrew Ng khóa học. Nhưng không ai trong số những kỹ sư AI hiệu quả đó hoàn thành khóa học của Wu Enda trên Coursera, họ không quen thuộc với PyTorch và họ không biết sự khác biệt giữa Hồ dữ liệu (Data Lake) và Kho dữ liệu (Data Warehouse).

Trong tương lai gần, sẽ không có ai đề nghị bắt đầu học kỹ thuật AI bằng cách đọc bài báo "Chú ý là tất cả những gì bạn cần" của Transformer, cũng như việc bạn bắt đầu học lái xe bằng cách đọc bản thiết kế của Ford Model T. Tất nhiên, sẽ rất hữu ích khi hiểu các nguyên tắc cơ bản và lịch sử phát triển của công nghệ, điều này có thể giúp bạn tìm ra cách cải thiện tư duy và hiệu quả của mình. Nhưng đôi khi bạn cũng có thể sử dụng sản phẩm để tìm hiểu đặc điểm của chúng thông qua trải nghiệm thực tế.

Sự đảo ngược của kỹ sư AI so với kỹ sư ML sẽ không xảy ra trong một sớm một chiều và đối với một người có nền tảng khoa học dữ liệu và máy học tốt, kỹ thuật và kỹ thuật AI có thể không tốt trong một thời gian dài. Tuy nhiên, theo thời gian, tính kinh tế của cung và cầu sẽ chiếm ưu thế và quan điểm của mọi người về kỹ thuật AI sẽ thay đổi.

**Tại sao các kỹ sư AI sẽ trỗi dậy? **

Ở cấp độ mô hình, nhiều mô hình cơ bản hiện nay là những người học ít cảnh quay với khả năng học theo ngữ cảnh mạnh mẽ và khả năng chuyển giao không ảnh. Hiệu suất của mô hình thường vượt quá mục đích ban đầu của mô hình đào tạo. Nói cách khác, những người tạo ra các mô hình này không biết đầy đủ phạm vi khả năng của các mô hình. Và những người không phải là chuyên gia LLM (Mô hình ngôn ngữ lớn) có thể khám phá và khai thác những khả năng này bằng cách tương tác nhiều hơn với mô hình và áp dụng nó vào các lĩnh vực được nghiên cứu đánh giá thấp.

Ở cấp độ tài năng, Microsoft, Google, Meta và các phòng thí nghiệm mô hình cơ bản lớn đã độc quyền những tài năng nghiên cứu khan hiếm và họ cung cấp API cho "nghiên cứu AI dưới dạng dịch vụ". Bạn có thể không thuê được loại nhà nghiên cứu này, nhưng bạn có thể thuê dịch vụ của họ. Hiện có khoảng 5.000 nhà nghiên cứu LLM và 50 triệu kỹ sư phần mềm trên toàn thế giới. Hạn chế về nguồn cung này cho thấy rằng các kỹ sư AI thuộc hạng “trung bình” sẽ tăng lên để đáp ứng nhu cầu nhân tài.

Ở cấp độ phần cứng, các công ty và tổ chức công nghệ lớn đã tích trữ GPU với số lượng lớn Tất nhiên, OpenAI và Microsoft là những người đầu tiên làm như vậy, nhưng Stability AI đã bắt đầu cuộc cạnh tranh GPU dành cho các công ty khởi nghiệp bằng cách nhấn mạnh vào 4.000 cụm GPU của họ.

Ngoài ra, một số công ty khởi nghiệp mới như Inflection ($1,3 tỷ), Mistral ($113 triệu), Reka ($58 triệu), Poolside ($26 triệu) và Contextual ($20 triệu) nhìn chung đã bắt đầu huy động một khoản tiền khổng lồ trong vòng tài trợ hạt giống để sở hữu nó. cơ sở phần cứng riêng.

Giám đốc điều hành và nhà đầu tư công nghệ Hoa Kỳ Nat Friedman thậm chí đã công bố sáng kiến Andromeda của họ, một cụm GPU trị giá 100 triệu đô la với 10 exaflop sức mạnh tính toán dành riêng để hỗ trợ các công ty khởi nghiệp mà họ đầu tư vào. Ở phía bên kia của bối cảnh API, nhiều kỹ sư AI sẽ có thể sử dụng các mô hình chứ không chỉ đào tạo chúng.

Về mặt hiệu quả, thay vì yêu cầu các nhà khoa học dữ liệu và kỹ sư máy học thực hiện việc thu thập dữ liệu tẻ nhạt trước khi đào tạo một mô hình dành riêng cho một miền và đưa mô hình đó vào sản xuất, các nhà quản lý sản phẩm và kỹ sư phần mềm có thể xây dựng và xác minh ý tưởng sản phẩm bằng cách tương tác với LLM.

Giả sử nhóm sau (dữ liệu, kỹ sư ML) nhiều hơn nhóm trước (kỹ sư AI) từ 100 đến 1000 lần và cách bạn làm việc bằng cách tương tác với LLM sẽ giúp bạn nhanh hơn từ 10 đến 100 lần so với học máy truyền thống. Do đó, các kỹ sư AI sẽ có thể xác nhận các sản phẩm AI rẻ hơn 10.000 lần so với trước đây.

Ở cấp độ phần mềm, sẽ có những thay đổi từ Python sang Java. Thế giới dữ liệu và AI theo truyền thống thường tập trung vào Python, cũng như các công cụ kỹ thuật AI đầu tiên như LangChain, LlamaIndex và Guardrails. Tuy nhiên, ít nhất phải có nhiều nhà phát triển Java bằng số nhà phát triển Python, vì vậy các công cụ đang ngày càng được mở rộng theo hướng này, từ LangChain.js và Transformers.js đến AI SDK mới của Vercel. Quy mô tổng thể của thị trường và cơ hội cho Java là rất ấn tượng.

Bất cứ khi nào một nhóm nhỏ xuất hiện với nền tảng hoàn toàn khác, nói một ngôn ngữ hoàn toàn khác, tạo ra một sản phẩm hoàn toàn khác, sử dụng một công cụ hoàn toàn khác, thì cuối cùng họ sẽ tách thành nhóm của riêng mình.

Vai trò của mã trong quá trình phát triển của phần mềm 2.0 thành phần mềm 3.0

6 năm trước, Andrej Karpathy đã viết một bài báo rất có ảnh hưởng mô tả Phần mềm 2.0, so sánh các ngăn ngôn ngữ lập trình viết tay cổ điển mô hình logic chính xác với các ngăn mới của mạng lưới thần kinh học máy gần đúng logic. Bài báo cho thấy rằng phần mềm có thể giải quyết nhiều vấn đề hơn con người có thể lập mô hình.

Năm nay, Karpathy tiếp tục đăng rằng ngôn ngữ lập trình mới hấp dẫn nhất là tiếng Anh, vì các gợi ý từ AI tổng quát có thể được hiểu là mã do con người thiết kế, trong nhiều trường hợp bằng tiếng Anh và được giải thích bởi các LLM, cuối cùng lấp đầy các khoảng trống trong biểu đồ của anh ấy. khu vực màu xám.

*Lưu ý: Bộ phần mềm 1.0 cổ điển (Software 1.0) được viết bằng Python, C++ và các ngôn ngữ khác. Phần mềm 2.0 được viết bằng cách sử dụng các trọng số mạng thần kinh và không ai tham gia vào quá trình viết mã này vì có nhiều trọng số. *

Năm ngoái, Kỹ thuật đã trở thành một chủ đề phổ biến và mọi người bắt đầu áp dụng GPT-3 và Khuếch tán ổn định vào công việc. Mọi người chế giễu các công ty khởi nghiệp AI là trình bao bọc OpenAI và lo lắng về tính dễ bị tổn thương của các ứng dụng LLM đối với kỹ thuật chèn gợi ý và đảo ngược gợi ý.

Nhưng một chủ đề rất quan trọng trong năm 2023 là tái thiết lập vai trò của mã do con người viết, từ Langchain khổng lồ với hơn 200 triệu đô la Mỹ cho đến Du hành do Nvidia hậu thuẫn, cho thấy tầm quan trọng của việc tạo và tái sử dụng mã. Kỹ thuật vừa cường điệu vừa dai dẳng, nhưng sự xuất hiện trở lại của mô hình Phần mềm 1.0 trong các ứng dụng Phần mềm 3.0 vừa là một cơ hội lớn vừa là không gian mới cho rất nhiều công ty khởi nghiệp:

Khi các kỹ sư con người học cách sử dụng AI và AI ngày càng chiếm lĩnh các công việc kỹ thuật, trong tương lai, khi chúng ta nhìn lại, sẽ rất khó để phân biệt giữa hai loại này.

Nội dung tham khảo:

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)