Model cỡ lớn của Huawei cuối cùng cũng có mặt, đánh giá của mình là: khá sốc

Nguồn gốc: Đánh giá xấu

Nguồn hình ảnh: Được tạo bởi Unbounded AI‌

Huawei, hãng luôn bị cho là tụt lại phía sau trong cuộc cạnh tranh mô hình quy mô lớn, lần này cuối cùng cũng đến với những người đàn ông của mình.

Không, tại Hội nghị các nhà phát triển Huawei 2023 ngày hôm qua, Huawei đã thể hiện.

Cuộc họp báo kéo dài gần 3 tiếng đồng hồ vẫn thừa hưởng phong cách trốn tránh trong quá khứ của Huawei khiến Shichao lóa mắt.

Tuy nhiên, tóm lại nó thực sự làm nổi bật một chủ đề: Pangu Large Model 3.0.

Trên thực tế, chỉ vài ngày trước, khi các người mẫu lớn khác vẫn đang so sánh các xếp hạng khác nhau, Pangu đã lọt vào tầm nhìn của mọi người một cách độc đáo khi dựa vào bảng hiệu vàng do tạp chí hàng đầu thế giới Nature chứng nhận.

Người ta nói rằng với việc bổ sung mô hình lớn Pangea, tốc độ dự đoán thời tiết đã được tăng lên hơn 10.000 lần và có thể thu được kết quả trong vài giây. nó sẽ rời đi, nó có thể cho bạn một dự đoán rõ ràng.

Điều quan trọng nhất là độ chính xác dự đoán của nó thậm chí còn vượt qua hệ thống IFS của Trung tâm Khí tượng Châu Âu vốn được mệnh danh là mạnh nhất thế giới, đây là sản phẩm dự đoán AI đầu tiên đã giành chiến thắng trong dự đoán số truyền thống.

Bạn biết đấy, hầu hết các dự báo thời tiết AI trước đây đều được phát triển dựa trên mạng thần kinh 2D, nhưng thời tiết quá phức tạp và 2D thực sự là quá nhiều.

Hơn nữa, mô hình AI trước đó sẽ tiếp tục tích lũy các lỗi lặp trong quá trình dự đoán, điều này sẽ dễ dàng ảnh hưởng đến độ chính xác của kết quả.

Do đó, các phương pháp dự đoán AI chưa được phổ biến.

Mô hình khí tượng quy mô lớn của Bàn Cổ thật tuyệt vời. Họ đã sử dụng mạng thần kinh ba chiều có tên là 3DEST để xử lý dữ liệu khí tượng. Nếu 2D không làm được, họ có thể sử dụng 3D.

Chiến lược suy luận và đào tạo mạng của 3DEST

Nhằm giải quyết vấn đề lỗi lặp, mô hình cũng sử dụng "chiến lược tổng hợp miền thời gian phân cấp" để giảm lỗi lặp và cải thiện độ chính xác của dự báo.

Mặc dù từ này nghe có vẻ dễ bị lừa, nhưng nó thực sự rất dễ hiểu.

Ví dụ như mô hình dự báo thời tiết AI FourCastNet trước đây, trước khi bão đến nó sẽ đưa ra dự báo trước 6 tiếng, trong 6 tiếng này mô hình sẽ tính toán lặp đi lặp lại thời điểm bão đến.

Nó có thể được tính trong một thời gian là 5 giờ và 4 giờ rưỡi trong một thời gian và sai số sẽ lớn nếu các kết quả này được cộng lại với nhau.

Nhưng Mô hình lớn Khí tượng Bàn Cổ đã nghĩ ra cách huấn luyện 4 mô hình với các khoảng thời gian dự báo khác nhau, cứ 1 giờ lặp lại một lần và cứ 3 giờ, 6 giờ và 24 giờ lại lặp lại một lần.

Sau đó, theo các yêu cầu dự báo thời tiết cụ thể, chọn mô hình tương ứng để lặp lại.

Ví dụ muốn dự đoán thời tiết trong 7 ngày tới thì cho mô hình 24 giờ lặp 7 lần, dự đoán 20 giờ tức là 3 lần lặp mô hình 6 giờ + 2 lần lặp mô hình 1 giờ.

**Càng ít lần lặp, lỗi càng nhỏ. **

Làn sóng hoạt động này đã đưa dự báo thời tiết lên một tầm cao mới.

Tuy nhiên, một số người bạn có thể đã bắt đầu lẩm bẩm: Các mô hình lớn của mọi người đều là hình ảnh và văn bản được tạo ra.Huawei đã trở thành một dự báo thời tiết như thế nào?

Phải nói một điều rằng, mô hình Pangu này thực sự khác với ChatGPT và Midjourney mà chúng tôi đã tiếp xúc trước đây, họ đang kinh doanh trong ngành.

Hiểu một cách đơn giản, nó có nghĩa là cá nhân chúng tôi không sử dụng mô hình Pangu.

Nó không phải là "kẻ thù không đội trời chung" của ChatGPT như mọi người mong đợi, mà nó hướng đến thị trường To B thường không tiếp cận được. **

Chưa nói đến khó khăn hay không, ít nhất nguồn khách hàng doanh nghiệp mà Huawei tích lũy bao năm qua thực sự rất dễ rút ra.

Hơn nữa, buổi họp báo lần này của Huawei không chỉ mang đến vai diễn tàn nhẫn của người mẫu dự báo thời tiết.

Không có loại kháng sinh mới nào được phát hiện trong hơn 40 năm và loại thuốc siêu kháng khuẩn Thuốc X đã được tìm thấy ngay khi mô hình phân tử thuốc Pangea xuất hiện, và chu kỳ phát triển thuốc được rút ngắn từ vài năm xuống còn vài tháng, nghiên cứu và phát triển chi phí đã giảm 70%.

Mô hình lớn của Mỏ Pangu cũng có thể đi sâu vào hơn 1.000 quy trình khai thác than và chỉ riêng việc lựa chọn than sạch có thể tăng tỷ lệ thu hồi than sạch từ 0,1% đến 0,2%.

Bạn biết đấy, đối với một nhà máy luyện than có sản lượng than luyện cốc hàng năm là 10 triệu tấn, tỷ lệ sản xuất than sạch cứ tăng 0,1% thì lợi nhuận hàng năm có thể tăng thêm 10 triệu.

** Đây là tất cả tiền trắng. . . **

Trên thực tế, ngoài dự báo thời tiết, phát triển thuốc và điều chế than nêu trên, mô hình Pangea đã được sử dụng trong nhiều ngành công nghiệp.

Tại buổi họp báo, Tian Qi, Nhà khoa học trưởng của HUAWEI CLOUD AI, cho biết các dự án HUAWEI CLOUD AI đã được áp dụng cho hơn 1.000 dự án, 30% trong số đó được sử dụng trong hệ thống sản xuất cốt lõi của khách hàng, giúp tăng lợi nhuận của khách hàng lên trung bình 18%. %.

Huawei có thể sản xuất hàng loạt các mô hình lớn này cho các ngành công nghiệp khác nhau nhờ vào kiến trúc ba lớp 5+N+X của Huawei Pangu Model 3.0.

Chính cấu trúc này cho phép Pangu nhanh chóng lấn sân sang nhiều ngành công nghiệp khác nhau.

tại sao bạn nói như vậy?

Vì AI đang đổ bộ vào ngành nên dữ liệu là một khó khăn lớn.

Zhang Pingan cho biết tại cuộc họp báo, "Do khó thu thập dữ liệu ngành và khó kết hợp công nghệ với ngành nên việc triển khai các mô hình lớn trong ngành diễn ra chậm."

** Pangu rất tài tình, thông qua cấu trúc ba tầng 5+N+X, trực tiếp chia vấn đề lớn này thành 3 vấn đề nhỏ để giải quyết. **

Trước hết, năm mô hình lớn của lớp L0 của Pangu đã học được hàng trăm terabyte dữ liệu văn bản như kiến thức bách khoa toàn thư, tác phẩm văn học, mã chương trình và hàng tỷ hình ảnh Internet có nhãn văn bản.

Chúng ta có thể hiểu rằng trước tiên hãy để các mô hình lớn L0 cấp một (năm mô hình lớn cơ bản của mô hình lớn ngôn ngữ tự nhiên, mô hình lớn trực quan, mô hình lớn đa phương thức, mô hình lớn dự đoán và mô hình lớn điện toán khoa học) thiết lập nhận dạng cơ bản. hơi giống với giai đoạn giáo dục chất lượng trước khi vào đại học của chúng ta.

Sau đó, mô hình trong lớp thứ hai L1 được hình thành bằng cách học dữ liệu của N ngành liên quan từ một mô hình lớn cơ bản nhất định trong L0. Đây giống như giai đoạn cử nhân của một trường đại học, nơi bạn cần chọn nhiều chuyên ngành để học.

Ví dụ, kiểm tra hình ảnh CT trong bệnh viện và kiểm tra chất lượng hình ảnh trong nhà máy sử dụng các mô hình trực quan lớn.

Nhưng xét cho cùng, một bên là bệnh viện, một bên là nhà máy, hoàn cảnh sử dụng hoàn toàn khác biệt, chỉ dựa vào mô hình lớn cơ bản chắc chắn sẽ không hiệu quả, nhưng nếu cộng thêm dữ liệu của ngành, có thể sẽ có bất ngờ.

L2 cuối cùng tương tự như sinh viên tốt nghiệp, và sẽ được tinh chỉnh đến một cảnh nhất định trên cơ sở các ngành cụ thể. Ví dụ: trong ngành kho bãi và hậu cần, các mô hình triển khai khác nhau có thể được yêu cầu cho việc vận chuyển, lưu kho và xuất hàng hóa.

Đồng thời, Huawei cũng đã thêm một liên kết phản hồi, hơi giống một liên kết thực tập trong công ty.

Theo họ, trước đây thường mất 5 tháng để phát triển một mô hình công nghiệp quy mô GPT-3, với bộ công cụ này, chu kỳ phát triển có thể được rút ngắn xuống còn 1/5 so với ban đầu.

Đồng thời, những hạn chế của tập dữ liệu nhỏ trong nhiều ngành cũng có thể được giải quyết. Ví dụ, một ngành công nghiệp rất chi tiết như sản xuất máy bay lớn cũng có thể có các mô hình lớn.

Ngoài tập hợp các mô hình lớn này, Huawei còn đề xuất một điều rất thú vị - bản địa hóa sức mạnh tính toán theo thời gian.

Như chúng ta đã biết, chúng ta thực sự lúng túng về sức mạnh tính toán của AI.

Thứ nhất, chúng ta không thể mua H100/A100 của Nvidia, thiết bị cốt lõi của ngành AI, thứ hai, ngay cả khi Nvidia "thân mật" tung ra sản phẩm thay thế H800, chúng ta vẫn phải dè chừng. Ví dụ, tốc độ đường truyền đã bị cắt giảm rất nhiều.

Trong bối cảnh một mô hình lớn phải mất vài tháng để đào tạo, rất dễ bị các đối tác nước ngoài có khả năng tính toán mạnh hơn vượt qua.

Và lần này, để giải quyết vấn đề này, Huawei vẫn ra tay với một số kẻ thực sự.

Ví dụ, xét về hiệu năng trên lý thuyết, bộ xử lý Ascend 910 của Huawei đã tốt hơn A100 của Nvidia.

Tuy nhiên, trên thực tế vẫn còn một số kẽ hở. Và A100 cũng không phải là vũ khí tối thượng của Nvidia.

Tuy nhiên, Shengteng đã được nhiều bạn bè công nhận. Huawei thậm chí còn trực tiếp tuyên bố tại cuộc họp báo rằng "sức mạnh tính toán của một nửa số mô hình lớn của Trung Quốc là do họ cung cấp."

Tất nhiên, điểm sáng về sức mạnh điện toán của Huawei ở thời điểm hiện tại nhiều khả năng là do toàn bộ hệ sinh thái phần mềm mang lại.

Ví dụ: theo cuộc họp báo, hãy đếm Cơ sở năng lượng điện toán đám mây AI Ascend và khung điện toán CANN. . . Ở các khía cạnh khác, hiệu quả của Huawei trong việc đào tạo các mô hình lớn gấp 1,1 lần so với các GPU chính trong ngành.

Ngoài ra, họ đã phát triển một bộ đầy đủ các gói ứng dụng cho người dùng.

Ví dụ: Meitu đã chuyển 70 mẫu sang Hệ sinh thái Huawei chỉ trong 30 ngày. Đồng thời, Huawei cũng tuyên bố rằng ** với nỗ lực của cả hai bên, hiệu suất AI đã được cải thiện 30% so với giải pháp ban đầu. **

Vẫn khá ấn tượng.

Hơn nữa, Huawei cũng cho biết họ hiện có gần 4 triệu nhà phát triển, con số này phù hợp với hệ sinh thái NVIDIA CUDA.

Chuỗi hành động này có thể coi như bù đắp một phần thiếu sót. **

Nói chung, sau khi xem một cuộc họp báo của Huawei, những người đánh giá tồi cảm thấy rằng cách bố trí AI của Huawei rất sâu sắc và họ đã bắt đầu suy nghĩ về câu hỏi "AI thực sự có thể mang lại cho chúng ta điều gì".

Trong sáu tháng qua, mặc dù ngành AI đã nhận được những tràng pháo tay như sấm, nhưng khi nó thực sự rơi xuống cấp độ ngành thì có phần lúng túng.

Và hành động này của Huawei chỉ xác nhận những gì Ren Zhengfei đã nói:

**" Trong tương lai, các mô hình lớn AI sẽ bùng nổ, không chỉ Microsoft. Đóng góp trực tiếp của các công ty nền tảng phần mềm trí tuệ nhân tạo cho xã hội loài người có thể dưới 2%, và 98% là thúc đẩy xã hội công nghiệp và xã hội nông nghiệp." * *

Trong lĩnh vực AI, kỷ nguyên lớn thực sự vẫn chưa đến.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)