Khi nào người khổng lồ mới sẽ ra đời? Mô hình lớn chờ “đầu nguồn”

Nguồn| Zero One Finance

Tác giả| Thẩm Trác Ngôn

Nguồn hình ảnh: Được tạo bởi công cụ Unbounded AI

Kể từ năm 2023, từ nóng nhất trong giới công nghệ là ChatGPT và công nghệ mô hình quy mô lớn đằng sau nó.

Trước đây có Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Pangu, HKUST Xunfei Xinghuo, v.v. Gần đây, Li Kaifu vào văn phòng để thành lập Zero One Wanwu và Volcano Engine đã ra mắt "Hòm núi lửa". Chỉ trong vài tháng, nó đã trở thành xu hướng cho nhiều doanh nghiệp phát triển và phát hành các ứng dụng mô hình quy mô lớn.

Có hơn 80 mô hình quy mô lớn trong nước với quy mô tham số từ 1 tỷ trở lên và con số này vẫn đang tăng lên nhanh chóng. Không khí chuẩn bị cho một cuộc chiến thương mại xung quanh các mô hình lớn đã vô cùng mạnh mẽ.

Cho dù đó là một công ty khổng lồ lớn hay một công ty khổng lồ nhỏ, họ đều cần những hành động như vậy để thể hiện sự nhạy bén với công nghệ tiên tiến và sự tích lũy lâu dài của họ. Bằng cách khởi chạy ứng dụng sớm hơn, bạn có thể kiểm tra dữ liệu có giá trị về sự tương tác giữa mô hình lớn và người dùng sớm hơn một ngày và "tích lũy được nhiều của ăn, tranh làm vua" trong cuộc cạnh tranh trong tương lai.

Chìa khóa của mô hình lớn là các yếu tố trường AI - thuật toán, sức mạnh tính toán, dữ liệu và các kịch bản/ứng dụng. Các thuật toán đại diện cho các chiến lược, sức mạnh tính toán xác định giới hạn trên và đặt ngưỡng, và dữ liệu bằng khẩu phần quân sự cũng tượng trưng cho sự phân biệt giữa tốt và xấu. Ngoài ba yếu tố, cảnh/ứng tượng trưng cho hướng điều quân.

"Cuộc chiến trăm mô hình" sắp nổ ra, liệu một công ty khổng lồ hội tụ đủ các yếu tố có phát triển thành một cuộc cách mạng vô hạn về năng lực công nghệ? Liệu những gã khổng lồ nhỏ trên đường đua dọc có thể củng cố vị trí dẫn đầu của mình với sự trợ giúp của những người mẫu lớn? Trong số những người chơi mới nhận được vé, ai có thể là ứng cử viên nặng ký cho sự thống trị của ngành?

Chưa xuất hiện mô hình quy mô lớn "đầu nguồn sức mạnh"

Người chơi mô hình lớn chủ yếu được chia thành ba loại: một là Internet (Baidu, Ali, Tencent, v.v.) và những người khổng lồ trong ngành (China Telecom và China Unicom, v.v.) Các công ty thông minh (SenseTime, Yuncong, Guangyuewai, v.v.) , và hạng mục cuối cùng là các viện nghiên cứu khoa học được đại diện bởi Phòng thí nghiệm Trí tuệ Nhân tạo Thượng Hải, Đại học Phúc Đán, Viện Công nghệ Cáp Nhĩ Tân, v.v.

Theo dữ liệu công khai, tính đến đầu tháng 7 năm 2023, có hơn 80 mô hình quy mô lớn với thông số trên 1 tỷ ở nước tôi và chúng vẫn đang tăng lên nhanh chóng. Các mô hình với lượng thông số này càng lớn thì ngưỡng cạnh tranh sẽ càng cao.

Hầu hết các mô hình quy mô lớn đã được phát hành cho đến nay đều là các mô hình quy mô lớn có mục đích chung, có hai lý do chính: một là sự cạnh tranh của các mô hình quy mô lớn vẫn chưa rõ ràng và trình độ kỹ thuật thuần túy chưa được mở rộng khoảng cách thế hệ và những người tham gia trong ngành có cơ hội thống trị thế giới; Mô hình quy mô lớn định hướng ứng dụng cho công chúng chưa xuất hiện và thiếu hướng dẫn định hướng rõ ràng. Trước "thời điểm Trò chuyện GPT" của mô hình quy mô lớn trong nước xuất hiện, nó vừa là một lựa chọn chủ động và thụ động để tham gia mô hình quy mô lớn có mục đích chung.

Hơn nữa, rất có khả năng một người khổng lồ mới sẽ xuất hiện từ lĩnh vực mô hình lớn.

Zhou Hongyi tin rằng các mô hình lớn phải là "phổ quát" và chỉ việc sử dụng chung mới có thể đi vào hàng nghìn hộ gia đình, trao quyền cho hàng trăm ngành công nghiệp và dẫn đầu cuộc cách mạng trí tuệ nhân tạo mới.

Điều còn dang dở là cần bao nhiêu sự đầu tư và hợp tác để trở thành người dẫn đầu cuộc cách mạng mới. Bất kể mô hình lớn là thị trường đại dương xanh hay đại dương đỏ đều phải có một cấu trúc sinh thái trong đó cá lớn dẫn dắt cá nhỏ hợp tác, tuy nhiên, ranh giới phân chia giữa cá lớn và cá bé vẫn chưa xuất hiện.

Xét từ tình hình hiện tại, một mô hình lớn với quy mô 1 tỷ tham số có thể được coi là ngưỡng đầu vào và một mô hình lớn với quy mô 10 tỷ tham số có thể được coi là có khả năng cạnh tranh trên thế giới, nhưng ngay cả một mô hình lớn với quy mô 100 tỷ tham số cũng không phải là tốt nhất.

Số lượng tham số không phải là lực lượng áp đảo quyết định cục diện chiến trường, các yếu tố như khả năng lập kế hoạch tài nguyên, tích lũy kinh nghiệm lâu dài và đầu tư nghiên cứu khoa học lớn đều là những khác biệt cốt lõi lâu đời trong cạnh tranh mô hình quy mô lớn.

Để so sánh với Open AI, cần thấy rằng đằng sau sự bùng nổ của Chat GPT là sự hỗ trợ toàn diện của Microsoft về dữ liệu, sức mạnh tính toán và nguồn vốn khổng lồ, nhờ đó hãng này đã tích lũy được rất nhiều tiền trong tương lai.

Mô hình quy mô lớn là ngành đầu tư dài hạn, hiểu đơn giản là “đốt tiền”. Việc tích lũy sức mạnh tính toán, thuật toán và dữ liệu không thể đạt được trong một sớm một chiều. Sau khi mô hình được phát hành, nó cần được đào tạo lặp đi lặp lại và lặp lại nhanh nhẹn, cuối cùng phát triển thành một "cơ thể trưởng thành".

Trong môi trường thực, người chơi của mô hình lớn được thúc đẩy bởi công nghệ hay lợi nhuận? Open AI là công ty mô hình quy mô lớn nổi tiếng nhất thế giới, ngay cả với sản phẩm bùng nổ Chat GPT, khả năng thương mại hóa của nó vẫn rất đáng lo ngại. Là một công ty công nghệ có giá trị thị trường đạt gần 30 tỷ USD, nó sẽ là trung tâm của làn sóng AI vào năm 2023. Doanh thu của Open AI cho đến nay vẫn chưa đến 200 triệu USD.

Đầu tư ban đầu chỉ là chi phí ban đầu, mỗi lần đào tạo tiếp theo đều cần tiền thật, có bao nhiêu công ty có thể chấp nhận lợi tức đầu tư đáng thương trong cuộc cạnh tranh mô hình quy mô lớn? Thành công của Chat GPT chứng tỏ mô hình lớn đã được mở ra con đường sản phẩm, nhưng không có nghĩa là thành công rực rỡ ở cấp độ thương mại.

Ít nhất là về tỷ lệ đầu vào-đầu ra, những gã khổng lồ Internet có lợi thế tương đối lớn hơn, họ có đủ động lực và nguồn lực để chống đỡ những tổn thất chiến lược trong giai đoạn đầu, giống như Alibaba Cloud hồi đó.

Về việc sẽ mất bao lâu để đốt tiền và khi nào thấy được lợi tức đầu tư hài lòng, các công ty lớn không biết, các VC của các công ty mới thành lập cũng không biết. Đây là một canh bạc có thể rời cuộc chơi bất cứ lúc nào, và số tiền cược lên tới hàng tỷ đô la.

Đối với những người chơi mô hình quy mô lớn "ai cũng có lợi thế riêng", trước tiên nên khám phá lớp ứng dụng và mở thử nghiệm càng sớm càng tốt, ai tích lũy được nhiều dữ liệu tương tác quý giá hơn sẽ là điểm đột phá của cuộc thi tiếp theo.

Nhu cầu theo chiều dọc và khó khăn theo chiều dọc

Sự cạnh tranh cho các mô hình quy mô lớn nói chung thiên về cạnh tranh quyền xây dựng cơ sở hạ tầng, trong khi các mô hình quy mô lớn theo chiều dọc dựa vào các mô hình quy mô lớn nguồn mở hoặc giao diện API trong các tình huống cụ thể để hình thành khả năng cạnh tranh khác biệt trong các ngành được phân khúc, tập trung nhiều hơn vào ứng dụng kịch bản.

Trên chiến trường của các mô hình quy mô lớn đa năng, theo thời gian, một số người chơi yếu sẽ dần tụt lại phía sau, và cuối cùng sẽ chỉ còn lại một số mô hình quy mô lớn đa năng, sẽ đóng vai trò cơ sở hạ tầng . Đồng thời, các mô hình lớn này vẫn đang phải đối mặt với vấn đề về tính đồng nhất và lớp ứng dụng vẫn phụ thuộc vào các mô hình lớn theo chiều dọc.

Mô hình lớn đa năng giống như một tập hợp nhiều mô hình lớn theo chiều dọc, càng nhiều kịch bản huấn luyện thì "tính tổng quát" của mô hình lớn đa năng càng mạnh.

Là công ty đầu tiên ở Trung Quốc phát hành các sản phẩm tương tự Chat GPT, Baidu có nhu cầu cấp thiết về các lớp ứng dụng theo chiều dọc mô hình quy mô lớn. Li Yanhong cho biết: "Quan trọng hơn số lượng mô hình lớn là ứng dụng, đây là bước đột phá trong việc áp dụng các lĩnh vực dọc. Điểm mấu chốt của chiến lược cạnh tranh quốc tế mới không phải là có bao nhiêu mô hình lớn, mà là có bao nhiêu người bản địa ứng dụng trên các mô hình lớn. Những ứng dụng này đã nâng cao hiệu quả sản xuất đến mức độ nào."

Theo cách nói ẩn dụ của Li Yanhong, các mô hình lớn, đặc biệt là các mô hình lớn có mục đích chung, giống như hệ điều hành trong thời đại AI, tất cả các ứng dụng sẽ được phát triển xung quanh mô hình lớn, bên trên là lớp ứng dụng, bao gồm các ứng dụng gốc AI khác nhau .

Trong phân tích cuối cùng, cái gọi là "phổ quát" chỉ là một khái niệm tương đối và không có mô hình mục đích chung nào hoàn toàn có thể áp dụng cho mọi lĩnh vực và có đủ chuyên sâu về ngành. Lấy Chat GPT làm ví dụ, vẫn là một số ngành có tỷ lệ chịu lỗi cao mới thực sự được sử dụng rộng rãi, cho dù giải pháp do mô hình lớn đưa ra có sai sót thì sai số cũng chỉ giới hạn ở một phạm vi tương đối hạn chế. Tuy nhiên, trong các tình huống như công nghiệp nặng, hàng không vũ trụ và chăm sóc y tế, tổn thất do sai lầm gây ra là vô cùng lớn, đó là Chat GPT không thể đáp ứng các yêu cầu chuyên môn và ngành dọc của các tình huống cụ thể.

Để tính đến các yêu cầu về tính thẳng đứng và tính chuyên nghiệp, dữ liệu là một lỗ hổng và có ít ngành có đủ độ sâu dữ liệu và một con hào ổn định. Rất khó để đánh giá cụ thể dữ liệu của các ngành này có dễ lấy hay không và liệu dữ liệu thu được có thể đáp ứng các yêu cầu luôn thay đổi của các ngành cụ thể hay không.

Các gã khổng lồ Internet có một lượng lớn dữ liệu mạng như thương mại điện tử, mạng xã hội và tìm kiếm, nhưng các loại dữ liệu không đủ toàn diện và chất lượng dữ liệu không được đảm bảo. rất nhiều công việc khai thác.

Gần đây, trong các lĩnh vực chính phủ, an ninh công cộng và chăm sóc y tế, các mô hình quy mô lớn theo chiều dọc đang lần lượt được triển khai. Ví dụ, Yunzhisheng đã tự phát triển mô hình quy mô lớn "núi và biển" trong lĩnh vực chăm sóc y tế thông minh, kết hợp với các công nghệ tương tác giọng nói thông minh toàn diện như xử lý tín hiệu âm thanh đầu cuối, nhận dạng giọng nói, nhận dạng giọng nói và tổng hợp giọng nói, dự kiến sẽ cải thiện hiệu quả nhập hồ sơ y tế điện tử của bác sĩ Hơn 400%, tiết kiệm hơn 40% thời gian tư vấn cho một bệnh nhân và cải thiện hiệu quả điều trị ngoại trú của bác sĩ hơn 66%.

Dựa trên các tài liệu chính thức, tài liệu chính sách, hướng dẫn công việc của chính phủ và các dữ liệu khác dưới dạng dữ liệu đào tạo chuyên nghiệp, TRS đã tạo ra một mô hình lớn về các công việc của chính phủ.

Trong lĩnh vực tài chính, Hang Seng Electronics sẽ bắt đầu lập kế hoạch và thiết kế các sản phẩm mô hình tài chính quy mô lớn vào cuối tháng 3 năm 2023. Vào cuối tháng 6, Hang Seng Electronics và công ty con Hang Seng Juyuan đã phát hành một sản phẩm tài chính trí tuệ kỹ thuật số mới dựa trên công nghệ mô hình ngôn ngữ lớn - trợ lý thông minh tài chính Photon và nền tảng nghiên cứu đầu tư thông minh nâng cấp mới WarrenQ.

Tencent, gã khổng lồ Internet với nhiều nguồn lực trong ngành, đang đặt cược vào nhiều bên. Vào cuối tháng 6, Tencent đã công bố các giải pháp dịch vụ MaaS bao gồm 10 ngành bao gồm tài chính, du lịch văn hóa, các vấn đề chính phủ và giáo dục, với tổng số hơn 50 giải pháp.

Đồng thời, dữ liệu mà mô hình lớn theo chiều dọc yêu cầu thường không giới hạn trong ngành, một số doanh nghiệp có thể yêu cầu tích hợp dữ liệu từ ngành khác hoặc nhiều ngành, việc đào tạo và ứng dụng mô hình phụ thuộc vào sự hợp tác liên ngành của doanh nghiệp hoặc nguồn lực của những gã khổng lồ Internet.tích hợp.

**Sức mạnh máy tính: Những viên gạch mạnh mẽ bay? **

Trong cơn sốt vàng ở miền Tây Hoa Kỳ vào thế kỷ 19, việc những người đào vàng thực sự kiếm được tiền là một sự kiện mang tính xác suất, trong khi đó là kết quả tất yếu mà những người bán xẻng kiếm được tiền.

Trong cơn sốt AI, tình hình chiến trường của mô hình lớn vẫn chưa rõ ràng, và người chơi vẫn đang tiến lên, nhưng "người bán xẻng" đã giành chiến thắng. Dựa vào xu hướng chip AI và mô hình lớn, Nvidia đã nới rộng khoảng cách với đối thủ cạnh tranh AMD, và giá trị thị trường của nó đã bước vào "câu lạc bộ nghìn tỷ đô la".

Giám đốc điều hành Open AI Sam Altman đã đề xuất một phiên bản mới của Định luật Moore, đó là sức mạnh tính toán của AI toàn cầu sẽ tăng gấp đôi sau mỗi 18 tháng. Việc duy trì các tính toán này cần có sự hỗ trợ của chip đào tạo AI và thị phần của Nvidia trong lĩnh vực này vượt quá 90%.

Sản phẩm chip AI của Nvidia được các hãng công nghệ lớn trên thế giới săn đón rầm rộ: Tháng 3/2023, Microsoft thông báo đã giúp OpenAI xây dựng một trung tâm điện toán mới với hàng chục nghìn A100; tháng 5, Google tung H100 với 26.000 chiếc. cụm máy tính ComputeEngineA3. Ngoài ra, theo thông tin từ China National Finance Securities, ByteDance đã đặt hàng hơn 1 tỷ USD GPU trong năm nay và ước tính có 100.000 chiếc A100 và H800 đã đến và chưa đến. Hàng chục nghìn con chip H800 cũng được sử dụng trong phiên bản mới của Trung tâm dịch vụ điện toán hiệu suất cao đám mây Tencent do Tencent phát hành.

Giám đốc tài chính Nvidia Kress cho biết nhu cầu thị trường hiện tại về sức mạnh tính toán AI đã vượt quá mong đợi của công ty trong vài quý tới và có quá nhiều đơn đặt hàng cần thực hiện.

Tất nhiên, thật vô ích khi chúng ta ghen tị với số tiền mà Nvidia kiếm được.

Đường đua GPU trong nước cũng đang bắt kịp, không chỉ có những gã khổng lồ Internet tự phát triển chip AI, chẳng hạn như chip AI Kunlun của Baidu, chip xử lý video Tencent "Canghai" và chip AI "Zixiao", v.v., mà còn có Suiyuan Technology, Tianshu Zhixin, Các công ty mới nổi như Moore Threads phát triển GPU đa năng. GPU đa năng được sử dụng cho các nhiệm vụ đa năng khác nhau, bao gồm khả năng tính toán song song cao và lõi tính toán quy mô lớn. Cũng đã có những tiến bộ lớn trong những năm gần đây , và khoảng cách với GPU hiệu suất cao đang dần thu hẹp.

Wu Hequan, một học giả của Học viện Kỹ thuật Trung Quốc, đề xuất rằng dưới sự phối hợp của các kế hoạch công nghiệp và khoa học công nghệ quốc gia, nên hình thành sự phân công lao động hợp lý để tạo thành sức mạnh tính toán chung và nền tảng sức mạnh tính toán của quốc gia. nên mở phòng thí nghiệm để hỗ trợ đào tạo mô hình quy mô lớn khác nhau. Đồng thời, đề xuất thành lập liên minh sức mạnh điện toán để tập trung các GPU cao cấp hiện có. Tài nguyên điện toán cung cấp sức mạnh tính toán cần thiết cho đào tạo dữ liệu mô hình lớn.

Ngoài GPU hiệu suất cao, các nền tảng điện toán chi phí thấp hơn cũng được coi là cơ hội thị trường mới. Gần đây, Jiuzhang Yunji tiết lộ rằng họ sẽ tiếp tục hợp tác với các nhà sản xuất đám mây thuộc sở hữu nhà nước và bao gồm một số lượng lớn các trung tâm điện toán thông minh trên thị trường với tư cách là đối tác và cung cấp cho khách hàng nền tảng nghiên cứu và phát triển mô hình AI tích hợp phần mềm và phần cứng. chi phí của khách hàng sẽ gắn liền với sức mạnh tính toán.

Sức mạnh tính toán là cơ sở để phát triển các mô hình lớn, là điều kiện cần nhưng chưa phải là điều kiện đủ, vai trò tối đa mà sức mạnh tính toán có thể phát huy còn phụ thuộc vào hướng sử dụng. Chỉ khi đổi mới thuật toán, xây dựng tài nguyên dữ liệu và lặp lại khung đào tạo, thì mới có thể tạo ra những “viên gạch bay mạnh mẽ”.

Chính sách: Hướng dẫn và quy định tại các thời điểm quan trọng

Thời kỳ bùng nổ AI trùng với thời điểm quan trọng của quản trị thuật toán và khai thác thuật toán ở nước ta.

Ngay từ năm 2021, "Các ý kiến hướng dẫn về tăng cường quản trị toàn diện các thuật toán dịch vụ thông tin trên Internet" đã đưa việc quản lý hồ sơ thuật toán là một phần quan trọng trong việc cải thiện hệ thống giám sát. Quy chế quản lý quy định rõ ràng hoặc đề cập rằng "các nhà cung cấp dịch vụ đề xuất thuật toán có thuộc tính dư luận xã hội hoặc khả năng vận động xã hội thì thực hiện thủ tục lập hồ sơ.”

Vào tháng 4 năm 2023, Cục Quản lý không gian mạng Trung Quốc đã soạn thảo "Các biện pháp quản lý đối với các dịch vụ trí tuệ nhân tạo sáng tạo (Dự thảo để lấy ý kiến)" để lấy ý kiến cộng đồng. Vào tháng 6, "Kế hoạch công tác lập pháp năm 2023 của Quốc vụ viện" do Quốc vụ viện ban hành cho thấy dự thảo luật trí tuệ nhân tạo đã được chuẩn bị để trình Ủy ban Thường vụ Đại hội đại biểu nhân dân toàn quốc thảo luận.

"Các biện pháp quản lý dịch vụ trí tuệ nhân tạo sáng tạo (Dự thảo để lấy ý kiến)" đề cập rằng trước khi sử dụng các sản phẩm trí tuệ nhân tạo sáng tạo để cung cấp dịch vụ cho công chúng, nó phải được báo cáo cho Mạng Nhà nước theo "Quy định về đánh giá bảo mật thông tin Internet Các dịch vụ có thuộc tính ý kiến công khai hoặc khả năng huy động xã hội". Bộ phận thông tin sẽ đăng ký đánh giá bảo mật và thực hiện các thủ tục gửi, sửa đổi và hủy bỏ thuật toán theo "Quy định quản lý đề xuất thuật toán dịch vụ thông tin Internet".

Đây cũng là một trong những nguyên nhân khiến không có sản phẩm mô hình quy mô lớn ra mắt công chúng.

Giáo sư Chen Bing, phó khoa Luật của Đại học Nam Khai và là nhà nghiên cứu đặc biệt tại Viện Nghiên cứu Chiến lược Phát triển Trí tuệ Nhân tạo Thế hệ Mới của Trung Quốc, tin rằng quy định trước sẽ không nhất thiết gây tổn hại đến đổi mới công nghệ, nhưng cần lưu ý rằng do quy định trước xem xét, nó sẽ làm tăng số lượng doanh nghiệp ở một mức độ nhất định.Nếu phạm vi xem xét trước không được đặt đúng, nó có thể hạn chế hiệu quả nghiên cứu và phát triển và đào tạo của các sản phẩm AI sáng tạo, và khách quan dẫn đến sự chậm lại trong sự phát triển của AI sáng tạo.

Vì không thể ước tính trước các rủi ro của trí tuệ nhân tạo một cách hoàn hảo và việc giám sát sau sự kiện có thể gây ra thiệt hại lớn, nên quốc gia của tôi hiện đang áp dụng biện pháp giám sát toàn bộ quá trình phát triển trí tuệ nhân tạo.

Theo quy định của toàn bộ quy trình, chi phí tuân thủ của người chơi mô hình quy mô lớn chắc chắn sẽ tăng lên và hệ thống lập hồ sơ cũng thúc giục người chơi trong trò chơi ưu tiên tìm kiếm hồ sơ để quảng bá sản phẩm ra thị trường sớm hơn , khách quan đẩy nhanh tốc độ sóng lớn. Sự hoàn thiện dần dần của luật pháp và các quy định đi kèm với quá trình cải tổ ngành và những người yếu kém bị bỏ lại phía sau, điều này cũng có thể mang lại thời điểm mây tan cho mặt trời sớm hơn.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)