Джерело зображення: створено інструментом Unbounded AI
З 2023 року найпопулярнішим словом у технологічному колі є ChatGPT і технологія великомасштабної моделі, що стоїть за ним.
Раніше це були Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Pangu, HKUST Xunfei Xinghuo тощо. Нещодавно Лі Кайфу увійшов до бюро, щоб створити Zero One Wanwu, а Volcano Engine запустила «Volcano Ark». Всього за кілька місяців це стало тенденцією для різних підприємств розробляти та випускати масштабні прикладні моделі.
Існує понад 80 вітчизняних великомасштабних моделей із масштабом параметрів 1 мільярд і більше, і їх кількість продовжує швидко зростати. Атмосфера підготовки до комерційної війни навколо великих моделей вже надзвичайно сильна.
Незалежно від того, велика це гігантська компанія чи маленька гігантська компанія, усі вони потребують таких дій, щоб продемонструвати свою чутливість до передових технологій та їх довгострокового накопичення. Запустивши програму раніше, ви можете перевірити цінні дані про взаємодію між великою моделлю та користувачем на день раніше, а також «накопичити багато їжі, і картинка буде королем» у майбутньому змаганні.
Ключем до великої моделі є елементи поля ШІ – алгоритми, обчислювальна потужність, дані та сценарії/програми. Алгоритми представляють стратегії, обчислювальна потужність визначає верхню межу та встановлює поріг, а дані дорівнюють військовим пайкам також символізують різницю між хорошим і поганим. Окрім трьох елементів, сцена/додаток відображає напрямок відправлення військ.
«Війна сотень моделей» ось-ось спалахне. Чи перетвориться гігантська компанія з усіма елементами в нескінченну інволюцію технологічних можливостей? Чи зможуть маленькі гіганти на вертикальній трасі закріпити своє лідерство за допомогою великих моделей? Хто з нових гравців, які отримують квитки, може бути серйозним претендентом на домінування в галузі?
Загальна масштабна модель «вододіл міцності» ще не з'явилася
Гравці великих моделей в основному поділяються на три категорії: одна — це Інтернет (Baidu, Ali, Tencent тощо) і гіганти галузі (China Telecom і China Unicom тощо), розумні компанії (SenseTime, Yuncong, Guangyuewai тощо) , і остання категорія – науково-дослідні інститути, представлені Шанхайською лабораторією штучного інтелекту, Фуданьським університетом, Харбінським технологічним інститутом тощо.
Згідно з відкритими даними, станом на початок липня 2023 року в моїй країні існує понад 80 великомасштабних моделей з параметрами понад 1 мільярд, і їх кількість продовжує швидко зростати. Чим більше великих моделей з такою кількістю параметрів, тим вище буде поріг конкуренції.
Більшість великомасштабних моделей, які були випущені досі, є великомасштабними моделями загального призначення. Є дві основні причини: одна полягає в тому, що конкуренція великомасштабних моделей все ще нечітка, а суто технічний рівень не розширився розрив між поколіннями, і учасники галузі мають можливість домінувати у світі; Широкомасштабна модель, орієнтована на додатки, для громадськості ще не з’явилася, і немає чітких вказівок щодо напрямку. До «моменту Chat GPT» з’являється вітчизняна великомасштабна модель, це як активний, так і пасивний вибір приєднатися до великомасштабної моделі загального призначення.
Більше того, дуже ймовірно, що з поля великих моделей з’явиться новий гігант.
Чжоу Хонгі вважає, що великі моделі мають бути «універсальними», і лише загальне використання може увійти в тисячі домогосподарств, розширити можливості сотень галузей промисловості та очолити нову революцію штучного інтелекту.
Залишається незавершеним те, скільки інвестицій і співпраці потрібно, щоб стати лідером нової революції. Незалежно від того, чи є велика модель ринку блакитного океану чи червоного океану, має існувати екологічна структура, у якій велика риба лідирує, а мала риба співпрацює.Однак вододіл між великою рибою та маленькою рибою ще не виник.
Судячи з поточної ситуації, велика модель із масштабом 1 мільярд параметрів може розглядатися як поріг входу, а велика модель із масштабом 10 мільярдів параметрів може вважатися такою, що має здатність конкурувати у світі, але навіть велика модель зі шкалою в 100 мільярдів параметрів далеко не найкраща Провідний рівень пилу.
Кількість параметрів не є переважаючою силою, яка визначає ситуацію на полі бою. Такі фактори, як можливості планування ресурсів, накопичення тривалого досвіду та значні інвестиції в наукові дослідження, є давніми основними відмінностями у змаганні великомасштабних моделей.
Щоб порівняти з Open AI, необхідно побачити, що за вибухом Chat GPT стоїть всеосяжна підтримка Microsoft у вигляді даних, обчислювальної потужності та величезних коштів, так що вона накопичила багато грошей у майбутньому.
Масштабні моделі – це галузі довгострокових інвестицій, що просто означає «спалювання грошей». Накопичення обчислювальної потужності, алгоритмів і даних не досягається за одну ніч. Після випуску моделі вона потребує повторного навчання та гнучких ітерацій, і, нарешті, перетворюється на «зріле тіло».
У реальному середовищі гравець великої моделі керується технологіями чи прибутком? Open AI є найвідомішою великомасштабною модельною компанією у світі. Навіть з вибухонебезпечним продуктом Chat GPT його здатність до комерціалізації все ще викликає занепокоєння. Будучи технологічною компанією, ринкова вартість якої наближається до 30 мільярдів доларів США, вона опиниться в центрі хвилі штучного інтелекту в 2023 році. Дохід від відкритого штучного інтелекту поки що становить менше 200 мільйонів доларів США.
Початкові інвестиції - це лише початкові витрати, а кожне наступне навчання вимагає реальних грошей.Скільки компаній можуть погодитися на жалюгідну віддачу від інвестицій у масштабному конкурсі моделей? Успіх Chat GPT доводить, що велика модель була відкрита на шляху продукту, але це не означає великий успіх на комерційному рівні.
Принаймні з точки зору співвідношення витрат і випуску, інтернет-гіганти мають більшу відносну перевагу.У них достатньо мотивації та ресурсів, щоб підтримати стратегічні втрати на ранній стадії, як тоді Alibaba Cloud.
Великі компанії не знають, як і венчурні інвестори компаній-початківців, скільки часу знадобиться для спалювання грошей і коли можна побачити приємну віддачу від інвестицій. Це азартна гра, яка може вийти з гри в будь-який момент, а фішки становлять мільярди доларів.
Гравці великої моделі, які «в кожного є свої переваги», повинні спочатку вивчити прикладний рівень і відкрити тест якнайшвидше. Хто зможе накопичити більше цінних даних взаємодії, стане переломною точкою наступного змагання.
Вертикальні потреби та вертикальні труднощі
Конкуренція за загальні великомасштабні моделі — це більше конкуренція за право сформулювати інфраструктуру, тоді як вертикальні великомасштабні моделі покладаються на широкомасштабні моделі з відкритим кодом або інтерфейси API у конкретних сценаріях для формування диференційованої конкурентоспроможності в сегментованих галузях, зосереджуючись більше на застосуванні сценаріїв.
На полі битви великомасштабних моделей загального призначення з часом деякі слабкі гравці поступово відставатимуть, і зрештою залишиться лише кілька великомасштабних моделей загального призначення, які відіграватимуть роль інфраструктури . У той же час ці великі моделі все ще стикаються з проблемою однорідності, а прикладний рівень все ще залежить від вертикальних великих моделей.
Велика модель загального призначення схожа на набір кількох вертикальних великих моделей. Чим більше сценаріїв навчання, тим сильніша "загальність" великої моделі загального призначення.
Будучи першою компанією в Китаї, яка випустила продукти, схожі на Chat GPT, Baidu має нагальну потребу у вертикальних прикладних рівнях великомасштабної моделі. Лі Яньхун сказав: «Найважливішим, ніж кількість великих моделей, є застосування, яке є проривом у застосуванні вертикальних полів. Ключовим моментом нової міжнародної стратегії конкуренції є не кількість великих моделей, а кількість рідних застосування на великих моделях. Ці програми Наскільки було покращено ефективність виробництва.
Відповідно до метафори Робіна Лі, великі моделі, особливо великі моделі загального призначення, схожі на операційну систему в епоху штучного інтелекту. Усі додатки розроблятимуться навколо великої моделі, над якою розташований прикладний рівень, включаючи різноманітні штучні інтелекти. програми.
Зрештою, так звана «універсальність» є лише відносним поняттям, і немає моделі загального призначення, яка б повністю застосовувалася до всіх сфер і мала достатню галузеву глибину. Якщо взяти Chat GPT як приклад, то все ще є деякі галузі з високим рівнем відмовостійкості, які дійсно широко використовуються. Навіть якщо рішення, надане великою моделлю, неправильне, помилка обмежена відносно обмеженим діапазоном. Однак у таких сценаріях, як важка промисловість, аерокосмічна та медична допомога, втрати, спричинені помилкою, є невимірними, тобто Chat GPT не може відповідати вертикальним і професійним вимогам конкретних сценаріїв.
З огляду на вимоги вертикальності та професіоналізму, дані є недоліком, а галузей з достатньою глибиною даних і стабільним ровом менше. Важко конкретно оцінити, чи легко отримати дані цих галузей і чи можуть отримані дані задовольнити потреби конкретних галузей, що постійно змінюються.
Інтернет-гіганти мають велику кількість мережевих даних, таких як електронна комерція, соціальні мережі та пошук, але типи даних недостатньо вичерпні, а якість даних не гарантована. Корпус, який можна навчити китайській мові, все ще потребує багато гірничої роботи.
Останнім часом у сферах державного управління, громадської безпеки та медичного обслуговування одна за одною впроваджуються вертикальні масштабні моделі. Наприклад, Yunzhisheng самостійно розробив широкомасштабну модель «гори і море» у сфері інтелектуальної медичної допомоги в поєднанні з повним набором інтелектуальних технологій голосової взаємодії, таких як зовнішня обробка звукових сигналів, розпізнавання відбитків голосу, розпізнавання мови та Синтез мовлення, очікується підвищення ефективності введення електронних медичних записів лікарів більш ніж на 400%, заощаджуючи понад 40% часу консультації для одного пацієнта та покращуючи ефективність амбулаторного лікування лікаря більш ніж на 66%.
Ґрунтуючись на власних офіційних документах, програмних документах, довідниках з питань державних справ та інших даних як дані про професійну підготовку, TRS створив велику модель державних справ.
У фінансовій сфері Hang Seng Electronics почне планувати та розробляти фінансові великомасштабні модельні продукти наприкінці березня 2023 року. Наприкінці червня Hang Seng Electronics та її дочірня компанія Hang Seng Juyuan випустили новий фінансовий продукт цифрового інтелекту, заснований на технології великої мовної моделі – фінансовий інтелектуальний помічник Photon і дебют нової оновленої платформи інтелектуальних інвестицій WarrenQ.
Tencent, інтернет-гігант із багатьма галузевими ресурсами, робить ставку на кілька сторін. Наприкінці червня Tencent анонсувала сервісні рішення MaaS, що охоплюють 10 галузей, включаючи фінанси, культурний туризм, урядові справи та освіту, із загалом понад 50 рішень.
У той же час дані, необхідні для вертикальної великої моделі, часто не обмежуються галуззю. Деяким підприємствам може знадобитися інтеграція даних з іншої чи кількох галузей. Навчання та застосування моделі залежить від міжгалузевої співпраці підприємств або ресурсів Інтернет-гігантів.
Під час золотої лихоманки на заході Сполучених Штатів у 19 столітті золотошукачі справді могли заробити гроші було ймовірною подією, тоді як продавці лопатами заробляли гроші було неминучим результатом.
У золотій лихоманці штучного інтелекту ситуація на полі бою великої моделі все ще незрозуміла, і гравці все ще просуваються, але «продавець лопати» вже переміг. Спираючись на тренд чіпів зі штучним інтелектом і великих моделей, Nvidia збільшила відставання від свого конкурента AMD, і її ринкова вартість увійшла в «клуб трильйонів доларів».
Генеральний директор Open AI Сем Альтман запропонував нову версію закону Мура, тобто обчислювальна потужність глобального ШІ подвоюватиметься кожні 18 місяців. Для підтримки цих розрахунків необхідна підтримка навчальних чіпів ШІ, і частка ринку Nvidia в цій галузі перевищує 90%.
Чіпи Nvidia зі штучним інтелектом були захоплені великими технологічними компаніями по всьому світу: у березні 2023 року Microsoft оголосила, що допомогла OpenAI створити новий обчислювальний центр із десятками тисяч A100; у травні Google випустив H100 із 26 000 штук. обчислювальний кластер ComputeEngineA3. Крім того, згідно з інформацією China National Finance Securities, цього року ByteDance замовила графічних процесорів на суму понад 1 мільярд доларів США, і, за оцінками, є 100 000 одиниць A100 і H800, які надійшли та не надійшли. Десятки тисяч мікросхем H800 також використовуються в новій версії Tencent Cloud High Performance Computing Service Center, випущеній Tencent.
Фінансовий директор Nvidia Кресс сказав, що поточний ринковий попит на обчислювальну потужність штучного інтелекту перевищив очікування компанії на наступні кілька кварталів, і є занадто багато замовлень для виконання.
Звичайно, нам марно заздрити грошима Nvidia.
Вітчизняний графічний процесор також наздоганяє. Існують не лише власноруч розроблені мікросхеми штучного інтелекту Інтернет-гігантів, такі як мікросхема штучного інтелекту Baidu Kunlun, мікросхема відеообробки Tencent «Canghai» та мікросхема штучного інтелекту «Zixiao» тощо, а й технологія Suiyuan, Tianshu Zhixin, нові компанії, такі як Moore Threads, які розробляють графічні процесори загального призначення. Графічні процесори загального призначення використовуються для різноманітних завдань загального призначення, включаючи можливості високопаралельних обчислень і великомасштабні обчислювальні ядра. Останніми роками також спостерігається великий прогрес , і відставання від високопродуктивних графічних процесорів поступово скорочується.
Ву Хецюань, академік Китайської інженерної академії, запропонував, щоб під час координації національних науково-технічних і промислових планів був сформований розумний розподіл праці для формування спільної обчислювальної потужності та платформи обчислювальної потужності національної лабораторія повинна бути відкрита для підтримки різноманітного навчання великомасштабних моделей.У той же час пропонується сформувати альянс обчислювальних потужностей для концентрації існуючих графічних процесорів високого класу.Обчислювальні ресурси забезпечують обчислювальну потужність, необхідну для навчання даних великих моделей.
На додаток до високопродуктивних графічних процесорів, недорогі обчислювальні платформи також розглядаються як нові ринкові можливості. Нещодавно Jiuzhang Yunji оголосив, що він продовжить співпрацювати з державними виробниками хмарних технологій і включатиме велику кількість інтелектуальних обчислювальних центрів на ринку як партнерів, а також надаватиме клієнтам платформу досліджень і розробки моделі штучного інтелекту, яка інтегрує програмне та апаратне забезпечення. вартість клієнтів буде прив'язана до обчислювальної потужності.
Обчислювальна потужність є основою для розробки великих моделей, і це необхідна умова, але не достатня.Максимальна роль, яку може відігравати обчислювальна потужність, все ще залежить від напрямку використання. Лише тоді, коли інновації в алгоритмі, створення ресурсів даних і ітерація навчальної структури йдуть рука об руку, можна створити «потужні цеглинки, що літають».
Політика: Керівництво та регулювання в критичні моменти
Період вибуху штучного інтелекту збігається з критичним моментом управління алгоритмами та їх подання в нашій країні.
Ще в 2021 році в «Керівних думках щодо посилення комплексного управління алгоритмами інформаційних послуг Інтернету» управління файлами алгоритмів було визначено як важлива частина вдосконалення системи нагляду. Регламент управління чітко передбачає або згадує, що «провайдери послуг рекомендацій щодо алгоритмів з атрибути громадської думки або можливості соціальної мобілізації повинні виконувати процедури подання документів».
У квітні 2023 року Управління кіберпростору Китаю розробило «Адміністративні заходи для служб генеративного штучного інтелекту (проект для коментарів)» для громадського обговорення. У червні «План законодавчої роботи Державної ради на 2023 рік», опублікований Державною радою, показав, що проект закону про штучний інтелект був підготовлений для подання до Постійного комітету Всекитайських зборів народних представників для обговорення.
У «Заходах з управління послугами генеративного штучного інтелекту (проект для коментарів)» зазначено, що перед використанням продуктів генеративного штучного інтелекту для надання послуг громадськості слід повідомити про це державну мережу відповідно до «Положення про оцінку безпеки Інтернет-інформації» Сервіси з атрибутами громадської думки або можливостями соціальної мобілізації". Інформаційний відділ подає заявку на оцінку безпеки та виконує процедури подання алгоритму, зміни та скасування відповідно до "Правил управління рекомендаціями щодо алгоритму інформаційної служби Інтернету".
Це також одна з причин, чому немає широкомасштабних моделей виробів, доступних для громадськості.
Професор Чен Бін, заступник декана юридичного факультету Нанкайського університету та спеціальний дослідник Китайського науково-дослідного інституту стратегії розвитку штучного інтелекту нового покоління, вважає, що попереднє регулювання не обов’язково зашкодить технологічним інноваціям, але слід зазначити, що через попередні це призведе до певного збільшення кількості підприємств. Якщо обсяг попереднього перегляду не встановлено належним чином, це може перешкоджати науково-дослідній діяльності та ефективності навчання генеративних продуктів штучного інтелекту та об’єктивно призвести до уповільнення розвитку генеративний ШІ.
Оскільки ризики штучного інтелекту неможливо точно оцінити заздалегідь, а нагляд після події може завдати величезної шкоди, моя країна наразі впроваджує повний нагляд за розробкою штучного інтелекту.
Відповідно до регулювання всього процесу, витрати на відповідність гравцям великомасштабних моделей, безсумнівно, зростуть, а система реєстрації записів також спонукає гравців у грі надавати пріоритет пошуку записів, щоб просувати продукти на ринок раніше. , об’єктивно прискорюючи швидкість великих хвиль. Поступове удосконалення законів і правил супроводжується процесом перебудови галузі та відставкою слабких, що також може призвести до того, що момент розгону хмар до сонця буде більш раннім.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Коли народиться новий гігант? Велика модель чекає «перелому»
Джерело| Zero One Finance
Автор| Шень Чжоянь
З 2023 року найпопулярнішим словом у технологічному колі є ChatGPT і технологія великомасштабної моделі, що стоїть за ним.
Раніше це були Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Pangu, HKUST Xunfei Xinghuo тощо. Нещодавно Лі Кайфу увійшов до бюро, щоб створити Zero One Wanwu, а Volcano Engine запустила «Volcano Ark». Всього за кілька місяців це стало тенденцією для різних підприємств розробляти та випускати масштабні прикладні моделі.
Існує понад 80 вітчизняних великомасштабних моделей із масштабом параметрів 1 мільярд і більше, і їх кількість продовжує швидко зростати. Атмосфера підготовки до комерційної війни навколо великих моделей вже надзвичайно сильна.
Незалежно від того, велика це гігантська компанія чи маленька гігантська компанія, усі вони потребують таких дій, щоб продемонструвати свою чутливість до передових технологій та їх довгострокового накопичення. Запустивши програму раніше, ви можете перевірити цінні дані про взаємодію між великою моделлю та користувачем на день раніше, а також «накопичити багато їжі, і картинка буде королем» у майбутньому змаганні.
Ключем до великої моделі є елементи поля ШІ – алгоритми, обчислювальна потужність, дані та сценарії/програми. Алгоритми представляють стратегії, обчислювальна потужність визначає верхню межу та встановлює поріг, а дані дорівнюють військовим пайкам також символізують різницю між хорошим і поганим. Окрім трьох елементів, сцена/додаток відображає напрямок відправлення військ.
«Війна сотень моделей» ось-ось спалахне. Чи перетвориться гігантська компанія з усіма елементами в нескінченну інволюцію технологічних можливостей? Чи зможуть маленькі гіганти на вертикальній трасі закріпити своє лідерство за допомогою великих моделей? Хто з нових гравців, які отримують квитки, може бути серйозним претендентом на домінування в галузі?
Загальна масштабна модель «вододіл міцності» ще не з'явилася
Гравці великих моделей в основному поділяються на три категорії: одна — це Інтернет (Baidu, Ali, Tencent тощо) і гіганти галузі (China Telecom і China Unicom тощо), розумні компанії (SenseTime, Yuncong, Guangyuewai тощо) , і остання категорія – науково-дослідні інститути, представлені Шанхайською лабораторією штучного інтелекту, Фуданьським університетом, Харбінським технологічним інститутом тощо.
Згідно з відкритими даними, станом на початок липня 2023 року в моїй країні існує понад 80 великомасштабних моделей з параметрами понад 1 мільярд, і їх кількість продовжує швидко зростати. Чим більше великих моделей з такою кількістю параметрів, тим вище буде поріг конкуренції.
Більшість великомасштабних моделей, які були випущені досі, є великомасштабними моделями загального призначення. Є дві основні причини: одна полягає в тому, що конкуренція великомасштабних моделей все ще нечітка, а суто технічний рівень не розширився розрив між поколіннями, і учасники галузі мають можливість домінувати у світі; Широкомасштабна модель, орієнтована на додатки, для громадськості ще не з’явилася, і немає чітких вказівок щодо напрямку. До «моменту Chat GPT» з’являється вітчизняна великомасштабна модель, це як активний, так і пасивний вибір приєднатися до великомасштабної моделі загального призначення.
Більше того, дуже ймовірно, що з поля великих моделей з’явиться новий гігант.
Чжоу Хонгі вважає, що великі моделі мають бути «універсальними», і лише загальне використання може увійти в тисячі домогосподарств, розширити можливості сотень галузей промисловості та очолити нову революцію штучного інтелекту.
Залишається незавершеним те, скільки інвестицій і співпраці потрібно, щоб стати лідером нової революції. Незалежно від того, чи є велика модель ринку блакитного океану чи червоного океану, має існувати екологічна структура, у якій велика риба лідирує, а мала риба співпрацює.Однак вододіл між великою рибою та маленькою рибою ще не виник.
Судячи з поточної ситуації, велика модель із масштабом 1 мільярд параметрів може розглядатися як поріг входу, а велика модель із масштабом 10 мільярдів параметрів може вважатися такою, що має здатність конкурувати у світі, але навіть велика модель зі шкалою в 100 мільярдів параметрів далеко не найкраща Провідний рівень пилу.
Кількість параметрів не є переважаючою силою, яка визначає ситуацію на полі бою. Такі фактори, як можливості планування ресурсів, накопичення тривалого досвіду та значні інвестиції в наукові дослідження, є давніми основними відмінностями у змаганні великомасштабних моделей.
Щоб порівняти з Open AI, необхідно побачити, що за вибухом Chat GPT стоїть всеосяжна підтримка Microsoft у вигляді даних, обчислювальної потужності та величезних коштів, так що вона накопичила багато грошей у майбутньому.
Масштабні моделі – це галузі довгострокових інвестицій, що просто означає «спалювання грошей». Накопичення обчислювальної потужності, алгоритмів і даних не досягається за одну ніч. Після випуску моделі вона потребує повторного навчання та гнучких ітерацій, і, нарешті, перетворюється на «зріле тіло».
У реальному середовищі гравець великої моделі керується технологіями чи прибутком? Open AI є найвідомішою великомасштабною модельною компанією у світі. Навіть з вибухонебезпечним продуктом Chat GPT його здатність до комерціалізації все ще викликає занепокоєння. Будучи технологічною компанією, ринкова вартість якої наближається до 30 мільярдів доларів США, вона опиниться в центрі хвилі штучного інтелекту в 2023 році. Дохід від відкритого штучного інтелекту поки що становить менше 200 мільйонів доларів США.
Початкові інвестиції - це лише початкові витрати, а кожне наступне навчання вимагає реальних грошей.Скільки компаній можуть погодитися на жалюгідну віддачу від інвестицій у масштабному конкурсі моделей? Успіх Chat GPT доводить, що велика модель була відкрита на шляху продукту, але це не означає великий успіх на комерційному рівні.
Принаймні з точки зору співвідношення витрат і випуску, інтернет-гіганти мають більшу відносну перевагу.У них достатньо мотивації та ресурсів, щоб підтримати стратегічні втрати на ранній стадії, як тоді Alibaba Cloud.
Великі компанії не знають, як і венчурні інвестори компаній-початківців, скільки часу знадобиться для спалювання грошей і коли можна побачити приємну віддачу від інвестицій. Це азартна гра, яка може вийти з гри в будь-який момент, а фішки становлять мільярди доларів.
Гравці великої моделі, які «в кожного є свої переваги», повинні спочатку вивчити прикладний рівень і відкрити тест якнайшвидше. Хто зможе накопичити більше цінних даних взаємодії, стане переломною точкою наступного змагання.
Вертикальні потреби та вертикальні труднощі
Конкуренція за загальні великомасштабні моделі — це більше конкуренція за право сформулювати інфраструктуру, тоді як вертикальні великомасштабні моделі покладаються на широкомасштабні моделі з відкритим кодом або інтерфейси API у конкретних сценаріях для формування диференційованої конкурентоспроможності в сегментованих галузях, зосереджуючись більше на застосуванні сценаріїв.
На полі битви великомасштабних моделей загального призначення з часом деякі слабкі гравці поступово відставатимуть, і зрештою залишиться лише кілька великомасштабних моделей загального призначення, які відіграватимуть роль інфраструктури . У той же час ці великі моделі все ще стикаються з проблемою однорідності, а прикладний рівень все ще залежить від вертикальних великих моделей.
Велика модель загального призначення схожа на набір кількох вертикальних великих моделей. Чим більше сценаріїв навчання, тим сильніша "загальність" великої моделі загального призначення.
Будучи першою компанією в Китаї, яка випустила продукти, схожі на Chat GPT, Baidu має нагальну потребу у вертикальних прикладних рівнях великомасштабної моделі. Лі Яньхун сказав: «Найважливішим, ніж кількість великих моделей, є застосування, яке є проривом у застосуванні вертикальних полів. Ключовим моментом нової міжнародної стратегії конкуренції є не кількість великих моделей, а кількість рідних застосування на великих моделях. Ці програми Наскільки було покращено ефективність виробництва.
Відповідно до метафори Робіна Лі, великі моделі, особливо великі моделі загального призначення, схожі на операційну систему в епоху штучного інтелекту. Усі додатки розроблятимуться навколо великої моделі, над якою розташований прикладний рівень, включаючи різноманітні штучні інтелекти. програми.
Зрештою, так звана «універсальність» є лише відносним поняттям, і немає моделі загального призначення, яка б повністю застосовувалася до всіх сфер і мала достатню галузеву глибину. Якщо взяти Chat GPT як приклад, то все ще є деякі галузі з високим рівнем відмовостійкості, які дійсно широко використовуються. Навіть якщо рішення, надане великою моделлю, неправильне, помилка обмежена відносно обмеженим діапазоном. Однак у таких сценаріях, як важка промисловість, аерокосмічна та медична допомога, втрати, спричинені помилкою, є невимірними, тобто Chat GPT не може відповідати вертикальним і професійним вимогам конкретних сценаріїв.
З огляду на вимоги вертикальності та професіоналізму, дані є недоліком, а галузей з достатньою глибиною даних і стабільним ровом менше. Важко конкретно оцінити, чи легко отримати дані цих галузей і чи можуть отримані дані задовольнити потреби конкретних галузей, що постійно змінюються.
Інтернет-гіганти мають велику кількість мережевих даних, таких як електронна комерція, соціальні мережі та пошук, але типи даних недостатньо вичерпні, а якість даних не гарантована. Корпус, який можна навчити китайській мові, все ще потребує багато гірничої роботи.
Останнім часом у сферах державного управління, громадської безпеки та медичного обслуговування одна за одною впроваджуються вертикальні масштабні моделі. Наприклад, Yunzhisheng самостійно розробив широкомасштабну модель «гори і море» у сфері інтелектуальної медичної допомоги в поєднанні з повним набором інтелектуальних технологій голосової взаємодії, таких як зовнішня обробка звукових сигналів, розпізнавання відбитків голосу, розпізнавання мови та Синтез мовлення, очікується підвищення ефективності введення електронних медичних записів лікарів більш ніж на 400%, заощаджуючи понад 40% часу консультації для одного пацієнта та покращуючи ефективність амбулаторного лікування лікаря більш ніж на 66%.
Ґрунтуючись на власних офіційних документах, програмних документах, довідниках з питань державних справ та інших даних як дані про професійну підготовку, TRS створив велику модель державних справ.
У фінансовій сфері Hang Seng Electronics почне планувати та розробляти фінансові великомасштабні модельні продукти наприкінці березня 2023 року. Наприкінці червня Hang Seng Electronics та її дочірня компанія Hang Seng Juyuan випустили новий фінансовий продукт цифрового інтелекту, заснований на технології великої мовної моделі – фінансовий інтелектуальний помічник Photon і дебют нової оновленої платформи інтелектуальних інвестицій WarrenQ.
Tencent, інтернет-гігант із багатьма галузевими ресурсами, робить ставку на кілька сторін. Наприкінці червня Tencent анонсувала сервісні рішення MaaS, що охоплюють 10 галузей, включаючи фінанси, культурний туризм, урядові справи та освіту, із загалом понад 50 рішень.
У той же час дані, необхідні для вертикальної великої моделі, часто не обмежуються галуззю. Деяким підприємствам може знадобитися інтеграція даних з іншої чи кількох галузей. Навчання та застосування моделі залежить від міжгалузевої співпраці підприємств або ресурсів Інтернет-гігантів.
**Обчислювальна потужність: потужні цеглини літають? **
Під час золотої лихоманки на заході Сполучених Штатів у 19 столітті золотошукачі справді могли заробити гроші було ймовірною подією, тоді як продавці лопатами заробляли гроші було неминучим результатом.
У золотій лихоманці штучного інтелекту ситуація на полі бою великої моделі все ще незрозуміла, і гравці все ще просуваються, але «продавець лопати» вже переміг. Спираючись на тренд чіпів зі штучним інтелектом і великих моделей, Nvidia збільшила відставання від свого конкурента AMD, і її ринкова вартість увійшла в «клуб трильйонів доларів».
Генеральний директор Open AI Сем Альтман запропонував нову версію закону Мура, тобто обчислювальна потужність глобального ШІ подвоюватиметься кожні 18 місяців. Для підтримки цих розрахунків необхідна підтримка навчальних чіпів ШІ, і частка ринку Nvidia в цій галузі перевищує 90%.
Чіпи Nvidia зі штучним інтелектом були захоплені великими технологічними компаніями по всьому світу: у березні 2023 року Microsoft оголосила, що допомогла OpenAI створити новий обчислювальний центр із десятками тисяч A100; у травні Google випустив H100 із 26 000 штук. обчислювальний кластер ComputeEngineA3. Крім того, згідно з інформацією China National Finance Securities, цього року ByteDance замовила графічних процесорів на суму понад 1 мільярд доларів США, і, за оцінками, є 100 000 одиниць A100 і H800, які надійшли та не надійшли. Десятки тисяч мікросхем H800 також використовуються в новій версії Tencent Cloud High Performance Computing Service Center, випущеній Tencent.
Фінансовий директор Nvidia Кресс сказав, що поточний ринковий попит на обчислювальну потужність штучного інтелекту перевищив очікування компанії на наступні кілька кварталів, і є занадто багато замовлень для виконання.
Звичайно, нам марно заздрити грошима Nvidia.
Вітчизняний графічний процесор також наздоганяє. Існують не лише власноруч розроблені мікросхеми штучного інтелекту Інтернет-гігантів, такі як мікросхема штучного інтелекту Baidu Kunlun, мікросхема відеообробки Tencent «Canghai» та мікросхема штучного інтелекту «Zixiao» тощо, а й технологія Suiyuan, Tianshu Zhixin, нові компанії, такі як Moore Threads, які розробляють графічні процесори загального призначення. Графічні процесори загального призначення використовуються для різноманітних завдань загального призначення, включаючи можливості високопаралельних обчислень і великомасштабні обчислювальні ядра. Останніми роками також спостерігається великий прогрес , і відставання від високопродуктивних графічних процесорів поступово скорочується.
Ву Хецюань, академік Китайської інженерної академії, запропонував, щоб під час координації національних науково-технічних і промислових планів був сформований розумний розподіл праці для формування спільної обчислювальної потужності та платформи обчислювальної потужності національної лабораторія повинна бути відкрита для підтримки різноманітного навчання великомасштабних моделей.У той же час пропонується сформувати альянс обчислювальних потужностей для концентрації існуючих графічних процесорів високого класу.Обчислювальні ресурси забезпечують обчислювальну потужність, необхідну для навчання даних великих моделей.
На додаток до високопродуктивних графічних процесорів, недорогі обчислювальні платформи також розглядаються як нові ринкові можливості. Нещодавно Jiuzhang Yunji оголосив, що він продовжить співпрацювати з державними виробниками хмарних технологій і включатиме велику кількість інтелектуальних обчислювальних центрів на ринку як партнерів, а також надаватиме клієнтам платформу досліджень і розробки моделі штучного інтелекту, яка інтегрує програмне та апаратне забезпечення. вартість клієнтів буде прив'язана до обчислювальної потужності.
Обчислювальна потужність є основою для розробки великих моделей, і це необхідна умова, але не достатня.Максимальна роль, яку може відігравати обчислювальна потужність, все ще залежить від напрямку використання. Лише тоді, коли інновації в алгоритмі, створення ресурсів даних і ітерація навчальної структури йдуть рука об руку, можна створити «потужні цеглинки, що літають».
Політика: Керівництво та регулювання в критичні моменти
Період вибуху штучного інтелекту збігається з критичним моментом управління алгоритмами та їх подання в нашій країні.
Ще в 2021 році в «Керівних думках щодо посилення комплексного управління алгоритмами інформаційних послуг Інтернету» управління файлами алгоритмів було визначено як важлива частина вдосконалення системи нагляду. Регламент управління чітко передбачає або згадує, що «провайдери послуг рекомендацій щодо алгоритмів з атрибути громадської думки або можливості соціальної мобілізації повинні виконувати процедури подання документів».
У квітні 2023 року Управління кіберпростору Китаю розробило «Адміністративні заходи для служб генеративного штучного інтелекту (проект для коментарів)» для громадського обговорення. У червні «План законодавчої роботи Державної ради на 2023 рік», опублікований Державною радою, показав, що проект закону про штучний інтелект був підготовлений для подання до Постійного комітету Всекитайських зборів народних представників для обговорення.
У «Заходах з управління послугами генеративного штучного інтелекту (проект для коментарів)» зазначено, що перед використанням продуктів генеративного штучного інтелекту для надання послуг громадськості слід повідомити про це державну мережу відповідно до «Положення про оцінку безпеки Інтернет-інформації» Сервіси з атрибутами громадської думки або можливостями соціальної мобілізації". Інформаційний відділ подає заявку на оцінку безпеки та виконує процедури подання алгоритму, зміни та скасування відповідно до "Правил управління рекомендаціями щодо алгоритму інформаційної служби Інтернету".
Це також одна з причин, чому немає широкомасштабних моделей виробів, доступних для громадськості.
Професор Чен Бін, заступник декана юридичного факультету Нанкайського університету та спеціальний дослідник Китайського науково-дослідного інституту стратегії розвитку штучного інтелекту нового покоління, вважає, що попереднє регулювання не обов’язково зашкодить технологічним інноваціям, але слід зазначити, що через попередні це призведе до певного збільшення кількості підприємств. Якщо обсяг попереднього перегляду не встановлено належним чином, це може перешкоджати науково-дослідній діяльності та ефективності навчання генеративних продуктів штучного інтелекту та об’єктивно призвести до уповільнення розвитку генеративний ШІ.
Оскільки ризики штучного інтелекту неможливо точно оцінити заздалегідь, а нагляд після події може завдати величезної шкоди, моя країна наразі впроваджує повний нагляд за розробкою штучного інтелекту.
Відповідно до регулювання всього процесу, витрати на відповідність гравцям великомасштабних моделей, безсумнівно, зростуть, а система реєстрації записів також спонукає гравців у грі надавати пріоритет пошуку записів, щоб просувати продукти на ринок раніше. , об’єктивно прискорюючи швидкість великих хвиль. Поступове удосконалення законів і правил супроводжується процесом перебудови галузі та відставкою слабких, що також може призвести до того, що момент розгону хмар до сонця буде більш раннім.