Діалог丨Боуен Чжоу: Як загальна широкомасштабна модель проривається через сценарії вертикальної галузі?

Автор: Wang Yongang Редактор: Dong Zibo

**Джерело: **AI Technology Review

Джерело зображення: створено інструментом Unbounded AI

Після того, як залишив JD.com, Чжоу Боуен давно не був таким схвильованим.

Виявилося, що ChatGPT сколихнув світ, як весняний грім розбудив практикуючих з усіх верств суспільства, щоб усі вони почули кроки AGI, що входять у реальність.

Під час підйому люди бачили, як Ван Хуйвен і Ван Сяочуань розпочали власний бізнес, а також бачили, як Baidu та Alibaba домінують на ринку. Чжоу Боуен, колишній декан Дослідницького інституту штучного інтелекту IBM і JD.com, вивчав базову теорію штучного інтелекту та основні передові технології, програми та індустріалізацію більше 25 років. Він заснував компанію Lianyuan Technology як наприкінці 2021 року. Модель із генеративним штучним інтелектом, багатораундовим діалогом і технологією співпраці між людиною та комп’ютером допомагає підприємствам і споживачам завершити інноваційні продукти та трансформацію цифрового інтелекту в нову еру штучного інтелекту. «Справа не стільки в тому, що я вирішив почати бізнес у цій сфері, краще сказати, що цей бізнес знайшов мене». Чжоу Боуен описав це як те, що потрібно зробити, ніби почуття місії спонукало його діяти.

Чжоу Бовен закінчив Університет науки і технологій Китаю, а потім поїхав до Університету Колорадо в Боулдері, щоб отримати докторський ступінь. Будучи колишнім президентом американського штаб-квартири IBM Research з фундаментальних досліджень штучного інтелекту, він повернувся до Китаю після того, як багато років очолював роботу, пов’язану зі ШІ, і послідовно обіймав посади старшого віце-президента JD Group, голови технічного комітету групи, президента JD Cloud and AI, президент-засновник JD Artificial Intelligence Research Institute та інші посади. Як засновник JD AI, він відповідає за технічні дослідження та розвиток бізнесу JD AI. Він створив відділ JD AI, дослідницький інститут AI та JD AI Accelerator з 0 для створення національної відкритої платформи для інтелектуального штучного інтелекту в ланцюзі поставок , реалізуючи щоденний обсяг дзвінків від 0. До десятків мільярдів, керував технічною реконструкцією служби підтримки клієнтів Jingdong зі штучним інтелектом і запустив зовнішню продукцію, керував мільярдами бізнесів технічного обслуговування та тисячами інтегрованих команд технологій, продуктів, маркетингу та продажів.

У 2021 році Чжоу Бовен передбачив, що генеративний штучний інтелект незабаром вибухне, і вирішив залишити JD.com, щоб заснувати Lianyuan Technology, яка прагне допомагати вертикальним підприємствам впроваджувати інноваційні продукти та цифрову трансформацію за допомогою загальних можливостей великомасштабних моделей, і переформатувати за допомогою AI Commodity value; у 2022 році він обійме посаду професора кафедри Huiyan Університету Цінхуа та штатного професора кафедри електронної інженерії, а в травні того ж року він створить Спільний інтерактивний дослідницький центр розвідки Університет Цінхуа. Випадково. **

ChatGPT незабаром з’явиться, і Чжоу Боуен також опублікував у Moments: «Я вважаю, що OpenAI Китаю потрібно досліджувати новий шлях!» Під гордістю він прагне шукати таланти. Але на відміну від інших підприємців, Zhou Bowen і Lianyuan Technology вирішили покладатися на десятки мільярдів параметрів і унікальні методи навчання, щоб зробити велику модель краще розуміти відносини між людьми та товарами на основі загальних можливостей.Інтелектуальна технологія допомагає компаніям реконструювати повноцінна інноваційна система від аналізу продукту, позиціонування, дизайну, досліджень і розробок до маркетингу.

Чжоу Бовен одного разу публічно заявив, що його підприємницький напрямок полягає в тому, щоб взяти на себе лідерство в інтеграції штучного інтелекту з традиційними галузями промисловості, щоб підвищити цінність корпоративних інновацій цифрового інтелекту, тобто досягти прориву в здатності загальних великих моделей у вертикальних сценаріях.

Нещодавно репортер AI Technology Review мав розмову з Чжоу Боуен. Нижче наведено стенограму розмови. AI Technology Review відредагував вміст, не змінюючи його початкове значення:

Дозвольте ШІ навчитися людської мудрості, нової парадигми взаємодії та співпраці

**Огляд технології штучного інтелекту: ChatGPT запропонував цей метод взаємодії, чим, на вашу думку, він відрізняється від попереднього методу взаємодії? **

Чжоу Бовен: Одним із моїх напрямків досліджень є взаємодія між ШІ та людьми та навчання у взаємодії. Взаємодія між людиною та комп’ютером відрізняється від діалогу між людиною та комп’ютером. Завдяки взаємодії між людиною та комп’ютером штучний інтелект може навчатися чомусь у процесі, тому це не просте завдання, а засіб для досягнення навчання.

Як записано в «Творах Конфуція», це історія Конфуція та його сімдесяти двох учнів, які навчаються через взаємодію. На Заході, подібно до Афінської академії Платона й Арістотеля, успадкування найдавніших знань і мудрості здійснюється через діалог між людьми, а вчителі допомагають студентам краще завершити навчання через взаємодію зі студентами.

Наприклад, якщо вчитель просить учнів налити склянку води, то такі прості «командно-виконавчі» дії важко підвищити мудрість; як подолати труднощі, це та взаємодія, яка може підвищити мудрість, а також відображає моя основна точка зору на спільну взаємодію між людьми та ШІ.

Суть штучного інтелекту полягає у співпраці та взаємодії з людьми. Він постійно вчиться на взаємодії, а потім співпрацює з людьми, щоб краще вирішувати проблеми. Ця точка зору ставатиме все більш і більш важливою в найближчому майбутньому, і в той же час вона стикатиметься з більшими технічними та етичними проблемами. Зрештою, буде непросто зберегти кінцевий результат. Подібно до згаданого вами AI Alignment, люди можуть передати свою волю ШІ, а потім розбити завдання за допомогою ШІ, дозволяючи ШІ навчатися та реалізовувати людську волю в процесі. Це новий спосіб співпраці, тобто спільний інтерактивний інтелект.

**Огляд технології штучного інтелекту: чи вважаєте ви, що досягнення вирівнювання цінностей через взаємодію є ефективним способом співпраці людського мозку та GPT? Як люди та ШІ повинні краще працювати разом? **

**Чжоу Боуен: **Після вибуху генеративного штучного інтелекту штучний інтелект, який навчається через спільну взаємодію з людьми, ставатиме все сильнішим.

Даніель Канеман, лауреат Нобелівської премії з економіки 2002 року, у своїй книзі-бестселері «Мислення швидко й повільно» запропонував, що існує два режими людського мислення — система 1 і система 2, а система 1 є швидкою. Мислення, інтуїтивне судження; Система 2 – це повільне мислення, яке вимагає багато міркувань і розрахунків.

Спочатку люди вважали, що ШІ більше підходить для роботи «системи 1», такої як розпізнавання облич і перевірка якості, які базуються на розпізнаванні образів «системи 1». Але я наполягаю на тому, що справжня цінність штучного інтелекту полягає в другому, тобто допомогти людям краще виконувати складні логічні завдання. Поява ChatGPT підтвердила доцільність штучного інтелекту як системи 2, що означає, що штучний інтелект може відкривати нові знання, а відкриття нових знань допоможе людям створювати кращі штучні інтелекти, такі як наука про мозок і оптимізація обчислень Discovery, і виникає маховик для створення нових знань. Ефект маховика означає, що штучний інтелект може дозволити всій системі краще відкривати нові знання, і ці нові знання можуть допомогти розробити кращі системи штучного інтелекту, таким чином утворюючи ефективне коло. Таким чином, між штучним інтелектом, знаннями та інноваціями сформувався взаємопідсилювальний зв’язок, який вимагає трансформації способу співпраці штучного інтелекту та людей.

Раніше я пропонував напрямок досліджень «3+1», тобто використовувати надійний штучний інтелект як дослідницьку базу та довгострокову мету, щоб зосередитись на мультимодальній взаємодії репрезентації, спільній інтерпретації людини й комп’ютера та спільній еволюції середовища. Суть полягає в тому, щоб бути людиною. Співпраця та спільне створення машин може реалізувати мету, коли люди допомагають штучному інтелекту впроваджувати інновації, а штучний інтелект допомагає людям впроваджувати інновації.

Одним із них є мультимодальна репрезентативна взаємодія, де може існувати велика уніфікована теорія. У 2022 році люди все ще скептично ставилися до цього, але з появою GPT-4 ця мультимодальна уніфікована репрезентативна взаємодія стала більш переконливою; Іншим моментом є спільна взаємодія людини та комп’ютера. Люди також скептично ставилися до цього у 2022 році, але тепер цей метод взаємодії став більш надійним, і люди почали вірити, що це ймовірно станеться; Третій момент — спільна еволюція ШІ та навколишнього середовища, це означає, що штучному інтелекту не тільки потрібно співпрацювати з людьми, але й адаптуватися до навколишнього середовища. Ми вперше запропонували цю концепцію на початку 2022 року, і поки що ми не бачили жодного успішного кейсу в цьому напрямку, навіть OpenAI.

Якщо ви не можете вивчити OpenAI, але ви не можете працювати з Microsoft, вам потрібно відняти для великомасштабних вітчизняних бізнес-стартапів

**Огляд технології штучного інтелекту: Особливістю моделі Transformer є те, що вона використовує механізм уваги (Attention) для моделювання тексту. Ми помітили, що ви дуже рано проводили дослідження, пов’язані з механізмом уваги ШІ. **

**Чжоу Боуен:**Основними моментами Transformer є механізм самоуважності та механізм із кількома головками. У червні 2017 року «Увага — це все, що вам потрібно», опублікована Google Brain, представила концепцію механізму самоуважності (самоуважності) і трансформатора. Пізніше ця стаття також зазнала глибокого впливу на GPT OpenAI.

До цього я опублікував першу статтю як автор-кореспондент, щоб представити механізм самоуважності з кількома стрибками для вдосконалення кодувальника - "A Structured Self-Attentive Sentence Embedding". Цей документ було завершено та завантажено в arXiv у 2016 році та офіційно опубліковано в ICLR на початку 2017 року. Ми також є першою командою, яка запропонувала цей механізм, і, що більш важливо, це перша модель представлення природної мови, яка не враховує наступні завдання зовсім. Кожен раніше використовував увагу або самоувагу в деяких випадках, але всі вони залежать від завдань.

**Огляд технології штучного інтелекту: що ви знайшли в цій статті? Як ці відкриття вплинули на подальші зміни технології Transformer? **

Чжоу Боуен: У статті ми запропонували, що найкращим методом репрезентації є використання структурованої самоуваги для репрезентації природної мови (НЛП). З моменту публікації цю статтю цитували більше 2300 разів.

До цього Ілля Суцкевер, головний науковий співробітник OpenAI, вважав, що найкращим методом представлення є «sequence-to-sequence (Seq2Seq)», тобто навчити модель перетворювати послідовність одного домену в послідовність іншого домену. , як-от відповідна мова оригіналу в машинному перекладі та цільова мова; або у відповіді на запитання, де запитання є послідовністю, а відповідь є послідовністю. На цій основі вивчається зв’язок відображення між двома, представленими глибокою нейронною мережею.

Але пізніше команда експерта з глибокого навчання й лауреата премії Тьюринга Йошуа Бенгіо запропонувала «механізм уваги», суть якого полягає в тому, що не всі слова є однаково важливими під час відповідей на запитання; шляхом визначення більш критичних частин, а потім приділяючи більше уваги на цю частину ви можете дати кращу відповідь. Ця модель уваги швидко отримала дуже широке визнання. У 2015 році я очолював команду IBM, щоб розпочати дослідження на основі архітектури та ідей «Seq2Seq+Attention Mechanism» одночасно, і послідовно запустив кілька найперших генеративних моделей для написання штучного інтелекту природною мовою. Пов’язані статті також цитувалися більше ніж 3000 разів.

Але тоді зміст роботи мене не влаштовував, тому що в ній була проблема, тобто увага будувалася на основі відповіді. ШІ, навчений таким чином, схожий на студента, який просить викладача відзначити ключові моменти перед випускним іспитом в університеті, а потім переглядає ключові моменти з цілеспрямованою увагою. Таким чином, хоча продуктивність штучного інтелекту в конкретних проблемах можна покращити, він не є універсальним. Тому ми запропонували, щоб це не залежало від заданого завдання та результату взагалі, а лише базувалося на внутрішній структурі вхідної природної мови, і вивчати, які частини важливіші та зв’язок між ними за допомогою багаторазового читання ШІ. Це самоувага плюс навчання репрезентації для багатоголових механізмів. Такий механізм навчання розглядає лише вхідні дані, схоже на те, що студенти вивчають і розуміють курс кілька разів і систематично перед іспитом, замість того, щоб навчатися цілеспрямовано та фрагментовано на основі ключових моментів іспиту, що ближче до мета загального штучного інтелекту та значно покращена здатність ШІ до навчання.

**Огляд технології штучного інтелекту: який зв’язок між документом «Увага — це все, що вам потрібно» та вами? **

Чжоу Бовен: Ми знаємо, що усі великі моделі цієї хвилі походять від Transformer, тому, коли ви бачите Т у моделі, то Т, швидше за все, означає Transformer. Для мене велика честь виконати перспективну роботу в цій сфері. Наприкінці 2017 року дослідники з Google опублікували «Увага — це все, що вам потрібно», визначну статтю, завдяки якій у світі з’явилася модель Transformer. І була процитована наша стаття «Структуроване вбудовування речення з увагою до себе», яка вперше запропонувала «механізм самоуважності з кількома стрибками», опублікована на початку 2017 року. І перший автор цієї статті, Ашіш Васвані, був студентом, якого я навчав у IBM. Назва статті «Увага — це все, що вам потрібно» також виражає запропоноване нами значення «самоувага дуже важлива, багатоголовість дуже важлива, але RNN може бути не такою важливою, як ми думали раніше».

**Огляд технології штучного інтелекту: які послідовні технічні оцінки ви та OpenAI маєте? **

**Чжоу Бовен: Ця стаття та архітектура Transformer повністю змінили все, і це вирішило проблему довгострокової пам’яті моделі. Ілля Суцкевер згадав у нещодавньому інтерв’ю, що OpenAI повністю перейшов на архітектуру Transformer наступного дня після появи статті. **

Ми знаємо, що GPT дуже відрізняється від моделі Берта, і причина, чому Берт був дуже успішним спочатку, але не таким хорошим, як GPT пізніше, полягає в тому, що він використовує інформацію як зліва направо, так і справа наліво. Іншими словами, Берт використовує майбутню інформацію, щоб допомогти штучному інтелекту навчитися представляти, тоді як GPT наполягає на передбаченні наступного слова лише на основі минулої інформації. **Підхід OpenAI у цьому питанні відповідає думці нашої команди, тобто намагайтеся не використовувати відповіді для навчання. **Від уваги до самоуважності, від BERT до GPT-3, основна ідея полягає в тому, коли ви більше не покладаєтеся на майбутню інформацію, таку як результати чи контекст слова, яке потрібно передбачити, або коли більше даних можна використовувати для Під час навчання моделей AI ми починаємо бачити можливість AGI.

Крім того, OpenAI вважає, що великі моделі вивчають знання світу за допомогою природної мови, таким чином стискаючи знання світу у великі моделі.Великі моделі серії GPT і ChatGPT також просуваються відповідно до цієї концепції. Те саме стосується концепції та бачення моєї команди та мене, тобто побудувати широкомасштабну модель загального призначення та забезпечити їй більшу цінність і можливості у вертикальному полі через професійне навчання та інтеграцію споживачів «складні емоції, потреби та досвід, а також інновації продукту, дизайн, параметри продукту, матеріали, функції тощо стискаються у велику модель, щоб реконструювати бінарні відносини між людьми та продуктами та використовувати ШІ для зміни цінності продуктів.

**Огляд технології штучного інтелекту: окрім технічної потужності, які ще аспекти OpenAI змушують вас вважати його перевагами? **

Чжоу Бовен: Не лише з точки зору технічних суджень, увесь бізнес-підхід OpenAI є репрезентативним, зокрема: створення екосистеми, оголошення нового закону Мура, зниження цін на API на 90% тощо. Розгорнути простір уяви капіталу та користувачів для комерційного застосування великих моделей і отримання майже необмежених сценаріїв застосування. Крім того, плани OpenAI щодо етичного управління, розвитку бізнесу, екологічних технологій і майбутнього розвитку також дуже чіткі.

**Огляд технологій ШІ: чи з’явиться наступний OpenAI у Китаї? **

** Чжоу Боуен: ** Багато китайських підприємців не можуть уявити технічні труднощі створення великої моделі. Тому я не рекомендую вітчизняним компаніям сліпо наслідувати та копіювати модель «OpenAI+Microsoft», оскільки більшість китайських технологічних компаній у Китаї не такі вправні в прийнятті бізнес-рішень, як Microsoft, і їхні технологічні судження не такі хороші, як OpenAI. . **

Успіх OpenAI є результатом багатьох факторів. Наприклад, Ілля Суцкевер робив технічні оцінки, Грег Брокман робив функції, а Сем Альтман інтегрував ресурси, зокрема дослідження впливу ШІ на етику та суспільство. Якщо вітчизняні компанії просто імітують OpenAI, відстань між собою буде тільки віддалятися.

Технічне судження OpenAI можна побачити з широти даних, оскільки не всі дані у світі однаково важливі. Чому OpenAI вирішила використовувати мову програмування Github для тренування ланцюжка мислення? Оскільки семантика і синтаксис мови програмування надзвичайно прості, логіка процесу виконання сувора. Це також є характеристикою та перевагою OpenAI: він не атакує наосліп. Тому я вважаю, що розвитку штучного інтелекту в Китаї потрібно знайти інший шлях, тобто покладатися на здатність загальних великих моделей починати із застосування вертикальних сценаріїв, що має більші шанси на успіх.

Генеративний штучний інтелект порушить існуючий досвід споживачів

**Огляд технології штучного інтелекту: чому ви націлені на споживчий сектор? **

Чжоу Боуен: Коли я працював у JD.com, я бачив величезні можливості для бізнесу, пов’язані з «динамічним узгодженням споживчого попиту та дизайну продукту за допомогою штучного інтелекту». У 2021 році я вирішив залишити роботу та розпочати бізнес із розробки загальної великої мовної моделі для вертикальних галузей (на той час велика мовна модель ще не розвинулася), сподіваючись охопити всю поведінку споживачів із неспецифічних сценаріїв. Ми знаємо, що час і простір відрізняються з понеділка по п’ятницю, і фокуси білих комірців або інших професій також відрізняються. За цими культурними символами, які впливають на поведінку покупців, стоять складні емоції споживачів, досвід і вибір продукту. Логічно , це саме та цінна інформація, яка потрібна бізнесу. Під час створення продуктів на стороні пропозиції це включає творчість, дизайн, параметри продукту, функції, матеріали та позиціонування бренду, слоган, маркетинг, рекламу, маркетинг, рекламні зображення тощо. Насправді за всіма цими факторами існує сильний відповідний зв’язок.

Такого роду відповідні відносини ніколи раніше не проходили між людьми. Практики з планування, маркетингу та продажів розуміють лише зв’язки, за які вони відповідають. І ми збираємося створити першу в світі широкомасштабну модель загального призначення ланцюга постачання товарів, тобто стиснути всю цю інформацію в модель загального призначення з високою точністю, і на основі цієї великомасштабної моделі розширити можливості весь життєвий цикл корпоративних продуктів, включаючи: можливості Insight (Discover), визначення продукту (Define), програмний дизайн (Design), стимулювання досліджень і розробок (Develop), маркетингову трансформацію (Distribute). Таким чином, підприємства можуть ефективніше відкривати інноваційні можливості, більш креативно проектувати та виробляти, здійснювати маркетингове просування, охоплювати користувачів і ефективніше завершувати трансформацію.

**Огляд технології штучного інтелекту: з точки зору бізнес-моделі, це здається більш просунутим. **

Чжоу Бовен: Для будь-якої команди підприємців дуже важливо мати можливість розвивати більше професійних здібностей після того, як вони мають загальні технічні можливості великих моделей. Наразі прорив GPT полягає головним чином у його загальних можливостях, але його значення для конкретних галузей промисловості та вертикальних сфер ще належить дослідити. Наприклад: GPT може малювати дуже реалістичні художні картини, але він не може малювати схеми, оскільки це робить недостатньо знання фізичних знань Глибокі та релевантні судження недостатньо професійні.

Тому я вважаю, що існує потреба в такому інструменті (велика модель загального призначення з професійними можливостями), щоб полегшити споживачам пошук і бути більш готовими купувати потрібні їм продукти, що може повністю змінити існуючі шляхи покупок людей . Генеративний штучний інтелект може стискати величезні обсяги бізнес-інформації в такі великі моделі, щоб вивчити всі аспекти ланцюжка поставок товарів і підвищити ефективність ключових ланок, зосереджених на споживачах. Це та ідея та креатив, які вже були згенеровані у 2021 році.

**Lianyuan Technology розробляє велику модель із загальними можливостями. Ця велика модель має досвід зв’язування продуктів і споживачів. **У нас є 37 індикаторів оцінки великомасштабної моделі, 2/3 з яких є здібностями загального призначення, такими як здатність міркувати та обчислювальна здатність, а більше десятка елементів спеціально застосовуються для зв’язку між продуктами та споживачами, щоб розуміти, що «кожен продукт має народжуватися з потреби, нехай кожен споживач отримає те, що хоче».

**Огляд технології штучного інтелекту: як генеративний штучний інтелект може краще інтегруватися зі сценаріями споживання, такими як електронна комерція? **

**Чжоу Бовен:**Люди можуть зрозуміти лише бізнес-логіку планування або логіку маркетингу, але ШІ може з’єднати всі бізнес-ланцюжки.

Споживачам потрібен великий професійний словниковий запас, щоб знайти потрібні продукти в таких сценаріях, як платформи електронної комерції; але, з іншого боку, продавці не розуміють справжніх потреб споживачів і можуть охопити споживачів лише через транзакції електронної комерції, через консультації. науково-дослідні установи, щоб краще зрозуміти споживачів. Після введення функції багатораундового діалогу, як-от ProductGPT, ефективність динамічного зіставлення продавців і споживачів щодо продуктів буде ефективнішою, ніж дослідження ринку, щоб платформи електронної комерції могли глибше брати участь в інноваціях продуктів, дизайні, дослідженнях і розробках, а також маркетинг, просування тощо.

У реальному комерційному суспільстві насправді існує сильна відповідність між стороною попиту та стороною пропозиції. Наша власно розроблена провідна платформа спільних інновацій SaaS базується на мультимодальному розумінні, міркуванні та можливостях генерації великих моделей і допомагає компаніям відкривати можливості для бізнесу та інновації в продуктах завдяки глибокому аналізу споживачів, сценаріїв, продуктів, посилань на продукти та досліджень і розробок. . Водночас багатораундова діалогова платформа ProductGPT від Lianyuan Technology надає кожному працівнику підприємства персонального помічника, який повністю налаштований відповідно до різних професійних ролей, і відповідає їхнім конкретним робочим потребам, надаючи навички та знання, пов’язані з певними ролями. Наприклад, особистий помічник із дослідження споживачів Lianyuan Technology надасть професійні навички та відповідні знання, такі як дослідження ринкових тенденцій, розуміння потреб споживачів та дослідження ринку.

**Огляд технології AI: Ви використовували генеративний AI, щоб заробляти гроші на JD.com, як вам це вдалося? **

**Чжоу Боуен:**У 2019 році я очолював команду AI JD.com для застосування генеративного штучного інтелекту для створення копірайтингу продуктів і вибору зображень. Це також перша генеративна великомасштабна модель JD.com. У той час наша модель штучного інтелекту головним чином досягла трьох речей:

По-перше, ви можете самостійно прочитати вміст на сторінці з інформацією про продукт і безпосередньо створити 8-9 пунктів продажу цього продукту шляхом аналізу;

По-друге, коли споживач переглядає певний продукт, велика модель швидко з’ясовує, які точки продажу можуть вразити користувача більше, аналізуючи дані про поведінку різних споживачів;

По-третє, AIGC створюватиме ексклюзивні слогани навколо торгових точок, які найбільше хвилюють споживачів, на основі портретів користувачів.

Після періоду впровадження коефіцієнт конверсії рекомендованих продуктів зріс на 30% порівняно з попереднім. Споживачі можуть не усвідомлювати, що коли вони шукають і роблять покупки на JD.com, категорії продуктів і описи, які вони бачать, насправді автоматично генеруються AIGC слово за словом відповідно до вподобань користувача та точки продажу продуктів у момент, коли він переглядає продукти .

**Огляд технології штучного інтелекту: що ви думаєте про відкритий API OpenAI і що це означає для галузі? **

Чжоу Бовен: Говорячи з особистого досвіду, я був головним науковим співробітником IBM Watson Group. У той час дані деяких галузей у Сполучених Штатах регулювалися, і такі підприємства, як правило, не могли співпрацювати, а могли розгортати лише приватні хмари. З цієї причини в 2015-2016 роках я вирішив бути публічною хмарою. Щоб досягти цього, необхідно налагодити API Watson AI. У той час я очолював запуск десятків API, включаючи діалог і розуміння природної мови. Розмістіть ці API на хмарній платформі, і тепер AI бізнес IBM в основному заробляє на цьому гроші.

Я повернувся до Китаю наприкінці 2017 року, а в квітні 2018 року я випустив відкриту платформу штучного інтелекту JD.com. На той момент у Китаї практично не було платформи штучного інтелекту, що також приносило чималий дохід JD.com. У 2019 році команда JD.com AI на чолі зі мною отримала 170 мільйонів юанів доходу, що непогано для команди з 200 людей.

**Огляд технології штучного інтелекту: у галузі існує думка, що ризик створення вертикальної великої моделі дуже високий. Що ви думаєте? **

Чжоу Бовен: Я думаю, що в майбутньому ці чітко визначені, цінні робочі процеси виконуватимуться професійними моделями ШІ, а не загальними моделями ШІ. Після успішного завершення певної вертикальної сцени можна легко вдосконалити базові можливості великої моделі загального призначення. Крім того, якщо ми почнемо з вертикального сценарію, наше минуле накопичення з точки зору обчислювальної потужності, даних і алгоритмів може бути використано повніше. Тому в Lianyuan Technology велика модель повинна мати базові можливості загальної технології великої моделі в основі технології, і її потрібно оцінювати за допомогою наукових методів, але вона також вимагає професійної підготовки.

У 2023 році через раптову популярність ChatGPT ринок почав використовувати AI 2.0, щоб описати його величезний потенціал. Крім того, майже всі технологічні гіганти приєдналися до битви, ринок венчурного капіталу намагається скористатися новими можливостями, а ринкове середовище також швидко змінюється. GPT – це систематична підприємницька можливість, але просто копіювати, слідкувати та наздоганяти ризиковано та важко.

Після заснування Lianyuan Technology ми спілкувалися з більш ніж 100 клієнтами, побачили реальні потреби та вдосконалили шлях реалізації технології шляхом постійної оптимізації великої моделі: «У 2022 році ми продемонстрували комерційну цінність і технічну здійсненність цього сценарію, це означає що навіть якщо ми створюємо велику модель, ми на іншому шляху, ніж OpenAI, і модель прибутку також відрізняється.

Те, що я хочу зробити, це кращий компресор світових знань, ніж поточний GPT, який вимагає дуже інтерактивних даних, і дані, очевидно, тісно пов’язані зі сценою. Що стосується того, які дані мають значення вищого людського інтелекту, насправді над цим потрібно виконати багато теоретичної роботи, і це напрямок, який варто досліджувати в майбутньому.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити