**Источник: **Обзор технологий искусственного интеллекта.
Источник изображения: сгенерировано инструментом Unbounded AI
Покинув JD.com, Чжоу Боуэн уже давно не был так взволнован.
ChatGPT оказался всколыхнуть мир, словно весенний гром разбудил практиков из всех слоев общества, чтобы все они услышали шаги входящего в реальность ОИИ.
Во время подъема люди увидели, как Ван Хуэйвэнь и Ван Сяочуань открыли свой собственный бизнес, а также увидели, что Baidu и Alibaba доминируют на рынке. Чжоу Боуэн, будучи бывшим деканом Исследовательского института искусственного интеллекта IBM и JD.com, более 25 лет изучал основы теории искусственного интеллекта и основные передовые технологии, приложения и индустриализацию.Он основал Lianyuan Technology as уже в конце 2021 года. Модель с генеративным искусственным интеллектом, многоэтапным диалогом и технологией взаимодействия человека и компьютера помогает предприятиям и потребителям внедрять инновационные продукты и трансформировать цифровой интеллект в новую эру искусственного интеллекта. «Дело не столько в том, что я решил начать бизнес в этой области, лучше сказать, что этот бизнес нашел меня.» Чжоу Боуэн описал это как то, что нужно сделать, как будто чувство миссии побуждало его действовать.
Чжоу Боуэн окончил Университет науки и технологий Китая, а затем поступил в Колорадский университет в Боулдере, чтобы получить докторскую степень. Будучи бывшим президентом института фундаментальных исследований искусственного интеллекта штаб-квартиры IBM Research в США, он вернулся в Китай после того, как много лет руководил работой, связанной с ИИ, и последовательно занимал должности старшего вице-президента JD Group, председателя технического комитета группы, президента JD Cloud и AI, а также президент-основатель Исследовательского института искусственного интеллекта JD и другие должности. Как основатель JD AI, он отвечает за технические исследования и развитие бизнеса JD AI.Он основал подразделение JD AI, научно-исследовательский институт искусственного интеллекта и JD AI Accelerator с нуля, чтобы создать национальную открытую платформу для интеллектуального искусственного интеллекта цепочки поставок. , осознавая ежедневный объем звонков от 0 до десятков миллиардов, руководил технической реконструкцией службы поддержки клиентов с искусственным интеллектом Jingdong и запускал внешнее производство продуктов, управлял миллиардным бизнесом технических услуг и тысячами интегрированных команд по технологиям, продуктам, маркетингу и продажам.
В 2021 году Чжоу Боуэн предсказал, что генеративный ИИ взорвется в ближайшем будущем, и решил покинуть JD.com, чтобы основать Lianyuan Technology, которая стремится помогать вертикальным предприятиям внедрять инновации в продукты и цифровую трансформацию с помощью общих возможностей крупномасштабного моделирования. и измениться с учетом стоимости товара ИИ; в 2022 году он станет профессором кафедры Хуэйянь Университета Цинхуа и штатным профессором кафедры электронной инженерии, а в мае того же года он создаст Совместный интерактивный исследовательский центр разведки Университет Цинхуа. **
ChatGPT вот-вот появится, и Чжоу Боуэн также написал в «Моментах»: «Я считаю, что OpenAI в Китае должен исследовать новый путь!» Под гордостью он стремится искать таланты. Но в отличие от других предпринимателей, Чжоу Боуэн и Lianyuan Technology решили полагаться на десятки миллиардов параметров и уникальные методы обучения, чтобы сделать большую модель лучше для понимания отношений между людьми и товарами на основе общих возможностей.Интеллектуальные технологии помогают компаниям реконструировать комплексная инновационная система от понимания продукта, позиционирования, дизайна, исследований и разработок до маркетинга.
Чжоу Боуэн однажды публично заявил, что его предпринимательское направление заключается в том, чтобы взять на себя ведущую роль в интеграции искусственного интеллекта с традиционными отраслями, чтобы повысить ценность инноваций корпоративного цифрового интеллекта, то есть добиться прорыва в возможностях общих крупных моделей в вертикальных сценариях.
Недавно репортер из AI Technology Review провел беседу с Чжоу Боуэном. Ниже приводится стенограмма разговора. AI Technology Review отредактировал содержание, не изменив его первоначального значения:
Позвольте ИИ изучить человеческую мудрость, новую парадигму взаимодействия и сотрудничества
**Обзор технологий искусственного интеллекта: ChatGPT привнес этот метод взаимодействия, как вы думаете, что отличается от предыдущего метода взаимодействия? **
Чжоу Боуэн: Одно из направлений моих исследований — взаимодействие между ИИ и людьми и обучение в процессе взаимодействия. Взаимодействие человека с компьютером отличается от диалога человека с компьютером.Благодаря взаимодействию человека с компьютером ИИ может учиться чему-то в процессе, так что это не простая задача для выполнения, а средство достижения обучения.
Как записано в «Аналектах Конфуция», это история Конфуция и его семидесяти двух учеников, которые учатся через взаимодействие. На Западе, подобно Афинской академии Платона и Аристотеля, наследование древнейших знаний и мудрости осуществляется через диалог между людьми, а преподаватели помогают учащимся лучше завершать учебу посредством взаимодействия со студентами.
Например, если учитель просит учеников налить стакан воды, то таким простым действиям «команда-исполнение» трудно увеличить мудрость; как преодолевать трудности, это взаимодействие, которое может увеличить мудрость, и оно также отражает моя основная точка зрения на совместное взаимодействие между людьми и ИИ.
Суть ИИ заключается в сотрудничестве и взаимодействии с людьми, он постоянно учится на взаимодействиях, а затем сотрудничает с людьми, чтобы лучше решать проблемы. Эта точка зрения будет становиться все более и более важной в ближайшем будущем, и в то же время она будет сталкиваться с более техническими и этическими проблемами.В конце концов, будет нелегко удержать практический результат. Подобно выравниванию ИИ, о котором все говорят, люди могут передавать свою волю ИИ, а затем разбивать задачи с помощью ИИ, позволяя ИИ учиться и реализовывать человеческую волю в процессе. Это новый способ совместной работы, то есть совместный интерактивный интеллект.
**Обзор технологий искусственного интеллекта: считаете ли вы, что достижение согласованности ценностей посредством взаимодействия является эффективным способом сотрудничества человеческого мозга и GPT? Как люди и ИИ должны лучше работать вместе? **
**Чжоу Боуэн: **После взрыва генеративного ИИ, ИИ, который обучается в процессе совместного взаимодействия с людьми, будет становиться все сильнее и сильнее.
Дэниел Канеман, лауреат Нобелевской премии по экономике 2002 года, в своем бестселлере «Думай быстро и медленно» предположил, что существует два режима человеческого мышления — система 1 и система 2, и система 1 — быстрая. Система 2 — медленное мышление, требующее много рассуждений и расчетов.
Изначально люди думали, что ИИ больше подходит для работы «системы 1», такой как распознавание лиц и проверка качества, которые основывались на распознавании образов «системы 1». Но я настаиваю на том, что реальная ценность ИИ заключается в том, чтобы помочь людям лучше выполнять сложные задачи логического мышления. Появление ChatGPT подтвердило осуществимость ИИ как Системы 2, а это означает, что ИИ может открывать новые знания, а открытие новых знаний поможет людям разрабатывать более совершенные ИИ, такие как наука о мозге и оптимизация вычислений. появляется маховик для создания новых знаний. Эффект маховика означает, что ИИ может позволить всей системе лучше открывать новые знания, и эти новые знания могут помочь в разработке более совершенных систем ИИ, таким образом образуя благотворный круг. Таким образом, между ИИ, знаниями и инновациями сформировались взаимоусиливающие отношения, которые требуют преобразования способов взаимодействия ИИ и людей.
Ранее я предлагал направление исследований «3+1», то есть использовать надежный ИИ в качестве исследовательской базы и долгосрочной цели, чтобы сосредоточиться на взаимодействии мультимодальных представлений, совместной интерпретации человека и компьютера и совместной эволюции окружающей среды. Суть в том, чтобы быть человеком. Сотрудничество и совместное творчество машин могут реализовать цель, состоящую в том, чтобы люди помогали ИИ внедрять инновации, а ИИ помогал людям вводить новшества.
Одним из них является мультимодальное взаимодействие представлений, где может существовать великая единая теория. В 2022 году люди все еще относятся к этому скептически, но с появлением GPT-4 это мультимодальное унифицированное представление представлений стало более убедительным; Еще один момент — совместное взаимодействие человека и компьютера. В 2022 году люди тоже относились к этому скептически, но сейчас этот метод взаимодействия стал более достоверным, и люди начинают верить, что это, вероятно, произойдет; Третий момент — это коэволюция ИИ и окружающей среды, Это означает, что ИИ должен не только сотрудничать с людьми, но и адаптироваться к окружающей среде. Впервые мы предложили эту концепцию в начале 2022 года, и пока не видели успешных кейсов в этом направлении, даже OpenAI.
Если вы не можете освоить OpenAI, но не можете заниматься Microsoft, вам нужно вычесть крупные стартапы отечественного бизнеса
**Обзор технологий искусственного интеллекта: особенностью модели Transformer является то, что она использует механизм внимания (Attention) для моделирования текста Мы заметили, что вы очень рано проводили исследования, связанные с механизмом внимания искусственного интеллекта. **
**Чжоу Боуэн:**Основными особенностями Transformer являются механизм самоконтроля и многоголовый механизм. В июне 2017 года в публикации Google Brain «Внимание — это все, что вам нужно» была представлена концепция механизма самоконтроля (самовнимания) и Transformer. Позже эта статья также оказала сильное влияние на GPT OpenAI.
До этого я опубликовал первую статью в качестве соответствующего автора, чтобы представить механизм многоэтапного самоконтроля для улучшения кодировщика - «Структурированное встраивание предложений с самостоятельным вниманием». Эта статья была завершена и загружена в arXiv в 2016 году и официально опубликована в ICLR в начале 2017 года. Мы также являемся первой командой, предложившей этот механизм, и, что более важно, это первая модель представления на естественном языке, которая не учитывает последующие задачи. совсем. Каждый раньше использовал внимание или само-внимание в некоторых случаях, но все они зависят от задачи.
**Обзор технологий искусственного интеллекта: что вы нашли в этой статье? Как эти открытия повлияли на последующие изменения технологии Transformer? **
Чжоу Боуэн: В статье мы предложили лучший метод репрезентации — использовать структурированное самовнимание для репрезентации естественного языка (НЛП). С момента публикации эта статья цитировалась более 2300 раз.
До этого Илья Суцкевер, главный научный сотрудник OpenAI, считал, что лучшим методом представления является «последовательность к последовательности (Seq2Seq)», то есть обучать модель преобразованию последовательности одного домена в последовательность другого домена. , например соответствующий исходный язык в машинном переводе и целевой язык, или при ответе на вопрос, где вопрос представляет собой последовательность, а ответ представляет собой последовательность. На этой основе изучаются отношения отображения между двумя, представленными глубокой нейронной сетью.
Но позже команда эксперта по глубокому обучению и лауреата премии Тьюринга Йошуа Бенжио предложила «механизм внимания», суть которого заключается в том, что не все слова одинаково важны при ответе на вопросы; определяя наиболее важные части, а затем уделяя больше внимания на эту часть вы можете дать лучший ответ. Эта модель внимания быстро получила очень широкое признание. В 2015 году я возглавил команду IBM, которая одновременно начала исследования, основанные на архитектуре и идеях «механизма Seq2Seq+Attention», и последовательно запустила несколько первых генеративных моделей для письма ИИ на естественном языке. более 3000 раз.
Но содержание работы меня в то время не устраивало, потому что в ней была проблема, то есть внимание строилось на основе ответа. Обученный таким образом ИИ подобен студенту, который просит преподавателя отметить ключевые моменты перед выпускным экзаменом в университете, а затем с прицельным вниманием просматривает ключевые моменты. Таким образом, хотя производительность ИИ при решении конкретных задач можно улучшить, он не является универсальным. Поэтому мы предложили, чтобы он вообще не зависел от поставленной задачи и вывода, а только на основе внутренней структуры входного естественного языка, через многократное чтение ИИ, чтобы узнать, какие части более важны и взаимосвязь между ними, это внимание к себе плюс обучение представлению для многоголовых механизмов. Этот тип механизма обучения рассматривает только входные данные, больше похоже на то, что студенты изучают и понимают курс несколько раз и систематически перед экзаменом, вместо целенаправленного и фрагментарного обучения на основе ключевых моментов экзамена, который ближе к экзамену. цель общего искусственного интеллекта и значительно улучшенная способность ИИ к обучению.
**Обзор технологий искусственного интеллекта: какова связь между статьей «Внимание — это все, что вам нужно» и вами? **
Чжоу Боуэн: Мы знаем, что все большие модели этой волны созданы Трансформером, поэтому, когда вы видите букву Т в модели, скорее всего, это означает Трансформера. Для меня большая честь проделать дальновидную работу в этой области. В конце 2017 года исследователи из Google опубликовали «Внимание — это все, что вам нужно», важный документ, который представил миру модель Transformer. И была процитирована наша статья «Структурированное встраивание предложений с самостоятельным вниманием», в которой впервые был предложен «многошаговый механизм внутреннего внимания», опубликованный в начале 2017 года. И первый автор этой статьи, Ашиш Васвани, был студентом, которого я обучал в IBM. Название статьи «Внимание — это все, что вам нужно» также выражает предложенный нами смысл «внимание к себе очень важно, многоголовость очень важна, но RNN может быть не так важно, как мы думали раньше».
**Обзор технологий искусственного интеллекта: какие согласованные технические суждения вы и OpenAI имеете? **
**Чжоу Боуэн: Эта статья и архитектура Transformer полностью изменили все, и это решило проблему дальней памяти модели. Илья Суцкевер в недавнем интервью напомнил, что OpenAI полностью перешла на архитектуру Transformer на следующий день после публикации статьи. **
Мы знаем, что GPT очень отличается от модели Берта, и причина, по которой Берт был очень успешным сначала, но не так хорош, как GPT позже, заключается в том, что он использует информацию как слева направо, так и справа налево. Другими словами, Берт использует информацию о будущем, чтобы помочь ИИ научиться представлять, в то время как GPT настаивает на том, чтобы предсказывать, какое следующее слово будет, только на основе прошлой информации. **Подход OpenAI в этом вопросе соответствует точке зрения нашей команды, а именно: старайтесь не использовать ответы для обучения. **От внимания к собственному вниманию, от BERT до GPT-3, основная идея заключается в том, что вы больше не полагаетесь на будущую информацию, такую как результат или контекст предсказуемого слова, или когда можно использовать больше данных для полностью При обучении моделей ИИ мы начинаем видеть возможности ОИИ.
Кроме того, OpenAI считает, что большие модели изучают знания о мире с помощью естественного языка, тем самым сжимая знания о мире в большие модели.В соответствии с этой концепцией также продвигаются большие модели серии GPT и ChatGPT. То же самое относится к концепции и видению моей команды и меня, то есть построить крупномасштабную модель общего назначения и позволить ей проявлять более высокую ценность и возможности в вертикальной области посредством профессионального обучения и интегрировать потребителей. Сложные эмоции, потребности и переживания, а также инновации продукта, дизайн, параметры продукта, материалы, функции и т. д. сжимаются в большую модель для реконструкции бинарных отношений между людьми и продуктами и использования ИИ для изменения ценности продукта. продукты.
**Обзор технологий искусственного интеллекта: помимо технической мощи, какие еще аспекты OpenAI заставляют вас думать, что у него есть достоинства? **
Чжоу Боуэн: Не только с точки зрения технических суждений, весь бизнес-подход OpenAI является репрезентативным, включая: создание экосистемы, объявление нового закона Мура, снижение цен на API на 90 % и т. д. Развернуть пространство воображения капитала и пользователей для коммерческого применения больших моделей и получения практически неограниченных сценариев применения. Кроме того, планы OpenAI в отношении этического управления, развития бизнеса, экологических технологий и будущего развития также очень ясны.
**Обзор технологий искусственного интеллекта: появится ли следующий OpenAI в Китае? **
**Чжоу Боуэн:**Техническая сложность создания большой модели на самом деле выходит за рамки воображения многих китайских предпринимателей. Поэтому я не рекомендую отечественным компаниям слепо следовать и копировать модель «OpenAI+Microsoft», потому что большинство китайских технологических компаний в Китае не так хороши в принятии бизнес-решений, как Microsoft, и их способность оценивать технологии не так хороша. как OpenAI. **
Успех OpenAI является результатом многих факторов, например, Илья Суцкевер выносил технические суждения, Грег Брокман выполнял функции, а Сэм Альтман объединял ресурсы, включая исследования влияния ИИ на этику и общество. Если отечественные компании будут просто имитировать OpenAI, расстояние между ними будет только увеличиваться.
Техническое суждение OpenAI можно увидеть по широте данных, потому что не все данные в мире одинаково важны. Почему OpenAI решила использовать язык программирования Github для обучения цепочки мышления? Поскольку семантика и синтаксис языка программирования чрезвычайно просты, логика процесса выполнения является строгой. Это также представляет собой характеристику и преимущество OpenAI: он не будет атаковать вслепую. Поэтому я думаю, что развитию ИИ в Китае нужно найти другой путь, то есть опираясь на способность общих крупных моделей начинать с применения вертикальных сценариев, что с большей вероятностью приведет к успеху.
Генеративный ИИ изменит существующий потребительский опыт
**Обзор технологий искусственного интеллекта: почему вы ориентируетесь на потребительский сектор? **
Чжоу Боуэн: Когда я работал в JD.com, я увидел огромную бизнес-возможность «динамического согласования потребительского спроса и дизайна продукта с искусственным интеллектом». В 2021 году я решил уйти с работы и начать бизнес по разработке общей большой языковой модели для вертикальных отраслей (в то время масштабная языковая модель еще не получила широкого распространения), надеясь охватить все потребительское поведение из неспецифических сценариев. Мы знаем, что с понедельника по пятницу время и пространство различны, и внимание белых воротничков или других профессий также отличается.За этими культурными символами, влияющими на покупательское поведение, стоят сложные эмоции, опыт и выбор продуктов потребителей. , это именно та ценная информация, которая нужна бизнесу. При производстве продуктов со стороны предложения это включает в себя креативность, дизайн, параметры продукта, функции, материалы и позиционирование бренда, слоган, маркетинг, рекламу, маркетинг, рекламные изображения и т. Д. На самом деле за всеми этими факторами существует тесная соответствующая взаимосвязь.
Такого рода соответствующие отношения еще никогда не проходили люди. Специалисты по планированию, маркетингу и продажам понимают только те связи, за которые они несут ответственность. И мы собираемся сделать первую в мире крупномасштабную модель цепочки поставок товаров общего назначения, то есть сжать всю эту информацию в универсальную модель с высокой точностью, и на основе этой крупномасштабной модели расширить возможности весь жизненный цикл корпоративных продуктов, включая: понимание возможностей (Discover), определение продукта (Define), разработку программы (Design), проведение НИОКР (Develop), маркетинговую трансформацию (Distribution). Таким образом, предприятия могут более эффективно находить инновационные возможности, более творчески проектировать и производить, осуществлять маркетинговое продвижение, привлекать пользователей и более эффективно проводить преобразования.
**Обзор технологий искусственного интеллекта: с точки зрения бизнес-модели это кажется более продвинутым. **
Чжоу Боуэн: Для любой предпринимательской команды очень важно иметь возможность развивать более профессиональные навыки, имея общие технические возможности крупных моделей. В настоящее время прорыв ТШП заключается в основном в его общих возможностях, но его значение для конкретных отраслей и вертикальных областей еще предстоит развить.Например: ТШП может рисовать очень реалистичные художественные картины, но не может рисовать принципиальные схемы, потому что это не так. не хватает знаний физических знаний.Глубокие и соответствующие суждения недостаточно профессиональны.
Поэтому я считаю, что нужен такой инструмент (универсальная крупная модель с профессиональными возможностями), чтобы потребителям было проще находить и охотнее покупать нужные им товары, что может полностью изменить существующие покупательские пути людей. . Генеративный ИИ может сжимать огромные объемы бизнес-информации в такие большие модели, чтобы изучать все аспекты цепочки поставок товаров и повышать эффективность ключевых звеньев, ориентированных на потребителей. Это идея и творчество, которые уже были сгенерированы в 2021 году.
**Lianyuan Technology разрабатывает большую модель с общими возможностями.Эта большая модель имеет опыт связывания продуктов и потребителей. ** У нас есть 37 показателей оценки крупномасштабных моделей, 2/3 из которых представляют собой возможности общего назначения, такие как способность рассуждать и вычислительные способности, и более дюжины элементов специально применяются для связи между продуктами и потребителями, чтобы реализовать цель «пусть каждый продукт должен быть рожден из необходимости, пусть каждый потребитель получит то, что он хочет».
**Обзор технологий искусственного интеллекта: как генеративный искусственный интеллект может лучше интегрироваться со сценариями потребления, такими как электронная коммерция? **
**Чжоу Боуэн:**Люди могут понять только бизнес-логику планирования или логику маркетинга, а ИИ может соединить все бизнес-цепочки.
Потребителям нужно много профессионального словаря, чтобы найти продукты, которые они хотят, в таких сценариях, как платформы электронной коммерции; но, с другой стороны, продавцы не понимают реальных потребностей потребителей и могут связаться с потребителями только посредством транзакций электронной коммерции, путем консультирования. исследовательские институты для дальнейшего понимания потребителей. После введения функции многоэтапного диалога, такой как ProductGPT, эффективность динамического сопоставления продавцов и потребителей продуктов станет более эффективной, чем исследование рынка, так что платформы электронной коммерции смогут более активно участвовать в разработке, разработке, исследованиях и разработках продуктов, а также маркетинг продвижение и т.д.
В реальном коммерческом обществе на самом деле существует сильное соответствие между стороной спроса и стороной предложения. Наша ведущая SaaS-платформа для совместных инноваций, разработанная нами самостоятельно, основана на мультимодальном понимании, рассуждениях и возможностях генерации больших моделей и помогает компаниям находить возможности для бизнеса и инновации продуктов благодаря глубокому пониманию потребителей, сценариев, продуктов, ссылок на продукты и исследований и разработок. . В то же время многоуровневая диалоговая платформа ProductGPT от Lianyuan Technology предоставляет каждому сотруднику предприятия личного помощника, глубоко настроенного в соответствии с различными профессиональными ролями, и отвечает их конкретным рабочим потребностям, предоставляя навыки и знания, специфичные для этой роли. Например, личный помощник Lianyuan Technology по исследованию потребителей предоставит профессиональные навыки и соответствующие знания, такие как исследование тенденций рынка, понимание потребностей потребителей и исследование рынка.
**Обзор технологий искусственного интеллекта: вы использовали генеративный искусственный интеллект для заработка на JD.com, как вам это удалось? **
**Чжоу Боуэн:**В 2019 году я руководил командой JD.com по искусственному интеллекту, которая применяла генеративный искусственный интеллект для создания копирайта продуктов и выбора изображений.Это также первая крупномасштабная генеративная модель JD.com. В то время наша модель ИИ в основном выполняла три задачи:
Во-первых, вы можете самостоятельно прочитать содержимое страницы сведений о продукте и напрямую создать 8-9 точек продаж этого продукта посредством анализа;
Во-вторых, когда потребитель просматривает определенный продукт, большая модель быстро выясняет, какие точки продаж могут произвести на пользователя большее впечатление, анализируя данные о поведении разных потребителей;
В-третьих, AIGC будет генерировать эксклюзивные слоганы вокруг точек продаж, которые больше всего беспокоят потребителей, на основе портретов пользователей.
После периода внедрения коэффициент конверсии рекомендаций по продуктам увеличился на 30% по сравнению с предыдущим периодом. Потребители могут не осознавать, что когда они ищут и совершают покупки на JD.com, категории продуктов и описания, которые они видят, на самом деле автоматически генерируются AIGC слово за словом в соответствии с предпочтениями пользователя и точками продажи продуктов в тот момент, когда он просматривает продукты. .
**Обзор технологий искусственного интеллекта: что вы думаете об открытом API OpenAI и что это значит для отрасли? **
Чжоу Боуэн: Исходя из личного опыта, я был главным научным сотрудником IBM Watson Group. В то время данные некоторых отраслей в США регулировались, и такие предприятия вообще не могли сотрудничать, а могли развертывать только частные облака. По этой причине в 2015-2016 годах я определился с публичным облаком. Для этого необходимо API-интерфейс возможностей ИИ Watson. В то время я руководил запуском десятков API, включая диалоги и понимание естественного языка. Разместите эти API на облачной платформе, и теперь AI-бизнес IBM в основном зарабатывает на этом деньги.
Я вернулся в Китай в конце 2017 года, а в апреле 2018 года выпустил открытую платформу искусственного интеллекта JD.com. В то время в Китае практически не было ИИ-платформы, что также приносило немалый доход JD.com. В 2019 году ИИ-команда JD.com под моим руководством принесла 170 млн юаней дохода, что неплохо для команды из 200 человек.
**Обзор технологии искусственного интеллекта: в отрасли существует мнение, что риск создания вертикальной большой модели очень высок, что вы думаете? **
Чжоу Боуэн: Я думаю, что в будущем эти четко определенные, ценные рабочие процессы будут дополняться профессиональными моделями ИИ, а не общими моделями ИИ. Базовые возможности большой модели общего назначения легко улучшить после успешного завершения определенной вертикальной сцены. Кроме того, если мы начнем с вертикального сценария, наши прошлые накопления с точки зрения вычислительной мощности, данных и алгоритмов могут быть использованы более полно. Таким образом, в Lianyuan Technology большая модель должна иметь базовые возможности общей технологии больших моделей в базовой структуре технологии, и она должна оцениваться научными методами, но также требует профессиональной подготовки.
В 2023 году из-за внезапной популярности ChatGPT рынок начал использовать AI 2.0 для описания своего огромного потенциала. Кроме того, в бой вступили почти все технологические гиганты, рынок венчурного капитала пытается использовать новые возможности, и рыночная среда также быстро меняется. GPT — это систематическая предпринимательская возможность, но просто копировать, следовать и догонять рискованно и сложно.
После основания Lianyuan Technology мы пообщались с более чем 100 клиентами, увидели реальные потребности и улучшили путь реализации технологии, постоянно оптимизируя большую модель: «В 2022 году мы продемонстрировали коммерческую ценность и техническую осуществимость этого сценария. Это означает что даже если мы делаем большую модель, мы идем по пути, отличному от OpenAI, и модель прибыли также отличается.
Что я хочу сделать, так это лучший компрессор знаний о мире, чем текущий GPT, который требует очень интерактивных данных, и данные, очевидно, тесно связаны со сценой. Что касается того, какие данные имеют значение для высшего человеческого интеллекта, то на самом деле над этим предстоит проделать много теоретической работы, и это направление стоит исследовать в будущем.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Диалог 丨 Боуэн Чжоу: Как общая крупномасштабная модель пробивает вертикальные отраслевые сценарии?
Автор: Ван Юнган Редактор: Дун Цзыбо
**Источник: **Обзор технологий искусственного интеллекта.
Покинув JD.com, Чжоу Боуэн уже давно не был так взволнован.
ChatGPT оказался всколыхнуть мир, словно весенний гром разбудил практиков из всех слоев общества, чтобы все они услышали шаги входящего в реальность ОИИ.
Во время подъема люди увидели, как Ван Хуэйвэнь и Ван Сяочуань открыли свой собственный бизнес, а также увидели, что Baidu и Alibaba доминируют на рынке. Чжоу Боуэн, будучи бывшим деканом Исследовательского института искусственного интеллекта IBM и JD.com, более 25 лет изучал основы теории искусственного интеллекта и основные передовые технологии, приложения и индустриализацию.Он основал Lianyuan Technology as уже в конце 2021 года. Модель с генеративным искусственным интеллектом, многоэтапным диалогом и технологией взаимодействия человека и компьютера помогает предприятиям и потребителям внедрять инновационные продукты и трансформировать цифровой интеллект в новую эру искусственного интеллекта. «Дело не столько в том, что я решил начать бизнес в этой области, лучше сказать, что этот бизнес нашел меня.» Чжоу Боуэн описал это как то, что нужно сделать, как будто чувство миссии побуждало его действовать.
Чжоу Боуэн окончил Университет науки и технологий Китая, а затем поступил в Колорадский университет в Боулдере, чтобы получить докторскую степень. Будучи бывшим президентом института фундаментальных исследований искусственного интеллекта штаб-квартиры IBM Research в США, он вернулся в Китай после того, как много лет руководил работой, связанной с ИИ, и последовательно занимал должности старшего вице-президента JD Group, председателя технического комитета группы, президента JD Cloud и AI, а также президент-основатель Исследовательского института искусственного интеллекта JD и другие должности. Как основатель JD AI, он отвечает за технические исследования и развитие бизнеса JD AI.Он основал подразделение JD AI, научно-исследовательский институт искусственного интеллекта и JD AI Accelerator с нуля, чтобы создать национальную открытую платформу для интеллектуального искусственного интеллекта цепочки поставок. , осознавая ежедневный объем звонков от 0 до десятков миллиардов, руководил технической реконструкцией службы поддержки клиентов с искусственным интеллектом Jingdong и запускал внешнее производство продуктов, управлял миллиардным бизнесом технических услуг и тысячами интегрированных команд по технологиям, продуктам, маркетингу и продажам.
В 2021 году Чжоу Боуэн предсказал, что генеративный ИИ взорвется в ближайшем будущем, и решил покинуть JD.com, чтобы основать Lianyuan Technology, которая стремится помогать вертикальным предприятиям внедрять инновации в продукты и цифровую трансформацию с помощью общих возможностей крупномасштабного моделирования. и измениться с учетом стоимости товара ИИ; в 2022 году он станет профессором кафедры Хуэйянь Университета Цинхуа и штатным профессором кафедры электронной инженерии, а в мае того же года он создаст Совместный интерактивный исследовательский центр разведки Университет Цинхуа. **
ChatGPT вот-вот появится, и Чжоу Боуэн также написал в «Моментах»: «Я считаю, что OpenAI в Китае должен исследовать новый путь!» Под гордостью он стремится искать таланты. Но в отличие от других предпринимателей, Чжоу Боуэн и Lianyuan Technology решили полагаться на десятки миллиардов параметров и уникальные методы обучения, чтобы сделать большую модель лучше для понимания отношений между людьми и товарами на основе общих возможностей.Интеллектуальные технологии помогают компаниям реконструировать комплексная инновационная система от понимания продукта, позиционирования, дизайна, исследований и разработок до маркетинга.
Чжоу Боуэн однажды публично заявил, что его предпринимательское направление заключается в том, чтобы взять на себя ведущую роль в интеграции искусственного интеллекта с традиционными отраслями, чтобы повысить ценность инноваций корпоративного цифрового интеллекта, то есть добиться прорыва в возможностях общих крупных моделей в вертикальных сценариях.
Недавно репортер из AI Technology Review провел беседу с Чжоу Боуэном. Ниже приводится стенограмма разговора. AI Technology Review отредактировал содержание, не изменив его первоначального значения:
Позвольте ИИ изучить человеческую мудрость, новую парадигму взаимодействия и сотрудничества
**Обзор технологий искусственного интеллекта: ChatGPT привнес этот метод взаимодействия, как вы думаете, что отличается от предыдущего метода взаимодействия? **
Чжоу Боуэн: Одно из направлений моих исследований — взаимодействие между ИИ и людьми и обучение в процессе взаимодействия. Взаимодействие человека с компьютером отличается от диалога человека с компьютером.Благодаря взаимодействию человека с компьютером ИИ может учиться чему-то в процессе, так что это не простая задача для выполнения, а средство достижения обучения.
Как записано в «Аналектах Конфуция», это история Конфуция и его семидесяти двух учеников, которые учатся через взаимодействие. На Западе, подобно Афинской академии Платона и Аристотеля, наследование древнейших знаний и мудрости осуществляется через диалог между людьми, а преподаватели помогают учащимся лучше завершать учебу посредством взаимодействия со студентами.
Например, если учитель просит учеников налить стакан воды, то таким простым действиям «команда-исполнение» трудно увеличить мудрость; как преодолевать трудности, это взаимодействие, которое может увеличить мудрость, и оно также отражает моя основная точка зрения на совместное взаимодействие между людьми и ИИ.
Суть ИИ заключается в сотрудничестве и взаимодействии с людьми, он постоянно учится на взаимодействиях, а затем сотрудничает с людьми, чтобы лучше решать проблемы. Эта точка зрения будет становиться все более и более важной в ближайшем будущем, и в то же время она будет сталкиваться с более техническими и этическими проблемами.В конце концов, будет нелегко удержать практический результат. Подобно выравниванию ИИ, о котором все говорят, люди могут передавать свою волю ИИ, а затем разбивать задачи с помощью ИИ, позволяя ИИ учиться и реализовывать человеческую волю в процессе. Это новый способ совместной работы, то есть совместный интерактивный интеллект.
**Обзор технологий искусственного интеллекта: считаете ли вы, что достижение согласованности ценностей посредством взаимодействия является эффективным способом сотрудничества человеческого мозга и GPT? Как люди и ИИ должны лучше работать вместе? **
**Чжоу Боуэн: **После взрыва генеративного ИИ, ИИ, который обучается в процессе совместного взаимодействия с людьми, будет становиться все сильнее и сильнее.
Дэниел Канеман, лауреат Нобелевской премии по экономике 2002 года, в своем бестселлере «Думай быстро и медленно» предположил, что существует два режима человеческого мышления — система 1 и система 2, и система 1 — быстрая. Система 2 — медленное мышление, требующее много рассуждений и расчетов.
Изначально люди думали, что ИИ больше подходит для работы «системы 1», такой как распознавание лиц и проверка качества, которые основывались на распознавании образов «системы 1». Но я настаиваю на том, что реальная ценность ИИ заключается в том, чтобы помочь людям лучше выполнять сложные задачи логического мышления. Появление ChatGPT подтвердило осуществимость ИИ как Системы 2, а это означает, что ИИ может открывать новые знания, а открытие новых знаний поможет людям разрабатывать более совершенные ИИ, такие как наука о мозге и оптимизация вычислений. появляется маховик для создания новых знаний. Эффект маховика означает, что ИИ может позволить всей системе лучше открывать новые знания, и эти новые знания могут помочь в разработке более совершенных систем ИИ, таким образом образуя благотворный круг. Таким образом, между ИИ, знаниями и инновациями сформировались взаимоусиливающие отношения, которые требуют преобразования способов взаимодействия ИИ и людей.
Ранее я предлагал направление исследований «3+1», то есть использовать надежный ИИ в качестве исследовательской базы и долгосрочной цели, чтобы сосредоточиться на взаимодействии мультимодальных представлений, совместной интерпретации человека и компьютера и совместной эволюции окружающей среды. Суть в том, чтобы быть человеком. Сотрудничество и совместное творчество машин могут реализовать цель, состоящую в том, чтобы люди помогали ИИ внедрять инновации, а ИИ помогал людям вводить новшества.
Одним из них является мультимодальное взаимодействие представлений, где может существовать великая единая теория. В 2022 году люди все еще относятся к этому скептически, но с появлением GPT-4 это мультимодальное унифицированное представление представлений стало более убедительным; Еще один момент — совместное взаимодействие человека и компьютера. В 2022 году люди тоже относились к этому скептически, но сейчас этот метод взаимодействия стал более достоверным, и люди начинают верить, что это, вероятно, произойдет; Третий момент — это коэволюция ИИ и окружающей среды, Это означает, что ИИ должен не только сотрудничать с людьми, но и адаптироваться к окружающей среде. Впервые мы предложили эту концепцию в начале 2022 года, и пока не видели успешных кейсов в этом направлении, даже OpenAI.
Если вы не можете освоить OpenAI, но не можете заниматься Microsoft, вам нужно вычесть крупные стартапы отечественного бизнеса
**Обзор технологий искусственного интеллекта: особенностью модели Transformer является то, что она использует механизм внимания (Attention) для моделирования текста Мы заметили, что вы очень рано проводили исследования, связанные с механизмом внимания искусственного интеллекта. **
**Чжоу Боуэн:**Основными особенностями Transformer являются механизм самоконтроля и многоголовый механизм. В июне 2017 года в публикации Google Brain «Внимание — это все, что вам нужно» была представлена концепция механизма самоконтроля (самовнимания) и Transformer. Позже эта статья также оказала сильное влияние на GPT OpenAI.
До этого я опубликовал первую статью в качестве соответствующего автора, чтобы представить механизм многоэтапного самоконтроля для улучшения кодировщика - «Структурированное встраивание предложений с самостоятельным вниманием». Эта статья была завершена и загружена в arXiv в 2016 году и официально опубликована в ICLR в начале 2017 года. Мы также являемся первой командой, предложившей этот механизм, и, что более важно, это первая модель представления на естественном языке, которая не учитывает последующие задачи. совсем. Каждый раньше использовал внимание или само-внимание в некоторых случаях, но все они зависят от задачи.
**Обзор технологий искусственного интеллекта: что вы нашли в этой статье? Как эти открытия повлияли на последующие изменения технологии Transformer? **
Чжоу Боуэн: В статье мы предложили лучший метод репрезентации — использовать структурированное самовнимание для репрезентации естественного языка (НЛП). С момента публикации эта статья цитировалась более 2300 раз.
До этого Илья Суцкевер, главный научный сотрудник OpenAI, считал, что лучшим методом представления является «последовательность к последовательности (Seq2Seq)», то есть обучать модель преобразованию последовательности одного домена в последовательность другого домена. , например соответствующий исходный язык в машинном переводе и целевой язык, или при ответе на вопрос, где вопрос представляет собой последовательность, а ответ представляет собой последовательность. На этой основе изучаются отношения отображения между двумя, представленными глубокой нейронной сетью.
Но позже команда эксперта по глубокому обучению и лауреата премии Тьюринга Йошуа Бенжио предложила «механизм внимания», суть которого заключается в том, что не все слова одинаково важны при ответе на вопросы; определяя наиболее важные части, а затем уделяя больше внимания на эту часть вы можете дать лучший ответ. Эта модель внимания быстро получила очень широкое признание. В 2015 году я возглавил команду IBM, которая одновременно начала исследования, основанные на архитектуре и идеях «механизма Seq2Seq+Attention», и последовательно запустила несколько первых генеративных моделей для письма ИИ на естественном языке. более 3000 раз.
Но содержание работы меня в то время не устраивало, потому что в ней была проблема, то есть внимание строилось на основе ответа. Обученный таким образом ИИ подобен студенту, который просит преподавателя отметить ключевые моменты перед выпускным экзаменом в университете, а затем с прицельным вниманием просматривает ключевые моменты. Таким образом, хотя производительность ИИ при решении конкретных задач можно улучшить, он не является универсальным. Поэтому мы предложили, чтобы он вообще не зависел от поставленной задачи и вывода, а только на основе внутренней структуры входного естественного языка, через многократное чтение ИИ, чтобы узнать, какие части более важны и взаимосвязь между ними, это внимание к себе плюс обучение представлению для многоголовых механизмов. Этот тип механизма обучения рассматривает только входные данные, больше похоже на то, что студенты изучают и понимают курс несколько раз и систематически перед экзаменом, вместо целенаправленного и фрагментарного обучения на основе ключевых моментов экзамена, который ближе к экзамену. цель общего искусственного интеллекта и значительно улучшенная способность ИИ к обучению.
**Обзор технологий искусственного интеллекта: какова связь между статьей «Внимание — это все, что вам нужно» и вами? **
Чжоу Боуэн: Мы знаем, что все большие модели этой волны созданы Трансформером, поэтому, когда вы видите букву Т в модели, скорее всего, это означает Трансформера. Для меня большая честь проделать дальновидную работу в этой области. В конце 2017 года исследователи из Google опубликовали «Внимание — это все, что вам нужно», важный документ, который представил миру модель Transformer. И была процитирована наша статья «Структурированное встраивание предложений с самостоятельным вниманием», в которой впервые был предложен «многошаговый механизм внутреннего внимания», опубликованный в начале 2017 года. И первый автор этой статьи, Ашиш Васвани, был студентом, которого я обучал в IBM. Название статьи «Внимание — это все, что вам нужно» также выражает предложенный нами смысл «внимание к себе очень важно, многоголовость очень важна, но RNN может быть не так важно, как мы думали раньше».
**Обзор технологий искусственного интеллекта: какие согласованные технические суждения вы и OpenAI имеете? **
**Чжоу Боуэн: Эта статья и архитектура Transformer полностью изменили все, и это решило проблему дальней памяти модели. Илья Суцкевер в недавнем интервью напомнил, что OpenAI полностью перешла на архитектуру Transformer на следующий день после публикации статьи. **
Мы знаем, что GPT очень отличается от модели Берта, и причина, по которой Берт был очень успешным сначала, но не так хорош, как GPT позже, заключается в том, что он использует информацию как слева направо, так и справа налево. Другими словами, Берт использует информацию о будущем, чтобы помочь ИИ научиться представлять, в то время как GPT настаивает на том, чтобы предсказывать, какое следующее слово будет, только на основе прошлой информации. **Подход OpenAI в этом вопросе соответствует точке зрения нашей команды, а именно: старайтесь не использовать ответы для обучения. **От внимания к собственному вниманию, от BERT до GPT-3, основная идея заключается в том, что вы больше не полагаетесь на будущую информацию, такую как результат или контекст предсказуемого слова, или когда можно использовать больше данных для полностью При обучении моделей ИИ мы начинаем видеть возможности ОИИ.
Кроме того, OpenAI считает, что большие модели изучают знания о мире с помощью естественного языка, тем самым сжимая знания о мире в большие модели.В соответствии с этой концепцией также продвигаются большие модели серии GPT и ChatGPT. То же самое относится к концепции и видению моей команды и меня, то есть построить крупномасштабную модель общего назначения и позволить ей проявлять более высокую ценность и возможности в вертикальной области посредством профессионального обучения и интегрировать потребителей. Сложные эмоции, потребности и переживания, а также инновации продукта, дизайн, параметры продукта, материалы, функции и т. д. сжимаются в большую модель для реконструкции бинарных отношений между людьми и продуктами и использования ИИ для изменения ценности продукта. продукты.
**Обзор технологий искусственного интеллекта: помимо технической мощи, какие еще аспекты OpenAI заставляют вас думать, что у него есть достоинства? **
Чжоу Боуэн: Не только с точки зрения технических суждений, весь бизнес-подход OpenAI является репрезентативным, включая: создание экосистемы, объявление нового закона Мура, снижение цен на API на 90 % и т. д. Развернуть пространство воображения капитала и пользователей для коммерческого применения больших моделей и получения практически неограниченных сценариев применения. Кроме того, планы OpenAI в отношении этического управления, развития бизнеса, экологических технологий и будущего развития также очень ясны.
**Обзор технологий искусственного интеллекта: появится ли следующий OpenAI в Китае? **
**Чжоу Боуэн:**Техническая сложность создания большой модели на самом деле выходит за рамки воображения многих китайских предпринимателей. Поэтому я не рекомендую отечественным компаниям слепо следовать и копировать модель «OpenAI+Microsoft», потому что большинство китайских технологических компаний в Китае не так хороши в принятии бизнес-решений, как Microsoft, и их способность оценивать технологии не так хороша. как OpenAI. **
Успех OpenAI является результатом многих факторов, например, Илья Суцкевер выносил технические суждения, Грег Брокман выполнял функции, а Сэм Альтман объединял ресурсы, включая исследования влияния ИИ на этику и общество. Если отечественные компании будут просто имитировать OpenAI, расстояние между ними будет только увеличиваться.
Техническое суждение OpenAI можно увидеть по широте данных, потому что не все данные в мире одинаково важны. Почему OpenAI решила использовать язык программирования Github для обучения цепочки мышления? Поскольку семантика и синтаксис языка программирования чрезвычайно просты, логика процесса выполнения является строгой. Это также представляет собой характеристику и преимущество OpenAI: он не будет атаковать вслепую. Поэтому я думаю, что развитию ИИ в Китае нужно найти другой путь, то есть опираясь на способность общих крупных моделей начинать с применения вертикальных сценариев, что с большей вероятностью приведет к успеху.
Генеративный ИИ изменит существующий потребительский опыт
**Обзор технологий искусственного интеллекта: почему вы ориентируетесь на потребительский сектор? **
Чжоу Боуэн: Когда я работал в JD.com, я увидел огромную бизнес-возможность «динамического согласования потребительского спроса и дизайна продукта с искусственным интеллектом». В 2021 году я решил уйти с работы и начать бизнес по разработке общей большой языковой модели для вертикальных отраслей (в то время масштабная языковая модель еще не получила широкого распространения), надеясь охватить все потребительское поведение из неспецифических сценариев. Мы знаем, что с понедельника по пятницу время и пространство различны, и внимание белых воротничков или других профессий также отличается.За этими культурными символами, влияющими на покупательское поведение, стоят сложные эмоции, опыт и выбор продуктов потребителей. , это именно та ценная информация, которая нужна бизнесу. При производстве продуктов со стороны предложения это включает в себя креативность, дизайн, параметры продукта, функции, материалы и позиционирование бренда, слоган, маркетинг, рекламу, маркетинг, рекламные изображения и т. Д. На самом деле за всеми этими факторами существует тесная соответствующая взаимосвязь.
Такого рода соответствующие отношения еще никогда не проходили люди. Специалисты по планированию, маркетингу и продажам понимают только те связи, за которые они несут ответственность. И мы собираемся сделать первую в мире крупномасштабную модель цепочки поставок товаров общего назначения, то есть сжать всю эту информацию в универсальную модель с высокой точностью, и на основе этой крупномасштабной модели расширить возможности весь жизненный цикл корпоративных продуктов, включая: понимание возможностей (Discover), определение продукта (Define), разработку программы (Design), проведение НИОКР (Develop), маркетинговую трансформацию (Distribution). Таким образом, предприятия могут более эффективно находить инновационные возможности, более творчески проектировать и производить, осуществлять маркетинговое продвижение, привлекать пользователей и более эффективно проводить преобразования.
**Обзор технологий искусственного интеллекта: с точки зрения бизнес-модели это кажется более продвинутым. **
Чжоу Боуэн: Для любой предпринимательской команды очень важно иметь возможность развивать более профессиональные навыки, имея общие технические возможности крупных моделей. В настоящее время прорыв ТШП заключается в основном в его общих возможностях, но его значение для конкретных отраслей и вертикальных областей еще предстоит развить.Например: ТШП может рисовать очень реалистичные художественные картины, но не может рисовать принципиальные схемы, потому что это не так. не хватает знаний физических знаний.Глубокие и соответствующие суждения недостаточно профессиональны.
Поэтому я считаю, что нужен такой инструмент (универсальная крупная модель с профессиональными возможностями), чтобы потребителям было проще находить и охотнее покупать нужные им товары, что может полностью изменить существующие покупательские пути людей. . Генеративный ИИ может сжимать огромные объемы бизнес-информации в такие большие модели, чтобы изучать все аспекты цепочки поставок товаров и повышать эффективность ключевых звеньев, ориентированных на потребителей. Это идея и творчество, которые уже были сгенерированы в 2021 году.
**Lianyuan Technology разрабатывает большую модель с общими возможностями.Эта большая модель имеет опыт связывания продуктов и потребителей. ** У нас есть 37 показателей оценки крупномасштабных моделей, 2/3 из которых представляют собой возможности общего назначения, такие как способность рассуждать и вычислительные способности, и более дюжины элементов специально применяются для связи между продуктами и потребителями, чтобы реализовать цель «пусть каждый продукт должен быть рожден из необходимости, пусть каждый потребитель получит то, что он хочет».
**Обзор технологий искусственного интеллекта: как генеративный искусственный интеллект может лучше интегрироваться со сценариями потребления, такими как электронная коммерция? **
**Чжоу Боуэн:**Люди могут понять только бизнес-логику планирования или логику маркетинга, а ИИ может соединить все бизнес-цепочки.
Потребителям нужно много профессионального словаря, чтобы найти продукты, которые они хотят, в таких сценариях, как платформы электронной коммерции; но, с другой стороны, продавцы не понимают реальных потребностей потребителей и могут связаться с потребителями только посредством транзакций электронной коммерции, путем консультирования. исследовательские институты для дальнейшего понимания потребителей. После введения функции многоэтапного диалога, такой как ProductGPT, эффективность динамического сопоставления продавцов и потребителей продуктов станет более эффективной, чем исследование рынка, так что платформы электронной коммерции смогут более активно участвовать в разработке, разработке, исследованиях и разработках продуктов, а также маркетинг продвижение и т.д.
В реальном коммерческом обществе на самом деле существует сильное соответствие между стороной спроса и стороной предложения. Наша ведущая SaaS-платформа для совместных инноваций, разработанная нами самостоятельно, основана на мультимодальном понимании, рассуждениях и возможностях генерации больших моделей и помогает компаниям находить возможности для бизнеса и инновации продуктов благодаря глубокому пониманию потребителей, сценариев, продуктов, ссылок на продукты и исследований и разработок. . В то же время многоуровневая диалоговая платформа ProductGPT от Lianyuan Technology предоставляет каждому сотруднику предприятия личного помощника, глубоко настроенного в соответствии с различными профессиональными ролями, и отвечает их конкретным рабочим потребностям, предоставляя навыки и знания, специфичные для этой роли. Например, личный помощник Lianyuan Technology по исследованию потребителей предоставит профессиональные навыки и соответствующие знания, такие как исследование тенденций рынка, понимание потребностей потребителей и исследование рынка.
**Обзор технологий искусственного интеллекта: вы использовали генеративный искусственный интеллект для заработка на JD.com, как вам это удалось? **
**Чжоу Боуэн:**В 2019 году я руководил командой JD.com по искусственному интеллекту, которая применяла генеративный искусственный интеллект для создания копирайта продуктов и выбора изображений.Это также первая крупномасштабная генеративная модель JD.com. В то время наша модель ИИ в основном выполняла три задачи:
Во-первых, вы можете самостоятельно прочитать содержимое страницы сведений о продукте и напрямую создать 8-9 точек продаж этого продукта посредством анализа;
Во-вторых, когда потребитель просматривает определенный продукт, большая модель быстро выясняет, какие точки продаж могут произвести на пользователя большее впечатление, анализируя данные о поведении разных потребителей;
В-третьих, AIGC будет генерировать эксклюзивные слоганы вокруг точек продаж, которые больше всего беспокоят потребителей, на основе портретов пользователей.
После периода внедрения коэффициент конверсии рекомендаций по продуктам увеличился на 30% по сравнению с предыдущим периодом. Потребители могут не осознавать, что когда они ищут и совершают покупки на JD.com, категории продуктов и описания, которые они видят, на самом деле автоматически генерируются AIGC слово за словом в соответствии с предпочтениями пользователя и точками продажи продуктов в тот момент, когда он просматривает продукты. .
**Обзор технологий искусственного интеллекта: что вы думаете об открытом API OpenAI и что это значит для отрасли? **
Чжоу Боуэн: Исходя из личного опыта, я был главным научным сотрудником IBM Watson Group. В то время данные некоторых отраслей в США регулировались, и такие предприятия вообще не могли сотрудничать, а могли развертывать только частные облака. По этой причине в 2015-2016 годах я определился с публичным облаком. Для этого необходимо API-интерфейс возможностей ИИ Watson. В то время я руководил запуском десятков API, включая диалоги и понимание естественного языка. Разместите эти API на облачной платформе, и теперь AI-бизнес IBM в основном зарабатывает на этом деньги.
Я вернулся в Китай в конце 2017 года, а в апреле 2018 года выпустил открытую платформу искусственного интеллекта JD.com. В то время в Китае практически не было ИИ-платформы, что также приносило немалый доход JD.com. В 2019 году ИИ-команда JD.com под моим руководством принесла 170 млн юаней дохода, что неплохо для команды из 200 человек.
**Обзор технологии искусственного интеллекта: в отрасли существует мнение, что риск создания вертикальной большой модели очень высок, что вы думаете? **
Чжоу Боуэн: Я думаю, что в будущем эти четко определенные, ценные рабочие процессы будут дополняться профессиональными моделями ИИ, а не общими моделями ИИ. Базовые возможности большой модели общего назначения легко улучшить после успешного завершения определенной вертикальной сцены. Кроме того, если мы начнем с вертикального сценария, наши прошлые накопления с точки зрения вычислительной мощности, данных и алгоритмов могут быть использованы более полно. Таким образом, в Lianyuan Technology большая модель должна иметь базовые возможности общей технологии больших моделей в базовой структуре технологии, и она должна оцениваться научными методами, но также требует профессиональной подготовки.
В 2023 году из-за внезапной популярности ChatGPT рынок начал использовать AI 2.0 для описания своего огромного потенциала. Кроме того, в бой вступили почти все технологические гиганты, рынок венчурного капитала пытается использовать новые возможности, и рыночная среда также быстро меняется. GPT — это систематическая предпринимательская возможность, но просто копировать, следовать и догонять рискованно и сложно.
После основания Lianyuan Technology мы пообщались с более чем 100 клиентами, увидели реальные потребности и улучшили путь реализации технологии, постоянно оптимизируя большую модель: «В 2022 году мы продемонстрировали коммерческую ценность и техническую осуществимость этого сценария. Это означает что даже если мы делаем большую модель, мы идем по пути, отличному от OpenAI, и модель прибыли также отличается.
Что я хочу сделать, так это лучший компрессор знаний о мире, чем текущий GPT, который требует очень интерактивных данных, и данные, очевидно, тесно связаны со сценой. Что касается того, какие данные имеют значение для высшего человеческого интеллекта, то на самом деле над этим предстоит проделать много теоретической работы, и это направление стоит исследовать в будущем.