Dialogue丨Bowen Zhou : Comment le modèle général à grande échelle perce-t-il les scénarios de l'industrie verticale ?

Auteur : Wang Yongang Éditeur : Dong Zibo

Source : Examen de la technologie IA

Source de l'image : générée par l'outil d'IA illimitée

Après avoir quitté JD.com, Zhou Bowen n'a pas été aussi excité depuis longtemps.

ChatGPT s'est avéré remuer le monde, comme un tonnerre printanier a réveillé des pratiquants de tous horizons, de sorte qu'ils ont tous entendu les pas d'AGI entrer dans la réalité.

Sous la poussée, les gens ont vu Wang Huiwen et Wang Xiaochuan démarrer leur propre entreprise, et ont également vu Baidu et Alibaba dominer le marché. Zhou Bowen, en tant qu'ancien doyen de l'Institut de recherche sur l'intelligence artificielle d'IBM et de JD.com, a étudié la théorie de base de l'intelligence artificielle et les technologies de pointe, les applications et l'industrialisation pendant plus de 25 ans. Il a fondé Lianyuan Technology en tant que dès la fin de 2021. Model, avec l'IA générative, le dialogue multi-tours et la technologie de collaboration homme-ordinateur, aide les entreprises et les consommateurs à mener à bien l'innovation produit et la transformation de l'intelligence numérique dans la nouvelle ère de l'intelligence artificielle. "Ce n'est pas tant que j'ai décidé de créer une entreprise dans ce domaine, c'est mieux de dire que cette entreprise m'a trouvé." Zhou Bowen a décrit cela comme quelque chose qui doit être fait, comme si un sens de la mission le poussait à agir.

Zhou Bowen est diplômé de l'Université des sciences et technologies de Chine, puis est allé à l'Université du Colorado à Boulder pour obtenir un doctorat. En tant qu'ancien président de l'institut de recherche fondamentale sur l'intelligence artificielle du siège social américain d'IBM Research, il est retourné en Chine après avoir présidé des travaux liés à l'IA pendant de nombreuses années et a successivement été vice-président senior du groupe JD, président du comité technique du groupe, président de JD Cloud et AI, et président fondateur de JD Artificial Intelligence Research Institute et d'autres postes. En tant que fondateur de JD AI, il est responsable de la recherche technique et du développement commercial de JD AI. Il a créé la division JD AI, l'institut de recherche sur l'IA et l'accélérateur JD AI à partir de 0 pour créer une plate-forme ouverte nationale pour l'intelligence artificielle de la chaîne d'approvisionnement intelligente. , réalisant le volume d'appels quotidien de 0. À des dizaines de milliards, a dirigé la reconstruction technique du service client d'intelligence artificielle de Jingdong et lancé la productisation externe, géré des milliards d'activités de services techniques et des milliers d'équipes intégrées de technologie, de produit, de marketing et de vente.

En 2021, Zhou Bowen a prédit que l'IA générative exploserait dans un avenir proche, il a donc décidé de quitter JD.com pour fonder Lianyuan Technology, qui s'engage à aider les entreprises verticales à mener à bien l'innovation de produits et la transformation de l'intelligence numérique avec un modèle général à grande échelle. capacités et remodeler avec la valeur de l'IA Commodity ; en 2022, il sera professeur titulaire de la chaire Huiyan de l'Université Tsinghua et professeur titulaire du Département de génie électronique, et en mai de la même année, il créera le Collaborative Interactive Intelligence Research Centre de l'Université Tsinghua. **

ChatGPT est sur le point d'arriver, et Zhou Bowen a également posté dans Moments : "Je crois que l'OpenAI chinois doit explorer une nouvelle voie !" Sous la fierté, il est impatient de rechercher des talents. Mais contrairement à d'autres entrepreneurs, Zhou Bowen et Lianyuan Technology ont choisi de s'appuyer sur des dizaines de milliards de paramètres et une méthode de formation unique pour permettre au grand modèle de mieux comprendre la relation entre les personnes et les biens sur la base de capacités générales. le système d'innovation complet, de la connaissance des produits, du positionnement, de la conception, de la R&D au marketing.

Zhou Bowen a déclaré un jour en public que sa direction entrepreneuriale était de prendre l'initiative d'intégrer l'intelligence artificielle aux industries traditionnelles afin d'apporter une plus grande valeur à l'innovation en matière d'intelligence numérique d'entreprise, c'est-à-dire de réaliser une percée dans la capacité des grands modèles généraux dans des scénarios verticaux.

Récemment, un journaliste d'AI Technology Review a eu une conversation avec Zhou Bowen. Voici la transcription de la conversation. AI Technology Review a modifié le contenu sans en changer le sens initial :

Laissez l'IA apprendre la sagesse humaine, un nouveau paradigme d'interaction et de collaboration

**AI Technology Review : ChatGPT a introduit cette méthode d'interaction, selon vous, qu'est-ce qui est différent de la méthode d'interaction précédente ? **

Zhou Bowen : L'une de mes directions de recherche est l'interaction entre l'IA et les gens, et l'apprentissage dans l'interaction. L'interaction homme-ordinateur est différente du dialogue homme-ordinateur. Grâce à l'interaction homme-ordinateur, l'IA peut apprendre des choses au cours du processus, ce n'est donc pas une tâche simple à accomplir, mais un moyen d'apprendre.

Comme enregistré dans "Les Analectes de Confucius", c'est l'histoire de Confucius et de ses soixante-douze disciples apprenant par l'interaction. En Occident, à l'instar de l'Académie d'Athènes de Platon et d'Aristote, l'héritage des connaissances et de la sagesse les plus anciennes s'accomplit par le dialogue entre les personnes, et les enseignants aident les étudiants à mieux terminer leurs études grâce à l'interaction avec les étudiants.

Par exemple, si l'enseignant demande aux élèves de verser un verre d'eau, il est difficile pour de telles actions simples de "commande-exécution" d'augmenter la sagesse ; comment surmonter les difficultés, c'est l'interaction qui peut augmenter la sagesse, et cela reflète également mon point de vue central sur l'interaction collaborative entre les humains et l'IA.

L'essence de l'IA est la collaboration et l'interaction avec les humains. Elle apprend continuellement des interactions, puis coopère avec les humains pour mieux résoudre les problèmes. Ce point de vue deviendra de plus en plus important dans un futur proche, et en même temps, il sera confronté à de plus en plus de défis techniques et éthiques.En fin de compte, il ne sera pas facile de garder le résultat net. Comme l'alignement de l'IA que tout le monde dit, les humains peuvent transmettre leur volonté à l'IA, puis décomposer les tâches avec l'IA, permettant à l'IA d'apprendre et de réaliser la volonté humaine dans le processus. Il s'agit d'un nouveau mode de collaboration, c'est-à-dire d'intelligence interactive collaborative.

** Examen de la technologie AI : pensez-vous que l'alignement des valeurs par l'interaction est un moyen efficace pour le cerveau humain et GPT de collaborer ? Comment les humains et l'IA devraient-ils mieux travailler ensemble ? **

**Zhou Bowen : **Après l'explosion de l'IA générative, l'IA qui apprend par l'interaction collaborative avec les humains deviendra de plus en plus forte.

Daniel Kahneman, lauréat du prix Nobel d'économie en 2002, a proposé dans son livre à succès Thinking Fast And Slow qu'il existe deux modes de pensée humaine : le système 1 et le système 2, et le système 1 est rapide. Le système 2 est une réflexion lente, qui nécessite beaucoup de raisonnement et de calcul.

Au départ, les gens pensaient que l'IA était plus adaptée au travail du "système 1", comme la reconnaissance faciale et l'inspection de la qualité, qui étaient basées sur la reconnaissance des formes du "système 1". Mais j'insiste sur le fait que la vraie valeur de l'IA réside dans 2, qui est d'aider les humains à mieux accomplir des tâches de raisonnement logique complexes. ** L'émergence de ChatGPT a vérifié la faisabilité de l'IA en tant que système 2, ce qui signifie que l'IA peut découvrir de nouvelles connaissances, et la découverte de nouvelles connaissances aidera les humains à concevoir une meilleure IA **, comme la science du cerveau et l'optimisation informatique Discovery, et un volant d'inertie pour créer de nouvelles connaissances émerge. L'effet volant signifie que l'IA peut permettre à l'ensemble du système de mieux découvrir de nouvelles connaissances, et ces nouvelles connaissances peuvent aider à concevoir de meilleurs systèmes d'IA, formant ainsi un cercle vertueux. Par conséquent, une relation de renforcement mutuel s'est formée entre l'IA, la connaissance et l'innovation, ce qui nécessite que la manière dont l'IA et les humains collaborent soit transformée.

J'ai déjà proposé une direction de recherche "3 + 1", c'est-à-dire utiliser une IA fiable comme base de recherche et objectif à long terme, pour se concentrer sur l'interaction de représentation multimodale, l'interprétation collaborative homme-ordinateur et l'évolution collaborative environnementale. L'essentiel est d'être humain La collaboration et la co-création de machines peuvent réaliser l'objectif des êtres humains aidant l'IA à innover et l'IA aidant les êtres humains à innover.

L'un d'eux est l'interaction de représentation multimodale, où il peut y avoir une grande théorie unifiée. En 2022, les gens sont encore sceptiques à ce sujet, mais avec l'avènement du GPT-4, cette interaction de représentation unifiée multimodale est devenue plus convaincante ; Un autre point est l'interaction collaborative homme-ordinateur. Les gens étaient également sceptiques à ce sujet en 2022, mais maintenant cette méthode d'interaction est devenue plus crédible, et les gens ont commencé à croire que cela est susceptible de se produire ; Le troisième point est la co-évolution de l'IA et de l'environnement, ce signifie que l'IA doit non seulement coopérer avec les humains, mais aussi s'adapter à l'environnement environnant. Nous avons proposé ce concept pour la première fois au début de 2022, et jusqu'à présent, nous n'avons vu aucun cas réussi dans cette direction, pas même OpenAI.

** Si vous ne pouvez pas apprendre OpenAI, mais que vous ne pouvez pas faire Microsoft, vous devez soustraire pour les startups nationales à grande échelle **

**AI Technology Review : La particularité du modèle Transformer est qu'il utilise un mécanisme d'attention (Attention) pour modéliser le texte. Nous avons remarqué que vous avez effectué très tôt des recherches liées au mécanisme d'attention de l'IA. **

**Zhou Bowen :**Les principaux points forts de Transformer sont le mécanisme d'auto-attention et le mécanisme multi-têtes. En juin 2017, "Attention is All You Need" publié par Google Brain a introduit le concept de mécanisme d'auto-attention (auto-attention) et Transformer. Plus tard, le GPT d'OpenAI a également été profondément influencé par cet article.

Avant cela, j'ai publié le premier article en tant qu'auteur correspondant pour introduire un mécanisme d'auto-attention multi-sauts pour améliorer l'encodeur - "A Structured Self-Attentive Sentence Embedding". Ce document a été achevé et téléchargé sur arXiv en 2016, et a été officiellement publié dans ICLR début 2017. Nous sommes également la première équipe à proposer ce mécanisme, et plus important encore, il s'agit du premier modèle de représentation en langage naturel qui ne prend pas en compte les tâches en aval. du tout. Tout le monde a déjà utilisé l'attention ou l'auto-attention dans certains cas, mais ils dépendent tous de la tâche.

**AI Technology Review : dans cet article, qu'avez-vous trouvé ? Comment ces découvertes ont-elles affecté les changements ultérieurs de la technologie Transformer ? **

Zhou Bowen : Nous avons proposé dans l'article que la meilleure méthode de représentation consiste à utiliser l'auto-attention structurée pour représenter le langage naturel (PNL). Cet article a été cité plus de 2 300 fois depuis sa publication.

Avant cela, Ilya Sutskever, scientifique en chef d'OpenAI, pensait que la meilleure méthode de représentation était "séquence à séquence (Seq2Seq)", c'est-à-dire entraîner le modèle à convertir la séquence d'un domaine en la séquence d'un autre domaine. , comme la langue source correspondante dans la traduction automatique et la langue cible ; ou dans la réponse aux questions, où la question est une séquence et la réponse est une séquence. Sur cette base, la relation de cartographie entre les deux représentés par le réseau neuronal profond est apprise.

Mais plus tard, l'équipe d'experts en apprentissage en profondeur et lauréat du prix Turing, Yoshua Bengio, a proposé un "mécanisme d'attention", dont le cœur est que tous les mots n'ont pas la même importance pour répondre aux questions ; en identifiant les parties les plus critiques, puis en accordant plus d'attention à cette partie, vous pouvez donner une meilleure réponse. Ce modèle d'attention a rapidement été très largement accepté. En 2015, j'ai dirigé l'équipe IBM pour démarrer des recherches basées sur l'architecture et les idées de "Seq2Seq + Attention Mechanism" en même temps, et lancé successivement plusieurs premiers modèles génératifs pour l'écriture d'IA en langage naturel. plus de 3000 fois.

Mais je n'étais pas satisfait du contenu de l'article à l'époque, car il y avait un problème, c'est-à-dire que l'attention était construite à partir de la réponse. L'IA ainsi formée est comme un étudiant qui demande à l'enseignant de marquer les points clés avant l'examen final de l'université, puis passe en revue les points clés avec une attention ciblée. De cette façon, bien que les performances de l'IA sur des problèmes spécifiques puissent être améliorées, elles ne sont pas universelles. Par conséquent, nous avons proposé que cela ne dépende pas du tout de la tâche et de la sortie données, mais uniquement de la structure interne du langage naturel d'entrée, et d'apprendre quelles parties sont les plus importantes et la relation entre elles grâce à des lectures multiples de l'IA. auto-attention plus apprentissage de la représentation pour les mécanismes multi-têtes. Ce type de mécanisme d'apprentissage ne regarde que l'entrée, plus comme les étudiants étudient et comprennent le cours plusieurs fois et systématiquement avant le test, plutôt que d'apprendre de manière ciblée et fragmentée en fonction des points clés du test, de sorte qu'il est plus proche aux fins de l'intelligence artificielle générale et de la capacité d'apprentissage de l'IA grandement améliorée.

**AI Technology Review : Quelle est la relation entre l'article "Attention is All You Need" et vous ? **

Zhou Bowen : Nous savons que tous les grands modèles de cette vague proviennent de Transformer, donc quand vous voyez un T dans le modèle, alors le T représente très probablement Transformer. Je suis très honoré d'avoir fait un travail d'avant-garde dans ce domaine. Fin 2017, des chercheurs de Google ont publié "Attention is All you need", un article marquant qui a fait connaître le modèle Transformer au monde. Et notre article "A Structured Self-attentive Sentence Embedding", qui proposait pour la première fois un "mécanisme d'auto-attention multi-sauts" publié début 2017, a été cité. Et le premier auteur de cet article, Ashish Vaswani, était un étudiant que j'avais encadré chez IBM. Le titre de l'article "L'attention est tout ce dont vous avez besoin" exprime également le sens de "l'attention portée à soi est très importante, les têtes multiples sont très importantes, mais RNN n'est peut-être pas aussi important que nous le pensions auparavant" proposé par nous.

**AI Technology Review : Quels jugements techniques cohérents avez-vous et OpenAI ? **

**Zhou Bowen : Cet article et l'architecture Transformer ont complètement tout changé et ont résolu le problème de la mémoire longue distance du modèle. Ilya Sutskever a rappelé dans une récente interview qu'OpenAI était complètement passé à l'architecture Transformer le lendemain de la parution de l'article. **

Nous savons que GPT est très différent du modèle de Bert, et la raison pour laquelle Bert a eu beaucoup de succès au début, mais pas aussi bon que GPT plus tard, c'est qu'il utilise à la fois des informations de gauche à droite et de droite à gauche. . En d'autres termes, Bert utilise les informations futures pour aider l'IA à apprendre à représenter, tandis que GPT insiste pour prédire quel sera le prochain mot en se basant uniquement sur les informations passées. **L'approche d'OpenAI sur ce point est conforme à la réflexion de notre équipe, à savoir : essayez de ne pas utiliser les réponses pour apprendre. ** De l'attention à l'auto-attention, du BERT au GPT-3, l'idée centrale est lorsque vous ne vous fiez plus aux informations futures telles que la sortie ou le contexte du mot à prédire, ou lorsque davantage de données peuvent être utilisées pour Lors de la formation de modèles d'IA, nous commençons à voir la possibilité d'AGI.

En outre, OpenAI estime que les grands modèles apprennent la connaissance du monde par le biais du langage naturel, comprimant ainsi la connaissance du monde dans de grands modèles. Les grands modèles de la série GPT et ChatGPT sont également promus selon ce concept. Il en va de même pour le concept et la vision de mon équipe et moi-même, à savoir construire un modèle à grande échelle à usage général, et lui permettre d'exercer une valeur et des capacités supérieures dans le domaine vertical grâce à la formation professionnelle, et intégrer les consommateurs ' les émotions, les besoins et les expériences complexes, ainsi que l'innovation produit, la conception, les paramètres du produit, les matériaux, les fonctions, etc., sont compressés dans un grand modèle pour reconstruire la relation binaire entre les personnes et les produits, et utiliser l'IA pour remodeler la valeur de des produits.

** Examen de la technologie AI : Outre la force technique, quels autres aspects d'OpenAI vous font penser qu'il y a des mérites ? **

Zhou Bowen : Non seulement en termes de jugements techniques, toute l'approche commerciale d'OpenAI est représentative, y compris : la mise en place de l'écosystème, l'annonce de la nouvelle loi de Moore, la réduction des prix des API de 90 %, etc. l'espace d'imagination du capital et des utilisateurs pour l'application commerciale de grands modèles, et dériver des scénarios d'application presque illimités. En outre, les plans d'OpenAI en matière de gouvernance éthique, de développement commercial, de technologie écologique et de développement futur sont également très clairs.

**AI Technology Review : le prochain OpenAI apparaîtra-t-il en Chine ? **

**Zhou Bowen :**La difficulté technique de construire un grand modèle est en fait au-delà de l'imagination de nombreux entrepreneurs chinois. Par conséquent, je ne recommande pas aux entreprises nationales de suivre et de copier aveuglément le modèle "OpenAI + Microsoft", car la plupart des entreprises technologiques chinoises en Chine ne sont pas aussi douées pour la prise de décision commerciale que Microsoft, et leur jugement technologique n'est pas aussi bon qu'OpenAI . **

Le succès d'OpenAI est le résultat de nombreux facteurs. Par exemple, Ilya Sutskever a fait des jugements techniques, Greg Brockman a fait des fonctions et Sam Altman a intégré des ressources, y compris des recherches sur l'impact de l'IA sur l'éthique et la société. Si les entreprises nationales imitent simplement OpenAI, la distance entre elles ne fera que s'éloigner de plus en plus.

Le jugement technique d'OpenAI peut être vu à partir de la latitude des données, car toutes les données du monde n'ont pas la même importance. Pourquoi OpenAI a-t-il choisi d'utiliser le langage de programmation de Github pour entraîner la chaîne de réflexion ? Parce que la sémantique et la syntaxe du langage de programmation sont extrêmement simples, la logique du processus d'exécution est rigoureuse. Cela représente également une caractéristique et un avantage d'OpenAI : il n'attaquera pas aveuglément. Par conséquent, je pense que le développement de l'IA en Chine doit trouver une autre voie, c'est-à-dire s'appuyer sur la capacité des grands modèles généraux à partir de l'application de scénarios verticaux, ce qui a plus de chances de réussir.

** L'IA générative va perturber l'expérience client existante **

**AI Technology Review : pourquoi ciblez-vous le secteur de la consommation ? **

Zhou Bowen : Lorsque j'étais chez JD.com, j'ai vu une énorme opportunité commerciale de "faire correspondre dynamiquement la demande des consommateurs et la conception des produits avec l'intelligence artificielle". En 2021, j'ai décidé de quitter mon emploi et de créer une entreprise pour développer un grand modèle de langage général pour les industries verticales (le grand modèle de langage n'avait pas explosé à l'époque), en espérant couvrir tous les comportements des consommateurs à partir de scénarios non spécifiques. Nous savons que les scènes temporelles et spatiales sont différentes du lundi au vendredi, et que l'attention des cols blancs ou d'autres professions est également différente.Derrière ces symboles culturels qui affectent le comportement d'achat se cachent des émotions, des expériences et des choix de produits complexes pour les consommateurs. , c'est exactement l'information précieuse dont les entreprises ont besoin. Lors de la fabrication de produits du côté de l'offre, cela inclut la créativité, la conception, les paramètres du produit, les fonctions, les matériaux et le positionnement de la marque, le slogan, le marketing, la publicité, le marketing, les images promotionnelles, etc. Il existe en fait une forte relation correspondante derrière tous ces facteurs.

Ce type de relation de correspondance n'a jamais été dépassé par les êtres humains auparavant. Les praticiens de la planification, du marketing et des ventes ne comprennent que les liens dont ils sont responsables. Et nous allons créer le premier modèle à grande échelle à usage général au monde de la chaîne d'approvisionnement des produits de base, c'est-à-dire compresser toutes ces informations dans un modèle à usage général avec une haute fidélité, et basé sur ce modèle à grande échelle pour habiliter l'ensemble du cycle de vie des produits d'entreprise, y compris : les opportunités Insight (Discover), la définition du produit (Define), la conception du programme (Design), la conduite de la R&D (Develop), la transformation marketing (Distribute). De cette manière, les entreprises peuvent découvrir plus efficacement les opportunités d'innovation, concevoir et produire de manière plus créative, effectuer des promotions marketing, atteindre les utilisateurs et mener à bien leur transformation plus efficacement.

** Examen de la technologie AI : en termes de modèle commercial, cela semble être plus avancé. **

Zhou Bowen : Pour toute équipe entrepreneuriale, il est très important de pouvoir cultiver des capacités plus professionnelles après avoir acquis les capacités techniques générales des grands modèles. À l'heure actuelle, la percée de GPT réside principalement dans sa capacité générale, mais sa valeur pour des industries spécifiques et des domaines verticaux n'a pas encore été développée. Par exemple : GPT peut dessiner des peintures artistiques très réalistes, mais il ne peut pas dessiner de schémas de circuits, car il ne n'ont pas assez de connaissances physiques Les jugements approfondis et pertinents ne sont pas assez professionnels.

Par conséquent, je pense qu'il existe un besoin pour un tel outil (un grand modèle à usage général avec des capacités professionnelles) pour permettre aux consommateurs de trouver plus facilement et d'être plus disposés à acheter les produits dont ils ont besoin, ce qui peut complètement changer les parcours d'achat existants des gens. . L'IA générative peut compresser des quantités massives d'informations commerciales dans des modèles aussi volumineux, afin d'apprendre tous les aspects de la chaîne d'approvisionnement des produits de base et d'améliorer l'efficacité des liens clés centrés sur les consommateurs. C'est l'idée et la créativité qui ont déjà été générées en 2021.

**Lianyuan Technology développe un grand modèle avec des capacités générales. Ce grand modèle possède une expertise dans la mise en relation des produits et des consommateurs. **Nous disposons de 37 indicateurs d'évaluation de modèles à grande échelle, dont les 2/3 sont des capacités à usage général telles que la capacité de raisonnement et la capacité de calcul, et plus d'une douzaine d'éléments sont spécialement appliqués à la connexion entre les produits et les consommateurs, afin de réalisez que "que chaque produit soit né du besoin, que chaque consommateur obtienne ce qu'il veut".

**AI Technology Review : comment l'IA générative peut-elle mieux s'intégrer aux scénarios de consommation tels que le commerce électronique ? **

**Zhou Bowen :**Les humains ne peuvent comprendre que la logique commerciale de la planification ou la logique du marketing, mais l'IA peut ouvrir toutes les chaînes commerciales.

Les consommateurs ont besoin de beaucoup de vocabulaire professionnel pour trouver les produits qu'ils souhaitent dans des scénarios tels que les plateformes de commerce électronique ; mais d'un autre côté, les commerçants ne comprennent pas les besoins réels des consommateurs et ne peuvent atteindre les consommateurs que par le biais de transactions de commerce électronique , Par le conseil instituts de recherche pour mieux comprendre les consommateurs. Après l'introduction d'une fonction de dialogue à plusieurs tours comme ProductGPT, l'efficacité de l'appariement dynamique des commerçants et des consommateurs sur les produits sera plus efficace que les études de marché, de sorte que les plateformes de commerce électronique puissent participer plus profondément à l'innovation, à la conception, à la recherche et au développement des produits, et commercialisation, promotion, etc.

Dans la société commerciale actuelle, il existe en fait une forte correspondance entre la demande et l'offre. Notre plate-forme d'innovation collaborative SaaS, développée en interne, est basée sur la compréhension multimodale, les capacités de raisonnement et de génération de grands modèles, et aide les entreprises à découvrir des opportunités commerciales et des innovations de produits grâce à des informations approfondies sur les consommateurs, les scénarios, les produits, les références de produits et la R&D. . Dans le même temps, la plate-forme de dialogue multi-tours ProductGPT de Lianyuan Technology fournit à chaque employé de l'entreprise un assistant personnel profondément personnalisé en fonction des différents rôles professionnels et répond à leurs besoins de travail spécifiques en fournissant des compétences et des connaissances spécifiques au rôle. Par exemple, l'assistant personnel de recherche sur les consommateurs de Lianyuan Technology fournira des compétences professionnelles et des connaissances pertinentes telles que la recherche des tendances du marché, la compréhension des besoins des consommateurs et les études de marché.

**Avis sur la technologie de l'IA : vous avez utilisé l'IA générative pour gagner de l'argent sur JD.com, comment avez-vous fait ? **

**Zhou Bowen :**En 2019, j'ai dirigé l'équipe d'intelligence artificielle de JD.com pour appliquer l'intelligence artificielle générative pour créer la rédaction de produits et sélectionner des images. Il s'agit également du premier modèle génératif à grande échelle de JD.com. À cette époque, notre modèle d'IA accomplissait principalement trois choses :

Tout d'abord, vous pouvez lire vous-même le contenu de la page de détails du produit et générer directement 8 à 9 arguments de vente de ce produit grâce à l'analyse ;

Deuxièmement, lorsqu'un consommateur navigue sur un certain produit, le grand modèle trouvera rapidement quels arguments de vente peuvent le plus impressionner l'utilisateur en analysant les données de comportement des différents consommateurs ;

Troisièmement, l'AIGC générera des slogans exclusifs autour des arguments de vente qui préoccupent le plus les consommateurs en fonction des portraits des utilisateurs.

Après une période de mise en œuvre, le taux de conversion des recommandations de produits a augmenté de 30 % par rapport à avant. Les consommateurs peuvent ne pas se rendre compte que lorsqu'ils recherchent et achètent sur JD.com, les catégories de produits et les descriptions qu'ils voient sont en fait automatiquement générées par AIGC mot par mot en fonction des préférences de l'utilisateur et des arguments de vente des produits au moment où il parcourt les produits. .

**AI Technology Review : que pensez-vous de l'API ouverte d'OpenAI et qu'est-ce que cela signifie pour l'industrie ? **

Zhou Bowen : Parlant d'expérience personnelle, j'étais le scientifique en chef d'IBM Watson Group. À cette époque, les données de certaines industries aux États-Unis étaient réglementées, et ces entreprises étaient généralement incapables de coopérer et ne pouvaient déployer que des clouds privés. Pour cette raison, en 2015-2016, j'étais déterminé à être un cloud public. Pour y parvenir, il est nécessaire d'APIiser les capacités d'IA de Watson. À cette époque, j'ai dirigé le lancement de dizaines d'API, y compris le dialogue et la compréhension du langage naturel. Mettez ces API sur la plate-forme cloud, et maintenant l'activité IA d'IBM en tire principalement de l'argent.

Je suis retourné en Chine fin 2017, et en avril 2018, j'ai lancé la plateforme ouverte d'intelligence artificielle de JD.com. À cette époque, il n'y avait pratiquement pas de plate-forme d'IA en Chine, ce qui apportait également des revenus considérables à JD.com. En 2019, l'équipe JD.com AI que je dirige a généré 170 millions de yuans de revenus, ce qui n'est pas mal pour une équipe de 200 personnes.

**Avis sur la technologie de l'IA : il y a une perception dans l'industrie que le risque de faire un grand modèle vertical est très élevé. Qu'en pensez-vous ? **

Zhou Bowen : Je pense qu'à l'avenir, ces flux de travail bien définis et de grande valeur seront complétés par des modèles d'IA professionnels plutôt que par des modèles d'IA généraux. Il est facile d'améliorer encore les capacités de base d'un grand modèle à usage général après avoir terminé avec succès une certaine scène verticale. De plus, si nous partons d'un scénario vertical, notre accumulation passée en termes de puissance de calcul, de données et d'algorithmes peut être plus pleinement utilisée. Par conséquent, dans la technologie Lianyuan, le grand modèle doit avoir les capacités de base de la technologie générale des grands modèles dans le cadre sous-jacent de la technologie, et il doit être évalué avec des méthodes scientifiques, mais il nécessite également une formation professionnelle.

En 2023, en raison de la popularité soudaine de ChatGPT, le marché a commencé à utiliser l'IA 2.0 pour décrire son énorme potentiel. De plus, presque tous les géants de la technologie ont rejoint la bataille, le marché du capital-risque tente de saisir de nouvelles opportunités et l'environnement du marché évolue également rapidement. GPT est une opportunité entrepreneuriale systématique, mais simplement copier, suivre et rattraper est risqué et difficile.

Après avoir fondé Lianyuan Technology, nous avons communiqué avec plus de 100 clients, vu les besoins réels et amélioré le chemin de réalisation de la technologie en optimisant continuellement le grand modèle : "En 2022, nous avons démontré la valeur commerciale et la faisabilité technique de ce scénario, cela signifie que même si nous faisons un grand modèle, nous sommes sur une voie différente d'OpenAI, et le modèle de profit est également différent.

Ce que je veux faire, c'est un meilleur compresseur de connaissance du monde que le GPT actuel, qui nécessite des données très interactives, et les données sont évidemment étroitement liées à la scène. Quant à savoir quel type de données a le sens d'une intelligence humaine supérieure, il y a en fait beaucoup de travail théorique à y faire, et c'est une direction qui mérite d'être explorée à l'avenir.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)