Fonte da imagem: Gerada pela ferramenta Unbounded AI
Desde 2023, a palavra mais quente no círculo tecnológico é ChatGPT e a tecnologia de modelo em grande escala por trás dele.
Anteriormente, havia Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Pangu, HKUST Xunfei Xinghuo, etc. Recentemente, Li Kaifu entrou no escritório para estabelecer Zero One Wanwu e a Volcano Engine lançou a "Volcano Ark". Em apenas alguns meses, tornou-se uma tendência para várias empresas desenvolver e lançar aplicativos de modelo em grande escala.
Existem mais de 80 modelos domésticos de grande escala com uma escala de parâmetro de 1 bilhão ou mais, e o número ainda está aumentando rapidamente. O clima de preparação para uma guerra comercial em torno de grandes modelos já é extremamente forte.
Seja uma grande empresa gigante ou uma pequena empresa gigante, todas precisam dessas ações para mostrar sua sensibilidade à tecnologia de ponta e sua acumulação de longo prazo. Ao iniciar o aplicativo mais cedo, você pode testar os dados valiosos sobre a interação entre o modelo grande e o usuário um dia antes e "acumular muita comida e a imagem é o rei" na futura competição.
A chave para o grande modelo são os elementos do campo de IA - algoritmos, poder de computação, dados e cenários/aplicativos. Algoritmos representam estratégias, o poder computacional determina o limite superior e estabelece um limiar, e dados equivalem a rações militares também simbolizam a distinção entre bom e mau. Além dos três elementos, a cena/aplicação representa a direção do envio de tropas.
A "Guerra dos Cem Modelos" está prestes a estourar. Uma empresa gigante com todos os elementos evoluirá para uma involução infinita de capacidades tecnológicas? Os pequenos gigantes na pista vertical podem consolidar sua posição de liderança com a ajuda de grandes modelos? Entre os novos jogadores que estão recebendo ingressos, quem poderia ser um sério candidato ao domínio da indústria?
Modelo geral em grande escala "bacia hidrográfica de força" ainda não apareceu
Os jogadores de grandes modelos são divididos principalmente em três categorias: uma é a Internet (Baidu, Ali, Tencent, etc.) e gigantes da indústria (China Telecom e China Unicom, etc.) Empresas inteligentes (SenseTime, Yuncong, Guangyuewai, etc.) , e a última categoria são institutos de pesquisa científica representados pelo Laboratório de Inteligência Artificial de Xangai, Universidade Fudan, Instituto de Tecnologia Harbin, etc.
De acordo com dados públicos, desde o início de julho de 2023, existem mais de 80 modelos de grande escala com parâmetros acima de 1 bilhão em meu país, e eles ainda estão aumentando rapidamente. Quanto mais modelos grandes com essa quantidade de parâmetros, maior será o limite de competição.
A maioria dos modelos de grande escala lançados até agora são modelos de grande escala de propósito geral. Há duas razões principais: uma é que a competição de modelos de grande escala ainda não é clara e o nível puramente técnico não aumentou a lacuna de geração e os participantes da indústria têm a oportunidade de dominar o mundo; O modelo de grande escala orientado a aplicativos para o público ainda não apareceu e há uma falta de orientação de direção clara. Antes do "momento Chat GPT" do modelo doméstico de grande escala aparece, é uma escolha ativa e passiva para se juntar ao modelo de grande escala de uso geral.
Além disso, é muito provável que surja um novo gigante no campo dos grandes modelos.
Zhou Hongyi acredita que grandes modelos devem ser "universais" e apenas o uso geral pode entrar em milhares de residências, capacitar centenas de indústrias e liderar a nova revolução da inteligência artificial.
O que fica inacabado é quanto investimento e cooperação são necessários para se tornar o líder da nova revolução. Independentemente de o grande modelo ser um mercado de oceano azul ou oceano vermelho, deve haver uma estrutura ecológica em que os peixes grandes liderem e os peixes pequenos cooperem.No entanto, o divisor de águas entre os peixes grandes e os peixes pequenos ainda não surgiu.
A julgar pela situação atual, um grande modelo com uma escala de 1 bilhão de parâmetros pode ser considerado como o limite de entrada, e um grande modelo com uma escala de 10 bilhões de parâmetros pode ser considerado capaz de competir no mundo, mas mesmo um modelo grande com uma escala de 100 bilhões de parâmetros está longe de ser o melhor, o nível líder de poeira.
A quantidade de parâmetros não é uma força avassaladora que determina a situação do campo de batalha. Fatores como capacidade de agendamento de recursos, acúmulo de experiência de longo prazo e grande investimento em pesquisa científica são diferenças centrais de longa data na competição de modelos em grande escala.
Para comparar com o Open AI, é necessário ver que por trás da explosão do Chat GPT está o suporte abrangente da Microsoft em dados, poder de computação e fundos maciços, de modo que acumulou muito dinheiro no futuro.
Modelos de grande escala são indústrias de investimento de longo prazo, o que significa simplesmente "queimar dinheiro". O acúmulo de poder de computação, algoritmos e dados não é alcançado da noite para o dia. Depois que o modelo é lançado, ele precisa de treinamento repetido e iterações ágeis e, finalmente, evolui para um "corpo maduro".
No ambiente real, o jogador do grande modelo é impulsionado pela tecnologia ou pelo lucro? A Open AI é a empresa de modelos em grande escala mais famosa do mundo.Mesmo com o produto explosivo Chat GPT, sua capacidade de comercialização ainda é preocupante. Como uma empresa de tecnologia com valor de mercado próximo a US$ 30 bilhões, ela estará no centro da onda da IA em 2023. A receita da Open AI até agora ainda é inferior a US$ 200 milhões.
O investimento inicial é apenas o custo inicial, e todo treinamento subseqüente requer dinheiro real. Quantas empresas podem aceitar o lamentável retorno do investimento na competição de modelos em grande escala? O sucesso do Chat GPT prova que o grande modelo foi aberto no caminho do produto, mas não significa um grande sucesso a nível comercial.
Pelo menos em termos de relação input-output, os gigantes da Internet têm uma vantagem relativa maior: têm motivação e recursos suficientes para suportar as perdas estratégicas no estágio inicial, assim como o Alibaba Cloud naquela época.
Quanto tempo levará para queimar dinheiro e quando ver um retorno gratificante sobre o investimento, as grandes empresas não sabem, nem os VCs de empresas iniciantes. Esta é uma aposta que pode sair do jogo a qualquer momento, e as fichas são de bilhões de dólares.
Para os jogadores de modelo em grande escala que "cada um tem suas próprias vantagens", eles devem primeiro explorar a camada de aplicativo e abrir o teste o mais rápido possível. Quem conseguir acumular dados de interação mais preciosos será o ponto de ruptura da próxima competição.
Necessidades verticais e dificuldades verticais
A competição por modelos gerais de larga escala é mais sobre a competição pelo direito de formular infraestrutura, enquanto o modelo vertical de larga escala depende de modelos de larga escala de código aberto ou interfaces de API em cenários específicos para formar competitividade diferenciada em setores subdivididos, focando mais na aplicação de cenários.
No campo de batalha de modelos de grande escala de uso geral, com o passar do tempo, alguns jogadores que são fracos gradualmente ficarão para trás e, eventualmente, haverá apenas alguns modelos de grande escala de uso geral, que desempenharão o papel de infraestrutura . Ao mesmo tempo, esses grandes modelos ainda enfrentam o problema da homogeneidade, e a camada de aplicação ainda depende dos grandes modelos verticais.
O modelo grande de uso geral é como uma coleção de vários modelos grandes verticais. Quanto mais cenários de treinamento, mais forte é a "generalidade" do modelo grande de uso geral.
Como a primeira empresa na China a lançar produtos semelhantes ao Chat GPT, a Baidu tem uma necessidade urgente de camadas de aplicativos verticais de modelo em grande escala. Li Yanhong disse: "Mais importante do que o número de modelos grandes é a aplicação, que é um avanço na aplicação de campos verticais. O ponto chave da nova estratégia de competição internacional não é quantos modelos grandes existem, mas quantos nativos aplicações nos modelos grandes. Essas aplicações Até que ponto a eficiência da produção foi melhorada."
De acordo com a metáfora de Robin Li, modelos grandes, especialmente modelos grandes de uso geral, são como o sistema operacional na era da IA. Todos os aplicativos serão desenvolvidos em torno do modelo grande, acima do qual está a camada de aplicativos, incluindo vários nativos de IA formulários.
Em última análise, o chamado "universal" é apenas um conceito relativo e não existe um modelo de uso geral que seja completamente aplicável a todos os campos e tenha profundidade industrial suficiente. Tomando o Chat GPT como exemplo, ainda são algumas indústrias com uma alta taxa de tolerância a falhas que são realmente amplamente utilizadas.Mesmo que a solução dada pelo modelo grande esteja errada, o erro é limitado a um intervalo relativamente limitado. Porém, em cenários como indústria pesada, aeroespacial e assistência médica, o prejuízo causado por um erro é imensurável, ou seja, o Chat GPT não consegue atender às exigências verticais e profissionais de cenários específicos.
Para levar em consideração os requisitos de verticalidade e profissionalismo, os dados são uma falha e há menos setores com profundidade de dados suficiente e um fosso estável. Se os dados dessas indústrias são fáceis de obter e se os dados obtidos podem atender aos requisitos em constante mudança de indústrias específicas, é difícil avaliar especificamente.
Os gigantes da Internet têm uma grande quantidade de dados de rede, como comércio eletrônico, redes sociais e pesquisa, mas os tipos de dados não são abrangentes o suficiente e a qualidade dos dados não é garantida. O corpus que pode ser treinado em chinês ainda precisa muito trabalho mineiro.
Recentemente, nas áreas de assuntos governamentais, segurança pública e assistência médica, modelos verticais de grande escala estão sendo implementados um após o outro. Por exemplo, Yunzhisheng autodesenvolveu o modelo de grande escala "montanha e mar" no campo de assistência médica inteligente, combinado com tecnologias de interação de voz inteligente de pilha completa, como processamento de sinal de som front-end, reconhecimento de impressão de voz, reconhecimento de fala e síntese de fala, espera-se melhorar a eficiência da entrada de registros médicos eletrônicos dos médicos em mais de 400%, economizando mais de 40% do tempo de consulta para um único paciente e melhorando a eficiência do ambulatório médico em mais de 66%.
Com base em seus próprios documentos oficiais, documentos de política, guias de assuntos governamentais e outros dados como dados de treinamento profissional, o TRS criou um grande modelo de assuntos governamentais.
No campo financeiro, a Hang Seng Electronics começará a planejar e projetar produtos financeiros em grande escala no final de março de 2023. No final de junho, a Hang Seng Electronics e sua subsidiária Hang Seng Juyuan lançaram um novo produto financeiro de inteligência digital baseado em tecnologia de modelo de linguagem grande - o assistente financeiro inteligente Photon e a recém-atualizada plataforma de pesquisa de investimento inteligente WarrenQ.
A Tencent, uma gigante da Internet com vários recursos da indústria, está apostando em vários lados. No final de junho, a Tencent anunciou soluções de serviço MaaS cobrindo 10 setores, incluindo finanças, turismo cultural, assuntos governamentais e educação, com um total de mais de 50 soluções.
Ao mesmo tempo, os dados exigidos pelo modelo grande vertical muitas vezes não se limitam ao setor. Algumas empresas podem exigir a integração de dados de outro ou mais setores. O treinamento e a aplicação do modelo dependem da cooperação entre setores de empresas ou dos recursos dos gigantes da Internet.
**Poder de computação: tijolos poderosos voam? **
Na corrida do ouro no oeste dos Estados Unidos no século 19, era um evento probabilístico que os garimpeiros pudessem realmente ganhar dinheiro, enquanto era um resultado inevitável que os vendedores de pás ganhassem dinheiro.
Na corrida do ouro da IA, a situação do campo de batalha do modelo grande ainda não está clara e os jogadores ainda estão avançando, mas o "vendedor de pás" já venceu. Baseando-se na tendência de chips de IA e modelos grandes, a Nvidia ampliou a distância com seu concorrente AMD e seu valor de mercado entrou no "clube do trilhão de dólares".
O CEO da Open AI, Sam Altman, propôs uma nova versão da Lei de Moore, ou seja, o poder computacional da IA global dobrará a cada 18 meses. A manutenção desses cálculos requer o suporte de chips de treinamento de IA, e a participação de mercado da Nvidia nessa área ultrapassa 90%.
Os produtos de chip AI da Nvidia foram freneticamente comprados por grandes empresas de tecnologia em todo o mundo: em março de 2023, a Microsoft anunciou que ajudou a OpenAI a construir um novo centro de computação com dezenas de milhares de A100s; em maio, o Google lançou um H100 com 26.000 peças. cluster de computação ComputeEngineA3. Além disso, de acordo com informações da China National Finance Securities, a ByteDance encomendou mais de US$ 1 bilhão em GPUs este ano, e estima-se que existam 100.000 peças de A100 e H800 que chegaram e não chegaram. Dezenas de milhares de chips H800 também são usados na nova versão do Tencent Cloud High Performance Computing Service Center lançado pela Tencent.
O CFO da Nvidia, Kress, disse que a demanda atual do mercado por poder de computação de IA excedeu as expectativas da empresa para os próximos trimestres e há muitos pedidos a serem atendidos.
Claro, é inútil invejar o dinheiro que a Nvidia ganha.
A faixa de GPU doméstica também está alcançando. Não há apenas chips AI autodesenvolvidos gigantes da Internet, como o chip AI Baidu Kunlun, o chip de processamento de vídeo Tencent "Canghai" e o chip AI "Zixiao", etc., mas também a Suiyuan Technology, Tianshu Zhixin, Empresas emergentes, como a Moore Threads, que desenvolvem GPUs de uso geral. As GPUs de uso geral são usadas para várias tarefas de uso geral, incluindo capacidades de computação altamente paralelas e núcleos de computação em grande escala. Também houve um grande progresso nos últimos anos , e a diferença com GPUs de alto desempenho está diminuindo gradualmente.
Wu Hequan, um acadêmico da Academia Chinesa de Engenharia, sugeriu que, sob a coordenação dos planos nacionais de ciência e tecnologia e industriais, uma divisão razoável do trabalho deveria ser formada para formar um poder de computação conjunto, e a plataforma de poder de computação do país O laboratório deve ser aberto para oferecer suporte a vários treinamentos de modelos em grande escala. Ao mesmo tempo, sugere-se formar uma aliança de poder de computação para concentrar as GPUs de ponta existentes. Os recursos de computação fornecem o poder de computação necessário para o treinamento de dados de modelos grandes.
Além de GPUs de alto desempenho, plataformas de computação de baixo custo também são consideradas novas oportunidades de mercado. Recentemente, a Jiuzhang Yunji revelou que continuará a cooperar com os fabricantes de nuvem estatais e incluirá um grande número de centros de computação inteligente no mercado como parceiros e fornecerá aos clientes uma plataforma de pesquisa e desenvolvimento de modelos de IA integrando software e hardware. o custo dos clientes estará vinculado ao poder de computação.
O poder de computação é a base para o desenvolvimento de grandes modelos, e é uma condição necessária, mas não suficiente.O papel máximo que o poder de computação pode desempenhar ainda depende da direção do uso. Somente quando a inovação do algoritmo, a construção de recursos de dados e a iteração da estrutura de treinamento andam de mãos dadas, é possível criar "tijolos poderosos voando".
Política: Orientação e regulamentação em momentos críticos
O período da explosão da IA coincide com o momento crítico da governança e arquivamento de algoritmos em nosso país.
Já em 2021, as "Opiniões Orientadoras sobre o Fortalecimento da Governança Abrangente de Algoritmos de Serviços de Informações da Internet" colocaram o gerenciamento de arquivamento de algoritmos como uma parte importante da melhoria do sistema de supervisão. O Regulamento de Gestão estipula ou menciona claramente que "provedores de serviços de recomendação de algoritmos com atributos de opinião pública ou capacidades de mobilização social devem realizar procedimentos de arquivamento."
Em abril de 2023, a Administração do Ciberespaço da China elaborou as "Medidas Administrativas para Serviços Geradores de Inteligência Artificial (Rascunho para Comentários)" para consulta pública. Em junho, o "Plano de Trabalho Legislativo do Conselho de Estado de 2023" emitido pelo Conselho de Estado mostrou que o projeto de lei de inteligência artificial foi preparado para ser submetido ao Comitê Permanente do Congresso Nacional do Povo para deliberação.
As "Medidas Gerativas de Gerenciamento de Serviços de Inteligência Artificial (Rascunho para Comentário)" mencionou que antes de usar produtos de inteligência artificial generativa para fornecer serviços ao público, isso deve ser relatado à Rede Estadual de acordo com o "Regulamento de Avaliação de Segurança de Informações da Internet Serviços com Atributos de Opinião Pública ou Capacidades de Mobilização Social". O departamento de informação deve solicitar uma avaliação de segurança e realizar os procedimentos de arquivamento, modificação e cancelamento de algoritmos de acordo com o "Regulamento de Gestão de Recomendação de Algoritmo de Serviço de Informação da Internet".
Esta é também uma das razões pelas quais não existem produtos modelo em grande escala disponíveis ao público.
O professor Chen Bing, vice-reitor da Faculdade de Direito da Universidade de Nankai e pesquisador especial do Instituto de Pesquisa de Estratégia de Desenvolvimento de Inteligência Artificial de Nova Geração da China, acredita que a pré-regulamentação não prejudicará necessariamente a inovação tecnológica, mas deve-se observar que, devido a revisão, aumentará o número de empresas até certo ponto. Se o escopo da revisão anterior não for definido adequadamente, pode inibir a pesquisa, desenvolvimento e eficiência de treinamento de produtos de IA generativos e levar objetivamente a uma desaceleração no desenvolvimento de IA generativa.
Como os riscos da inteligência artificial não podem ser perfeitamente estimados com antecedência, e a supervisão após o evento pode causar grandes danos, meu país atualmente adota a supervisão de processo completo do desenvolvimento da inteligência artificial.
Sob a regulamentação de todo o processo, o custo de conformidade dos jogadores modelo em grande escala aumentará, sem dúvida, e o sistema de arquivamento de registros também exorta os jogadores no jogo a buscar o arquivamento de registros primeiro, a fim de promover produtos no mercado mais cedo, objetivamente acelerando a velocidade das grandes ondas. O aprimoramento gradativo de leis e regulamentos vem acompanhado do processo de remanejamento da indústria e da superação dos fracos, o que também pode trazer o momento de abrir as nuvens para o sol mais cedo.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Quando nascerá o novo gigante? Grande modelo aguarda "divisor de águas"
Fonte| Zero One Finance
Autor| Shen Zhuoyan
Desde 2023, a palavra mais quente no círculo tecnológico é ChatGPT e a tecnologia de modelo em grande escala por trás dele.
Anteriormente, havia Baidu Wenxin Yiyan, Alibaba Cloud Tongyi Qianwen, Huawei Pangu, HKUST Xunfei Xinghuo, etc. Recentemente, Li Kaifu entrou no escritório para estabelecer Zero One Wanwu e a Volcano Engine lançou a "Volcano Ark". Em apenas alguns meses, tornou-se uma tendência para várias empresas desenvolver e lançar aplicativos de modelo em grande escala.
Existem mais de 80 modelos domésticos de grande escala com uma escala de parâmetro de 1 bilhão ou mais, e o número ainda está aumentando rapidamente. O clima de preparação para uma guerra comercial em torno de grandes modelos já é extremamente forte.
Seja uma grande empresa gigante ou uma pequena empresa gigante, todas precisam dessas ações para mostrar sua sensibilidade à tecnologia de ponta e sua acumulação de longo prazo. Ao iniciar o aplicativo mais cedo, você pode testar os dados valiosos sobre a interação entre o modelo grande e o usuário um dia antes e "acumular muita comida e a imagem é o rei" na futura competição.
A chave para o grande modelo são os elementos do campo de IA - algoritmos, poder de computação, dados e cenários/aplicativos. Algoritmos representam estratégias, o poder computacional determina o limite superior e estabelece um limiar, e dados equivalem a rações militares também simbolizam a distinção entre bom e mau. Além dos três elementos, a cena/aplicação representa a direção do envio de tropas.
A "Guerra dos Cem Modelos" está prestes a estourar. Uma empresa gigante com todos os elementos evoluirá para uma involução infinita de capacidades tecnológicas? Os pequenos gigantes na pista vertical podem consolidar sua posição de liderança com a ajuda de grandes modelos? Entre os novos jogadores que estão recebendo ingressos, quem poderia ser um sério candidato ao domínio da indústria?
Modelo geral em grande escala "bacia hidrográfica de força" ainda não apareceu
Os jogadores de grandes modelos são divididos principalmente em três categorias: uma é a Internet (Baidu, Ali, Tencent, etc.) e gigantes da indústria (China Telecom e China Unicom, etc.) Empresas inteligentes (SenseTime, Yuncong, Guangyuewai, etc.) , e a última categoria são institutos de pesquisa científica representados pelo Laboratório de Inteligência Artificial de Xangai, Universidade Fudan, Instituto de Tecnologia Harbin, etc.
De acordo com dados públicos, desde o início de julho de 2023, existem mais de 80 modelos de grande escala com parâmetros acima de 1 bilhão em meu país, e eles ainda estão aumentando rapidamente. Quanto mais modelos grandes com essa quantidade de parâmetros, maior será o limite de competição.
A maioria dos modelos de grande escala lançados até agora são modelos de grande escala de propósito geral. Há duas razões principais: uma é que a competição de modelos de grande escala ainda não é clara e o nível puramente técnico não aumentou a lacuna de geração e os participantes da indústria têm a oportunidade de dominar o mundo; O modelo de grande escala orientado a aplicativos para o público ainda não apareceu e há uma falta de orientação de direção clara. Antes do "momento Chat GPT" do modelo doméstico de grande escala aparece, é uma escolha ativa e passiva para se juntar ao modelo de grande escala de uso geral.
Além disso, é muito provável que surja um novo gigante no campo dos grandes modelos.
Zhou Hongyi acredita que grandes modelos devem ser "universais" e apenas o uso geral pode entrar em milhares de residências, capacitar centenas de indústrias e liderar a nova revolução da inteligência artificial.
O que fica inacabado é quanto investimento e cooperação são necessários para se tornar o líder da nova revolução. Independentemente de o grande modelo ser um mercado de oceano azul ou oceano vermelho, deve haver uma estrutura ecológica em que os peixes grandes liderem e os peixes pequenos cooperem.No entanto, o divisor de águas entre os peixes grandes e os peixes pequenos ainda não surgiu.
A julgar pela situação atual, um grande modelo com uma escala de 1 bilhão de parâmetros pode ser considerado como o limite de entrada, e um grande modelo com uma escala de 10 bilhões de parâmetros pode ser considerado capaz de competir no mundo, mas mesmo um modelo grande com uma escala de 100 bilhões de parâmetros está longe de ser o melhor, o nível líder de poeira.
A quantidade de parâmetros não é uma força avassaladora que determina a situação do campo de batalha. Fatores como capacidade de agendamento de recursos, acúmulo de experiência de longo prazo e grande investimento em pesquisa científica são diferenças centrais de longa data na competição de modelos em grande escala.
Para comparar com o Open AI, é necessário ver que por trás da explosão do Chat GPT está o suporte abrangente da Microsoft em dados, poder de computação e fundos maciços, de modo que acumulou muito dinheiro no futuro.
Modelos de grande escala são indústrias de investimento de longo prazo, o que significa simplesmente "queimar dinheiro". O acúmulo de poder de computação, algoritmos e dados não é alcançado da noite para o dia. Depois que o modelo é lançado, ele precisa de treinamento repetido e iterações ágeis e, finalmente, evolui para um "corpo maduro".
No ambiente real, o jogador do grande modelo é impulsionado pela tecnologia ou pelo lucro? A Open AI é a empresa de modelos em grande escala mais famosa do mundo.Mesmo com o produto explosivo Chat GPT, sua capacidade de comercialização ainda é preocupante. Como uma empresa de tecnologia com valor de mercado próximo a US$ 30 bilhões, ela estará no centro da onda da IA em 2023. A receita da Open AI até agora ainda é inferior a US$ 200 milhões.
O investimento inicial é apenas o custo inicial, e todo treinamento subseqüente requer dinheiro real. Quantas empresas podem aceitar o lamentável retorno do investimento na competição de modelos em grande escala? O sucesso do Chat GPT prova que o grande modelo foi aberto no caminho do produto, mas não significa um grande sucesso a nível comercial.
Pelo menos em termos de relação input-output, os gigantes da Internet têm uma vantagem relativa maior: têm motivação e recursos suficientes para suportar as perdas estratégicas no estágio inicial, assim como o Alibaba Cloud naquela época.
Quanto tempo levará para queimar dinheiro e quando ver um retorno gratificante sobre o investimento, as grandes empresas não sabem, nem os VCs de empresas iniciantes. Esta é uma aposta que pode sair do jogo a qualquer momento, e as fichas são de bilhões de dólares.
Para os jogadores de modelo em grande escala que "cada um tem suas próprias vantagens", eles devem primeiro explorar a camada de aplicativo e abrir o teste o mais rápido possível. Quem conseguir acumular dados de interação mais preciosos será o ponto de ruptura da próxima competição.
Necessidades verticais e dificuldades verticais
A competição por modelos gerais de larga escala é mais sobre a competição pelo direito de formular infraestrutura, enquanto o modelo vertical de larga escala depende de modelos de larga escala de código aberto ou interfaces de API em cenários específicos para formar competitividade diferenciada em setores subdivididos, focando mais na aplicação de cenários.
No campo de batalha de modelos de grande escala de uso geral, com o passar do tempo, alguns jogadores que são fracos gradualmente ficarão para trás e, eventualmente, haverá apenas alguns modelos de grande escala de uso geral, que desempenharão o papel de infraestrutura . Ao mesmo tempo, esses grandes modelos ainda enfrentam o problema da homogeneidade, e a camada de aplicação ainda depende dos grandes modelos verticais.
O modelo grande de uso geral é como uma coleção de vários modelos grandes verticais. Quanto mais cenários de treinamento, mais forte é a "generalidade" do modelo grande de uso geral.
Como a primeira empresa na China a lançar produtos semelhantes ao Chat GPT, a Baidu tem uma necessidade urgente de camadas de aplicativos verticais de modelo em grande escala. Li Yanhong disse: "Mais importante do que o número de modelos grandes é a aplicação, que é um avanço na aplicação de campos verticais. O ponto chave da nova estratégia de competição internacional não é quantos modelos grandes existem, mas quantos nativos aplicações nos modelos grandes. Essas aplicações Até que ponto a eficiência da produção foi melhorada."
De acordo com a metáfora de Robin Li, modelos grandes, especialmente modelos grandes de uso geral, são como o sistema operacional na era da IA. Todos os aplicativos serão desenvolvidos em torno do modelo grande, acima do qual está a camada de aplicativos, incluindo vários nativos de IA formulários.
Em última análise, o chamado "universal" é apenas um conceito relativo e não existe um modelo de uso geral que seja completamente aplicável a todos os campos e tenha profundidade industrial suficiente. Tomando o Chat GPT como exemplo, ainda são algumas indústrias com uma alta taxa de tolerância a falhas que são realmente amplamente utilizadas.Mesmo que a solução dada pelo modelo grande esteja errada, o erro é limitado a um intervalo relativamente limitado. Porém, em cenários como indústria pesada, aeroespacial e assistência médica, o prejuízo causado por um erro é imensurável, ou seja, o Chat GPT não consegue atender às exigências verticais e profissionais de cenários específicos.
Para levar em consideração os requisitos de verticalidade e profissionalismo, os dados são uma falha e há menos setores com profundidade de dados suficiente e um fosso estável. Se os dados dessas indústrias são fáceis de obter e se os dados obtidos podem atender aos requisitos em constante mudança de indústrias específicas, é difícil avaliar especificamente.
Os gigantes da Internet têm uma grande quantidade de dados de rede, como comércio eletrônico, redes sociais e pesquisa, mas os tipos de dados não são abrangentes o suficiente e a qualidade dos dados não é garantida. O corpus que pode ser treinado em chinês ainda precisa muito trabalho mineiro.
Recentemente, nas áreas de assuntos governamentais, segurança pública e assistência médica, modelos verticais de grande escala estão sendo implementados um após o outro. Por exemplo, Yunzhisheng autodesenvolveu o modelo de grande escala "montanha e mar" no campo de assistência médica inteligente, combinado com tecnologias de interação de voz inteligente de pilha completa, como processamento de sinal de som front-end, reconhecimento de impressão de voz, reconhecimento de fala e síntese de fala, espera-se melhorar a eficiência da entrada de registros médicos eletrônicos dos médicos em mais de 400%, economizando mais de 40% do tempo de consulta para um único paciente e melhorando a eficiência do ambulatório médico em mais de 66%.
Com base em seus próprios documentos oficiais, documentos de política, guias de assuntos governamentais e outros dados como dados de treinamento profissional, o TRS criou um grande modelo de assuntos governamentais.
No campo financeiro, a Hang Seng Electronics começará a planejar e projetar produtos financeiros em grande escala no final de março de 2023. No final de junho, a Hang Seng Electronics e sua subsidiária Hang Seng Juyuan lançaram um novo produto financeiro de inteligência digital baseado em tecnologia de modelo de linguagem grande - o assistente financeiro inteligente Photon e a recém-atualizada plataforma de pesquisa de investimento inteligente WarrenQ.
A Tencent, uma gigante da Internet com vários recursos da indústria, está apostando em vários lados. No final de junho, a Tencent anunciou soluções de serviço MaaS cobrindo 10 setores, incluindo finanças, turismo cultural, assuntos governamentais e educação, com um total de mais de 50 soluções.
Ao mesmo tempo, os dados exigidos pelo modelo grande vertical muitas vezes não se limitam ao setor. Algumas empresas podem exigir a integração de dados de outro ou mais setores. O treinamento e a aplicação do modelo dependem da cooperação entre setores de empresas ou dos recursos dos gigantes da Internet.
**Poder de computação: tijolos poderosos voam? **
Na corrida do ouro no oeste dos Estados Unidos no século 19, era um evento probabilístico que os garimpeiros pudessem realmente ganhar dinheiro, enquanto era um resultado inevitável que os vendedores de pás ganhassem dinheiro.
Na corrida do ouro da IA, a situação do campo de batalha do modelo grande ainda não está clara e os jogadores ainda estão avançando, mas o "vendedor de pás" já venceu. Baseando-se na tendência de chips de IA e modelos grandes, a Nvidia ampliou a distância com seu concorrente AMD e seu valor de mercado entrou no "clube do trilhão de dólares".
O CEO da Open AI, Sam Altman, propôs uma nova versão da Lei de Moore, ou seja, o poder computacional da IA global dobrará a cada 18 meses. A manutenção desses cálculos requer o suporte de chips de treinamento de IA, e a participação de mercado da Nvidia nessa área ultrapassa 90%.
Os produtos de chip AI da Nvidia foram freneticamente comprados por grandes empresas de tecnologia em todo o mundo: em março de 2023, a Microsoft anunciou que ajudou a OpenAI a construir um novo centro de computação com dezenas de milhares de A100s; em maio, o Google lançou um H100 com 26.000 peças. cluster de computação ComputeEngineA3. Além disso, de acordo com informações da China National Finance Securities, a ByteDance encomendou mais de US$ 1 bilhão em GPUs este ano, e estima-se que existam 100.000 peças de A100 e H800 que chegaram e não chegaram. Dezenas de milhares de chips H800 também são usados na nova versão do Tencent Cloud High Performance Computing Service Center lançado pela Tencent.
O CFO da Nvidia, Kress, disse que a demanda atual do mercado por poder de computação de IA excedeu as expectativas da empresa para os próximos trimestres e há muitos pedidos a serem atendidos.
Claro, é inútil invejar o dinheiro que a Nvidia ganha.
A faixa de GPU doméstica também está alcançando. Não há apenas chips AI autodesenvolvidos gigantes da Internet, como o chip AI Baidu Kunlun, o chip de processamento de vídeo Tencent "Canghai" e o chip AI "Zixiao", etc., mas também a Suiyuan Technology, Tianshu Zhixin, Empresas emergentes, como a Moore Threads, que desenvolvem GPUs de uso geral. As GPUs de uso geral são usadas para várias tarefas de uso geral, incluindo capacidades de computação altamente paralelas e núcleos de computação em grande escala. Também houve um grande progresso nos últimos anos , e a diferença com GPUs de alto desempenho está diminuindo gradualmente.
Wu Hequan, um acadêmico da Academia Chinesa de Engenharia, sugeriu que, sob a coordenação dos planos nacionais de ciência e tecnologia e industriais, uma divisão razoável do trabalho deveria ser formada para formar um poder de computação conjunto, e a plataforma de poder de computação do país O laboratório deve ser aberto para oferecer suporte a vários treinamentos de modelos em grande escala. Ao mesmo tempo, sugere-se formar uma aliança de poder de computação para concentrar as GPUs de ponta existentes. Os recursos de computação fornecem o poder de computação necessário para o treinamento de dados de modelos grandes.
Além de GPUs de alto desempenho, plataformas de computação de baixo custo também são consideradas novas oportunidades de mercado. Recentemente, a Jiuzhang Yunji revelou que continuará a cooperar com os fabricantes de nuvem estatais e incluirá um grande número de centros de computação inteligente no mercado como parceiros e fornecerá aos clientes uma plataforma de pesquisa e desenvolvimento de modelos de IA integrando software e hardware. o custo dos clientes estará vinculado ao poder de computação.
O poder de computação é a base para o desenvolvimento de grandes modelos, e é uma condição necessária, mas não suficiente.O papel máximo que o poder de computação pode desempenhar ainda depende da direção do uso. Somente quando a inovação do algoritmo, a construção de recursos de dados e a iteração da estrutura de treinamento andam de mãos dadas, é possível criar "tijolos poderosos voando".
Política: Orientação e regulamentação em momentos críticos
O período da explosão da IA coincide com o momento crítico da governança e arquivamento de algoritmos em nosso país.
Já em 2021, as "Opiniões Orientadoras sobre o Fortalecimento da Governança Abrangente de Algoritmos de Serviços de Informações da Internet" colocaram o gerenciamento de arquivamento de algoritmos como uma parte importante da melhoria do sistema de supervisão. O Regulamento de Gestão estipula ou menciona claramente que "provedores de serviços de recomendação de algoritmos com atributos de opinião pública ou capacidades de mobilização social devem realizar procedimentos de arquivamento."
Em abril de 2023, a Administração do Ciberespaço da China elaborou as "Medidas Administrativas para Serviços Geradores de Inteligência Artificial (Rascunho para Comentários)" para consulta pública. Em junho, o "Plano de Trabalho Legislativo do Conselho de Estado de 2023" emitido pelo Conselho de Estado mostrou que o projeto de lei de inteligência artificial foi preparado para ser submetido ao Comitê Permanente do Congresso Nacional do Povo para deliberação.
As "Medidas Gerativas de Gerenciamento de Serviços de Inteligência Artificial (Rascunho para Comentário)" mencionou que antes de usar produtos de inteligência artificial generativa para fornecer serviços ao público, isso deve ser relatado à Rede Estadual de acordo com o "Regulamento de Avaliação de Segurança de Informações da Internet Serviços com Atributos de Opinião Pública ou Capacidades de Mobilização Social". O departamento de informação deve solicitar uma avaliação de segurança e realizar os procedimentos de arquivamento, modificação e cancelamento de algoritmos de acordo com o "Regulamento de Gestão de Recomendação de Algoritmo de Serviço de Informação da Internet".
Esta é também uma das razões pelas quais não existem produtos modelo em grande escala disponíveis ao público.
O professor Chen Bing, vice-reitor da Faculdade de Direito da Universidade de Nankai e pesquisador especial do Instituto de Pesquisa de Estratégia de Desenvolvimento de Inteligência Artificial de Nova Geração da China, acredita que a pré-regulamentação não prejudicará necessariamente a inovação tecnológica, mas deve-se observar que, devido a revisão, aumentará o número de empresas até certo ponto. Se o escopo da revisão anterior não for definido adequadamente, pode inibir a pesquisa, desenvolvimento e eficiência de treinamento de produtos de IA generativos e levar objetivamente a uma desaceleração no desenvolvimento de IA generativa.
Como os riscos da inteligência artificial não podem ser perfeitamente estimados com antecedência, e a supervisão após o evento pode causar grandes danos, meu país atualmente adota a supervisão de processo completo do desenvolvimento da inteligência artificial.
Sob a regulamentação de todo o processo, o custo de conformidade dos jogadores modelo em grande escala aumentará, sem dúvida, e o sistema de arquivamento de registros também exorta os jogadores no jogo a buscar o arquivamento de registros primeiro, a fim de promover produtos no mercado mais cedo, objetivamente acelerando a velocidade das grandes ondas. O aprimoramento gradativo de leis e regulamentos vem acompanhado do processo de remanejamento da indústria e da superação dos fracos, o que também pode trazer o momento de abrir as nuvens para o sol mais cedo.