Nvidia é uma loucura! Investimento consecutivo em três unicórnios generativos de IA, além de um único cinto para voar a capacidade de produção de 5 nm da TSMC

Fonte original: Core Things

Fonte da imagem: Gerada por Unbounded AI‌

Notícias Xinshi em 30 de junho, seja no primeiro semestre deste ano ou nesta semana, a Nvidia é uma grande vencedora.

Na nova onda de boom da inteligência artificial causada pela IA generativa, a Nvidia se tornou uma das ações mais quentes. ** O preço das ações subiu 185% até agora este ano e o valor de mercado ultrapassou 1 trilhão de dólares americanos. Está apoiando IA generativa e modelos grandes. Liderando o caminho na corrida de hardware para P&D**.

** Em torno do investimento em start-ups de IA generativa, o senso de presença da Nvidia está se tornando cada vez mais difícil de ignorar. ** Nesta quinta-feira, a Inflection AI, uma startup americana de chatbot de IA, anunciou que recebeu US$ 1,3 bilhão em novos financiamentos, com uma avaliação subindo para cerca de US$ 4 bilhões; Runway, uma startup americana de vídeo baseada em IA, anunciou a conclusão de US$ 141 milhões em novos financiamentos, com uma avaliação subindo para US$ 4 bilhões. Cerca de US$ 1,5 bilhão. ** A Nvidia está entre os investidores em ambos os financiamentos. **

De acordo com a empresa de pesquisa de mercado TrendForce, a Nvidia deve substituir a Qualcomm como a maior empresa de design de chips do mundo no segundo trimestre de 2023, já que a implantação de chips relacionados à IA estimula o crescimento da receita. **

Por um lado, receber pedidos no mercado de chips de IA é suave e, por outro lado, investir pesadamente na trilha de IA generativa, o pensamento positivo de IA da Nvidia está ficando cada vez mais alto.

01. Investimento consecutivo em unicórnios generativos de IA, expansão relâmpago da Nvidia no território de investimento em IA

Os dois mais recentes unicórnios de IA generativa da Nvidia – Inflection AI, uma startup de modelo de linguagem em larga escala que cria produtos semelhantes ao ChatGPT, e uma startup de software de edição de vídeo AI que permite aos usuários criar vídeos curtos facilmente digitando o texto Runway, ambos desses dois reuniram uma linha de investimento estrela muito forte.

Além da Nvidia, a nova rodada de financiamento da Inflection AI também recebeu cofundador do LinkedIn, Reid Hoffman, cofundador da Microsoft, Bill Gates, ex-CEO do Google, Eric Schmidt e outros gigantes da tecnologia E a injeção de capital do chefão. Os investidores financeiros mais recentes da Runway incluem Google, Salesforce e outros gigantes da tecnologia, com um financiamento cumulativo de cerca de 237 milhões de dólares americanos.

Anteriormente, em 9 de junho deste ano, Cohere, uma empresa iniciante de IA canadense que também está trabalhando em chatbots semelhantes ao ChatGPT, anunciou a conclusão do financiamento da Série C de US$ 270 milhões, com uma avaliação de cerca de US$ 2,2 bilhões. Nvidia,* Oracle*, Salesforce, etc. todos participaram desta rodada de financiamento.

É especialmente importante mencionar que a Inflection AI, cofundada pelo cofundador da DeepMind, Mustafa Suleyman, e atuou como CEO em 2022, recebeu um grande número de ofertas após o lançamento do Pi chatbot e, em seguida, recebeu esse alto financiamento e Nvidia é o único novo investidor nesta rodada. Até agora, esta empresa unicórnio ultrapassou a Cohere, tornando-se o terceiro maior unicórnio de IA geradora do mundo, depois da OpenAI e da Anthropic em avaliação.

A Inflection AI lançou recentemente seu primeiro modelo de linguagem proprietária, Inflection-1, que diz ter sido treinado usando milhares de Nvidia H100 em conjuntos de dados muito grandes, com desempenho comparável ao GPT-3.5, Chinchilla e PaLM -540B é equivalente.

▲Inflection-1, GPT-3.5, LLaMA-65B comparação de precisão multitarefa (Fonte: Inflection AI)

02. 11 minutos para treinar GPT-3, GPU Nvidia domina o teste de benchmark de modelo grande

A Inflection AI está trabalhando com a NVIDIA para criar um dos maiores clusters de GPU do mundo para treinar grandes modelos de IA. Por meio de uma parceria com a Nvidia e o provedor de serviços em nuvem CoreWeave, seu supercomputador será expandido para incluir 22.000 H100, o que excede em muito os 16.000 A100 do cluster de supercomputação Meta RSC.

Fundada em 2017, a CoreWeave afirma oferecer poder de computação "até 80% mais barato que os provedores de nuvem tradicionais". A Nvidia investiu anteriormente US$ 100 milhões na CoreWeave. De acordo com relatos da mídia estrangeira em junho deste ano, a Microsoft concordou em investir bilhões de dólares na CoreWeave nos próximos anos para a construção de infraestrutura de computação em nuvem.

No mais recente teste de benchmark de desempenho de IA, MLPerf, NVIDIA e CoreWeave construíram em conjunto um cluster com 3584 H100s, Levou menos de 11 minutos para treinar o modelo de linguagem de grande escala GPT-3.

▲O desempenho da Nvidia H100 no mais recente teste de benchmark de treinamento GPT-3

Não surpreendentemente, a Nvidia continua a dominar os benchmarks com seu principal chip de computação, a GPU H100.

▲O desempenho da Nvidia H100 em 8 testes de benchmark MLPerf

O último treinamento MLPerf 3.0 adicionou o teste de benchmark de modelo grande GPT-3, e NVIDIA e Intel se tornaram os únicos dois participantes. A Nvidia estabeleceu o recorde de treinamento GPT-3 mais rápido com 3584 GPUs, e o chip Intel AI Habana Gaudi2 demonstrou sua competitividade em termos de facilidade de uso e desempenho de custo executando GPT-3 em um sistema menor, incluindo 384 Gaudi2 O tempo total de treinamento no chip é de mais de 5 horas, e o tempo total de treinamento em 256 chips Gaudi2 é de mais de 7 horas.

▲ Comparação dos resultados do teste de benchmark de treinamento GPT-3, a legenda em vermelho escuro é Nvidia H100 e a legenda em vermelho claro é Intel Gaudi2 (Fonte: IEEE Spectrum)

Em alguns testes, o desempenho do treinamento Gaudi2 supera o da GPU Nvidia A100. A Intel também planeja reduzir ainda mais a diferença entre Gaudi2 e H100 por meio da otimização de software, lançando suporte de software e novos recursos para o FP8 em setembro e prevê que Gaudi2 ultrapassará o H100 em termos de desempenho e custo. Outra AMD, considerada forte concorrente da Nvidia, não apresentou resultados de testes.

▲ Gaudi2 executa 4 modelos com desempenho superior a A100 (Fonte: Intel)

Os resultados do benchmark MLPerf são publicados pela MLCommons. De acordo com David Kanter, diretor executivo da MLCommons, o GPT-3 é o mais exigente computacionalmente dos benchmarks MLPerf, e a maioria das redes de benchmark no MLPerf pode rodar em um único processador, mas o GPT-3 requer pelo menos 64 processadores.

**03.A corrida armamentista de modelos de IA em larga escala está esquentando, e a demanda por chips de IA com grande poder de computação está disparando

As empresas de tecnologia estão integrando ativamente a IA em seus produtos e serviços, e os investidores estão entusiasmados com o investimento em startups generativas de IA. Obviamente, ninguém quer perder essa onda de potenciais oportunidades históricas de crescimento por causa da velocidade de computação retrógrada.

Apenas nesta semana, a maior aquisição de IA generativa até agora nasceu em casa e no exterior: o superunicórnio americano de big data Databricks concordou em adquirir a MosaicML, uma grande startup de modelo de linguagem americana, por US$ 1,3 bilhão (aproximadamente RMB 9,4 bilhões). Tuan anunciou ontem que adquirirá a Light Years Beyond, uma startup modelo em grande escala fundada pelo co-fundador da Meituan, Wang Huiwen, por 2,065 bilhões de yuans.

**O treinamento de modelos de IA generativa é inseparável dos caros chips de computação de data center. No contexto da feroz corrida armamentista de modelos em grande escala, a demanda do mercado por chips de IA com grande poder de computação continua a aumentar. No momento, há apenas um vencedor de fichas real para treinar modelos grandes de IA - Nvidia. **

Em novembro do ano passado, a Oracle anunciou a compra de dezenas de milhares de A100 e H100 para construir um novo centro de computação. O Google anunciou o A3, um supercomputador AI com 26.000 H100s, em sua conferência de desenvolvedores I/O em maio deste ano. Esta semana, a Oracle foi noticiada pela mídia estrangeira que está gastando bilhões de dólares para comprar chips da Nvidia para expandir os serviços de computação em nuvem para a nova onda de IA.

Se a Nvidia pode continuar a vencer no futuro está intimamente relacionado ao mercado chinês. De acordo com o relatório financeiro, a receita da China continental e Hong Kong representou 22% da receita da Nvidia no ano passado. De acordo com relatórios do "LatePost", após o Festival da Primavera deste ano, as principais empresas de Internet na China com negócios de computação em nuvem fizeram grandes pedidos à Nvidia. Um pedido de nível Wanka foi feito para a Nvidia, e o valor é estimado em mais de 1 bilhão yuan com base no preço de tabela. A Byte sozinha pode ter feito pedidos este ano perto do número total de GPUs comerciais que a Nvidia vendeu na China no ano passado. Excluindo os novos pedidos deste ano, o número total de Byte A100 e seu predecessor V100 está próximo de 100.000 yuan; o número total de A100 e H800 que o Byte chegou e não chegou é de 100.000 yuan.

Depois que surgiram rumores esta semana de que o Departamento de Comércio dos EUA estava considerando mais restrições às exportações de A800 e H800 da Nvidia para a China, a diretora financeira da Nvidia, Colette Kress, alertou: , fará com que a indústria dos EUA perca permanentemente a oportunidade de competir e liderar em um dos maiores mercados do mundo e afetará nossos negócios futuros e desempenho financeiro".

**04.Conclusão: Falta apenas um passo para chegar ao topo da maior empresa de design de chips do mundo

Independentemente do desempenho do produto, novos pedidos, progresso de desempenho, desempenho do mercado de ações, expansão ecológica ou layout de investimento, a Nvidia já venceu visivelmente a olho nu.

Em 25 de maio, a Nvidia divulgou seu relatório financeiro para o primeiro trimestre do ano fiscal de 2024, no qual obteve receita de US$ 7,19 bilhões em um único trimestre e previu que sua receita no segundo trimestre chegaria a US$ 11,00 bilhões. Em 12 de junho, de acordo com relatos da mídia de Taiwan, impulsionados pelo aumento dos pedidos de chips Nvidia AI, a taxa de utilização do processo avançado da TSMC aumentou significativamente e a taxa de utilização da capacidade de produção de 5 nm aumentou de mais de 50% para 70% para 80%.

De acordo com dados divulgados recentemente pela organização de pesquisa de mercado TrendForce, beneficiando-se da demanda explosiva por IA generativa e poder de computação em nuvem e do lançamento de novos produtos da série GeForce RTX 40, a receita da Nvidia no primeiro trimestre de 2023 aumentará 13,5% para os EUA. US$ 6,73 bilhões. A participação no mercado de design de chips aumentou para 19,9%.

▲ Ranking das dez maiores empresas de design de chips do mundo no primeiro trimestre de 2023, unidade: US$ milhões (Fonte: TrendForce)

A TrendForce prevê que, devido à implantação de chips relacionados à IA estimulando o crescimento da receita, a taxa de crescimento é óbvia.No segundo trimestre de 2023, a Nvidia deve substituir a Qualcomm para se tornar a maior empresa de design de chips sem fabricação do mundo.

Sob o pano de fundo de que a Nvidia se tornou a maior beneficiária da era da IA generativa, gigantes de chips como Intel e AMD estão de olho, tentando compartilhar o mercado de computação de IA por meio da otimização colaborativa de software e hardware. Ao mesmo tempo, se as empresas domésticas de chips de IA podem pegar essa onda de dividendos de treinamento e implantação de grandes modelos também se tornou o foco da indústria.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)