DeepSeek-R1 lançamento cria novas tendências na indústria de IA, Guo Mingzhi detalha o desenvolvimento futuro
Novas tendências na indústria de IA causadas pelo lançamento do DeepSeek-R1
Em 31 de janeiro, o analista da Tianfeng International Securities, Guo Mingzhi, publicou um relatório no dia 29, indicando que o lançamento do DeepSeek-R1 gerou duas novas tendências importantes na indústria de IA. Essas duas tendências acabariam se manifestando mesmo sem o DeepSeek-R1, mas o lançamento acelerou sua ocorrência.
Tendência 1: Quando os benefícios marginais da lei de escalabilidade diminuem, o poder de computação da IA pode continuar a crescer por meio da otimização dos métodos de treinamento
Nos últimos 1-2 anos, a lógica de investimento dos investidores na cadeia de fornecimento de servidores de IA foi baseada no crescimento sustentável das remessas de servidores de IA sob a Lei de Escalabilidade. No entanto, à medida que os benefícios marginais da Lei de Escalabilidade diminuem, o mercado começa a se concentrar em como o DeepSeek melhora significativamente a eficiência do modelo por meio de outros métodos.
A Lei de Escalabilidade afirma que o desempenho do modelo de IA é determinado pela quantidade de parâmetros do modelo (N), pela quantidade de dados de treinamento (D) e pela capacidade de computação (C), sendo o caso ideal o aumento simultâneo de N, D e C. No entanto, vários fatores levaram à diminuição dos benefícios marginais da Lei de Escalabilidade:
1. Os dados de texto criados por humanos (D) estão quase esgotados.
2. Sem um aumento significativo na capacidade de computação (C) ou no esgotamento dos dados de treinamento (D), aumentar o número de parâmetros do modelo (N) não resulta em um aumento significativo no desempenho do modelo.
3. A capacidade de computação (C) não pode ser aumentada significativamente no curto prazo (por exemplo, o sistema Blackwell ainda não foi produzido em massa, limitações no fornecimento de energia etc.).
Do ponto de vista da pesquisa industrial, o DeepSeek-R1 demonstrou como a otimização dos métodos de treinamento pode melhorar significativamente a eficiência dos modelos, indicando que a otimização dos métodos de treinamento pode continuar a aumentar o poder de computação da infraestrutura de IA e explorar novos aplicativos mesmo quando os benefícios marginais da Lei de Escalabilidade diminuem.
Tendência 2: Queda significativa no preço de APIs/Tokens favorece a diversificação dos aplicativos de IA
Atualmente, o modelo de negócios da indústria de IA é principalmente baseado na venda de ferramentas e na redução de custos, em vez de criar novos negócios ou aumentar o valor agregado dos negócios existentes. O DeepSeek-R1 adotou uma estratégia de preços agressiva, oferecendo uso gratuito e preços de API/Token inferiores a 1/100 dos preços do OpenAI-o1. Essa pressão competitiva pode levar à queda nos custos de uso da IA e acelerar a diversificação dos aplicativos de IA.
O custo de software/serviços de IA e dispositivos de IA está caindo devido à queda nos preços de APIs/Tokens e à otimização dos métodos de treinamento, o que ajuda a aumentar a demanda por poder de computação de IA e reduz as dúvidas dos investidores sobre a rentabilidade dos investimentos em IA. Embora o uso de IA tenha aumentado devido à queda nos preços, ainda é incerto se o aumento do uso será suficiente para compensar a queda de preços.
Conclusão
A Lei de Escalabilidade é uma regra empírica, e reduzir razoavelmente as expectativas e adotar uma visão racional das tendências de investimento de longo prazo é benéfico. Atualizações de chips, melhorias nas limitações de fornecimento de energia e a adição de mais dados multimodais no treinamento podem ajudar a acelerar novamente os benefícios marginais da Lei de Escalabilidade. Apenas grandes implantadores enfrentarão os efeitos marginais reduzidos da Lei de Escalabilidade, o que valida novamente a posição dominante da Nvidia.
Dado os recursos da comunidade aberta e o ambiente competitivo na China, espera-se que outros fabricantes chineses lancem LLMs com desempenho superior e preços mais agressivos. Nesse caso, se os fornecedores de serviços LLM não começarem a gerar lucros estáveis, a pressão sobre eles para alcançar a lucratividade aumentará.
Graças à queda significativa nos preços de APIs/Tokens, softwares/serviços de IA e dispositivos de IA atrairão mais atenção dos investidores. A capacidade de se tornar uma nova tendência de investimento de longo prazo dependerá de sua capacidade de criar um modelo de negócios rentável.
A Nvidia continua sendo a vencedora quando os benefícios marginais da Lei de Escalabilidade se acelerarem novamente, mas a atenção deve ser voltada para problemas de produção em larga escala do GB200 NVL72 no curto prazo e para possíveis mudanças nas proibições de exportação de semicondutores dos EUA no médio e longo prazo.