DeepSeek-R1 lanza nuevas tendencias en la industria de la IA, Guo Mingzhi detalla el futuro

Nuevas tendencias en la industria de la IA desencadenadas por el lanzamiento de DeepSeek-R1
El 31 de enero, el analista de Tianfeng International Securities, Guo Mingzhi, publicó un informe el 29 de enero señalando que el lanzamiento de DeepSeek-R1 ha desatado dos importantes nuevas tendencias en la industria de la IA. Estas dos tendencias surgirían eventualmente, incluso sin el lanzamiento de DeepSeek-R1, pero su aparición ha acelerado su aparición.
Tendencia 1: Cuando los rendimientos marginales de la ley de escalado disminuyen, la potencia computacional de la IA aún puede crecer mediante la optimización de métodos de entrenamiento
En los últimos 1-2 años, los inversores en la cadena de suministro de servidores de IA han basado su lógica de inversión principalmente en el crecimiento sostenible de los envíos de servidores de IA bajo la ley de escalado. Sin embargo, a medida que los rendimientos marginales de la ley de escalado disminuyen, el mercado está comenzando a centrarse en cómo DeepSeek mejora significativamente la eficiencia de los modelos a través de otros métodos.
La ley de escalado establece que el rendimiento del modelo de IA está determinado por la cantidad de parámetros del modelo (N), la cantidad de datos de entrenamiento (D) y la potencia computacional (C), y la situación ideal es que N, D y C aumenten simultáneamente. Sin embargo, varios factores están causando la desaceleración de los rendimientos marginales de la ley de escalado:
1. Los datos de texto creados por humanos (D) están prácticamente agotados.
2. Sin una mejora significativa en la potencia computacional (C) o el agotamiento de los datos de entrenamiento (D), simplemente aumentar la cantidad de parámetros del modelo (N) no mejora el rendimiento del modelo.
3. La potencia computacional (C) es difícil de mejorar significativamente en el corto plazo (por ejemplo, el sistema Blackwell aún no se ha producido en masa, limitaciones en el suministro de energía, etc.).
Desde una perspectiva de investigación industrial, DeepSeek-R1 ha mejorado significativamente la eficiencia del modelo al optimizar los métodos de entrenamiento, lo que indica que cuando los rendimientos marginales de la ley de escalado disminuyen, la optimización de los métodos de entrenamiento ayuda a seguir mejorando la infraestructura de la IA y descubrir nuevas aplicaciones.
Tendencia 2: La caída significativa de los precios de las API/Tokens favorece la diversificación de aplicaciones de IA
Actualmente, el modelo de ingresos de la industria de la IA se basa principalmente en la venta de herramientas y la reducción de costos, más que en la creación de nuevos negocios o en la mejora del valor agregado de los negocios existentes. DeepSeek-R1 ha adoptado una estrategia de precios agresiva, ofreciendo uso gratuito y fijando los precios de las API/Tokens en menos de 1/100 de OpenAI-o1. Esta presión competitiva podría impulsar una reducción en el costo de uso de la IA y acelerar la diversificación de las aplicaciones de IA.
Los costos de software/servicios de IA y de los dispositivos de IA se están reduciendo debido a la caída de los precios de las API/Tokens y la optimización de los métodos de entrenamiento, lo que ayuda a aumentar la demanda de potencia computacional de la IA y puede reducir las dudas de los inversores sobre la rentabilidad de las inversiones en IA. Aunque el uso de la IA está aumentando debido a la caída de precios, aún se debe observar si el aumento en el uso puede compensar la caída en los precios.
Conclusión
La ley de escalado es una regla empírica, por lo que reducir razonablemente las expectativas y abordar las tendencias de inversión a largo plazo de manera racional es beneficioso. Las actualizaciones de chips, la mejora de las limitaciones de suministro de energía y la inclusión de más datos multimodales en el entrenamiento son factores que podrían acelerar nuevamente los rendimientos marginales de la ley de escalado. Los grandes desplegadores son los que enfrentarán la desaceleración de los rendimientos marginales de la ley de escalado, lo que vuelve a validar la posición de liderazgo de Nvidia.
Se espera que los recursos comunitarios abiertos y el entorno altamente competitivo en China den lugar al lanzamiento de LLM con un buen rendimiento y precios más agresivos por parte de otros fabricantes chinos. En ese momento, si los proveedores de servicios LLM aún no han comenzado a generar ganancias estables, la presión para ser rentables aumentará.
Gracias a la caída significativa en los precios de las API/Tokens, el software/servicios de IA y los dispositivos de IA atraerán más atención de los inversores. Si se convierten en una nueva tendencia de inversión a largo plazo dependerá de si pueden crear un modelo comercial rentable.
Nvidia sigue siendo el ganador en el futuro cuando los rendimientos marginales de la ley de escalado se aceleren nuevamente, pero se debe prestar atención a los problemas de producción a gran escala de GB200 NVL72 a corto plazo y a cualquier cambio en las restricciones a las exportaciones de semiconductores de EE. UU. a medio y largo plazo.