La irrupción de DeepSeek, el nuevo chat de inteligencia artificial desarrollado por la empresa homónima, ha causado revuelo en el sector tecnológico. Este modelo no solo ha igualado, sino que en algunos aspectos ha superado a ChatGPT en descargas y rendimiento, estableciendo un nuevo estándar en la industria.
Un modelo de código abierto, accesible y económico
DeepSeek se destaca por ser totalmente de código abierto, lo que permite a cualquier usuario acceder a su funcionamiento interno. Investigadores, desarrolladores e incluso empresas pueden descargar el modelo desde GitHub y adaptarlo para diversos usos, incluyendo aplicaciones comerciales. Este enfoque democratiza el acceso a la inteligencia artificial, una propuesta que contrasta con modelos más restrictivos.
Además, DeepSeek es gratuito y no requiere suscripción alguna para utilizar su versión más avanzada. En comparación, el modelo GTP de OpenAI tiene un costo mensual de 20 dólares. Esta accesibilidad ha captado la atención de miles de usuarios, tanto individuales como corporativos.
El costo de entrenamiento del modelo también marca una diferencia significativa: DeepSeek fue desarrollado con una inversión de 5,5 millones de dólares, frente a los 80 millones destinados al entrenamiento de modelos de OpenAI.
DeepSeek presenta una ventaja significativa en cuanto al costo de uso de su API. Este sistema, clave para interactuar con el modelo de inteligencia artificial, permite procesar 1 millón de tokens (unidades de texto que la IA utiliza para comprender y generar respuestas) por solo 55 centavos de dólar. En comparación, OpenAI cobra 15 dólares por la misma cantidad de tokens utilizando su modelo.
Esto significa que DeepSeek no solo es más accesible en términos económicos para desarrolladores y empresas, sino que también puede permitir la implementación de aplicaciones de IA a gran escala con costos operativos mucho más bajos.
Esta diferencia de precio, que es casi 27 veces menor, podría ser un factor decisivo para aquellos que buscan integrar inteligencia artificial en sus productos o servicios, especialmente en mercados emergentes o proyectos con presupuestos limitados.
La polémica de la censura
Sin embargo, no todo es positivo en torno a DeepSeek. Un tema controvertido es la posible censura en sus respuestas, un debate que la empresa aún no ha abordado de manera exhaustiva. Este aspecto será clave para definir si el modelo logra mantener la confianza y transparencia que promete, pero sus servidores están en China, con todo lo que eso significa.
Nvidia: las GPU detrás de DeepSeek
El desarrollo de DeepSeek ha puesto en el centro de la escena a NVIDIA, líder en el mercado de GPU para aprendizaje automático, con un 95% de participación global. La empresa asiática detrás de DeepSeek utilizó 2.000 chips H800 de NVIDIA para entrenar su modelo R1, el cual, aunque menos avanzado que las versiones utilizadas por compañías estadounidenses, cumple con las restricciones de exportación impuestas por Estados Unidos en 2022.
Este contexto también arroja luz sobre las dificultades económicas que enfrenta NVIDIA. A pesar de su liderazgo, la compañía sufrió un “lunes negro”, con pérdidas que alcanzaron los 600.000 millones de dólares, lo que genera dudas sobre la sostenibilidad del alto costo en el desarrollo de inteligencia artificial.
El futuro de DeepSeek
Con su modelo R1 de código abierto, accesibilidad económica y una comunidad creciente, DeepSeek tiene el potencial de transformar la inteligencia artificial tal como la conocemos. Su enfoque disruptivo plantea un desafío directo a gigantes como OpenAI, abriendo nuevas oportunidades y debates en el camino hacia una IA más inclusiva y accesible. Sin embargo, cuestiones como la censura y la sostenibilidad del modelo seguirán siendo temas a observar en el futuro.ç
Por Martín Salamero
(*) Director del Centro de Investigación Aplicada y Desarrollo en Informática y Telecomunicaciones (CIADE-IT) de la Universidad Blas Pascal.