El compromiso de la empresa con el código abierto la ha distinguido de la mayoría de las empresas chinas de IA, que al igual que sus rivales estadounidenses se inclinan por modelos de código cerrado.
La china DeepSeek hará público el código de sus modelos, anunció el viernes la empresa emergente, redoblando así su compromiso con la inteligencia artificial de código abierto.
La compañía dijo en una publicación en la plataforma de redes sociales X que abrirá 5 repositorios de código fuente la próxima semana, describiendo el movimiento como «pequeño pero sincero progreso» que compartirá «con total transparencia».
«Estos humildes bloques de construcción de nuestro servicio en línea han sido documentados, desplegados y probados en combate en producción», dice la publicación. DeepSeek sacudió la industria mundial de la IA el mes pasado cuando publicó su modelo de razonamiento R1 de código abierto, que rivalizaba en rendimiento con los sistemas occidentales a la vez que se desarrollaba a un costo menor.
El compromiso de la empresa con el código abierto la ha distinguido de la mayoría de las empresas chinas de IA, que al igual que sus rivales estadounidenses se inclinan por modelos de código cerrado. El discreto fundador de DeepSeek, Liang Wenfeng, dijo en una entrevista con un medio de comunicación chino el pasado mes de julio que la empresa no daba prioridad a la comercialización de sus modelos de IA y que el código abierto tenía un poder blando.
«Que otros sigan tu innovación da una gran sensación de logro», dijo Liang en julio. «De hecho, el código abierto es más un comportamiento cultural que comercial, y contribuir a él nos hace ganar respeto», añadió.
El nuevo código fuente abierto proporcionará la infraestructura de apoyo a los modelos de IA que DeepSeek ya ha compartido públicamente, basándose en los marcos de modelos de código abierto existentes.
El anuncio se produjo después de que DeepSeek lanzó el martes un nuevo algoritmo llamado Native Sparse Attention (NSA), diseñado para hacer más eficientes el entrenamiento y la inferencia en contextos largos.
La base de usuarios de DeepSeek se disparó el mes pasado. En China, es el servicio de chatbot más popular, con 22.2 millones de usuarios activos diarios a 11 de enero, superando los 16,95 millones de Douban, según Aicpb.com, un sitio web chino que rastrea productos de IA.
Por El Economista