IA
La empresa china DeepSeek lanza DSpark, un marco que agiliza la respuesta de modelos de inteligencia artificial sin requerir chips avanzados.

La compañía china DeepSeek ha dado a conocer un nuevo marco de trabajo denominado DSpark, capaz de acelerar la respuesta de modelos de inteligencia artificial hasta en un 85% sin depender de los chips más avanzados del sector. Esta innovación podría contribuir a reducir los costos operativos de modelos de gran escala.
Este desarrollo surge en un contexto donde las empresas de inteligencia artificial enfrentan crecientes dificultades para acceder a la capacidad computacional necesaria para operar sus modelos, especialmente debido a las restricciones impuestas por Estados Unidos que limitan el acceso de firmas chinas a chips avanzados de fabricantes como Nvidia.
DeepSeek explicó que DSpark utiliza una técnica conocida como decodificación predictiva, en la que un modelo pequeño y rápido propone inicialmente la respuesta, y luego el modelo principal la revisa y valida en bloque, en lugar de generar cada segmento de la respuesta desde cero.
Este procedimiento permite omitir varios pasos cuando las predicciones son correctas, lo que reduce significativamente el tiempo de respuesta. Además, todas las operaciones se ejecutan en la unidad de procesamiento gráfico, sin delegar ninguna tarea al procesador central.
El sistema también genera fragmentos pequeños de texto de forma simultánea en lugar de producir cada unidad textual de manera individual, lo que contribuye a acelerar aún más la respuesta.
DeepSeek ha lanzado DSpark como un proyecto de código abierto en colaboración con la Universidad de Pekín, disponible en las plataformas GitHub y Hugging Face. La empresa aclaró que esta tecnología no amplía las capacidades intrínsecas del modelo, sino que mejora la eficiencia de su ejecución y reduce la necesidad de inversiones adicionales en infraestructura computacional.
La compañía indicó que ha probado este marco en varios modelos de código abierto, incluyendo Gemma, desarrollado por Google DeepMind, y Qwen, de Alibaba, lo que sugiere que la tecnología podría aplicarse a un espectro más amplio de modelos.
El anuncio se produce en un momento de aumento global del gasto en centros de datos para inteligencia artificial. Al mismo tiempo, firmas como Uber y Walmart han comenzado a restringir el uso de IA por parte de sus empleados debido al elevado costo asociado al consumo de unidades de procesamiento.
En abril, DeepSeek lanzó la versión V4 Preview de su modelo, disponible como código abierto y orientada a soluciones de bajo costo para contextos que abarcan hasta un millón de tokens. Además, ofrece el modelo V4-Pro para alto rendimiento y V4-Flash para respuestas rápidas y económicas.
DeepSeek no es la única empresa que busca acelerar la respuesta de modelos de IA. Recientemente, Xiaomi anunció que su modelo MiMo-V2.5-Pro-UltraSpeed puede generar más de 1000 tokens por segundo, situándose entre las tasas más elevadas del sector.
Economía
Mundo
Mundo
Copa Mundial 2026