DeepSeek presenta DSpark para acelerar respuestas de IA hasta un 85%

La empresa china DeepSeek lanza DSpark, un marco que agiliza la respuesta de modelos de inteligencia artificial sin requerir chips avanzados.

·29 de junio de 2026 a las 20:43·2 min de lectura

DeepSeek presenta DSpark para acelerar respuestas de IA hasta un 85%

La compañía china DeepSeek ha dado a conocer un nuevo marco de trabajo denominado DSpark, capaz de acelerar la respuesta de modelos de inteligencia artificial hasta en un 85% sin depender de los chips más avanzados del sector. Esta innovación podría contribuir a reducir los costos operativos de modelos de gran escala.

Este desarrollo surge en un contexto donde las empresas de inteligencia artificial enfrentan crecientes dificultades para acceder a la capacidad computacional necesaria para operar sus modelos, especialmente debido a las restricciones impuestas por Estados Unidos que limitan el acceso de firmas chinas a chips avanzados de fabricantes como Nvidia.

El método de decodificación predictiva en DSpark

DeepSeek explicó que DSpark utiliza una técnica conocida como decodificación predictiva, en la que un modelo pequeño y rápido propone inicialmente la respuesta, y luego el modelo principal la revisa y valida en bloque, en lugar de generar cada segmento de la respuesta desde cero.

Este procedimiento permite omitir varios pasos cuando las predicciones son correctas, lo que reduce significativamente el tiempo de respuesta. Además, todas las operaciones se ejecutan en la unidad de procesamiento gráfico, sin delegar ninguna tarea al procesador central.

El sistema también genera fragmentos pequeños de texto de forma simultánea en lugar de producir cada unidad textual de manera individual, lo que contribuye a acelerar aún más la respuesta.

Colaboración y disponibilidad de DSpark

DeepSeek ha lanzado DSpark como un proyecto de código abierto en colaboración con la Universidad de Pekín, disponible en las plataformas GitHub y Hugging Face. La empresa aclaró que esta tecnología no amplía las capacidades intrínsecas del modelo, sino que mejora la eficiencia de su ejecución y reduce la necesidad de inversiones adicionales en infraestructura computacional.

La compañía indicó que ha probado este marco en varios modelos de código abierto, incluyendo Gemma, desarrollado por Google DeepMind, y Qwen, de Alibaba, lo que sugiere que la tecnología podría aplicarse a un espectro más amplio de modelos.

Contexto del mercado y costos en IA

El anuncio se produce en un momento de aumento global del gasto en centros de datos para inteligencia artificial. Al mismo tiempo, firmas como Uber y Walmart han comenzado a restringir el uso de IA por parte de sus empleados debido al elevado costo asociado al consumo de unidades de procesamiento.

En abril, DeepSeek lanzó la versión V4 Preview de su modelo, disponible como código abierto y orientada a soluciones de bajo costo para contextos que abarcan hasta un millón de tokens. Además, ofrece el modelo V4-Pro para alto rendimiento y V4-Flash para respuestas rápidas y económicas.

DeepSeek no es la única empresa que busca acelerar la respuesta de modelos de IA. Recientemente, Xiaomi anunció que su modelo MiMo-V2.5-Pro-UltraSpeed puede generar más de 1000 tokens por segundo, situándose entre las tasas más elevadas del sector.

Añade Daily Beirut a tu feed de Google News y recibe lo último primero.Seguir

Etiquetas

DeepSeek

Últimas noticias

Economía

El precio del gas en Europa sube a 503 dólares por mil metros cúbicos

1 h

Mundo

El jefe de inteligencia sirio destaca retos más allá del ISIS y reafirma compromiso antiterrorista

1 h

Mundo

Pakistán y Afganistán intercambian acusaciones tras ataques en territorio afgano

1 h

Copa Mundial 2026

FIFA agradece al equipo de Jordania tras su participación en el Mundial 2026

1 h