IA
DeepSeek lance DSpark, une technologie accélérant la réponse de l'IA jusqu'à 85%
DeepSeek présente DSpark, un cadre accélérant de 85 % la réponse des modèles d'IA sans recourir aux puces les plus récentes, réduisant ainsi les coûts d'exploitation.

La société chinoise DeepSeek a dévoilé un nouveau cadre nommé DSpark, capable d'accélérer la réponse des modèles d'intelligence artificielle jusqu'à 85 %, sans nécessiter les puces d'IA les plus récentes. Cette innovation pourrait contribuer à diminuer les coûts liés à l'exploitation des modèles volumineux.
Cette initiative intervient alors que les entreprises d'IA rencontrent des difficultés croissantes pour obtenir la puissance de calcul indispensable à leurs modèles, notamment en raison des restrictions américaines limitant l'accès des firmes chinoises aux puces avancées de fabricants comme Nvidia.
DSpark repose sur une méthode appelée décodage prédictif. Celle-ci consiste à ce qu'un modèle secondaire, plus petit et rapide, propose d'abord une réponse, que le modèle principal examine et valide ensuite en une seule fois, au lieu de générer chaque segment de la réponse depuis le départ.
Ce procédé permet d'éviter plusieurs étapes lorsque les prédictions sont correctes, ce qui réduit significativement le temps de réponse. Toutes les opérations sont exécutées sur l'unité de traitement graphique, sans transfert de tâches vers le processeur central.
Le système utilise également une technique qui génère des segments de texte en blocs plutôt qu'unité par unité, ce qui contribue aussi à accélérer la production des réponses.
DeepSeek a rendu les recherches sur DSpark accessibles en open source, en collaboration avec l'université de Pékin, via les plateformes GitHub et Hugging Face. L'entreprise précise que cette technologie ne modifie pas les capacités intrinsèques des modèles, mais améliore leur efficacité opérationnelle tout en limitant les besoins d'investissements supplémentaires dans l'infrastructure informatique.
Le cadre DSpark a été testé sur plusieurs modèles open source, notamment Gemma de Google DeepMind et Qwen d'Alibaba, ce qui suggère un potentiel d'application étendu.
Cette annonce survient dans un contexte d'augmentation des dépenses mondiales consacrées aux centres de données pour l'intelligence artificielle. Par ailleurs, certaines entreprises comme Uber et Walmart ont commencé à restreindre l'usage de l'IA par leurs employés, en raison des coûts élevés liés à la consommation des unités de traitement.
En avril dernier, DeepSeek avait lancé la version V4 Preview open source, une solution économique adaptée à des contextes pouvant atteindre un million de tokens. La société propose aussi une version V4-Pro pour des performances élevées et une V4-Flash destinée à des réponses plus rapides et moins coûteuses.
DeepSeek n'est pas la seule entreprise à travailler sur l'accélération des réponses des modèles d'IA. Xiaomi a récemment annoncé que son modèle MiMo-V2.5-Pro-UltraSpeed est capable de générer plus de 1000 tokens par seconde, figurant parmi les plus rapides du secteur.
Dernières actualités
ÉconomieLes prix du gaz en Europe atteignent 503 dollars pour 1 000 m³
MondeLe chef du renseignement syrien évoque des menaces dépassant Daech et réaffirme l'engagement anti-terroriste
MondePakistan et Afghanistan échangent des accusations après frappes transfrontalières
Coupe du Monde 2026
