京东云全面适配最新版DeepSeek模型,推理速度提升50%

近日,DeepSeek发布了模型更新——DeepSeek-V3-0324,此次升级不仅延续了DeepSeek系列“低成本、高性能”的基因,更凭借MLA(多头潜在注意力)和MTP(多Token预测)两大创新技术,将推理速度显著提升。京东云DeepSeek一体机第一时间完成适配,相比开源版本性能大幅提升50%。

单机支持超千并发:单机支持1000+并发请求,总吞吐突破7200 Token/s,可同时服务超大规模企业级AI应用。

极致数据吞吐保障:500并发时仍保持11.03 Token/s,平衡性能与用户体验。

据悉,此次DeepSeek模型更新,通过MLA技术通过将高维特征压缩至低维潜在空间,显著减少计算资源消耗;MTP技术则提升数据利用效率,实现时间维度的资源优化。二者的结合,使得DeepSeek-V3-0324在复杂任务处理中展现出更快的响应速度与更高的稳定性。

京东云DeepSeek一体机通过融合MLA+MTP双技术,为企业提供无缝适配的推理加速方案。此次支持的DeepSeek-V3-0324版本,延续了“单机即可部署满血版模型”的特性,用户无需复杂配置即可运行完整版大模型,满足千人规模企业的并发需求。

同时,京东云DeepSeek一体机还支持华为昇腾、海光等国产AI芯片,兼顾性能与安全自主可控。并通过采用自研算力池化与智能推理加速引擎,软硬协同下推理速度较开源方案提升高达50%。

当前,京东云DeepSeek一体机已广泛应用于政务、金融、科研、能源、医疗、工业、科研等领域。以“推理加速+算力池化”的双重策略,实现同等硬件规格下、同等参数规格下更高效的推理能力和资源利用率,通过将复杂的AI工程化过程封装为标准化产品,让企业无需纠结于“造轮子”,而是聚焦于“用AI创造价值”,更好地进行AI智能化转型。

关键词:

来源:中国新闻网
编辑:GY653

免责声明:本网站内容主要来自原创、合作媒体供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

  • 相关推荐

相关词

21