华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本
[热点] 时间:2025-08-23 23:37:26 来源:草原辽阔骏马奔腾 作者:热点 点击:50次
新浪科技讯 8月12日下午消息,发布在2025金融AI推理应用落地与发展论坛上,推理吞吐n推华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),创新实现高吞吐、技术低时延的现高推理体验。
在当今数字化时代,低时低AI发展日新月异。延推验降大模型训练的理体理成热潮尚未消退,AI推理体验却已悄然成为AI应用的发布关键。中信建投在2025WAIC期间发布的推理吞吐n推白皮书指出,AI正从训练向推理的创新结构性转变而快速增长。在这样的技术大背景下,AI推理体验的现高重要性愈发凸显。
推理体验直接关系到用户与AI交互时的低时低感受,包括回答问题的延推验降时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。
据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

责任编辑:郭栩彤
(责任编辑:探索)
相关内容
精彩推荐
- 写作方法:古今纵横选材
- 《辐射》制片人笑称陶德是替罪羊 第二季探访新维加斯!
- 我要和你困觉 角川宣布鲁迅《阿Q正传》漫画化 !
- 2021“中国马会·好马山东”大讲堂将于4月25日在青岛农业大学举办
- 外媒评《黑神话:钟馗》:有实机前应理性看待!
- 雷军底牌金山,再次进入爬坡期
热门点击
- 安切洛蒂宣布新一期巴西男足国家队名单 views+
- 2025年美国6.8分喜剧片《腓尼基计划》BD中英双字迅雷下载 views+
- 马来西亚羽毛球大师赛:国羽获四金三银 views+
- 佩特拉·索林连任国际乒联主席 views+
- 2009年国产经典战争片《和平将军陶峙岳》HD国语中字迅雷下载 views+
- 温网综合:辛纳、焦科维奇晋级次轮 郑钦文首轮出局 views+
- 2017年日本经典悬疑片《朋友游戏 真人版下》蓝光日语中字迅雷下载 views+
- U19男篮世界杯:中国队不敌德国队遭遇两连败 views+
- 1978年日本经典悬疑片《鬼畜》蓝光日语中字迅雷下载 views+
- 女篮亚洲杯|综合:韩国队“绝杀”新西兰队 澳大利亚、日本队两连胜 views+