网站首页 > 新闻动态
新闻动态Welcome to visit our

腾讯云TencentOS Server AI，助力荣耀打造高性能AI底座

分享到：

来源：玉环巨恩阀门有限公司更新时间：2025-08-14 16:34:09 【打印此页】【关闭】

随着生成式AI技术的腾讯爆发式增长，AI大模型开始渗透至手机领域，助力座一线厂商已经把AI应用集成到各自最新的荣耀产品中，并且在以惊人的打造I底速度迭代。为了进一步提升大模型部署的高性效能，荣耀基于应用腾讯云TencentOS Server AI中提供的腾讯TACO-LLM加速模块部署DeepSeek-R1等开源大模型，并应用荣耀企业内部等场景，助力座稳定性、荣耀可靠性、打造I底推理性能均大幅提升。高性

在推理平台场景中，腾讯荣耀侧重关注框架效能、助力座稳定性、荣耀运行状态监控及应急预案等特性。打造I底使用TACO-LLM进行推理任务后，高性在DeepSeek-R1 满血版场景下，相对于荣耀原始线上业务性能，TTFT（首Token 延迟）P95 的响应时间最高降低6.25倍，吞吐提升2倍，端到端延迟降低100%。在社区最新版本sglang场景下，TTFT P95的响应时间最高降低12.5倍。

腾讯云TACO-LLM之所以能够对荣耀业务的性能提升如此明显，主要的得益于多种投机采样技术核心能力：大语言模型的自回归解码属性无法充分利用GPU的算力，计算效率不高，解码成本高昂。而TACO-LLM通过投机采样的方式，从根本上解决了计算密度的问题，让真正部署的大模型实现“并行”解码，从而大幅提高解码效率。

荣耀大数据平台部相关负责人表示：“荣耀使用腾讯云 TACO-LLM 打造高性能的AI底座，部署稳定可靠，提升了性能加速体验。”

TencentOS Server AI加速版中提供的TACO-LLM加速模块，针对企业级AI模型私有化部署挑战，对大语言模型业务进行了专门的内核运行优化，用于提高大语言模型的推理效能，提供兼顾高吞吐和低延时的优化方案，能够“无缝”整合到现有的大模型部署方案中。

上一篇：AI 时代掘金策略：傅盛、吴世春、陈昱等投资大佬看好这些方向
下一篇：618从6月17日20:00开始持续至6月18日24:00的28小时内买苹果手机最便宜

新闻动态Site navigation

联系方式Contact

网站首页 > 新闻动态
新闻动态Welcome to visit our

腾讯云TencentOS Server AI，助力荣耀打造高性能AI底座

友情链接:

新闻动态Site navigation

联系方式Contact

网站首页 > 新闻动态 新闻动态Welcome to visit our

腾讯云TencentOS Server AI，助力荣耀打造高性能AI底座

相关文章

友情链接:

网站首页 > 新闻动态
新闻动态Welcome to visit our