CANN/docs ACLNN缓存限制-北京尧图网络科技有限公司

ACLNN_CACHE_LIMIT【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs功能描述此环境变量用于配置aclnn API在Host侧缓存的算子信息条目个数。缓存的算子信息包含workspace大小、算子计算的执行器、Tiling信息等。单位个取值范围[0,10000000]默认值为10000。当取值为0时表示不开启算子信息缓存功能。一般不建议设置ACLNN_CACHE_LIMIT环境变量保持默认值即可。针对动态shape场景若算子的shape范围较大开发者可结合业务需求适当增加此环境变量取值以增加算子缓存条目从而提升调度性能。但需要注意增加算子信息缓存条目会增加Host内存开销具体请参见使用约束。配置示例export ACLNN_CACHE_LIMIT10000使用约束单算子的缓存按线程管理线程之间使用不同的缓存互不影响。ACLNN_CACHE_LIMIT配置的是每个线程的算子缓存条目个数。因此线程越多算子缓存条目越多。每个算子缓存条目大约占2KB左右的Host内存单算子cache的总内存占用大小为ACLNN_CACHE_LIMIT * 线程数 * 2KB。以10个线程ACLNN_CACHE_LIMIT100000为例这种情况下单算子cache的总内存占用为10*100000*2KB2GB。融合算子大kernel算子的缓存在进程级单独的内存池管理单条cache占约20KB左右的Host内存融合算子cache的总内存占用是ACLNN_CACHE_LIMIT * 20KB。使用者应结合Host的内存总大小、线程数以及每一个算子缓存条目的大小合理地设置ACLNN_CACHE_LIMIT设置过大可能导致Host内存占用过多造成调度性能下降。支持的型号Atlas 推理系列产品Atlas 训练系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品Atlas A3 训练系列产品/Atlas A3 推理系列产品Ascend 950PR/Ascend 950DT【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN/docs ACLNN缓存限制

相关新闻

Playnite：5分钟打造你的终极游戏库，免费整合20+平台游戏

Citra 3DS模拟器终极指南：如何快速解决黑屏闪退问题

还在为电子教材下载烦恼？这个Python工具如何3步搞定国家中小学智慧教育平台课本下载？

最新新闻

AgentKit 与 MCP 集成指南：打造企业级智能体应用

Faster-Whisper：4倍速语音转录背后的技术革命

3步学会Video2X：让模糊视频秒变4K高清的AI神器

3步快速下载AcFun视频的完整指南：AcFunDown免费开源工具详解

89个公共Tracker服务器：彻底解决BT下载速度慢的终极方案

glibc-all-in-one高级功能：自定义glibc提取与调试文件管理

日新闻

从论文到实践：一维卷积神经网络在RUL预测中的复现与调优

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

周新闻

从论文到实践：一维卷积神经网络在RUL预测中的复现与调优

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

月新闻

YOLOv8推理性能优化：从1.2FPS到35FPS的全链路加速实践

Coze与Dify对比指南：低代码AI应用开发从入门到实战

AI生图工具怎么选？2026年6月版实测对比