
当这条消息进入记忆系统后第一个问题不是问「怎么记住」而是要先判断「值不值得记住」。如果所有信息都以相同的权重被存储和检索随着数据量增长系统会面临两个问题检索信噪比持续下降存储成本不可控。香农信息论也解释了这件事高概率事件的信息量趋近于零不值得长期存储低概率但关键事件的信息量极大必须持久化保留。重要性评估就是干这件事的它是信息过滤器。它会为每条信息打一个分数这个分数决定后续的衰减速度、复习频率和淘汰优先级。那么重要性如何评估1.1 六维度评估模型在 PowerMem 中评估一条信息的重要性比想象中复杂。它使用了一个六维评估模型即从六个维度进行综合评估、加权汇总维度权重评估什么relevance关联度0.30信息与用户当前上下文的关联程度novelty新颖度0.20信息的新鲜程度是否为首次出现emotional_impact情感强度0.15信息是否包含强烈的情感色彩actionable可操作性0.15信息是否需要用户采取行动factual事实性0.10信息的客观事实程度personal个人相关性0.10信息与用户个人的关联程度拿前面举例的会议消息来说。它与「Q2 的工作」高度相关relevance ≈ 0.8包含明确的时间地点factual ≈ 0.8用户必须参加不能错过actionable ≈ 0.9但情感上中性emotional_impact ≈ 0.2那么从使用六维评估模型加权计算出的重要性分数大致如下0.3×0.8 0.2×0.5 0.15×0.2 0.15×0.9 0.1×0.8 0.1×0.6 ≈ 0.72即最终得出的重要性评估分数为 0.72。六维评估模型是重要性评估的重要理论基础。1.2 双路径评估LLM 与规则引擎PowerMem 设计了两条重要性评估执行路径确保系统在任何情况下都能给出评分。第一条路径就是基于六维评估模型得出的评分第二路径则是在第一条路径不可用时进行优雅降级的规则引擎计算方案。路径一LLM 深度评估优先当 LLM 可用时会直接走这一条评估路径。系统要求 LLM 根据六维度评估模型从六个维度分别分析返回结构化 JSON。得到的结果示例如下{ importance_score: 0.72, reasoning: 会议安排对用户具有明确的时间约束和行动要求, criteria_scores: { relevance: 0.8, novelty: 0.5, emotional_impact: 0.2, actionable: 0.9, factual: 0.8, personal: 0.6 } }PowerMem 从这个 LLM 回复的结构化 JSON 中提取importance_score字段作为重要性评分。但实际上因为 LLM 的回答会有一定的不可预知性所以为了确保即使 LLM 返回格式不规范系统也不会崩溃可以拿到对应的评分数据PowerMem 使用了一种三级回退的方式来进行解析首先尝试解析 JSON 拿到最准确的数据若解析失败则用正则表达式匹配评分数字若再失败即返回保底的默认值 0.5。值得注意的是LLM 返回的结构化 JSON 中的六维数据实际上并未直接参与最后的权重的计算在这里让 LLM 返回六维数据只是为了通过 Chain-of-Thought 的结构化分解来辅助 LLM 推理让最终答案更可靠稳定。路径二规则引擎兜底当 LLM 不可用时路径一则失效规则引擎会接管重要性分数的计算。虽然精度会有所下降但能保证系统能正常运行。规则引擎基于一组可量化的信号来累加分数的内容长度 100 字符0.1 50 字符0.05命中关键词每个 0.1包含?或!各 0.05元数据标记了优先级high/medium0.2/0.1最终分数上限为 1.0规则引擎评分精度不如 LLM 评分但确保了系统在 LLM 不可用时仍能正常运行这种优雅降级graceful degradation设计是生产级系统的重要特征。即不会因为一个外部服务的故障就导致整个记忆系统停摆。二、分类与参数初始化2.1 三层记忆模型重要性分数确定了之后下一步就要给信息分类来决定这条信息属于哪一层的记忆。不知道大家还是否记得前一篇聊过的大脑的记忆分层机制。即信息先进入容量有限的海马体短期存储经过记忆巩固后转移至新皮层长期存储只有那些被反复激活的、与已有知识建立了丰富关联的、或伴随强烈情绪体验的信息才能获得优先转移权。PowerMem 把这个过程翻译为三层模型层级生物学类比倍率典型存活时间working工作记忆前额叶皮层×0.5数小时~1 天short_term短期记忆海马体×1.5数天~数周long_term长期记忆新皮层×2.0数周~数月而分类的逻辑又以重要性分数为依据≥ 0.8进入 long_term≥ 0.6进入 short_term其余归入 working。不同层级的衰减速率不同层级越高衰减越慢信息活得越久if score self._algo.long_term_threshold: # 0.8 return long_term if score self._algo.short_term_threshold: # 0.6 return short_term return working前面算出来的会议信息重要性评分为 importance 0.72命中了≥ 0.6但不到0.8。所以落入short_term短期记忆。2.2 遗忘参数初始化分类分完了但是分类只回答了「这条信息该待在哪一层」更具体的问题是应该忘多快为了巩固记忆什么时候要再复习一遍PowerMem 在分类完成后会为每条记忆生成一整套可随生命周期演进的数值档案。即系统会为这条记忆建立一份元数据卡片用来记录这条信息记忆的强度、衰减参数、复习计划和管理状态等。元数据卡片在结构上分成两块