一、模型层实现(核心算法与逻辑层)

核心定位:聚焦“记忆处理的智能逻辑与算法规则”,明确核心能力的底层实现逻辑,不涉及具体交互设计与界面开发,仅输出标准化能力接口供软件层调用;所有偏向算法设计、规则定义、数据处理的需求,均归属此层范畴。

(一)记忆存储与索引模型 (含文本与多模态数据的原子化存储、加密、索引核心逻辑)

  1. 存储逻辑:定义“记忆片段原子化”存储规范,将所有记忆数据(含对话记录、外部导入素材、多模态内容)拆解为「唯一ID+核心元数据+内容主体+关联索引+操作日志(OpLog)」的原子结构;其中元数据包含时间戳、领域标签、重要度等级、激活频率、数据类型(文本/图像/视频)等关键属性,支撑后续检索与管理;操作日志(OpLog)专门记录该原子单元的所有增删改标记、关联调整、内容编辑等操作,每条日志包含「操作类型+操作时间戳+操作设备ID+操作内容」,为多设备同步冲突解决提供核心依据。

  2. 本地存储加密机制:采用AES-256加密算法对原子化记忆片段进行本地加密存储,仅检索所需的索引信息经脱敏处理后,可同步至云端用于跨设备匹配;多模态特征向量额外采用国密SM4算法二次加密,强化隐私保护。

  3. 备份校验机制:云端备份仅存储脱敏索引与加密哈希值,恢复数据时通过哈希校验验证本地内容完整性,从根源避免原始数据在云端存储的泄露风险。

  4. 检索索引体系:构建“关键词检索+语义向量匹配+专属ID定位+多模态特征匹配”的多维度索引体系;其中文本语义向量基于轻量级BERT模型生成,多模态特征向量基于轻量CNN/Transformer变体生成,兼顾检索精度与移动端算力适配性。

  5. 索引权重规则:建立动态权重排序机制,近期激活、重要度等级高、关联度强的记忆片段索引,在检索结果中优先展示;多模态索引额外关联场景特征相似度权重,优化跨类型检索体验。

  6. 数据可移植性核心逻辑(加密容器生成):定义“全量记忆原子+索引信息+完整性校验码”的标准化加密容器格式,采用国密SM4算法进行二次加密;容器内置唯一设备绑定码与解锁密钥,保障数据导出后的安全性;支持多模态记忆单独/批量导出配置。

  7. 跨平台适配规则:输出标准化容器解析接口,兼容iOS、Android、Windows等主流操作系统,确保加密容器导出后可在不同终端稳定解析,保障文本与多模态数据结构完整性。

  8. 数字遗产权限逻辑:支持配置“遗产继承人授权密钥”,绑定继承人身份校验算法;仅通过身份校验的继承人,可调用容器解析接口获取记忆数据,实现数字遗产的安全传承;补充密钥安全机制:引入社交恢复(绑定3-5位可信联系人)与多签机制(需继承人与2位可信联系人共同授权),防止密钥丢失导致遗产永久锁定。

(二)多模态记忆处理模型 (作为存储与索引的特化扩展,定义图像/视频的特征提取、摘要、关联规则)

核心原则:遵循“特征化而非副本化”,聚焦图像/视频核心信息提取与关联,不存储原始媒体文件,以“记住关联与意义”为核心目标,兼顾成本控制与隐私保护。

  1. 多模态存储核心规则

  2. 成本控制优先:绝不存储原始媒体到云端,本地存储仅保留用户主动标记或系统筛选的优化版图像;默认99%的图片/视频仅留存“特征指纹”,原始文件由用户通过相册、云盘等自行管理;针对生活场景图片,新增智能筛选机制,仅保留构图完整、情感/意义突出的内容(如家庭聚会核心时刻、旅行标志性场景),自动过滤模糊、冗余、无核心意义的生活快照,避免存储冗余。

  3. 三级存储策略:L1(指纹级)存储特征向量+文本描述(<1KB),用于关联检索与语义匹配;L2(预览级)存储关键帧缩略图(10-50KB),用于快速预览与记忆提示;L3(完整级)存储优化后图像(200-500KB),仅用于用户主动标记的重要记忆。

  4. 自动清理规则:30天后自动删除L3完整级图像,保留L1+L2;90天后启动L2预览级清理,但新增双重豁免机制——1. 关联豁免:若该L2缩略图与有效聊天记录存在关联(关联分≥40分),则豁免清理;2. 相册映射豁免:若检测到用户本地相册存在该记忆对应的原始图片(通过文件名匹配、特征向量比对双重验证),则展示权限不受梯度清理影响,仍可正常预览,但后台梯度清理逻辑正常执行(仅保留L1指纹用于关联匹配);无关联、无相册映射且90天内无用户查看的L2内容,才删除并仅留L1指纹;用户手动标记的“重要记忆”可永久保留L3。

  5. 图像/视频处理算法

  6. 轻量化特征提取:移动端采用轻量CNN/Transformer变体,将输入图像转化为256维特征向量,确保设备端处理效率与算力适配性。

  7. 智能摘要生成:自动生成3句核心描述——主体描述(如“两人在会议室白板前讨论”)、关键内容(如“白板上写着Q2目标:增长30%”)、情感/氛围(如“氛围专注,有争论迹象”)。

  8. 关键信息提取:通过OCR识别图片中的文字(会议白板、文档标题等);仅执行人脸计数(不识别身份);完成场景分类(如“会议室”“户外”“图表界面”)。

  9. 视频优化处理:聚焦会议等核心场景,采用“场景特征提取+核心内容汇总”策略——仅提取1-3帧关键场景特征图(如白板核心内容、全员讨论场景、结论展示时刻),明确特征图核心维度:场景类型(如“会议室-多人讨论”)、核心主体(如“白板/投影/参会人员”)、关键状态(如“结论输出/问题争论”);同步提取音频转文字内容,汇总为“会议主要内容”(含核心议题、讨论结论、待办事项);自动关联视频原始文件名/会议主题标签,建立“特征图-会议纪要-原始文件名”的关联链,支撑应用与相册的精准匹配。

  10. 多模态关联逻辑

  11. 跨模态关联规则:强化“文件/场景”关联逻辑——文本中提到的会议主题/待办事项,自动关联对应会议的场景特征图与会议纪要;场景特征图通过文件名标签,自动关联相册中对应的原始图片/视频;图片中提取的关键信息(如白板结论),关联到相关项目文档与会议记录,形成完整记忆链路。

  12. 关联强度计算:关联分=时间接近度×0.3 + 场景特征相似度×0.4 + 用户交互历史×0.3,优先展示关联分高的多模态内容;针对聊天记录与图片的关联,增设“关联保护阈值”(关联分≥40分即判定为有效关联),用于L2清理豁免与日常关联展示,避免因阈值过高导致关联断裂或清理过度。其中场景特征相似度为核心关键参数,采用可调整的复合函数计算框架,明确各维度构成与权重,为算法实现与参数调优提供清晰依据,具体规则如下:1. 核心公式:场景特征相似度 = 0.4×全局特征向量余弦相似度 + 0.3×场景分类标签匹配度 + 0.2×OCR关键词重叠率(Jaccard相似度) + 0.1×主体检测框IoU;各维度权重支持基于用户场景反馈、不同领域适配需求动态微调(微调逻辑见4.6算法迭代闭环);2. 各维度详细判定规则:① 全局特征向量余弦相似度:基于轻量CNN/Transformer变体生成的256维多模态特征向量,计算两组向量的余弦相似度,取值范围0-1.0,反映整体场景的特征契合度;② 场景分类标签匹配度:预设“会议室讨论”“户外旅行”“家庭聚会”“图表评审”“白板研讨”等12类核心场景标签及“工作会议”“生活场景”“学习研究”3大类父标签,采用多级匹配机制——核心标签完全匹配得1.0分,同大类下细分标签匹配得0.6分,跨大类标签匹配得0.0分;③ OCR关键词重叠率(Jaccard相似度):提取OCR识别文本中的核心关键词(过滤“的”“是”等停用词,保留名词、动词、核心数据),计算两组关键词集合的交集与并集比值,取值范围0-1.0;无OCR文本时该项得0.3基础分;④ 主体检测框IoU:对场景中的核心主体(如白板、图表、参会人员、旅行标志物等)进行检测并生成边界框,计算两组主体边界框的交并比,取值范围0-1.0;仅统计双方均检测到的主体类型,无共同主体时该项得0.0分;3. 计算示例:“白板讨论”场景与“图表评审”场景计算示例——全局特征向量余弦相似度(0.65分)×0.4 + 场景分类标签匹配度(同属“工作会议”大类,0.6分)×0.3 + OCR关键词重叠率(均含“项目目标”“Q2计划”,0.5分)×0.2 + 主体检测框IoU(均含“多人+文档类主体”,0.7分)×0.1 = 0.65×0.4 + 0.6×0.3 + 0.5×0.2 + 0.7×0.1 = 0.26 + 0.18 + 0.10 + 0.07 = 0.61分,精准判定两者同属工作场景且具备强关联性。

  13. 混合检索算法:支持文本检索、图像特征检索、OCR文本检索并行执行,融合排序后返回结果;以图搜图功能仅在WiFi环境下可用,移动网络仅搜索指纹。

  14. 算力与隐私控制算法

  15. 设备端优先处理:所有图像分析、特征提取在设备端完成,仅同步加密后的特征向量(<1KB)用于跨设备关联,避免原始数据上传泄露。

  16. 分级算力分配:充电+WiFi时处理积压的图像分析任务;移动网络下仅处理用户标记为重要的内容;低电量模式暂停所有非紧急处理。

  17. 隐私保护规则:仅检测人脸存在(不识别身份);特征向量加密后跨设备同步;原始文件与记忆系统完全隔离,绝不自动上传至任何服务器。

(三)梯度遗忘算法模型

  1. 遗忘优先级判定逻辑:基于记忆片段的「内容类型标签」(含事实查询类、日常对话类、低价值临时沟通类、多模态场景类)与「用户交互频次」,建立自动化优先级判定机制,精准区分高/低价值记忆;多模态记忆额外结合场景重要度(工作场景按季度/半年度快照精简,生活场景保留优质内容)调整优先级。

  2. 遗忘梯度执行规则:短期(1-7天):完整保留所有记忆的原子结构(含文本与多模态L1-L3级数据),索引权重设置为最高,支撑即时回溯需求;

  3. 中期(8-15天):自动过滤重复、低价值记忆片段,文本仅保留核心结论与完整元数据,多模态保留L1+L2级数据,降低存储占用;

  4. 长期(15天以上):文本仅保留记忆片段的ID、核心元数据、用户标记内容及系统生成总结;多模态执行三级存储清理规则(含关联豁免与相册映射豁免机制);支持用户手动锁定关键内容,豁免自动清理规则。

  5. 宽限期管控逻辑:为所有待执行遗忘操作的记忆片段设置15天宽限期,并设置搜索及多次自动误删反馈功能,宽限期内完整保留恢复接口,到期后自动执行对应梯度的遗忘规则。

(四)智能标记与语义理解模型

  1. 自动标记算法:基于命名实体识别(NER)与关键句抽取算法,智能识别文本记忆中的结论性语句、核心数据、核心观点,以及多模态记忆中的关键信息(如白板文字、场景主体),生成初始标记结果。

  2. 反馈学习机制:提供“误标/漏标”一键纠正入口,用户反馈数据实时同步至模型训练模块,通过调整NER模型的实体权重与关键句判定阈值,持续优化自动标记的精准度;多模态标记额外收集场景特征识别反馈,优化筛选与摘要生成逻辑。

  3. 语义标签生成模型:自动提取记忆片段的「领域关键词+逻辑类型+应用场景」,生成三层结构化语义标签(示例:“政策影响-因果逻辑-商业分析”“会议讨论-场景特征-工作复盘”),支撑后续跨领域、跨模态关联匹配。

  4. 跨领域语义匹配逻辑:突破传统同领域匹配限制,基于“逻辑类型+核心观点”的语义向量相似度进行关联判定,实现核心逻辑一致的跨领域记忆匹配(如“政策引导技术迭代”与“教育政策推动创新”);支持文本与多模态场景特征的跨类型匹配。

  5. 关联性判定优化逻辑:定义“误关联率”“漏关联投诉量”两大量化评估指标——误关联率=误关联次数/总关联次数,漏关联投诉量基于用户反馈标签进行统计,为模型优化提供数据支撑。

  6. 算法迭代闭环:构建“用户反馈数据池-模型参数微调-效果验证”的全流程迭代机制,每两周基于积累的反馈数据,微调语义匹配阈值与权重因子,持续提升关联判定精度;关联权重动态调整算法:基于用户对关联结果的正面/负面反馈进行在线学习,如用户多次点击某类关联结果则提升对应因子权重(如场景特征相似度权重),多次标记“不相关”则降低权重并优化匹配阈值。

  7. 能力边界定义:输出关联性判定的置信度评分(0-100分),置信度低于60分的关联结果不主动触发展示,仅存入弱关联池,避免无效关联干扰用户。

(五)离散思维关联模型

  1. 触发场景判定逻辑:基于“对话轮次统计+观点输出检测+多模态场景识别”三维度算法,判定是否为深度交流场景——满足“对话围绕单一核心话题展开≥3轮”“用户手动标记为‘深度思考’”“系统识别到观点输出/逻辑推导类内容”“多模态场景为重要工作/生活场景”四者之一即可激活;

  2. 非深度交流场景(如寒暄、一次性事务沟通、简单事实查询、冗余多模态快照)下,直接屏蔽关联触发接口,避免冗余干扰。

  3. 关联权重计算逻辑:建立多维度权重评估体系,权重因子包含激活频率(0.3)、历史重要程度(0.3)、时间远近(0.2)、跨领域/跨模态适配度(0.2);仅定义因子维度,不固化具体数值,支持基于用户行为动态调整(具体调整逻辑见4.6),核心贴合当下关注重点。

  4. 相似度阈值判定:核心观点语义向量相似度≥75%(文本-文本/文本-多模态场景特征)时,触发精准关联;相似度处于60%-70%区间的内容,纳入弱关联池,供后续发散探索。

  5. 关联强度量化逻辑:逻辑相似度映射——将语义向量余弦相似度(0-1)转化为颜色深浅,颜色越深代表逻辑相似度越高;

  6. 历史验证强度映射——将用户正反馈次数(0-5次)转化为线条粗细,线条越粗代表历史验证度越高,帮助用户快速判断关联价值。

(六)认知迭代追踪模型

  1. 版本迭代记录逻辑:完整记录文本每一次修改的「操作类型+时间戳+内容差异值+修改原因」,生成可追溯的版本链;多模态记忆记录特征提取版本、摘要生成版本及关联调整记录,支撑后续认知迭代分析。

  2. 认知变化提取逻辑:基于版本链的内容差异分析,自动提取用户的认知变化特征(如观点调整、分析维度拓展、思考深度提升等),生成结构化的“认知迭代轨迹向量”;结合多模态记忆的关联变化,捕捉用户对场景/信息的认知演变。

  3. 冲突观点判定逻辑:对比当前观点与历史观点的语义向量,当差异值≥0.6时判定为观点冲突,自动记录冲突差异点、上下文信息及思考背景,支撑后续观点迭代分析;多模态场景关联的观点冲突额外记录场景特征差异,辅助认知分析。

(七)协作与学习强化模型

  1. 实时协作核心逻辑:定义“协作空间原子化数据”规范,将各成员的标记内容、思维片段、多模态特征片段拆解为可拼接的原子单元,每个单元包含「贡献者ID+核心内容+语义标签+时间戳+数据类型」,支撑集体思维网络构建。

  2. 集体思维网络生成算法:基于所有协作成员的原子单元语义向量(含文本与多模态),构建集体思维关联网络,自动识别网络中的共识点与差异点,支撑团队深度讨论;多模态内容作为场景佐证融入网络,提升讨论直观性。

  3. 单人学习双回路逻辑:语音转文字实时处理——采用轻量级ASR模型,支持离线语音转文字,转写内容实时生成临时记忆原子,避免灵感流失;

  4. 嘴-手协同校验:对比语音转写内容与手写标记内容的语义相似度,自动识别并提示两者差异点;优化体验设计:在用户一段落输入后,温和提示“发现一处表述差异,是否查看?”,避免专注思考时的干扰,辅助用户快速整合灵感,提升学习整理效率。

(八)伦理风险管控与极端场景模型 (顶层约束,整合所有伦理原则与兜底判定逻辑)

核心定位:作为模型层的独立顶级模块,制定贯穿所有模型的伦理约束原则与极端场景兜底规则,具体算法实现仍保留在对应子模块,此处仅做纲领性总结与全局约束定义。

  1. 核心伦理原则:坚守“用户控制权优先”“原始内容不可篡改”“算法中立性”三大核心原则,所有模型设计均需遵循此约束。

  2. 用户控制权保障规则:所有记忆数据(含多模态)的录入、存储、关联、删除均需用户明确授权或可手动干预;支持批量管理、导出清理、权限配置等全流程控制权;数字遗产继承引入多重安全机制,保障遗产可访问性与安全性。

  3. 原始内容保护原则:原始对话、原始多模态特征提取结果等核心数据永久保留完整原子结构,总结、关联、标记等衍生内容仅作为辅助层,不可覆盖或替代原始数据;梯度遗忘仅清理冗余衍生内容,核心原始数据纳入宽限期保护。

  4. 算法中立性约束:所有标记、总结、关联、筛选算法仅基于“内容特征”(如结论性语句、核心数据、场景特征)进行判定,不引入主观重要度评估、身份识别、价值评判等主观逻辑;算法参数可基于用户反馈优化,但核心中立逻辑不变更。

  5. 认知退化预防原则:通过个性化记忆回顾周期、回想校验机制,鼓励用户主动内化外部记忆,避免过度依赖系统导致的认知退化;回顾与校验算法仅提供辅助引导,不替代用户自主思考。

  6. 隐私保护兜底规则:所有数据处理均遵循“本地处理优先”“加密传输存储”“原始数据隔离”原则;绝不进行人脸、身份等敏感信息识别;多模态特征向量等敏感数据需二次加密,严防泄露。

  7. 极端场景判定与兜底逻辑:明确三类核心极端场景的判定标准及兜底处理规则,全程保障用户决策权:1. 存储将满场景:当本地存储剩余容量达到默认阈值(10%)时自动触发预警,优先标记低价值冗余记忆(含无关联多模态L2内容)供用户确认清理,同步提供“导出至私有云”“开启版本精简”等优化入口;2. 长期未使用场景:连续30天无任何交互操作时判定为“回归场景”,自动生成近期核心记忆片段、关键多模态场景及未完成任务清单,提供“快速回顾”“继续之前任务”等便捷入口,降低回归使用门槛;3. 严重误关联场景:当用户连续3次反馈误关联后,自动弹窗提供“立即切换至严格关联模式”操作按钮,将模式切换决策权完全交予用户;同时基于用户反馈加速算法迭代,上调关联匹配阈值,减少无效关联干扰。

  8. 能力边界透明化原则:明确告知用户系统的能力局限(如关联判定可能存在误关联/漏关联、多模态记忆为提示而非备份),通过置信度评分、优化进展展示等方式,管理用户预期,避免过度依赖。

模型层边界

  1. 仅输出标准化能力接口(如“标记接口”“关联接口”“遗忘接口”“协作接口”“多模态处理接口”“伦理校验接口”等),明确接口入参、出参规范,不涉及接口调用时机与前端交互形式;

  2. 所有算法规则支持参数调优(如语义相似度阈值、权重因子占比、多模态筛选阈值等),但核心伦理逻辑与中立性原则不随软件层交互设计调整而变更;

  3. 仅处理结构化的记忆原子数据(含文本与多模态结构化特征),负责数据加密、语义分析、关联匹配、多模态处理等核心计算,不涉及界面渲染、用户输入采集、终端适配等非算法类任务;

  4. 伦理风险管控仅输出底层规则与能力接口,用户预期管理、界面提示文案、反馈入口设计等均归属软件层实现。

二、软件层实现(交互与功能落地层)

核心定位:基于模型层输出的标准化能力接口,实现用户可感知的功能落地、交互设计与可视化展示,聚焦“易用性、轻量化、低摩擦”核心体验;所有偏向交互流程、界面设计、用户体验优化的需求,均归属此层范畴;模块顺序与模型层基本对应,体现调用关系。

(一)基础存储与交互模块

  1. 存储管理功能:可视化容量分布——调用模型层存储索引数据,生成环形图展示原始记忆、标记内容、版本文件、回收站内容、多模态存储的占比情况,支持点击图表节点跳转至对应分类详情页;

  2. 容量阈值设置——提供“自动清理”功能开关,用户自定义容量阈值后,软件层通过调用模型层遗忘接口执行自动清理操作;

  3. 误删恢复交互——提供“回收站”功能入口,用户输入专属恢复密码验证通过后,调用模型层恢复接口还原记忆片段及版本记录。

  4. 检索交互:提供关键词输入框及多维度筛选条件(含存储时间、标记等级、话题类型、数据类型等),用户触发检索后,调用模型层检索接口,展示记忆片段列表(默认加载核心摘要,点击可查看完整内容);

  5. 上下文回溯交互——提供“上下文回溯”功能按钮,调用模型层关联接口,精准加载指定上下文片段(含文本与关联多模态内容),无需加载全部历史记录,提升交互效率。

  6. 数据可移植性落地功能:加密容器导出交互——提供“导出至私有云/本地设备”功能入口,用户选择导出范围(全量记忆/指定领域/高重要度内容/仅文本记忆)后,调用模型层加密容器生成接口,生成加密文件并引导上传至可信私有云;

  7. 数字遗产设置界面——提供“遗产继承人授权”专属页面,支持用户录入继承人信息、设置授权密钥,配置社交恢复联系人与多签规则,通过调用模型层权限逻辑接口完成绑定;

  8. 跨平台导入交互——提供“加密容器导入”功能入口,支持读取不同终端导出的加密文件,调用模型层解析接口完成数据迁移(含文本与多模态数据),保障跨平台使用体验。

(二)多模态记忆交互模块 (调用模型层(一)(二))

核心定位:以“克制交互、轻量化体验”为原则,实现多模态记忆的极简录入、智能展示与高效检索,明确告知用户系统定位为“记忆提示系统”而非“照片备份系统”。

  1. 多模态录入交互

  2. 极简录入流程:相册选择图片/视频→系统3秒内自动处理(图片:生成特征+摘要;视频:提取关键场景图+汇总会议主要内容)→用户确认/修改(支持补充会议主题、待办事项等标签)→保存指纹(默认);支持手动切换至“保存完整图像”模式,弹窗提示存储成本(如“将保存优化版图像(约300KB),原始文件仍保留在相册中”);

  3. 批量处理模式:支持选择多张图片一键生成“图片记忆合集”,系统自动提取合集主题(如“2024.06产品会议合集”);提供“仅保存指纹”批量处理选项,节省存储空间;针对生活场景图片,自动触发筛选机制,仅展示构图优质的候选内容供用户确认录入,减少冗余操作;

  4. 录入权限控制:默认不自动添加图片记忆,需用户逐张批准;支持设置“自动录入白名单”(如特定相册、特定场景),提升高频场景效率。

  5. 多模态展示交互

  6. 记忆流呈现规则:以文本记忆为主,图片记忆为辅;图片默认显示为小缩略图,点击后按需加载高清版本;相似图片自动折叠(如“共8张会议照片”),避免冗余展示;会议场景优先展示关键特征图+会议核心内容摘要,标注对应的原始文件名(如“20240610产品复盘会.mp4-特征图1”),方便用户关联相册原始文件;

  7. 关联展示逻辑:默认仅展示关联度最高的1-2张图片(降低极端性),提供“查看更多相关图片”折叠入口;移动网络下默认不加载高清图,仅显示缩略图,保障性能与流量控制;若检测到相册存在原始图,点击可选择“查看应用记忆版”或“跳转相册查看原始版”;

  8. 用户预期管理:首次使用多模态功能时弹窗提示“系统帮你记住照片里的重要信息,而非存储照片本身;原始照片仍保存在你的相册中”,避免用户期望偏差。

  9. 多模态检索与管理交互

  10. 混合检索操作:支持多维度检索匹配——1. 文本检索(如“找202406产品复盘会内容”),同步展示会议纪要、关键特征图及对应的原始文件名;2. 以图搜图(上传相册原始图),匹配应用内关联的记忆片段与会议记录;3. 文件名检索(输入相册中视频/图片文件名),快速定位对应的记忆内容;

  11. 多模态记忆管理:提供“批量删除”功能,支持一键删除某个时间段的所有图片记忆;导出加密容器时,可选“仅导出文本记忆”,灵活控制导出内容;

  12. 存储监控交互:在记忆健康度仪表盘新增多模态存储占比展示,设置图片记忆总大小不超过文本记忆10倍的硬性上限,接近上限时弹窗提示清理建议;同时展示“关联豁免的L2内容占比”,让用户清晰了解L2保留的核心依据。

(三)荧光笔标记交互模块

  1. 手动标记交互:滑动标记——长按文本触发荧光笔工具,滑动选中目标内容,支持核心(红色)、次要(黄色)两级标记,标记信息实时同步至模型层标记接口;支持对多模态记忆的关键特征图进行标记,关联至对应文本记忆;

  2. 语音标记——支持语音指令(如“标记这段核心结论”“标记这张图的白板内容”)触发标记,软件层将语音转文字后调用模型层标记接口,完成标记操作。

  3. 自动标记调优交互:在系统自动标记结果(含文本与多模态)旁设置“误标/漏标”一键纠正按钮,用户点击反馈后,软件层采集反馈数据并调用模型层学习接口,支撑模型优化。

  4. 新手引导:首次使用时设计分步引导任务,引导用户完成3次手动标记操作(含文本与多模态),帮助模型层初始化用户标记偏好,降低学习成本。

(四)离散思维关联交互模块

  1. 关联提示交互:精准关联——在对话窗口底部展示1-2条轻量化关联提示(含文本观点与多模态场景),旁附关联线可视化图标(颜色深浅表示逻辑相似度,线条粗细表示历史验证度),直观呈现关联强度;

  2. 发散模式——提供“发散探索”功能开关,开启后从弱关联池随机加载1条内容(含文本与多模态),以折叠形式显示“潜在关联推荐”,用户可自主选择展开查看或忽略,保留意外洞见可能。

  3. 关联详情交互:一级点击——展示核心思维链路(仅含观点要点+核心关联点+关键多模态特征图);

  4. 二级点击——加载完整思维记录与溯源信息(含文本版本链、多模态原始关联记录),支持“一键收起”操作,将回顾成本控制权交予用户;

  5. 反馈交互——提供“关联不相关”一键反馈按钮,用户标记后调用模型层调优接口,支撑关联判定精度优化。

  6. 关联性用户预期管理:首次使用关联功能时弹窗——坦诚告知用户“系统关联性判定处于持续学习阶段,可能存在误关联/漏关联情况,您的反馈将帮助系统快速优化”;在“系统设置-关于-优化进展”页面,展示脱敏后的当前误关联率及迭代优化趋势,增强用户信任。

(五)进阶记忆管理功能模块

  1. 记忆健康度仪表盘:可视化面板——调用模型层索引、关联、迭代、多模态等核心数据,生成环形图(存储容量分布)、柱状图(近7/30天高频调取话题Top5)、热力图(近期认知迭代热点领域)、网络图(离散思维关联脉络)、多模态存储占比图;交互设计——支持自定义时间维度(日/周/月)筛选数据,所有关键数据节点支持点击跳转至对应记忆片段详情页,实现“可视化-溯源”闭环。

  2. 情景化记忆模板:模板库——预置项目复盘、学术论文阅读、客户会议等高频场景模板,调用模型层标记接口,自动触发对应场景的核心维度标记提示(如项目复盘模板提示标记“目标、障碍、解决方案、结果、经验教训”,会议模板提示关联对应多模态场景图);自定义模板——提供模板可视化编辑页面,支持用户设置专属标记规则、总结格式与关联逻辑(含多模态关联规则),保存后可直接调用模型层对应接口实现功能。

  3. 外部知识内化接口:多格式导入——提供网页剪藏插件、PDF上传入口、图片OCR识别、音频转文字、视频关键帧提取等功能,软件层将提取的文字/特征内容转化为标准化记忆原子数据,调用模型层存储接口完成存储;知识关联交互——外部素材导入后,自动提示“是否关联相似内部记忆”,用户确认后调用模型层关联接口,生成“内外部知识融合笔记”(含外部素材关键信息+内部关联记忆+多模态佐证内容),打通内部记忆与外部知识壁垒。

(六)多设备同步与协作模块

  1. 同步交互:主从设备设置——提供设备管理页面,支持用户指定手机为主设备,平板、电脑等为从设备;从设备通过端对端加密通道授权后,调用模型层同步接口获取检索索引与修改记录(含文本与加密多模态特征向量,非全量复制原始数据);同步触发——支持手动触发同步,或设置“连接指定Wi-Fi后自动同步”,避免实时同步带来的隐私泄露与设备能耗问题。

  2. 协作交互:基础协作——支持生成加密共享链接,可自定义链接有效期与操作权限(仅查看/可评论/可创建衍生版本),被分享者通过链接调用模型层只读/评论接口;实时协作画布——提供“协作空间”专属入口,进入后调用模型层实时协作接口,所有成员的标记内容、思维片段、多模态特征片段以原子单元形式动态展示,支持拖拽拼接、关联标注,自动生成集体思维网络图;共识/差异展示——在协作画布右侧分区,高亮标注集体思维的共识点,分色标注差异点,支持一键导出协作成果(含思维网络图、共识/差异清单、关联多模态内容汇总)。

(七)单人学习强化模块

  1. 嘴-手双回路交互:语音实时记录——提供“灵感语音”功能按钮,点击后启动在线/离线ASR转写,调用模型层语音处理接口,实时生成临时记忆内容,快速捕捉灵感;手写同步整合——支持一边语音记录一边手写标记内容,软件层调用模型层协同校验接口,对比两者语义相似度,自动识别差异点;优化体验设计:在用户一段落输入后,温和提示“发现一处表述差异,是否查看?”,避免专注思考时的干扰;

  2. 灵感导出——支持将语音转写与手写整合后的内容,一键生成笔记或总结文档,调用模型层存储接口完成保存;支持关联多模态场景图插入文档,提升笔记完整性。

(八)伦理与极端场景优化模块 (调用模型层(八),实现用户侧引导)

  1. 记忆塑造风险规避交互:界面优先级设计——展示记忆内容时,原始对话、原始多模态特征提取结果置顶展示,总结、关联等衍生内容折叠呈现并标注“衍生内容”字样,支持一键切换至“仅展示原始内容”视图;手动干预入口——提供“屏蔽自动总结/关联/多模态筛选”功能开关,用户开启后仅展示原始记忆内容,避免算法引导用户注意力。

  2. 认知退化预防交互:轻量提醒功能——在首页或系统通知栏,按个性化回顾周期推送“记忆回顾”提醒,用户点击后进入回想界面,调用模型层回想校验接口,展示记忆关键点引导用户主动回想;回想成果展示——用户完成回想后,展示回想结果与原始记忆的匹配度评分及差异对比,鼓励用户主动内化外部记忆,强化生物记忆。

  3. 极端场景引导交互:存储将满——弹窗温和提示“本地存储即将满,可通过以下方式优化:1. 导出至私有云 2. 清理低价值记忆 3. 开启版本精简 4. 清理无关联多模态内容”,提供一键跳转至对应功能页的入口;长期未使用回归——展示“回归引导页”,汇总近期核心记忆片段、关键多模态场景、未完成任务清单,提供“快速回顾”“继续之前任务”等便捷入口,降低回归使用门槛;严重误关联——用户连续3次反馈误关联后,弹窗提示“已记录您的反馈,系统将优先优化此类关联规则;可暂时开启严格关联模式,减少无效关联干扰”,提供模式快速切换入口,避免用户产生挫败感。

  4. 隐私保护交互强化:在设置页面单独增设“隐私保护中心”,集中展示所有隐私相关设置(如本地处理开关、加密同步开关、多模态特征加密设置、人脸计数仅开启选项);提供“隐私安全检测”功能,定期扫描记忆数据存储与同步状态,提示潜在风险。

软件层边界

  1. 仅调用模型层输出的标准化接口,严格遵循接口入参、出参规范,不修改模型层核心算法逻辑与数据处理规则;

  2. 所有交互设计以“轻量化”为核心原则,避免过度渲染与复杂操作流程,降低设备性能消耗与用户操作成本;如嘴-手协同校验优化、多模态轻量化展示等设计均遵循此原则;

  3. 聚焦用户操作路径优化、界面可视化设计、用户预期管理与反馈收集,不涉及底层数据加密、语义分析、关联匹配、多模态处理等核心计算任务;

  4. 功能落地需适配手机、平板、电脑等不同终端的交互规范与界面尺寸,但核心调用的模型层接口保持一致,保障跨终端体验统一;

  5. 伦理风险管控侧重“用户感知与操作引导”,通过界面设计、提示文案、功能开关、隐私中心等方式规避风险,不涉及底层伦理规则制定。

三、分层协作规则

  1. 模型层为软件层提供核心能力底座,软件层根据用户实际使用场景(如深度交流/泛谈、单人学习/团队协作、文本/多模态处理),自主判断接口调用时机——例如深度交流场景调用关联接口,泛谈场景则屏蔽该接口,多模态场景调用特征提取与关联接口;

  2. 软件层负责采集用户全流程反馈(如标记纠错、关联反馈、伦理相关操作偏好、多模态筛选反馈等),同步至模型层用户反馈数据池;模型层定期基于反馈数据迭代算法参数,优化接口输出结果,形成“用户反馈-模型优化-体验提升”的闭环;

  3. 数据流转闭环:用户输入/操作→软件层采集并转化为结构化数据→调用模型层接口完成核心处理→软件层将处理结果可视化展示→用户反馈→软件层采集反馈同步至模型层→模型层算法调优,实现全流程闭环;

  4. 性能适配策略:软件层根据终端算力差异,自主选择调用模型层轻量化或完整版接口——例如移动端调用精简版语义向量计算接口与多模态特征提取接口,PC端调用完整版接口,兼顾体验与性能;

  5. 需求协作规范:数据可移植性、伦理风险管控、实时协作、多模态处理等所有核心需求,均遵循“模型层定底层规则/算法,软件层做上层交互/落地”的协作模式,严格划分两层职责边界,避免职责混淆。