【红杉播客】AI Neolab--Engram【主攻记忆与持续学习】--分享未来 AI 发展趋势的独特见解

#machinelearning #ai #deeplearning #llm

https://www.youtube.com/watch?v=aiR7F4jqjXY
在这期由红杉资本（Sequoia Capital）主持的《Training Data》播客节目中，初创公司 Engram 的联合创始人 Dan Biderman 和 Jessy Lin 深入探讨了 “记忆（Memory）与持续学习（Continual Learning）” 在 AI 领域的核心作用，并分享了他们对未来 AI 发展趋势的独特见解：

核心论点与核心 premise

将知识直接“烤入”模型权重（Weights）： Engram 的核心前提是：不要一味地将越来越长的提示词强行塞入上下文窗口，或者完全依赖外挂的检索增强生成（RAG）。相反，应该将团队、公司或个人的特有知识直接训练并内化到模型的权重中，让 AI 模型像工作了多年的资深员工一样，本能、直觉式地了解这家公司 01:11。
记忆与持续学习是硬币的两面： 目前的 Frontier 实验室主要聚焦于预训练和后训练（Post-training），将模型打造成在数学和代码上具有高 raw intelligence 的工具。而 Engram 认为，AI 未来的瓶颈在于理解“全新且不断演变的上下文”，并主张模型应该处于“永远在训练”的状态 01:04。

技术实现与架构

轻量化训练与适配器（Adapters）： 团队在技术上通过各种适配器（如 LoRA、Prefix 等）和微调手段（SFT、RL、在策略蒸馏等），在各个工作空间（Workspace）内针对不同团队训练专属的专属小模型 04:39。
不仅是开源模型： 虽然由于可以直接访问权重（White box access），这种方法在开源模型上最容易实施，但他们也可以与闭源模型公司合作，将这种能力应用到任何基于 Transformer 的模型上 06:31。

与 RAG（外挂检索）及 KV Cache 的对比

RAG 存在极限（"Rag Killer" 的定位）： 尽管不完全排斥 RAG（基础事实的记录依然需要），但如果一味依赖 RAG，模型很难进行抽象的、跨领域的联想（Associations）。此外，当信息量达到每天数千万 Token 时，RAG 的查找和模型的重新阅读成本将变得极为高昂 02:59, 29:00。
压缩 KV 缓存（KV Cache）： Dan 提到目前的 KV 缓存堪称“庞然大物”（例如一个 Llama 70B 模型对单个长条目的 KV 缓存甚至能吃掉 80GB 的显存，而整个模型的权重也就 100GB 左右）。通过梯度下降（离线训练），可以将这 80GB 的“大脑状态”压缩上千倍，并深深烙印在权重中，极大降低推理成本 30:16。

创始人背景与思维碰撞

生物学/神经网络的启发： Dan 拥有神经科学背景，他提到人类的大脑演化出了特定的局限性，大脑在梦境中其实也是在脱离实际交互后，重新去试验和消化白天所学。Engram 的模型也包含类似的阶段，给模型时间去“消化”并从中学习，以防模型在持续学习中彻底“脱轨”（Off the rails） 13:24, 27:52。
关于“语言战胜视觉”的趣味探讨： 主持人提出了一个非技术性的“疯狂理论”（即电脑纯电子化的环境强化了语言，削弱了生物学上具有极高比特率的视觉优势）。Dan 和 Jessy 认为，人类在办公室读写备忘录等知识工作（Knowledge work）本就不是生物演化的结果，因此采用基于文本的语言作为现阶段 AI 的切入点和界面是非常高效且合理的 41:11, 42:43。

未来愿景（5-10年后）

人人都有专属模型： 未来不会是只有一个越来越大的通用 AGI 模型统治一切。世界将走向分化：每个人、每个团队都将拥有专属于自己的小模型，它们懂你的风格和独特的习惯 15:21, 42:53。
数据层的神经接口（Neural Interface to Data Plane）： 正如 DataBricks 或 Oracle 成为传统数据层的基础设施一样，Engram 期望成为所有人访问数据层的“神经网络接口”——它不代表冷冰冰的文件系统，而是代表针对该文件系统的一种高度联想、高效的大脑状态（Brain state） 43:26。

AI 业内备受瞩目的创新实验室（Neolab）Engram 详细介绍

Engram 是一家在 AI 业内备受瞩目的创新实验室（Neolab），其核心愿景是攻克生成式 AI 的两大终极难题：长期记忆（Memory）与在线持续学习（Continual Learning）。

2026年6月，Engram 正式结束隐身状态（Stealth mode），宣布获得由红杉资本（Sequoia Capital）、Kleiner Perkins 和 General Catalyst 领投的 9800 万美元融资，估值达到 6 亿美元。令人瞩目的是，AI 巨擘 Andrej Karpathy 和 AI 领域泰斗 Pieter Abbeel 均以个人名义进行了追投。而此时，整个公司仅有 13 名员工。

以下是关于两位联合创始人、公司起源以及发展历史的详细介绍：

一、核心创始人背后的技术底色

Engram 的诞生是一场“理论神经科学”与“计算机系统架构”的强强联合。

1. Dan Biderman（首席执行官 CEO）

学术背景与底色： Dan Biderman 来自理论神经科学领域。在神经科学中，“记忆”与“大脑印记”是研究的核心。他曾于斯坦福大学统计学与 AI 领域深造，并在世界顶级 AI 专家 Christopher Ré 教授的实验室工作。
核心理念： 受到生物学启发，Dan 认为当前的 AI 模型虽然充满智慧，但由于缺乏真正的记忆，它们就像“聪明的陌生人”。他主张模型不应在每次对话时重新检索、阅读文件，而是应该像人类大脑一样，通过消耗离线算力，将知识压缩并“内化”到权重中。

2. Jessy Lin

学术背景与底色： Jessy Lin 毕业于麻省理工学院（MIT），在认知计算科学与自然语言处理（NLP）领域拥有深厚的研究背景，随后在加州大学伯克利分校（UC Berkeley）继续进行前沿 AI 机制的研究。
核心研究贡献： Jessy 长期专注于模型的主动阅读（Active Reading）与稀疏记忆微调（Sparse Memory Finetuning）。在联合创办 Engram 之前，她便致力于解决模型在面对长上下文时，如何识别“哪些事实值得被记住，哪些事实该被遗忘”的过滤机制。

3. 豪华创始人天团的其他成员

除 Dan 和 Jessy 外，创始团队还包括：

Sabri Eyuboglu： 斯坦福大学博士，专注于 Transformer 内部记忆机制、状态空间模型（SSM）及 BASED、Minions 等架构的研究。
Jack Morris： 2025年底毅然放弃康奈尔大学（Cornell）的博士学位加入创办，专注于模型记忆化与对抗性研究。
Scott Linderman & Christopher Ré： 斯坦福大学知名教授及实验室导师。

二、公司的起源：从斯坦福实验室到“逆向押注”

1. 实验室的灵感碰撞（2025年前后）

公司起源于斯坦福大学的 AI 实验室。当时，Dan Biderman 和 Sabri Eyuboglu 在 Christopher Ré 的实验室里发现，他们正从两个完全不同的学科两端，追逐着同一个“在当时并不算流行”的概念——机器记忆。

传统的计算机科学中，“数据库（存储事实）”和“算法（处理逻辑）”是完全分离的。
现代大模型的快猛发展（如预训练和 RAG）虽然部分解决了知识外挂的问题，但并没有从底层改变模型“健忘”的缺陷。

2. “记忆印记”的命名

公司取名 “Engram”（记忆印记/ 遗痕） 正是源自神经科学。在生物学中，engram 指的是记忆在生物大脑神经组织中留下的物理或化学痕迹。创始人们希望在硅基芯片中，为 AI 刻下同样可以线性组合、擦除和沉淀的“神经印记”。

3. 成立与拒绝巨头邀约（2025年10月）

2025年10月，团队正式从斯坦福实验室走出，在旧金山创立了 Engram。为了这个共同的机器记忆愿景，团队内的多位核心成员拒绝了来自 Google Gemini 团队和 Anthropic 等前沿实验室的高薪 Offer，选择加入这场胜算极高却充满挑战的 calculated risk（精确计算的冒险）。

三、发展历史与商业演进（2025年10月 - 2026年6月）

1. 隐身期与“RAG 杀手”架构的确立

在创立初期的几个月里，Engram 在隐身状态下快速迭代。大模型行业当时正深陷“高昂的 Token 推理成本”和“日益臃肿的上下文窗口（Context Window）”危机。

痛点： 现有的企业 AI 代理（Agents）在处理一份 7 万字的合同或代码库时，其生成的 KV Cache（键值缓存）会膨胀到 100GB 以上。每问一个新问题，模型就得把这 100GB 的“大脑状态”重新从磁盘加载或重新计算一遍，这带来了恐怖的显存占用和资金消耗。
Engram 的解法： 他们提出了一套 “永远在训练”（Always Training） 的架构。利用团队此前在 LoRA、BASED、Cartridges、稀疏微调等领域的一系列突破性论文成果，Engram 能够在后台自主运行轻量化的微调，把企业的 Bespoke（定制化）工作流、专属工具链和团队上下文，直接压缩成数千倍小的适配器权重。

2. 拥抱顶尖生态合作伙伴

随着算力成本和 Token 消耗成为应用层的最大痛点，Engram 的技术迅速迎来了强烈的市场需求。在隐身期间，他们便与 Microsoft（微软）、Notion、Harvey（知名法律 AI） 等在企业协作和大规模数据处理上饱受 AI 运营成本折磨的巨头及头部初创公司达成了战略合作伙伴关系。

3. 轰动性的高额融资与未来愿景（2026年6月）

2026年6月23日前后，Engram 正式走出隐身状态，向世界揭晓了其 9800 万美元的巨额融资。

在红杉资本主持的 Training Data 播客中，Dan Biderman 和 Jessy Lin 勾勒出了公司的终极演进路线：

从每天更新到每分钟更新： 目前 Engram 的系统能够让模型在企业内部每天自主消化和吸收新产生的数据。未来，他们的目标是提升数据吸收频率到“每小时”，最终实现“每分钟”甚至“实时更新”而不会发生灾难性遗忘（Catastrophic forgetting）。
去中心化的个人模型时代： Frontier 实验室（如 OpenAI、Anthropic）在拼尽全力用海量资源去堆积一个庞大、通用的 AGI。而 Engram 坚信未来的世界属于分化：“每个人、每个团队都应该拥有一个属于自己的小模型”。这个模型独立、安全、可控、极度便宜，且会在日常使用中，像一个真正的数据员工一样，每天醒来都变得比昨天更聪明。

DEV Community