概念与架构¶
QuantumAtlas 是一个"分层"系统。理解三层各自的职责和它们之间的数据流,是把这个项目用对的前提。
这一节讲什么¶
为什么要分这么多层?¶
简单回答:分类和关联是两回事。
- Raw Sources 是证据链 —— 论文 PDF、MinerU 解析出的 Markdown、各种 JSON。它们存在的目的是「永远可追溯」,所以追加为主、几乎不删改。
- Wiki 是知识的 source of truth —— 经过人审阅 / LLM 辅助整理后的结构化页面。它面向「人和 LLM 都能稳定消费」。
- Neo4j 是从 Wiki 派生出来的关系索引 —— 回答「这个算法跟哪些原语相关」「哪些论文引用了它」。它不是独立事实来源,而是「Wiki 投影到图模型上的副本」。
这样的边界有两个好处:
- 让研究笔记可以被人读,也能被工具稳定消费。
- 让关系查询不污染正文;分类、叙述和图查询各在合适的地方发生。
下面的几节会把每一层讲清楚。