2026-05-17
实现了一个 RAG Demo
用 LangChain + 向量数据库完成了第一个 RAG 应用,整个链路跑通了!
用 LangChain + Chroma 搭了一个最简单的 RAG 系统。
核心流程:
- 文档加载 → 切分 chunk
- Embedding → 存入向量库
- 检索 → 用户问题 → 相似度搜索 → Top-K 文档
- 生成 → 将检索结果塞进 prompt → LLM 回答
最大的坑:chunk size 和 overlap 的调参,太小检索不到完整语义,太大 context 爆炸。
下一步:试试 HyDE(Hypothetical Document Embeddings)看看能不能提升召回质量。