NOW

探索中

构建中

思考中

SCROLL

← 返回从心

2026-05-17

实现了一个 RAG Demo

用 LangChain + 向量数据库完成了第一个 RAG 应用，整个链路跑通了！

用 LangChain + Chroma 搭了一个最简单的 RAG 系统。

核心流程：

文档加载 → 切分 chunk
Embedding → 存入向量库
检索 → 用户问题 → 相似度搜索 → Top-K 文档
生成 → 将检索结果塞进 prompt → LLM 回答

最大的坑：chunk size 和 overlap 的调参，太小检索不到完整语义，太大 context 爆炸。

下一步：试试 HyDE（Hypothetical Document Embeddings）看看能不能提升召回质量。

← 更早一篇

阅读了《被讨厌的勇气》

更新一篇 →

理解了窗口函数的执行流程

← 所有从心