2026每周复盘 | 第 [6] 周 (2026.03.30 – 04.05)

4 月 02, 2026 YangHaixin

464 0

这一周主要还是继续进行数据爬取、整理、知识图谱入库工作。平平淡淡，每天都差不多，不停的拷打大模型写数据提取脚本、上传脚本。同时编写了一些知识库查询接口，增加API KEY验证。

周五就要溜了，回家过清明假期了，所以我在周四写了本周复盘。

💡 本周关键词：#知识入库 #API设计 #清明假期

1. 本周成就

LightRAG检索速度提升：
- 我的LightRAG使用的是Qwen3.5 397B，该模型默认是会使用思考模式，每次检索的时候调用大模型时都会去思考半天，导致检索很慢，通过修改docker里面的app/lightrag/llm/openai.py接口文件，添加extra body即可关闭思考模式，显著提升检索效率
- kwargs.update(
- {
- “extra_body”: {
- ‘chat_template_kwargs’: {“thinking”: False, “enable_thinking”: False},
- “enable_thinking”: False,
- “think”: False
- }
- }
- )
LightRAG检索接口及反向代理：
- 对LightRAG自带的API接口进行了包装，通过nginx去反向代理到查询接口，并在nginx中增加了API KEY校验功能，从而实现必须使用正确的API KEY才能进行查询的功能。
- nginx可以配置返回值，比如验证失败，返回403，然后可以自定义写一段错误提示，还挺好玩的。
LightRAG节点检索rerank：如果LightRAG只通过上传节点API进行知识图谱上传，那么其documents里面是不会有东西的，每次检索出来的chunks都为空，尽管知识图谱节点、关系内容也进入了向量数据库中。这种情况下是不会调用reranker模型对检索结果进行排序的，因此我手搓了一个节点检索rerank接口，这个接口先去调用常规的节点查询接口，然后将查询结果发送给rerank模型进行排序，最后将排序后的结果返回给用户，从而实现对节点检索rerank的功能。
个人成长：本周工作日只坚持锻炼了 3 天，周五清明放假回家了。
其他：
- 《席德梅尔的回忆录：我的计算机游戏人生》大致看完了，里面很多游戏我都没玩过，感受不深，只对《文明》的部分产生了共鸣，《文明》自诞生之初就开始成为了时间黑洞，90年代的人们就已经开始废寝忘食玩《文明》了。
- 继续阅读《挽救计划》的原版小说，小说补全了很多电影里没有的细节，目前看到了男主研究噬星体繁殖技术，也讲了休眠技术的由来，首先要拥有休眠基因才行，否则会导致大脑损伤。

2. 本周学到了什么

服务器简单运维：本周经常出现服务器CPU、内存、网络拉满的情况，需要使用合适的命令查看是什么进程在占用大量资源。
- htop: 增强版的top，按H可以把同一个进程下的多个线程隐藏起来，避免整个屏幕都是同一个进程名（只有PID不同，表明是多线程）
- df -h: 查看磁盘空间
- du: 查看目录大小，能查看当前目录各子目录大小。
  - du [选项][文件]
  - du -sh .：查看当前路径所有文件总和，并human显示
- nethogs: 进程级带宽使用情况，有时候docker容器之间传数据也会占用很多网卡带宽

3. 踩坑与解决方案

问题描述	原因分析	解决方案	避免策略
LightRAG检索速度慢	源代码中没有对大模型思考模式的配置，而Qwen3.5默认是思考模式	修改源码，在大模型调用请求体中添加关闭思考模式的内容： kwargs.update( { “extra_body”: { ‘chat_template_kwargs’: {“thinking”: False, “enable_thinking”: False}, “enable_thinking”: False, “think”: False } } )	1. 选择非思考模型 2. 修改源码

6. 本周瞬间

玩《文明》还有这种好处

打赏赞

2026每周复盘 | 第 [6] 周 (2026.03.30 – 04.05)

1. 本周成就

2. 本周学到了什么

3. 踩坑与解决方案

6. 本周瞬间

分类

友情链接

归档

分类

1. 本周成就

2. 本周学到了什么

3. 踩坑与解决方案

6. 本周瞬间

相关推荐

分类

友情链接

归档

分类