2026每周复盘 | 第 [6] 周 (2026.03.30 – 04.05)

这一周主要还是继续进行数据爬取、整理、知识图谱入库工作。平平淡淡,每天都差不多,不停的拷打大模型写数据提取脚本、上传脚本。同时编写了一些知识库查询接口,增加API KEY验证。

周五就要溜了,回家过清明假期了,所以我在周四写了本周复盘。

💡 本周关键词#知识入库 #API设计 #清明假期

1. 本周成就

  • LightRAG检索速度提升:
    • 我的LightRAG使用的是Qwen3.5 397B,该模型默认是会使用思考模式,每次检索的时候调用大模型时都会去思考半天,导致检索很慢,通过修改docker里面的app/lightrag/llm/openai.py接口文件,添加extra body即可关闭思考模式,显著提升检索效率
    • kwargs.update(
    •         {
    •             “extra_body”: {
    •                 ‘chat_template_kwargs’: {“thinking”: False, “enable_thinking”: False},
    •                 “enable_thinking”: False,
    •                 “think”: False
    •             }
    •         }
    •     )
  • LightRAG检索接口及反向代理:
    • 对LightRAG自带的API接口进行了包装,通过nginx去反向代理到查询接口,并在nginx中增加了API KEY校验功能,从而实现必须使用正确的API KEY才能进行查询的功能。
    • nginx可以配置返回值,比如验证失败,返回403,然后可以自定义写一段错误提示,还挺好玩的。
  • LightRAG节点检索rerank:如果LightRAG只通过上传节点API进行知识图谱上传,那么其documents里面是不会有东西的,每次检索出来的chunks都为空,尽管知识图谱节点、关系内容也进入了向量数据库中。这种情况下是不会调用reranker模型对检索结果进行排序的,因此我手搓了一个节点检索rerank接口,这个接口先去调用常规的节点查询接口,然后将查询结果发送给rerank模型进行排序,最后将排序后的结果返回给用户,从而实现对节点检索rerank的功能。
  • 个人成长:本周工作日只坚持锻炼了 3 天,周五清明放假回家了。
  • 其他
    • 《席德梅尔的回忆录:我的计算机游戏人生》大致看完了,里面很多游戏我都没玩过,感受不深,只对《文明》的部分产生了共鸣,《文明》自诞生之初就开始成为了时间黑洞,90年代的人们就已经开始废寝忘食玩《文明》了。
    • 继续阅读《挽救计划》的原版小说,小说补全了很多电影里没有的细节,目前看到了男主研究噬星体繁殖技术,也讲了休眠技术的由来,首先要拥有休眠基因才行,否则会导致大脑损伤。

2. 本周学到了什么

  • 服务器简单运维:本周经常出现服务器CPU、内存、网络拉满的情况,需要使用合适的命令查看是什么进程在占用大量资源。
    • htop: 增强版的top,按H可以把同一个进程下的多个线程隐藏起来,避免整个屏幕都是同一个进程名(只有PID不同,表明是多线程)
    • df -h: 查看磁盘空间
    • du: 查看目录大小,能查看当前目录各子目录大小。
      • du [选项][文件]
      • du -sh .:查看当前路径所有文件总和,并human显示
    • nethogs: 进程级带宽使用情况,有时候docker容器之间传数据也会占用很多网卡带宽

3. 踩坑与解决方案

问题描述原因分析解决方案避免策略
LightRAG检索速度慢源代码中没有对大模型思考模式的配置,而Qwen3.5默认是思考模式修改源码,在大模型调用请求体中添加关闭思考模式的内容:
kwargs.update(
        {
            “extra_body”: {
                ‘chat_template_kwargs’: {“thinking”: False, “enable_thinking”: False},
                “enable_thinking”: False,
                “think”: False
            }
        }
    )
1. 选择非思考模型
2. 修改源码

6. 本周瞬间

玩《文明》还有这种好处