GraphRAG 工作流

当前的 RAG 技术无法回答关于语料库的全局性问题,比如“这个数据集的主题是什么”。这一类问题不是可以通过检索增强技术解决的,因为答案一般不在某一段文本里面,正确答案需要理解整个语料库并给出抽象的总结,作者称这类问题为 query-focused summarization (QFS) 问题1。普通的 RAG 技术无法很好处理这个问题。

论文阅读: Outrageously Large Neural Networks-The Sparsely-Gated Mixture-of-Experts Layer

模型能力跟模型参数量有关系,模型参数量越多,数据越多,效果就越好。但训练成本也成倍上升。为了解决这个问题,大家提出了很多种条件计算(Conditional Computations)的方案,顾名思义,某些条件满足的情况下才会计算,这样就可以不增加训练成本的同时增加模型参数量,提升模型效果

什么是 Python 装饰器

如果你能够认识到函数是一等公民(First-class)的话,那么你理解 Python 装饰器应该没有什么困难。函数是一等公民(First-class)就意味着:函数也是值,和其他基本类型(int, str, float, etc)等一样,都可以作为函数的入参和返回值