Better TF-IDF: BM25

最近在工作中着手模型评测平台的搭建，其中有这么一个场景：需要调用其他部门提供的 LLM API 进行在评测集上跑模型评测，但这个 LLM API 有请求速率限制 - 最多 1 秒调用 2 次（2 RPS）。所以我的任务概括来说就是：如何在严格遵守 API 速率请求的情况下，最大提高并发度加快模型评测速度。本文的内容主要记录了对这个任务的尝试，以及最后的解决方案

范畴论与编程：Functor 是什么

MartinLwx 发布于 2025-06-01 收录于类别 Programming-Languages

引言

你可能每天都在使用 Functor 但你并没有意识到这一点：当你每次使用各种容器类型的 map 方法的时候，其实就是在利用 Functor 的性质

本篇文章会分别从范畴论的视角、编程语言视角讲解 Functor，希望能对你有所帮助 :)

Transformer 架构变化：旋转位置编码 (RoPE)

MartinLwx 发布于 2025-05-24 收录于类别 ML-DL

自注意力机制回顾

用 $\mathbf x_i$ 表示没有位置编码的 token embedding，那么 $\mathbf q_m,\mathbf k_n,\mathbf v_n$ 的计算如下

$$ \begin{aligned} \mathbf q_m&=f_q(\mathbf x_m,m)\\ \mathbf k_n&=f_k(\mathbf x_n,n)\\ \mathbf v_n&=f_v(\mathbf x_n,n) \end{aligned} $$

这里的 $n, m$ 表示的是不同的位置，这里假设 $\mathbf k$ 和 $\mathbf v$ 是都是位置 $n$ 的，而 $\mathbf q$ 是位置 $m$ 的，并且 $m > n$