有限域上的挂谷集合与 Nikodym 集合

发布时间 2023-07-17 01:29:10作者: EntropyIncreaser

引入

有限域上的挂谷 (Kakeya) 集合是 \(\mathbb R^2\) 情况的挂谷集合 (又称 Besikovitch 集合) 的类比.

\(q\) 元有限域 \(\mathbb F\), 称一个集合 \(K\subset \mathbb F^n\) 是挂谷集合, 当对于任意方向 \(\ell \in \mathbb F^n\), 都存在 \(a\in \mathbb F^n\), 使得 \((a + \ell t) \in K, \forall t\in \mathbb F\), 换句话说, 就是 \(K\) 包含任意一条方向上的直线.

称一个集合 \(N\subset \mathbb F^n\) 是 Nikodym 集合, 当对于任意 \(a\in \mathbb F^n\), 要么 \(a\in N\), 要么存在一条过 \(a\) 的直线 \(\ell\), 使得 \(\ell \subset N \cup \{a\}\).

我们想要问的是, 挂谷集合和 Nikodym 集合至少要有多大? 对于固定的 \(n\) 而言, 人们一度认为得到一个 \(\Omega(q^n)\) 的下界是很难的, 但在 2008 年, Zeev Dvir 给出了简单一个漂亮的证明, 而后又被诸多人改进.

多项式方法

我们首先给出 Nikodym 集合的一个下界.

定理 1. \(|N| \geq c_n q^n\), 其中

\[c_n = \frac 1{n!}. \]

首先回忆 Schwartz–Zippel 引理:

Schwartz–Zippel 引理. 对于域上的一个 \(n\)\(d\) 次非零多项式 \(F\), 以及一个集合 \(S\), \(F\)\(S^n\) 上的零点数量不超过 \(d |S|^{n-1}\).

我们先不回顾这个引理的证明, 因为之后需要证明一个更强的结果.

一般来说我们都取 \(S = \mathbb F\), 这样我们就可以知道, 一个 \(< q\) 次多项式如果处处为 \(0\), 那么它一定是零.

现在我们证明定理 1.

证明. 考虑全体度数 \(<q-1\) 的多项式构成的线性空间 \(V =\mathbb F[X]_{<q-1}\), 令同态 \(\phi \colon V \to \mathbb F^N\) 定义为 \(\phi(F)_a = F(a)\), 也就是多项式求值. 考虑检查 \(\ker \phi\), 也就是在 \(N\) 上消没的多项式.

如果 \(a\in N\), 根据定义, 我们有 \(F(a)=0\). 如果 \(a\notin N\), 根据 Nikodym 集的定义, 我们有一条直线 \(\ell(t)\) 使得 \(\ell(0)=a\), 且 \(F(\ell(t))=0, \forall t\neq 0\). 注意 \(\ell\) 是一次函数, 所以 \(F(\ell(t))\)\(<q-1\) 次多项式, 但我们已知它有了 \(q-1\) 个零点.

这说明 \(F(\ell(t))\) 整个就是零多项式, 带入 \(0\) 也必然是 \(0\), 我们有 \(F(a) = 0\).

综上, \(F\) 在整个 \(\mathbb F^n\) 上消没, 而 \(F\) 又是度数小于 \(q\) 的, 这说明 \(F\) 只能是零.

综上, \(\phi\) 是单射, 必然有 \(\dim V \leq |N|\), 简单数数可以知道

\[\dim V = \binom{n + q-1}{n} \geq \frac 1{n!} q^n. \]

因此 \(|N| \geq q^n/n!.\square\)

相比之下, 挂谷集合的证明更具有技巧性一些. 或者说, 这个证明本质上需要一些其他方面的洞察来帮助.

定理 2 (Dvir) \(|K| \geq c_n q^n\), 其中

\[c_n = \frac 1{n!}. \]

证明. 考虑求值 \(\phi \colon \mathbb F[X]_{<q} \to \mathbb F^K\).

对于任何一个非零多项式 \(F\in \ker \phi\), 将它写成各齐次部分的和 \(F = F_0 + \cdots + F_d\), 其中 \(F_d\neq 0\).

对于任意 \(\ell\in \mathbb F^n\), 根据挂谷集合的定义, 有 \(a\in \mathbb F^n\) 使得 \(F(\ell t + a)\) 处处为 \(0\), 进而是零多项式. 考察 \(F(\ell t + a)\)\(d\) 次项系数, 它只能被 \(F_d\) 贡献, 而且等于 \(F_d(\ell)\), 所以 \(F_d(\ell) = 0\). 由于这对一切 \(\ell\) 都成立, 所以 \(F_d = 0\), 矛盾.

所以 \(\phi\) 是单射, 我们有

\[|K| \geq \dim F[X]_{<q} = \binom{n+q}{n} \geq \frac 1{n!}q^n. \square \]

观察最高次项的这个洞察可以用射影几何的角度来解释. 射影空间可以看做以仿射空间所有过原点的直线来当做点, 而一个多项式的最高齐次部分刻画了 "无穷远处" 的性质.

带重数的多项式方法

我们这里定义 \(F\in \mathbb F[X_1,\dots,X_n]\) 在点 \(a\) 处的重数 \(\mu(F,a)\) 是最大的正整数 \(\delta\) 使得 \(F \in (X_1-a_1,\dots,X_n-a_n)^\delta = \mathfrak{m}_a^\delta\), 或者等价地说, 对于任意 \(e\in \mathbb N^n\) 使得 \(\sum e_i < \delta\), 定义

\[F^{(e)}(X) = \sum_{i} f_{i} \binom{i_1}{e_1} \cdots \binom{i_n}{e_n} X_1^{i_1-e_1}\cdots X_1^{i_n-e_n}, \]

\(F^{(e)}(a) = 0\).

为了利用重数, 我们需要更强的 Schwartz–Zippel 引理.

加强版 Schwartz–Zippel 引理. 对于域上的一个 \(n\)\(d\) 次非零多项式 \(F\), 以及一个集合 \(S\), \(F\)\(S^n\) 上的重数总和不超过 \(d |S|^{n-1}\).

证明. 方法大同小异, 考虑进行归纳. 归纳的基础是 \(n=1\) 的情况, 这个时候多项式有唯一分解, 正确性是显然的.

接下来, 将多项式写成 \(F = \sum_i X_1^{d-i} F_i\), 其中 \(F_i\) 是关于 \(X_2,\dots,X_n\) 的不超过 \(i\) 次多项式. 我们取最小的 \(i\) 使得 \(F_i\) 非零. 我们考虑首先枚举 \(a_2,\dots,a_n\). 假设 \(F_i\)\((a_2,\dots,a_n)\) 处的重数是 \(m\), 也就是说存在一个 \(e' = (e_2,\dots,e_n)\) 使得 \(F_i^{e'}(a_2,\dots,a_n)\neq 0\), 那么\(f(X_1) = F^{(0,e')}(X_1,a_2,\dots,a_n)\)\(d-i\) 次多项式, 在 \(a_1\in S\) 处的重数为 \(e_1\) 的话, 则 \(a_1,\dots,a_n\)\(F\) 的重数不超过 \(e_1 + e_2 + \cdots + e_n\). 求和得到重数之和 \(\leq (d-i)|S|^{n-1} + |S| \cdot i|S|^{n-2} = d\cdot |S|^{n-1}\). \(\square\)

注意这个不等式对于 \(d \geq |S|\) 也是有意义的.

现在我们可以证明一些更强的估计了.

定理 3.

\[|N| \geq \left(\frac{q}{2}\right)^n. \]

证明. 我们先考虑一个多项式 \(F\) 次数不超过 \(d\), 且在每个 \(N\) 的点上的消没次数都至少是 \(m\).

我们选定 \(v < m\), 对于任意一个点 \(a\notin N\), 我们知道有 \(\ell \neq 0\) 使得 \(\ell t + a\) 在其他点上交于 \(N\). 那么考虑对于任意 \(|e| < v\), Hasse 导数有 \(F^{(e)}\)\(N\) 上消没次数 \(\geq m-v\), 如果 \((m-|e|)(q-1) > d-|e|\), 那么 \(F^{(e)}(a\ell + t)\) 就是 \(0\) 多项式, 必然有 \(F^{(e)}(a) = 0\) 了, 因此在 \(a\) 处的消没次数至少是 \(v+1\).

进一步地, 根据强 Schwartz–Zippel 引理, 如果一个多项式处处消没次数 \(\geq v\), 我们就有 \((\deg F)q^{n-1} \geq (v+1)\cdot q^n\), 进而 \(d \geq (v+1)\cdot q\). 所以如果我们再加上 \(d < (v+1)\cdot q\), 这样的多项式就是不存在的了.

综上, 如果我们的参数满足

\[d < \min\{ (m-v)(q-1)+v, (v+1) q \}, \]

映射 \(\phi \colon \mathbb F[X_1,\dots,X_n]_{\leq d} \to (\mathbb F[X_1,\dots,X_n]_{<m})^{N}\) 就是单射, 因此

\[|N| \cdot \binom{n+m-1}{n} \leq \binom{n+d}{n}. \]

\[v = \frac{m(q-1)-q}{2q-2} \]

的时候 \(d\) 可以达到最大值, 此外有无穷多的 \(m\) 使得这个 \(v\) 是整数, 这个时候

\[\lim_{m\to\infty} \left(\frac{d}{m}\right) = 1/2, \]

进而

\[|N| \geq \lim_{m\to\infty} \frac{\binom{n+d}{n}}{\binom{n+m-1}{n}} = \left(\frac q 2\right)^n. \square \]

结合定理 2 和 3 的证明经验, 我们可以得到类似的对于挂谷集合的估计

定理 4 (Dvir, Kopparty, Saraf, Sudan)

\[|K| \geq \left(\frac{q}{2-1/q}\right)^n. \]

Hilbert 函数

定义 \(A=\mathbb F[X_1,\dots,X_n]\), 对于理想 \(I\), 定义 \(I_{\leq d}\)\(I\) 中度数 \(\leq d\) 的部分, 构成一个线性空间, 对此可以定义仿射 Hilbert 函数

\[\operatorname{{^a}HF}_I(d) = \dim A_{\leq d}/I_{\leq d} = \binom{n+d}{n} - \dim I_{\leq d}, \]

接下来我们简记作 \(H_I(d)\). 对于点集 \(X\subset \mathbb F^n\), 我们定义 \(H(X,d) = H_{I(X)}(d)\).

我们需要用到 FKG 不等式来证明一个需要的结论, FKG 不等式本身的证明我们略去.

FKG 不等式 (Fortuin–Kasteleyn–Ginibre) 对于分配格 \(L\) 上的对数超模 (log supermodular) 函数 \(\mu(x)\mu(y) \leq \mu(x\land y)\mu(x\lor y)\), 有

\[\langle f \rangle \langle g \rangle \leq \langle fg\rangle \langle 1\rangle, \]

其中 \(f,g\)\(L\) 上的单调递增函数, 且 \(\langle f\rangle = \sum_x f(x)\mu(x)\).

引理. 对于点集 \(X\subset \mathbb F^n\), 有 \(H(\mathbb F^n, d) |X| \leq H(X, d) q^n\).

证明. 这个证明的方法是将 \(H(X, d)\) 转化成一个具体的几何对象上的点数. 考虑一个单项式的分级序, 比如 \(a < b\)\(|a| < |b|\), 或 \(|a|=|b|\)\(a\) 字典序小于 \(b\).

一个基本的事实是, \(H(X,d)\) 就是形如 \(|a| \leq d\)\(X_1^{a_1}\cdots X_n^{a_n}\) 不是任何一个 \(I\) 中的多项式的首项 (按照分级序确定) 的倍数, 我们记这些 \(a\) 构成集合 \(S\), 那么 \(H(X,d)=|S|\). 此外, 由于 \(X\subset \mathbb F^n\), 有 \(I(X)\supset I(\mathbb F^n) = (X_1^q-X_1,\dots,X_n^q-X_n)\), 进而有 \(S \subset \{0,\dots,q-1\}^n\).

我们考虑 \(\{0,1,\dots,q-1\}^n\) 上的分配格 \(\geq\), 显然 \(f(x) = [x\in S]\) 是单调递增的, \(g(x) = [|x| \leq d]\) 也是单调递增的. 所以根据 FKG 不等式, 取 \(\mu = 1\), 有

\[\langle f \rangle \langle g \rangle \leq \langle fg\rangle \langle 1\rangle, \]

带入得到 \(|X| H(\mathbb F^n,d) \leq H(X,d) q^n\). \(\square\)

回忆 Zariski 闭包 \(\overline X = V(I(X))\) 是把所有在 \(X\) 上零化的多项式的零点集取交, 我们考虑 \(Z_d(X) = V(I(X)_{\leq d})\), 这能一定程度上类比我们对于之前做的操作.

定理 5 (聂, Wang)

\[H(\mathbb F^n, d) |Z_d(X)| \leq q^n |X|. \]

证明. 首先, 根据前述引理, 有

\[H(\mathbb F^n, d) |Z_d(X)| \leq q^n H(Z_d(X), d). \]

接着, 注意到 \(Z_d(X) \supset X\), 所以 \(I(Z_d(X)) \subset I(X)\), 进而 \(I(Z_d(X))_{\leq d} \subset I(X)_{\leq d}\). 另一方面, 如果 \(f\in I(X)_{\leq d}\), 那么按照定义, \(f\) 也零化了 \(Z_d(X)\), 所以 \(I(X)_{\leq d} = I(Z_d(X))_{\leq d}\), 所以

\[q^n H(Z_d(X), d) = q^n H(X, d). \]

最后, 注意到 \(H(X,d)\) 随着 \(d\) 的增加而增加, 收敛到 \(|X|\), 我们有 \(H(X,d)\leq d\). 结合这三个不等式或等式就得到了 \(H(\mathbb F^n, d) |Z_d(X)| \leq q^n |X|\). \(\square\)

挂谷问题的 Statistical 版本是指将控制从 "对所有都成立" 改成 "对很多成立", 由于多项式只要确定了足够多的点就能确定本身, 可以预见的是这也是能有一定的控制的.

我们考虑运用定理 5, 对于集合 \(Y\), 如果 \(x\in X\) 都存在一条直线经过 \(x\) 以及至少 \(Y\) 上的 \(d\) 个点, 那么对于任何一个次数 \(<d\) 的多项式零化 \(Y\), 我们必然有 \(x\) 也被这个多项式零化, 因此 \(X\subset Z_{d-1}(Y)\), 进而有

\[|X| \leq |Z_{d-1}(Y)| \leq q^n \frac{|Y|}{H(\mathbb F^n, d-1)}, \]

由于 \(d \leq q\) 时有 \(H(\mathbb F^n, d-1)\), 我们有 \(H(\mathbb F^n, d-1) = \binom{n+d-1}{n} \geq d^n/n!\), 对于 \(d = \gamma q\), 我们有

\[|Y| \geq \frac{\gamma^n}{n!} |X|. \]

带重数的 Hilbert 函数

\(H^m(X,d) = \operatorname{{^a}HF}_{I(X)^m}(d)\), 注意 \(I(X)^m\) 对有限集来说也就是在 \(X\) 每个点上消没次数至少是 \(m\) 的多项式.

接下来, 我们还可以把原先定义的 \(Z_d(X)\) 拓展到 \(Z_d^{\ell,m}(X)\), 定义为

\[Z_d^{\ell,m}(X) = V^\ell(I^m(X)_{\leq d}), \]

也就是说, \(y\in Z_d^{\ell,m}(X)\), 当任何在 \(X\) 上消没次数 \(\geq m\) 的次数 \(\leq d\) 的多项式都在 \(y\) 上消没次数 \(\geq \ell\).

对于结合重数论证, 我们可以对 Statistical 版本的挂谷问题有更好的上界.

定理 6 (聂, Wang) 对于 \(X, Y\subset \mathbb F^n\), 每个 \(x\in X\) 都有一条次数不超过 \(\Lambda\) 的曲线 \(C_x(t)\)\(x\), 且交 \(Y\) 于至少 \(\tau\) 个点, 假设 \(\tau > \Lambda\), 那么

\[|X| \leq \left(1 + \frac{\Lambda(q-1)}{\tau}\right)^n |Y|. \]

证明. 先假设选取的 \(d, \ell, m\) 满足 \(\Lambda d < \tau(m-\ell + 1) + \Lambda(\ell - 1)\), 我们证明此时 \(X\subset Z_d^{\ell, m}(Y)\): 对于任意一个 \(x\in X\), 根据定义, 有次数不超过 \(\Lambda\)\(C_x(t)\) 经过 \(Y\) 至少 \(\tau\) 次. 那么对于任意一个多项式 \(f \in I^m(Y)_{\leq d}\), 而对于任意 \(i=|e| < \ell\), 我们欲证明 \(f^{(e)}(C_x(0)) = f^{(e)}(x)=0\).

考虑 \(f^{(e)}(C_x(t))\) 是一个 \(\Lambda(d-i)\) 次多项式, 它在 \(\tau\) 个位置具有 \(\geq m-i\) 阶重数, 为了保证它是 \(0\), 只需 \(\Lambda(d-i) < \tau(m-i)\), 也即 \(\Lambda d -\tau m <(\Lambda-\tau)i\), 为了使得所有 \(i<\ell\) 都满足, 只需 \(\Lambda d -\tau m <(\Lambda-\tau)(\ell-1)\), 整理一下可以发现这是前面所设的条件足够导出的.

因此我们一定有 \(x\in V^\ell(I^m(X)_{\leq d})\), 那么就有 \(X\subset Z_d^{\ell, m}(Y)\) 了.

又设 \(d\geq (\ell - 1)q + n(q-1)\), 考虑 \(H^\ell(X, d)\), 考虑 \(I(X)^\ell \supset I(\mathbb F^n)^\ell = (X_1^q-X_1,\dots,X_n^q-X_n)^\ell\), 这说明 \((X_1^q-X_1,\dots,X_n^q-X_n)^\ell\)

\[\prod_i (X_i^q-X_i)^{a_i},\quad \sum_i a_i = \ell \]

张成, 所以在数点的时候, 如果 \(X_1^{d_1}\cdots X_n^{d_n}\) 满足

\[\sum_i \left\lfloor \frac{d_i}{q}\right\rfloor \geq \ell, \]

就有 \(X_1^{d_1}\cdots X_n^{d_n}\) 一定偏序某个生成元. 我们进一步把条件放宽成

\[\sum_i \frac{d_i-q+1}{q} > \ell - 1, \]

就得到了 \(\sum_i d_i > n(q-1) + (\ell-1) q\) 一定可以被排除. 所以所有的点都包含在 \(d\leq (\ell -1)q + n(q-1)\) 中, 我们就有

\[H^\ell(X,d) = H^\ell(X) = |X| \binom{n+\ell-1}{n}. \]

接下来, 由于 \(X\subset Z_d^{\ell, m}(Y)\), 我们有 \(H^\ell(X,d) \leq H^\ell(Z_d^{\ell, m}(Y), d)\), 而

\[H^\ell(Z_d^{\ell, m}(Y), d) = H(I^\ell(V^\ell(I^m(Y)_{\leq d})), d), \]

显然 \(I^\ell(V^\ell(\bullet)) \supset \bullet\), 所以

\[H(I^\ell(V^\ell(I^m(Y)_{\leq d})), d) \leq H(I^m(Y)_{\leq d}, d) = H^m(Y, d). \]

最后, 必然有

\[H^m(Y, d) \leq |Y| \binom{n + m-1}{n}, \]

综合整个不等式链条, 我们得到了

\[|X| \binom{n+\ell-1}{n}\leq |Y| \binom{n + m-1}{n}. \]

\[\frac{\binom{n + m-1}{n}}{\binom{n+\ell-1}{n}} \sim \left(\frac m \ell\right)^n, \]

我们所设的条件下 \(m/\ell\) 由不等式

\[\Lambda[(\ell-1)q + n(q-1)] \leq \tau(m-\ell+1)+ \Lambda(\ell-1) \]

控制, 易见 \(m/\ell\) 趋近于 \(\Lambda(q-1)/\tau + 1\), 所以就有

\[|X| \leq \left(1 + \frac{\Lambda(q-1)}{\tau}\right)^n |Y|. \square \]

和前面不带 Hilbert 函数的推论做比较, 比如取 \(\tau = \gamma q\)\(\Lambda = 1\), 我们就有

\[|X| \leq \left(1 + \frac 1{\gamma} - \frac{1}{\gamma q}\right)^n |Y|. \]