因证明了关于卡迈克尔数分布的重要结果,时年17岁的丹尼尔•拉森(Daniel Larsen)曾在去年引起一定程度的轰动,并被媒体誉为“天才少年”。2023年10月18日,随着该论文修改稿在论文预印本网站在线发布,丹尼尔•拉森再次吸引无数数学爱好者及一些学生家长的目光。
与丹尼尔•拉森一道受到数学爱好者们关注的,还有卡迈克尔数。引人注意的是,丹尼尔•拉森的证明与张益唐关于孪生素数问题的研究存在着相当程度的关联。本文着重介绍有趣的卡迈克尔数,并简要讲述丹尼尔•拉森这位“天才少年”的成长故事。
一、“互素”“同余”与“同余算术”
要较为完整地了解这个故事,我们需要先大致了解与此相关的一些基础数学知识。
首先需要了解的是素数。对于素数,相信大家都已经耳熟能详,它们就是大于1,但不能分解为两个大于1的因数之乘积的自然数(为便于阅读,本文中所有“数”都指自然数)。例如,2,3,5,7,11都是素数。不是素数而又大于1的数被称为“合数”,例如,6和9都是合数,因为它们分别可以写成2⤫3和3⤫3。
两个数如果没有公因数,或者说它们的“最大公因数”是1,那么我们就说这两个数是“互素”的。例如,8和11是互素的,但6和9不是互素的,它们有公因数3。
我们还需要了解的两个数学术语是“同余”与同余算术。简而言之,“同余”的意思就是“余数相同”,具体解释,就是两个被除数,对同一个除数的余数相同——这里,商是多少我们不关心,我们只关心余数。例如,以6为除数,被除数14和8的余数是相同的,所以我们说“14与8对模6是同余的”。对此,我们记成:14 ≡ 8mod(6)。
上面这种表达式叫做“同余式”,其中,mod(6) 意思是式子两边的数之公共除数为6,它称为同余式的“模”。对同一个模m,如果a≡bmod(m) 与c≡dmod(m) 都成立,那么同余式:
a + c≡b + dmod(m)
a - c≡b - dmod(m)
ac≡bdmod(m)
ak≡bkmod(m)
也都成立。我们来证明其中第三个:
由于c≡dmod(m) 的意思是c与d除以m的余数相同,因此,c - d等于m的某个倍数,也就是说,存在整数k,使得c – d = mk。于是:
ac – bd=a(km + d) –bd
=akm + ad – bd
=akm+d(a - b)
由已知条件a≡b mod(m),知a - b可以被m整除,因此,ac – bd也可以被m整除,也就是说:ac≡bdmod(m)。
以上三个式子表明,同余式关于加法、减法和乘法都可以像等式那样“正常运算”。那么,我们知道“等式可以除以等式”,同余式是不是可以呢?答案是:不行!具体情况需要具体分析,分析的方法是把同余式写成除法关系式,用这些除法关系式来考虑问题。尽管如此,我们还是可以得到两个简单的结论:
其一,如果k与m是互素的,那么我们可以由同余式:ka≡kb mod(m)。
得到同余式:a≡b mod(m)。
换句话说,当k与m没有公因数的时候,我们的确可以将因数k从同余式两边“约去”。
其次,如果k是m的因数,或者等价地说,如果m = kn,那么,从同余式ka≡kb mod(m) 得到的就是:a≡b mod(n)。
这种情况下的“约分”,就连模m里面的因数也一起“约去”了。
二、费马小定理与卡迈克尔数
谈论本文的主题之前,我们还必须介绍著名的“费马小定理”。这个定理的一种表述方式是:
费马小定理:如果p是素数,而a是自然数,则ap- a可以被p整除,即ap– a≡0mod(p)成立。
很自然地,好奇的人们会考虑与这个定理相关的命题,其中,重要的命题有如下两个:
命题1:若n使得同余式2n–2≡0mod(n),则n必为素数。
命题2(费马小定理的逆命题):若n使得同余式an– a≡0mod(n)对所有自然数a都成立,则n必为素数。
在此有一段小插曲。清朝同治、光绪年间,英国曾派驻中国一位外交官叫威妥玛(Thomas Wade,1818-1895)。在汉语拼音正式出台之前,他发明的“威妥玛拼音”是影响最大的汉语拼音方案。有意思的是,威妥玛误听人言,向欧洲传回了一条错误的信息。他说,早在孔子的年代,中国人就已经有如下关于素数的“定理”:
中国假设:若n为素数,则同余式2n–2≡0mod(n)成立。
反之,若n使上述同余式成立,则n必为素数。
显而易见,中国假设的前半是费马小定理的推论,后半则是前述命题1。1898年,詹斯(James Jeans,1877-1946)指出:前述命题1是错误的,最小的反例是341。他指出,341 = 11⤫31,是一个合数,但是:
25= 32 ≡ 1mod(31)
25= 32 ≡ -1mod(11)
所以:
2340= (25)68≡ 168≡ 1mod(31)
2340=(25)68≡ (-1)68≡ 1mod(11)
因此:
2340≡ 1mod(31⤫11)
2341≡ 2mod(31⤫11)
这就是说:2341- 2≡ 0mod(341)。
1899年,在引述詹斯的结果之后,科塞尔特(Alwin Korselt,1864-1947)进一步考虑了前述命题2,给出了如下“科塞尔特准则”。
科塞尔特准则:自然数n使得同余式an– a≡0mod(n)对所有自然数a都成立,当且仅当n没有平方因子,且对n的所有素因子p,都有n–1≡0mod(p-1)。
在费马小定理的视角之下,满足科塞尔特准则的合数与素数非常相似,因此它们被称为“费马伪素数”。1910年,卡迈克尔(Robert Carmichael,1879-1967)开创性地应用欧拉φ-函数研究这种伪素数,证明它们至少拥有三个素因数,并给出了3⤫11⤫17,5⤫13⤫17,7⤫13⤫31,7⤫31⤫73等具体的三个素因数的费马伪素数。出于对其开拓性研究的尊重,数学界从此将费马伪素数称为“卡迈克尔数”。
1939年,切尔尼克(Jack Chernick,1911-1971)深入研究具有三个、四个或更多素因数的卡迈克尔数的乘积表达式,得到了多个重要的结果。对于三个素因数的卡迈克尔数,切尔尼克证明它们具有如下形式:F3=(2r1h+1)(2r2h+1)(2r3h+1)。
其中,r1,r2,r3两两互素,而(2r1h+1),(2r2h+1),(2r3h+1)则均为素数。
例如,对于h=3M, r1=1,r2=2,r3=3,我们得到U3=(6M+1)(12M+1)(18M+1),只要非负整数M使得(6M+1),(12M+1),(18M+1)都是素数,则这三个素数的乘积,即(6M+1)(12M+1)(18M+1),就一定是一个卡迈克尔数。事实上,当M=1时,我们得到的是7⤫13⤫19,它确实是一个卡迈克尔数。
可用于搜索卡迈克尔数的三因数乘积式有很多,常见的还有:
U3=(10M+7) (20M+13) (50M+31);
U3=(24M+13) (72M+37) (192M+97);
U3=(60M+41) (90M+61) (150M+101);
U3=(40M+3) (200M+11) (320M+17)。
其中,最后一式对应于h=20M+1, r1=1,r2=5,r3=8。当M=0时,得到的是最小的卡迈克尔数:3⤫11⤫17=561。
有意思的是,中国业余数学爱好者余建春在2016年给出了一个搜索卡迈克尔数的新公式:Y3=(6M+1)(54M2+12M+1)(18M+1)。
并因此一时间红遍整个网络。平心而论,这个研究成果远非有些报道所说的那样“破解了世界难题”,但它是切尔尼克研究的延伸,是一个有新意的结果。
三、难题:证明卡迈克尔数的伯纳德-切比雪夫定理
从切尔尼克的研究可以看到,对于同一个d,很多卡迈克尔数都是一组形如kd+1的素数的乘积。
数论界把小于x的素数的个数记为π(x),称之为素数计数函数,并且很早就得到如下重要结果:π(x) ~x/ ln(x)。
当d与a互素时,所有形如kd+a的自然数构成等差数列,将其中小于x的素数的个数表示为π(x; d, a),则π(x,d, a)有与π(x)相关的公式:π(x; d, a) ~ π(x) / φ(d)。
其中,φ(d)是欧拉φ-函数,即不超过d且与d互素的自然数的个数。
可以证明,对于a = 1及ε>0,存在自然数xε,当x>xε时,即有:π(x; d, 1) > 0.5•π(x) / φ(d)。
这就是说,在形如kd+1的自然数构成等差数列中,只要x足够大,小于x的素数个数就将至少达到ln(x)的数量级,与d互素的自然数的个数越少,数列中的素数就越多。
很显然,小于x而形如kd+1的素数越多,等于其中若干素数乘积的卡迈克尔数存在的可能性就越大。上述素数计数公式给出一个强烈的暗示:存在很多这种形式的卡迈克尔数。
研究卡迈克尔数的人都知道,科塞尔特准则有一个重要但容易证明的推论:
假设S是一个由若干奇素数组成的集合,L等于集合{p-1|p∈S} 中所有数的最小公倍数。如果Q是S的子集,c等于Q中所有素数的乘积,并且c≡ 1 (mod L),则c是一个卡迈克尔数。
如果一个数的所有素因数都很小,那么它就是拉马努金所说的“高度合数”。当L是一个高度合数时,检验同余式c≡ 1 (mod L)是否成立的工作就相对容易。1992年,四川大学的张明志将L取为高度合数,从上述推论出发,给出了一个搜索巨大卡迈克尔数的新方法。
受张明志的启发,应用前述关于形如kd+1的素数的计数公式,阿尔福德(William R. Alford,1926 - 2022)、格兰维尔(Andrew Granville)和波默兰斯(Carl Pomerance)在1994年证明,对于充分大的高度合数L,存在自然数d,使得许多组形如kd+1的素数的乘积关于模L的余数都等于1,进而证明存在无穷多个卡迈克尔数。
应用前人关于从x1-E到x之间素数个数的计数结果,阿尔福德等人证明,对于充分大的x,不超过x的卡迈克尔数至少有x1/3个。
关于素数的分布规律,叙述最为简洁的是著名的伯纳德-切比雪夫定理:对任何大于2的自然数n,在n和2n之间存在至少一个素数。
阿尔福德等人的方法给出了(当x充分大时)区间[1,x]内卡迈克尔数个数的一个下限,却无法证明这个区间的后半——即[x/2,x]——卡迈克尔数的存在性。这个后一半区间卡迈克尔数的存在性就是卡迈克尔数的伯纳德-切比雪夫定理。阿尔福德等人断定,证明卡迈克尔数的伯纳德-切比雪夫定理将是一项极其艰难的任务。沿着阿尔福德等人的思路,仅考虑形如kd+1的素数时无法证明卡迈克尔数的伯纳德-切比雪夫定理。
四、丹尼尔•拉森的研究
直到此时,才轮到我们的主人公出场。
丹尼尔•拉森提出一个大胆的设想:同时考虑形如kd+1和kd'+1的素数组合,或许可以证明[x/2,x]内卡迈克尔数的存在性。幸运的是,梅纳德(James Maynard)在改善张益唐关于孪生素数的结论时提出了创新性的办法,证明了对于不小于246的h,间隔为h的“素数对”x与x+h的分布规律。丹尼尔•拉森读懂了梅纳德的论文,将梅纳德的方法创造性地用于形如kd+1和kd'+1的素数组合,证明了对于差距不大的d和d',kd+1和kd'+1同为素数的频率的一个下限。
因为形如kd+1和kd'+1的“素数对”的大量存在,丹尼尔•拉森得以使用修正的阿尔福德等人的方法,证明如下突破性结果:
对任何正小数δ,以及依赖于δ的充分大的自然数n,在n与之间,至少存在
个卡迈克尔数。
如果觉得上述结果过于复杂,我们可以归纳出一个弱化但简单易记的结果:
当n > 3300时,n与2n之间总是存在卡迈克尔数。而且n趋于无穷大时,n与2n之间卡迈克尔数的个数也趋于无穷大。
读者自行对比即可看出,这一描述也就是在限定条件(n > 3300)下的卡迈克尔数的伯纳德-切比雪夫定理。
我们看到,对所谓“中国假设”的否定性研究催生了科塞尔特准则;张明志对高度合数的使用启发了阿尔福德等人,成为他们证明卡迈克尔数个数的无穷性的起点;而张益唐的研究点燃了拉森研习数学的热情,梅纳德对张益唐证明方法的改进则成为拉森突破性研究的关键。在卡迈克尔数研究的几个主要节点上都有中国人的踪迹,这不能不说是一个颇有趣味的巧合。
丹尼尔•拉森的父亲迈克尔•拉森(Michael Larsen)和母亲阿耶莱特•林登斯特劳斯(Ayelet Lindenstrauss)都是印第安纳大学的数学教授,家里浓厚的数学氛围对他产生了极为深刻的影响。
2013年开始,张益唐关于孪生素数问题的突破性进展成为其父母谈论的话题,这引起童年丹尼尔•拉森的强烈兴趣,他决心了解这个让父母佩服不已的数学成就,并择机开始自己的数学研究。从高一年级起,丹尼尔•拉森就开始尝试研读张益唐、梅纳德和陶喆轩等前沿数学家有关孪生素数问题的论文。尽管这些论文对于中学生来说过于艰深,但丹尼尔•拉森性格坚韧,从不轻言放弃。
在几个月的摸索之后,他实事求是地将研究方向确定为看似相对容易而又与上述几位数学家的工作颇有关联的问题——卡迈克尔数的分布问题,并在17岁时证明了前述关于卡迈克尔数分布的突破性结果,成为轰动一时的“天才少年”。
如果说丹尼尔•拉森的故事有什么启发意义,我们大概可以说:优越的家庭教育环境、良好的天分和不懈的努力,都是造就“天才少年”的关键因素。