如果p是一个素数,并且p+2也是一个素数,那么p与p+2构成一对孪生素数。
像(3,5)、(5,7)、(11,13)都是孪生素数对。
自然数中是否有无穷对孪生素数,这是一个有待证明的数学问题,被称为孪生素数猜想。
要证明这个问题,我们必须先了解素数以及孪生素数的分布规律。然而素数及孪生素数的分布规律是几乎无迹可寻的,所以关于素数的问题,差不多总是一个难题。
1. 有关孪生素数的一个分布现象
下面要介绍一个我发现的孪生素数的分布现象。仔细观察素数表,我们会发现:
相邻素数的平方数之间都有至少2对以上孪生素数存在!
在4~9(2²~3²)之间,有:(3,5)、(5,7);
在9~25(3²~5²)之间,有:(11,13)、(17,19);
在25~49(5²~7²)之间,有:(29,31)、(41,43);
在49~121(7²~11²)之间,有:(59,61)、(71,73)、(101,103)、(107,109);
在121~169(11²~13²)之间,有:(137,139)、(149,151);
在169~289(13²~17²)之间,有:(179,181)、(191,193)、(197,199)、(227,229)、(239,241)、(269,271)、(281,283);
在289~361(17²~19²)之间,有:(311,313)、(347,349)
在361~529(19²~23²)之间,有:(419,421)、(431,433)、(461,463)、(521,523)
…………
上述规律是否具普适性呢?我们不妨可以做一猜想。对此猜想若能予以证明,也许是另一条通往孪生素数猜想证明的道路。
2. 对上述分布规律的证明
用P(n)表示自然数中的第n个素数。
有如下一个问题:
下述类型的自然数m在全体自然数的比例有多少:m以及m+2均不能为所有不大于P(n)的素数所整除?
假设这个比例为λ,那么答案是:
λ=1/2·(1﹣2/3)(1-2/5)(1-2/7)(1-2/11)(1-2/13)……(1-2/P(n))
我们要以这个结果为基础来证明上一节所述的分布规律。
这个结果是不难证明的。
证明如下:
不妨考虑类似埃拉托色尼筛法筛取素数的筛法过程,计算每一个步骤中筛掉的数以及保留下来的数的比例。步骤如下:
① 首先筛除偶数,此时全体自然数中剩下奇数的比例是1-1/2=1/2;
② 而在所有奇数中,满足要求的奇数m必是属于3k+2形式的奇数,不能是3k(除了3)或3k+1这两种形式的奇数,而3k+2形式的奇数占全体奇数的比例因此是1-2/3=1/3,其占全体自然数的比例则是:1/2×(1-2/3)=1/6。所以,本轮筛除后剩下的数是3以及形式为6k-1的奇数。
③ 由上一步筛剩下而所剩比例为1/6的自然数,对于5k,5k+1,5k+2,5k+3,5k+4这五种形式来说也是分布均匀的,因此在此基础上继续在这筛剩的1/6的数中筛除属于5k及5k+3这两种类型的数,于是等于再继续筛除剩下的1/6的2/5,由此而再剩下的比例是:1/2×(1﹣2/3)×(1-2/5)=1/10。剩下的数为3、5以及如下3种形式的数:30k-19,30k-13,30k-1。
④ 同理进一步考虑关于素数7。我们将得到剩下的比例是:1/2×(1﹣2/3)×(1-2/5)×(1-2/7)=1/14。剩下的数是3、5、7以及如下15种形式的奇数:210k-199, 210k-193,210k-181,210k-169,210k-151,210k-139,210k-109,210k-103,210k-73, 210k-61,210k-43,210k-31, 210k-19, 210k-13,210k-1。(提示:210=2×3×5×7=14×15)
………………
⑤ 同理,每一次几乎应筛除前次筛除剩余数的2/P(i)。
⑥ 因此,最后剩下的数在全体自然数中的比例是:
λ=1/2·∏(1-2/P(i)) (∏为乘积符号,i的取值为从2至n)
=1/2·(1﹣2/3)(1-2/5)(1-2/7)(1-2/11)(1-2/13)……(1-2/P(n))
这个证明到此基本上结束了,但存在着一个小小的漏洞。因为我们在描述上述筛除的过程中,为了计算比例方便,是把所有不大于P(n)的使得m及m+2构成孪生素数的m也视为筛除忽略不计了。
所以我们有必要说明:考虑到这些被忽略的自然数m的数量有限,相比于全体自然数中的无穷,其比例是趋向于无穷小的,所以从整体而言,对λ的取值是几乎不构成影响的。因为λ的值事实上应该看作是一个极限值。
证明完毕。
不妨将最后筛剩下的数称为M数。显然,如果自然数m是一个M数并且足够小的话,(m,m+2)将会是一对孪生素数。
因此接下来我们不妨假设有一对足够大的孪生素数对P(n)及P(n+1),然后思考如下问题:
在孪生素数平方数区间(P(n)²,P(n+1)²)中存在多少属于M数的自然数m:m以及m+2均不能为所有不大于P(n)的素数所整除?
假设存在X个这样的自然数m,由于:
(P(n+1)²-P(n)²) × λ=(P(n+1)+P(n))(P(n+1)-P(n)) × λ=4λ(P(n)+1)
从而我们可以肯定有如下关系式存在:
X≥[4λ(P(n)+1)] (这里中括号表取整)
λ是使得m以及m+2均不能为所有不大于P(n)的素数整除的所有自然数m构成的M数在全体自然数中所占的比例。
对自然数区间(P(n)²,P(n+1)²)来说,λ则是一个近似比例,一般是略小的近似。也就是说在(P(n)²,P(n+1)²)区间中,筛剩下来的数的实际比例一般会略大于λ。
所以,满足要求的自然数m在(P(n)²,P(n+1)²)区间中的实际个数X也就必然不会少于[4λ(P(n)+1)] (这里中括号表取整)。
我们不妨再做进一步说明:
规定自然数m为下述:m以及m+2都不能为所有不大于P(n)的素数整除。符合条件的这样的自然数m根据我们之前的定义可被称为M数。假设在[1,P(n)²]中M数的实际比例是λ(n),在[1,P(n+1)²]中M数实际比例是λ(n+1),在[1,P(n+2)²]中M数实际比例是λ(n+2),……,由λ(n)、λ(n+1)、λ(n+2)……构成的无穷数列各项将会是一个总体趋势递减,极限为λ的数列。也就是说,假设f(n)=λ(n),那么limf(n)=λ (n→∞)。
理由也很简单:
首先,在任意有限长度的等差数列中,筛除所有不能为素数P(i)整除或余数为P(i)-2的数,不可能筛除的数的比例刚好为1/P(i),除非该数列的项数刚好是P(i)的整数倍,否则筛除的非M数的实际比例总是会略微小于1/P(i)。其次,正如前述证明所述,有些6k-1形式的素数不能筛除而被忽略不计视为筛除。因此综合如上,最后筛剩下来的M数在自然数中的实际比例一定会略大于λ。
然后我们再观察:
4λ(P(n)+1)=4[P(n)+1]×[1/2·(1﹣2/3)(1-2/5)(1-2/7)(1-2/11)(1-2/13)……(1-2/P(n))]
=2[P(n)+1]·{[3×5×9×11×……(P(n)-2)]/[3×5×7×11×13×……×P(n)]}
>2[P(n)+1]×1/P(n)
>2
(提示:观察[3×5×9×11×……(P(n)-2)]/[3×5×7×11×13×……×P(n)]的分子与分母的特征可直接推出上述结果)
也就是说,在孪生素数平方数区间(P(n)²,P(n+1)²)中,至少存在2个以上属于M数的自然数m,m以及m+2不能为所有不大于P(n)的素数整除,并且这样的自然数m以及m+2还足够小,由于它们不可能同时又是合数又没有包含不大于P(n)的素数因子,从而这样的自然数m以及m+2必都是素数,也即为一对孪生素数。
不妨再假设(P(x),P(x+1))是(P(n)²,P(n+1)²)区间中的一对孪生素数,于是同理可证(P(x)²,P(x+1)²)中也必有孪生素数存在。这意味着自然数中不可能存在最大的孪生素数对,也就等价于证明了孪生素数猜想。
3. 进一步的更具普适性的分布规律
如果相邻素数平方数区间(P(n)²,P(n+1)²)中的(P(n),P(n+1))不是孪生素数,而是一般性的相邻素数,譬如43与47,那么情况又会怎样呢?
我们假设P(n+1)-P(n)=2d (d为自然数),于是有:
(P(n+1)²-P(n)²) × λ=4λd(P(n)+d)
=4d[P(n)+d]×[1/2·(1﹣2/3)(1-2/5)(1-2/7)(1-2/11)(1-2/13)……(1-2/P(n))]
=2d[P(n)+d]·{[3×5×9×11×……(P(n)-2)]/[3×5×7×11×13×……×P(n)]}
>2d[P(n)+d]×1/P(n)
>2d
这意味着如果相邻素数P(n+1)与P(n)之间的差为2d,那么在区间(P(n)²,P(n+1)²)中至少有2d对孪生素数。这可说是一个相当令人惊奇的规律。我们去对照素数表检验,会发现确实是成立的。
4. λ的精确度的验证
若我们令n=11,P(n)=31,此时:
λ=1/2×1/3×3/5×5/7×9/11×11/13×15/17×17/19×21/23×27/29×29/31
≈ 0.031
由此我们可以借此估算1000以内的孪生素数的对数将会不少于:1000×0.031=31。
1000以内孪生素数的实际对数为35,可见这个估值还是相当接近的。
根据我们前述第2节证明中的描述,λ值的得出过程有意忽略了相关的孪生素数对。在这个例子中,等于我们忽略了(3,5),(5,7),(11,13),(17,19),(29,31),总计5对。若再加上,则31+5=36,这个值比实际多出了1对。