Faster BN_mod_sqrt algorithm for p == 5 (8).
[openssl.git] / crypto / bn / bn_sqrt.c
1 /* crypto/bn/bn_mod.c */
2 /* Written by Lenka Fibikova <fibikova@exp-math.uni-essen.de>
3  * and Bodo Moeller for the OpenSSL project. */
4 /* ====================================================================
5  * Copyright (c) 1998-2000 The OpenSSL Project.  All rights reserved.
6  *
7  * Redistribution and use in source and binary forms, with or without
8  * modification, are permitted provided that the following conditions
9  * are met:
10  *
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer. 
13  *
14  * 2. Redistributions in binary form must reproduce the above copyright
15  *    notice, this list of conditions and the following disclaimer in
16  *    the documentation and/or other materials provided with the
17  *    distribution.
18  *
19  * 3. All advertising materials mentioning features or use of this
20  *    software must display the following acknowledgment:
21  *    "This product includes software developed by the OpenSSL Project
22  *    for use in the OpenSSL Toolkit. (http://www.openssl.org/)"
23  *
24  * 4. The names "OpenSSL Toolkit" and "OpenSSL Project" must not be used to
25  *    endorse or promote products derived from this software without
26  *    prior written permission. For written permission, please contact
27  *    openssl-core@openssl.org.
28  *
29  * 5. Products derived from this software may not be called "OpenSSL"
30  *    nor may "OpenSSL" appear in their names without prior written
31  *    permission of the OpenSSL Project.
32  *
33  * 6. Redistributions of any form whatsoever must retain the following
34  *    acknowledgment:
35  *    "This product includes software developed by the OpenSSL Project
36  *    for use in the OpenSSL Toolkit (http://www.openssl.org/)"
37  *
38  * THIS SOFTWARE IS PROVIDED BY THE OpenSSL PROJECT ``AS IS'' AND ANY
39  * EXPRESSED OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
40  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR
41  * PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE OpenSSL PROJECT OR
42  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
43  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT
44  * NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
45  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
46  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
47  * STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
48  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED
49  * OF THE POSSIBILITY OF SUCH DAMAGE.
50  * ====================================================================
51  *
52  * This product includes cryptographic software written by Eric Young
53  * (eay@cryptsoft.com).  This product includes software written by Tim
54  * Hudson (tjh@cryptsoft.com).
55  *
56  */
57
58 #include "cryptlib.h"
59 #include "bn_lcl.h"
60
61
62 BIGNUM *BN_mod_sqrt(BIGNUM *in, const BIGNUM *a, const BIGNUM *p, BN_CTX *ctx) 
63 /* Returns 'ret' such that
64  *      ret^2 == a (mod p),
65  * using the Tonelli/Shanks algorithm (cf. Henri Cohen, "A Course
66  * in Algebraic Computational Number Theory", algorithm 1.5.1).
67  * 'p' must be prime!
68  */
69         {
70         BIGNUM *ret = in;
71         int err = 1;
72         int r;
73         BIGNUM *b, *q, *t, *x, *y;
74         int e, i, j;
75         
76         if (!BN_is_odd(p) || BN_abs_is_word(p, 1))
77                 {
78                 if (BN_abs_is_word(p, 2))
79                         {
80                         if (ret == NULL)
81                                 ret = BN_new();
82                         if (ret == NULL)
83                                 goto end;
84                         if (!BN_set_word(ret, BN_is_bit_set(a, 0)))
85                                 {
86                                 BN_free(ret);
87                                 return NULL;
88                                 }
89                         return ret;
90                         }
91
92                 BNerr(BN_F_BN_MOD_SQRT, BN_R_P_IS_NOT_PRIME);
93                 return(NULL);
94                 }
95
96         if (BN_is_zero(a) || BN_is_one(a))
97                 {
98                 if (ret == NULL)
99                         ret = BN_new();
100                 if (ret == NULL)
101                         goto end;
102                 if (!BN_set_word(ret, BN_is_one(a)))
103                         {
104                         BN_free(ret);
105                         return NULL;
106                         }
107                 return ret;
108                 }
109
110 #if 0 /* if BN_mod_sqrt is used with correct input, this just wastes time */
111         r = BN_kronecker(a, p, ctx);
112         if (r < -1) return NULL;
113         if (r == -1)
114                 {
115                 BNerr(BN_F_BN_MOD_SQRT, BN_R_NOT_A_SQUARE);
116                 return(NULL);
117                 }
118 #endif
119
120         BN_CTX_start(ctx);
121         b = BN_CTX_get(ctx);
122         q = BN_CTX_get(ctx);
123         t = BN_CTX_get(ctx);
124         x = BN_CTX_get(ctx);
125         y = BN_CTX_get(ctx);
126         if (y == NULL) goto end;
127         
128         if (ret == NULL)
129                 ret = BN_new();
130         if (ret == NULL) goto end;
131
132         /* now write  |p| - 1  as  2^e*q  where  q  is odd */
133         e = 1;
134         while (!BN_is_bit_set(p, e))
135                 e++;
136         if (e > 2)
137                 /* we don't need this  q  if  e = 1 or 2 */
138                 if (!BN_rshift(q, p, e)) goto end;
139         q->neg = 0;
140
141         if (e == 1)
142                 {
143                 /* The easy case:  (p-1)/2  is odd, so 2 has an inverse
144                  * modulo  (p-1)/2,  and square roots can be computed
145                  * directly by modular exponentiation.
146                  * We have
147                  *     2 * (p+1)/4 == 1   (mod (p-1)/2),
148                  * so we can use exponent  (p+1)/4,  i.e.  (p-3)/4 + 1.
149                  */
150                 if (!BN_rshift(q, p, 2)) goto end;
151                 if (!BN_add_word(q, 1)) goto end;
152                 if (!BN_mod_exp(ret, a, q, p, ctx)) goto end;
153                 err = 0;
154                 goto end;
155                 }
156         
157         if (e == 2)
158                 {
159                 /* p == 5  (mod 8)
160                  *
161                  * In this case  2  is always a non-square since
162                  * Legendre(2,p) = (-1)^((p^2-1)/8)  for any odd prime.
163                  * So if  a  really is a square, then  2*a  is a non-square.
164                  * Thus for
165                  *      b := (2*a)^((p-5)/8),
166                  *      i := (2*a)*b^2
167                  * we have
168                  *     i^2 = (2*a)^((1 + (p-5)/4)*2)
169                  *         = (2*a)^((p-1)/2)
170                  *         = -1;
171                  * so if we set
172                  *      x := a*b*(i-1),
173                  * then
174                  *     x^2 = a^2 * b^2 * (i^2 - 2*i + 1)
175                  *         = a^2 * b^2 * (-2*i)
176                  *         = a*(-i)*(2*a*b^2)
177                  *         = a*(-i)*i
178                  *         = a.
179                  *
180                  * (This is due to A.O.L. Atkin, 
181                  * <URL: http://listserv.nodak.edu/scripts/wa.exe?A2=ind9211&L=nmbrthry&O=T&P=562>,
182                  * November 1992.)
183                  */
184
185                 /* make sure that  a  is reduced modulo p */
186                 if (a->neg || BN_ucmp(a, p) >= 0)
187                         {
188                         if (!BN_nnmod(x, a, p, ctx)) goto end;
189                         a = x; /* use x as temporary variable */
190                         }
191
192                 /* t := 2*a */
193                 if (!BN_mod_lshift1_quick(t, a, p)) goto end;
194
195                 /* b := (2*a)^((p-5)/8) */
196                 if (!BN_rshift(q, p, 3)) goto end;
197                 if (!BN_mod_exp(b, t, q, p, ctx)) goto end;
198
199                 /* y := b^2 */
200                 if (!BN_mod_sqr(y, b, p, ctx)) goto end;
201
202                 /* t := (2*a)*b^2 - 1*/
203                 if (!BN_mod_mul(t, t, y, p, ctx)) goto end;
204                 if (!BN_sub_word(t, 1)) goto end; /* cannot become negative */
205
206                 /* x = a*b*t */
207                 if (!BN_mod_mul(x, a, b, p, ctx)) goto end;
208                 if (!BN_mod_mul(x, x, t, p, ctx)) goto end;
209
210                 if (!BN_copy(ret, x)) goto end;
211                 err = 0;
212                 goto end;
213                 }
214         
215         /* e > 2, so we really have to use the Tonelli/Shanks algorithm.
216          * First, find some  y  that is not a square. */
217         i = 2;
218         do
219                 {
220                 /* For efficiency, try small numbers first;
221                  * if this fails, try random numbers.
222                  */
223                 if (i < 22)
224                         {
225                         if (!BN_set_word(y, i)) goto end;
226                         }
227                 else
228                         {
229                         if (!BN_pseudo_rand(y, BN_num_bits(p), 0, 0)) goto end;
230                         if (BN_ucmp(y, p) >= 0)
231                                 {
232                                 if (!(p->neg ? BN_add : BN_sub)(y, y, p)) goto end;
233                                 }
234                         /* now 0 <= y < |p| */
235                         if (BN_is_zero(y))
236                                 if (!BN_set_word(y, i)) goto end;
237                         }
238                 
239                 r = BN_kronecker(y, p, ctx);
240                 if (r < -1) goto end;
241                 if (r == 0)
242                         {
243                         /* m divides p */
244                         BNerr(BN_F_BN_MOD_SQRT, BN_R_P_IS_NOT_PRIME);
245                         goto end;
246                         }
247                 }
248         while (r == 1 && ++i < 82);
249         
250         if (r != -1)
251                 {
252                 /* Many rounds and still no non-square -- this is more likely
253                  * a bug than just bad luck.
254                  * Even if  p  is not prime, we should have found some  y
255                  * such that r == -1.
256                  */
257                 BNerr(BN_F_BN_MOD_SQRT, BN_R_TOO_MANY_ITERATIONS);
258                 goto end;
259                 }
260
261
262         /* Now that we have some non-square, we can find an element
263          * of order  2^e  by computing its q'th power. */
264         if (!BN_mod_exp(y, y, q, p, ctx)) goto end;
265         if (BN_is_one(y))
266                 {
267                 BNerr(BN_F_BN_MOD_SQRT, BN_R_P_IS_NOT_PRIME);
268                 goto end;
269                 }
270
271         /* Now we know that (if  p  is indeed prime) there is an integer
272          * k,  0 <= k < 2^e,  such that
273          *
274          *      a^q * y^k == 1   (mod p).
275          *
276          * As  a^q  is a square and  y  is not,  k  must be even.
277          * q+1  is even, too, so there is an element
278          *
279          *     X := a^((q+1)/2) * y^(k/2),
280          *
281          * and it satisfies
282          *
283          *     X^2 = a^q * a     * y^k
284          *         = a,
285          *
286          * so it is the square root that we are looking for.
287          */
288         
289         /* t := (q-1)/2  (note that  q  is odd) */
290         if (!BN_rshift1(t, q)) goto end;
291         
292         /* x := a^((q-1)/2) */
293         if (BN_is_zero(t)) /* special case: p = 2^e + 1 */
294                 {
295                 if (!BN_nnmod(t, a, p, ctx)) goto end;
296                 if (BN_is_zero(t))
297                         {
298                         /* special case: a == 0  (mod p) */
299                         if (!BN_zero(ret)) goto end;
300                         err = 0;
301                         goto end;
302                         }
303                 else
304                         if (!BN_one(x)) goto end;
305                 }
306         else
307                 {
308                 if (!BN_mod_exp(x, a, t, p, ctx)) goto end;
309                 if (BN_is_zero(x))
310                         {
311                         /* special case: a == 0  (mod p) */
312                         if (!BN_zero(ret)) goto end;
313                         err = 0;
314                         goto end;
315                         }
316                 }
317
318         /* b := a*x^2  (= a^q) */
319         if (!BN_mod_sqr(b, x, p, ctx)) goto end;
320         if (!BN_mod_mul(b, b, a, p, ctx)) goto end;
321         
322         /* x := a*x    (= a^((q+1)/2)) */
323         if (!BN_mod_mul(x, x, a, p, ctx)) goto end;
324
325         while (1)
326                 {
327                 /* Now  b  is  a^q * y^k  for some even  k  (0 <= k < 2^E
328                  * where  E  refers to the original value of  e,  which we
329                  * don't keep in a variable),  and  x  is  a^((q+1)/2) * y^(k/2).
330                  *
331                  * We have  a*b = x^2,
332                  *    y^2^(e-1) = -1,
333                  *    b^2^(e-1) = 1.
334                  */
335
336                 if (BN_is_one(b))
337                         {
338                         if (!BN_copy(ret, x)) goto end;
339                         err = 0;
340                         goto end;
341                         }
342
343
344                 /* find smallest  i  such that  b^(2^i) = 1 */
345                 i = 1;
346                 if (!BN_mod_sqr(t, b, p, ctx)) goto end;
347                 while (!BN_is_one(t))
348                         {
349                         i++;
350                         if (i == e)
351                                 {
352                                 BNerr(BN_F_BN_MOD_SQRT, BN_R_NOT_A_SQUARE);
353                                 goto end;
354                                 }
355                         if (!BN_mod_mul(t, t, t, p, ctx)) goto end;
356                         }
357                 
358
359                 /* t := y^2^(e - i - 1) */
360                 if (!BN_copy(t, y)) goto end;
361                 for (j = e - i - 1; j > 0; j--)
362                         {
363                         if (!BN_mod_sqr(t, t, p, ctx)) goto end;
364                         }
365                 if (!BN_mod_mul(y, t, t, p, ctx)) goto end;
366                 if (!BN_mod_mul(x, x, t, p, ctx)) goto end;
367                 if (!BN_mod_mul(b, b, y, p, ctx)) goto end;
368                 e = i;
369                 }
370
371  end:
372         if (err)
373                 {
374                 if (ret != NULL && ret != in)
375                         {
376                         BN_clear_free(ret);
377                         }
378                 ret = NULL;
379                 }
380         BN_CTX_end(ctx);
381         return ret;
382         }