40f7b23b4faa26865ebcb62eaa715fe544ab1125
[openssl.git] / crypto / bn / bn_sqr.c
1 /*
2  * Copyright 1995-2017 The OpenSSL Project Authors. All Rights Reserved.
3  *
4  * Licensed under the OpenSSL license (the "License").  You may not use
5  * this file except in compliance with the License.  You can obtain a copy
6  * in the file LICENSE in the source distribution or at
7  * https://www.openssl.org/source/license.html
8  */
9
10 #include "internal/cryptlib.h"
11 #include "bn_lcl.h"
12
13 /* r must not be a */
14 /*
15  * I've just gone over this and it is now %20 faster on x86 - eay - 27 Jun 96
16  */
17 int BN_sqr(BIGNUM *r, const BIGNUM *a, BN_CTX *ctx)
18 {
19     int max, al;
20     int ret = 0;
21     BIGNUM *tmp, *rr;
22
23     bn_check_top(a);
24
25     al = a->top;
26     if (al <= 0) {
27         r->top = 0;
28         r->neg = 0;
29         return 1;
30     }
31
32     BN_CTX_start(ctx);
33     rr = (a != r) ? r : BN_CTX_get(ctx);
34     tmp = BN_CTX_get(ctx);
35     if (rr == NULL || tmp == NULL)
36         goto err;
37
38     max = 2 * al;               /* Non-zero (from above) */
39     if (bn_wexpand(rr, max) == NULL)
40         goto err;
41
42     if (al == 4) {
43 #ifndef BN_SQR_COMBA
44         BN_ULONG t[8];
45         bn_sqr_normal(rr->d, a->d, 4, t);
46 #else
47         bn_sqr_comba4(rr->d, a->d);
48 #endif
49     } else if (al == 8) {
50 #ifndef BN_SQR_COMBA
51         BN_ULONG t[16];
52         bn_sqr_normal(rr->d, a->d, 8, t);
53 #else
54         bn_sqr_comba8(rr->d, a->d);
55 #endif
56     } else {
57 #if defined(BN_RECURSION)
58         if (al < BN_SQR_RECURSIVE_SIZE_NORMAL) {
59             BN_ULONG t[BN_SQR_RECURSIVE_SIZE_NORMAL * 2];
60             bn_sqr_normal(rr->d, a->d, al, t);
61         } else {
62             int j, k;
63
64             j = BN_num_bits_word((BN_ULONG)al);
65             j = 1 << (j - 1);
66             k = j + j;
67             if (al == j) {
68                 if (bn_wexpand(tmp, k * 2) == NULL)
69                     goto err;
70                 bn_sqr_recursive(rr->d, a->d, al, tmp->d);
71             } else {
72                 if (bn_wexpand(tmp, max) == NULL)
73                     goto err;
74                 bn_sqr_normal(rr->d, a->d, al, tmp->d);
75             }
76         }
77 #else
78         if (bn_wexpand(tmp, max) == NULL)
79             goto err;
80         bn_sqr_normal(rr->d, a->d, al, tmp->d);
81 #endif
82     }
83
84     rr->neg = 0;
85     rr->top = max;
86     bn_correct_top(rr);
87     if (r != rr && BN_copy(r, rr) == NULL)
88         goto err;
89
90     ret = 1;
91  err:
92     bn_check_top(rr);
93     bn_check_top(tmp);
94     BN_CTX_end(ctx);
95     return ret;
96 }
97
98 /* tmp must have 2*n words */
99 void bn_sqr_normal(BN_ULONG *r, const BN_ULONG *a, int n, BN_ULONG *tmp)
100 {
101     int i, j, max;
102     const BN_ULONG *ap;
103     BN_ULONG *rp;
104
105     max = n * 2;
106     ap = a;
107     rp = r;
108     rp[0] = rp[max - 1] = 0;
109     rp++;
110     j = n;
111
112     if (--j > 0) {
113         ap++;
114         rp[j] = bn_mul_words(rp, ap, j, ap[-1]);
115         rp += 2;
116     }
117
118     for (i = n - 2; i > 0; i--) {
119         j--;
120         ap++;
121         rp[j] = bn_mul_add_words(rp, ap, j, ap[-1]);
122         rp += 2;
123     }
124
125     bn_add_words(r, r, r, max);
126
127     /* There will not be a carry */
128
129     bn_sqr_words(tmp, a, n);
130
131     bn_add_words(r, r, tmp, max);
132 }
133
134 #ifdef BN_RECURSION
135 /*-
136  * r is 2*n words in size,
137  * a and b are both n words in size.    (There's not actually a 'b' here ...)
138  * n must be a power of 2.
139  * We multiply and return the result.
140  * t must be 2*n words in size
141  * We calculate
142  * a[0]*b[0]
143  * a[0]*b[0]+a[1]*b[1]+(a[0]-a[1])*(b[1]-b[0])
144  * a[1]*b[1]
145  */
146 void bn_sqr_recursive(BN_ULONG *r, const BN_ULONG *a, int n2, BN_ULONG *t)
147 {
148     int n = n2 / 2;
149     int zero, c1;
150     BN_ULONG ln, lo, *p;
151
152     if (n2 == 4) {
153 # ifndef BN_SQR_COMBA
154         bn_sqr_normal(r, a, 4, t);
155 # else
156         bn_sqr_comba4(r, a);
157 # endif
158         return;
159     } else if (n2 == 8) {
160 # ifndef BN_SQR_COMBA
161         bn_sqr_normal(r, a, 8, t);
162 # else
163         bn_sqr_comba8(r, a);
164 # endif
165         return;
166     }
167     if (n2 < BN_SQR_RECURSIVE_SIZE_NORMAL) {
168         bn_sqr_normal(r, a, n2, t);
169         return;
170     }
171     /* r=(a[0]-a[1])*(a[1]-a[0]) */
172     c1 = bn_cmp_words(a, &(a[n]), n);
173     zero = 0;
174     if (c1 > 0)
175         bn_sub_words(t, a, &(a[n]), n);
176     else if (c1 < 0)
177         bn_sub_words(t, &(a[n]), a, n);
178     else
179         zero = 1;
180
181     /* The result will always be negative unless it is zero */
182     p = &(t[n2 * 2]);
183
184     if (!zero)
185         bn_sqr_recursive(&(t[n2]), t, n, p);
186     else
187         memset(&t[n2], 0, sizeof(*t) * n2);
188     bn_sqr_recursive(r, a, n, p);
189     bn_sqr_recursive(&(r[n2]), &(a[n]), n, p);
190
191     /*-
192      * t[32] holds (a[0]-a[1])*(a[1]-a[0]), it is negative or zero
193      * r[10] holds (a[0]*b[0])
194      * r[32] holds (b[1]*b[1])
195      */
196
197     c1 = (int)(bn_add_words(t, r, &(r[n2]), n2));
198
199     /* t[32] is negative */
200     c1 -= (int)(bn_sub_words(&(t[n2]), t, &(t[n2]), n2));
201
202     /*-
203      * t[32] holds (a[0]-a[1])*(a[1]-a[0])+(a[0]*a[0])+(a[1]*a[1])
204      * r[10] holds (a[0]*a[0])
205      * r[32] holds (a[1]*a[1])
206      * c1 holds the carry bits
207      */
208     c1 += (int)(bn_add_words(&(r[n]), &(r[n]), &(t[n2]), n2));
209     if (c1) {
210         p = &(r[n + n2]);
211         lo = *p;
212         ln = (lo + c1) & BN_MASK2;
213         *p = ln;
214
215         /*
216          * The overflow will stop before we over write words we should not
217          * overwrite
218          */
219         if (ln < (BN_ULONG)c1) {
220             do {
221                 p++;
222                 lo = *p;
223                 ln = (lo + 1) & BN_MASK2;
224                 *p = ln;
225             } while (ln == 0);
226         }
227     }
228 }
229 #endif