index d147874..651de97 100644 (file)

/* TODO: width-m NAFs */

-/* TODO: optional Lim-Lee precomputation for the generator */
+/* TODO: optional precomputation of multiples of the generator */

#define EC_window_bits_for_scalar_size(b) \
-               ((b) >= 1500 ? 6 : \
-                (b) >=  550 ? 5 : \
-                (b) >=  200 ? 4 : \
-                (b) >=   55 ? 3 : \
+               ((b) >= 2000 ? 6 : \
+                (b) >=  800 ? 5 : \
+                (b) >=  300 ? 4 : \
+                (b) >=   70 ? 3 : \
(b) >=   20 ? 2 : \
1)
/* For window size 'w' (w >= 2), we compute the odd multiples
*     w = 1  if   12 >= b
*
* Note that neither table tries to take into account memory usage
- * (code locality etc.).  Actual timings with NIST curve P-192 and
- * 192-bit scalars show that  w = 3  (instead of 4) is preferrable;
- * and timings with NIST curve P-521 and 521-bit scalars show that
- * w = 4  (instead of 5) is preferrable.  So we round up all the
+ * (allocation overhead, code locality etc.).  Actual timings with
+ * NIST curves P-192, P-224, and P-256 with scalars of 192, 224,
+ * and 256 bits, respectively, show that  w = 3  (instead of 4) is
+ * preferrable; timings with NIST curve P-384 and 384-bit scalars
+ * confirm that  w = 4  is optimal for this case; and timings with
+ * NIST curve P-521 and 521-bit scalars show that  w = 4  (instead
+ * of 5) is preferrable.  So we generously round up all the
* boundaries and use the following table:
*
- *    w >= 6  if         b >= 1500
- *     w = 5  if 1499 >= b >=  550
- *     w = 4  if  549 >= b >=  200
- *     w = 3  if  199 >= b >=   55
- *     w = 2  if   54 >= b >=   20
+ *    w >= 6  if         b >= 2000
+ *     w = 5  if 1999 >= b >=  800
+ *     w = 4  if  799 >= b >=  300
+ *     w = 3  if  299 >= b >=   70
+ *     w = 2  if   69 >= b >=   20
*     w = 1  if   19 >= b
*/

@@ -203,7 +206,7 @@ int EC_POINTs_mul(const EC_GROUP *group, EC_POINT *r, const BIGNUM *scalar,

bits = i < num ? BN_num_bits(scalars[i]) : BN_num_bits(scalar);
wsize[i] = EC_window_bits_for_scalar_size(bits);
-               num_val += 1 << (wsize[i] - 1);
+               num_val += 1u << (wsize[i] - 1);
if (bits > max_bits)
max_bits = bits;
wbits[i] = 0;
@@ -224,7 +227,7 @@ int EC_POINTs_mul(const EC_GROUP *group, EC_POINT *r, const BIGNUM *scalar,
for (i = 0; i < totalnum; i++)
{
val_sub[i] = v;
-               for (j = 0; j < (1 << (wsize[i] - 1)); j++)
+               for (j = 0; j < (1u << (wsize[i] - 1)); j++)
{
*v = EC_POINT_new(group);
if (*v == NULL) goto err;
@@ -275,14 +278,14 @@ int EC_POINTs_mul(const EC_GROUP *group, EC_POINT *r, const BIGNUM *scalar,
if (wsize[i] > 1)
{
if (!EC_POINT_dbl(group, tmp, val_sub[i], ctx)) goto err;
-                       for (j = 1; j < (1 << (wsize[i] - 1)); j++)
+                       for (j = 1; j < (1u << (wsize[i] - 1)); j++)
{
if (!EC_POINT_add(group, val_sub[i][j], val_sub[i][j - 1], tmp, ctx)) goto err;
}
}
}

-#if 1 /* optional, maybe we should only do this if total_num > 1 */
+#if 1 /* optional; EC_window_bits_for_scalar_size assumes we do this step */
if (!EC_POINTs_make_affine(group, num_val, val, ctx)) goto err;
#endif