Remove unrolled loops
[openssl.git] / crypto / ec / curve448 / word.h
index ff85c4c458a334c3c2bee4eb751c56362aa1d921..c739b70d51e18811299b7917548cf3ad8858b025 100644 (file)
 # define HEADER_WORD_H
 
 # include <string.h>
-
 # include <assert.h>
+# include <stdlib.h>
 # include <openssl/e_os2.h>
 # include "arch_intrinsics.h"
-
 # include "curve448utils.h"
-# include <stdlib.h>
 
 # if defined(__ARM_NEON__)
 #  include <arm_neon.h>
@@ -56,83 +54,11 @@ typedef int64_t dsword_t;
 # if C448_WORD_BITS == 64
 #  define SC_LIMB(x) (x)
 # elif C448_WORD_BITS == 32
-#  define SC_LIMB(x) ((uint32_t)x),(x>>32)
+#  define SC_LIMB(x) ((uint32_t)(x)),((x) >> 32)
 # else
 #  error "For now we only support 32- and 64-bit architectures."
 # endif
 
-# ifdef __ARM_NEON__
-typedef uint32x4_t vecmask_t;
-# elif defined(__clang__)
-typedef uint64_t uint64x2_t __attribute__ ((ext_vector_type(2)));
-typedef int64_t int64x2_t __attribute__ ((ext_vector_type(2)));
-typedef uint64_t uint64x4_t __attribute__ ((ext_vector_type(4)));
-typedef int64_t int64x4_t __attribute__ ((ext_vector_type(4)));
-typedef uint32_t uint32x4_t __attribute__ ((ext_vector_type(4)));
-typedef int32_t int32x4_t __attribute__ ((ext_vector_type(4)));
-typedef uint32_t uint32x2_t __attribute__ ((ext_vector_type(2)));
-typedef int32_t int32x2_t __attribute__ ((ext_vector_type(2)));
-typedef uint32_t uint32x8_t __attribute__ ((ext_vector_type(8)));
-typedef int32_t int32x8_t __attribute__ ((ext_vector_type(8)));
-typedef word_t vecmask_t __attribute__ ((ext_vector_type(4)));
-# elif defined(__GNUC__) \
-       && (__GNUC__ >= 4 || (__GNUC__== 3 && __GNUC_MINOR__ >= 1))
-typedef uint64_t uint64x2_t __attribute__ ((vector_size(16)));
-typedef int64_t int64x2_t __attribute__ ((vector_size(16)));
-typedef uint64_t uint64x4_t __attribute__ ((vector_size(32)));
-typedef int64_t int64x4_t __attribute__ ((vector_size(32)));
-typedef uint32_t uint32x4_t __attribute__ ((vector_size(16)));
-typedef int32_t int32x4_t __attribute__ ((vector_size(16)));
-typedef uint32_t uint32x2_t __attribute__ ((vector_size(8)));
-typedef int32_t int32x2_t __attribute__ ((vector_size(8)));
-typedef uint32_t uint32x8_t __attribute__ ((vector_size(32)));
-typedef int32_t int32x8_t __attribute__ ((vector_size(32)));
-typedef word_t vecmask_t __attribute__ ((vector_size(32)));
-# endif
-
-# if defined(__AVX2__)
-#  define VECTOR_ALIGNED __attribute__((aligned(32)))
-typedef uint64x4_t uint64xn_t;
-typedef uint32x8_t uint32xn_t;
-# elif defined(__SSE2__)
-#  define VECTOR_ALIGNED __attribute__((aligned(16)))
-typedef uint64x2_t uint64xn_t;
-typedef uint32x4_t uint32xn_t;
-# elif defined(__ARM_NEON__)
-#  define VECTOR_ALIGNED __attribute__((aligned(16)))
-typedef uint64x2_t uint64xn_t;
-typedef uint32x4_t uint32xn_t;
-# elif !defined(_MSC_VER) \
-       && (defined(_WIN64) || defined(__amd64__) || defined(__X86_64__) \
-           || defined(__aarch64__))
-#  define VECTOR_ALIGNED __attribute__((aligned(8)))
-typedef uint32_t uint32xn_t;
-# else
-#  ifdef __GNUC__
-#   define VECTOR_ALIGNED __attribute__((aligned(4)))
-#  else
-/*
- * This shouldn't be a problem because a big_register_t isn't actually a vector
- * type anyway in this case.
- */
-#   define VECTOR_ALIGNED
-#  endif
-typedef uint64_t uint64xn_t;
-typedef uint32_t uint32xn_t;
-# endif
-
-
-/* PERF: vectorize vs unroll */
-# ifdef __clang__
-#  if 100*__clang_major__ + __clang_minor__ > 305
-#   define UNROLL _Pragma("clang loop unroll(full)")
-#  endif
-# endif
-
-# ifndef UNROLL
-#  define UNROLL
-# endif
-
 /*
  * The plan on booleans: The external interface uses c448_bool_t, but this
  * might be a different size than our particular arch's word_t (and thus
@@ -163,9 +89,4 @@ static ossl_inline mask_t bool_to_mask(c448_bool_t m)
     return ret;
 }
 
-static ossl_inline void ignore_result(c448_bool_t boo)
-{
-    (void)boo;
-}
-
 #endif                          /* HEADER_WORD_H */