Manual formatting tweaks to Curve448 code
[openssl.git] / crypto / ec / curve448 / arch_x86_64 / arch_intrinsics.h
index 9c7dbb7..cca3f81 100644 (file)
 #include <openssl/e_os2.h>
 
 /* FUTURE: autogenerate */
-static __inline__ __uint128_t widemul(const uint64_t *a, const uint64_t *b) {
-  uint64_t c,d;
+static __inline__ __uint128_t widemul(const uint64_t *a, const uint64_t *b)
+{
+  uint64_t c, d;
+
   #ifndef __BMI2__
       __asm__ volatile
           ("movq %[a], %%rax;"
@@ -34,11 +36,13 @@ static __inline__ __uint128_t widemul(const uint64_t *a, const uint64_t *b) {
            : [b]"m"(*b), [a]"m"(*a)
            : "rdx");
   #endif
-  return (((__uint128_t)(d))<<64) | c;
+  return (((__uint128_t)(d)) << 64) | c;
 }
 
-static __inline__ __uint128_t widemul_rm(uint64_t a, const uint64_t *b) {
-  uint64_t c,d;
+static __inline__ __uint128_t widemul_rm(uint64_t a, const uint64_t *b)
+{
+  uint64_t c, d;
+
   #ifndef __BMI2__
       __asm__ volatile
           ("movq %[a], %%rax;"
@@ -52,11 +56,13 @@ static __inline__ __uint128_t widemul_rm(uint64_t a, const uint64_t *b) {
            : [c]"=r"(c), [d]"=r"(d)
            : [b]"m"(*b), [a]"d"(a));
   #endif
-  return (((__uint128_t)(d))<<64) | c;
+  return (((__uint128_t)(d)) << 64) | c;
 }
 
-static __inline__ __uint128_t widemul_rr(uint64_t a, uint64_t b) {
-  uint64_t c,d;
+static __inline__ __uint128_t widemul_rr(uint64_t a, uint64_t b)
+{
+  uint64_t c, d;
+
   #ifndef __BMI2__
       __asm__ volatile
           ("mulq %[b];"
@@ -69,11 +75,13 @@ static __inline__ __uint128_t widemul_rr(uint64_t a, uint64_t b) {
            : [c]"=r"(c), [d]"=r"(d)
            : [b]"r"(b), [a]"d"(a));
   #endif
-  return (((__uint128_t)(d))<<64) | c;
+  return (((__uint128_t)(d)) << 64) | c;
 }
 
-static __inline__ __uint128_t widemul2(const uint64_t *a, const uint64_t *b) {
-  uint64_t c,d;
+static __inline__ __uint128_t widemul2(const uint64_t *a, const uint64_t *b)
+{
+  uint64_t c, d;
+
   #ifndef __BMI2__
       __asm__ volatile
           ("movq %[a], %%rax; "
@@ -91,11 +99,13 @@ static __inline__ __uint128_t widemul2(const uint64_t *a, const uint64_t *b) {
            : [b]"m"(*b), [a]"m"(*a)
            : "rdx");
   #endif
-  return (((__uint128_t)(d))<<64) | c;
+  return (((__uint128_t)(d)) << 64) | c;
 }
 
-static __inline__ void mac(__uint128_t *acc, const uint64_t *a, const uint64_t *b) {
-  uint64_t lo = *acc, hi = *acc>>64;
+static __inline__ void mac(__uint128_t *acc, const uint64_t *a,
+                           const uint64_t *b)
+{
+  uint64_t lo = *acc, hi = *acc >> 64;
   
   #ifdef __BMI2__
       uint64_t c,d;
@@ -118,12 +128,14 @@ static __inline__ void mac(__uint128_t *acc, const uint64_t *a, const uint64_t *
            : "rax", "rdx", "cc");
   #endif
   
-  *acc = (((__uint128_t)(hi))<<64) | lo;
+  *acc = (((__uint128_t)(hi)) << 64) | lo;
 }
 
-static __inline__ void macac(__uint128_t *acc, __uint128_t *acc2, const uint64_t *a, const uint64_t *b) {
-  uint64_t lo = *acc, hi = *acc>>64;
-  uint64_t lo2 = *acc2, hi2 = *acc2>>64;
+static __inline__ void macac(__uint128_t *acc, __uint128_t *acc2,
+                             const uint64_t *a, const uint64_t *b)
+{
+  uint64_t lo = *acc, hi = *acc >> 64;
+  uint64_t lo2 = *acc2, hi2 = *acc2 >> 64;
   
   #ifdef __BMI2__
       uint64_t c,d;
@@ -150,12 +162,13 @@ static __inline__ void macac(__uint128_t *acc, __uint128_t *acc2, const uint64_t
            : "rax", "rdx", "cc");
   #endif
   
-  *acc = (((__uint128_t)(hi))<<64) | lo;
-  *acc2 = (((__uint128_t)(hi2))<<64) | lo2;
+  *acc = (((__uint128_t)(hi)) << 64) | lo;
+  *acc2 = (((__uint128_t)(hi2)) << 64) | lo2;
 }
 
-static __inline__ void mac_rm(__uint128_t *acc, uint64_t a, const uint64_t *b) {
-  uint64_t lo = *acc, hi = *acc>>64;
+static __inline__ void mac_rm(__uint128_t *acc, uint64_t a, const uint64_t *b)
+{
+  uint64_t lo = *acc, hi = *acc >> 64;
   
   #ifdef __BMI2__
       uint64_t c,d;
@@ -177,11 +190,12 @@ static __inline__ void mac_rm(__uint128_t *acc, uint64_t a, const uint64_t *b) {
            : "rax", "rdx", "cc");
   #endif
   
-  *acc = (((__uint128_t)(hi))<<64) | lo;
+  *acc = (((__uint128_t)(hi)) << 64) | lo;
 }
 
-static __inline__ void mac_rr(__uint128_t *acc, uint64_t a, const uint64_t b) {
-  uint64_t lo = *acc, hi = *acc>>64;
+static __inline__ void mac_rr(__uint128_t *acc, uint64_t a, const uint64_t b)
+{
+  uint64_t lo = *acc, hi = *acc >> 64;
   
   #ifdef __BMI2__
       uint64_t c,d;
@@ -202,11 +216,13 @@ static __inline__ void mac_rr(__uint128_t *acc, uint64_t a, const uint64_t b) {
            : "rdx", "cc");
   #endif
   
-  *acc = (((__uint128_t)(hi))<<64) | lo;
+  *acc = (((__uint128_t)(hi)) << 64) | lo;
 }
 
-static __inline__ void mac2(__uint128_t *acc, const uint64_t *a, const uint64_t *b) {
-  uint64_t lo = *acc, hi = *acc>>64;
+static __inline__ void mac2(__uint128_t *acc, const uint64_t *a,
+                            const uint64_t *b)
+{
+  uint64_t lo = *acc, hi = *acc >> 64;
   
   #ifdef __BMI2__
       uint64_t c,d;
@@ -231,11 +247,14 @@ static __inline__ void mac2(__uint128_t *acc, const uint64_t *a, const uint64_t
            : "rax", "rdx", "cc");
   #endif
   
-  *acc = (((__uint128_t)(hi))<<64) | lo;
+  *acc = (((__uint128_t)(hi)) << 64) | lo;
 }
 
-static __inline__ void msb(__uint128_t *acc, const uint64_t *a, const uint64_t *b) {
-  uint64_t lo = *acc, hi = *acc>>64;
+static __inline__ void msb(__uint128_t *acc, const uint64_t *a,
+                           const uint64_t *b)
+{
+  uint64_t lo = *acc, hi = *acc >> 64;
+
   #ifdef __BMI2__
       uint64_t c,d;
       __asm__ volatile
@@ -256,11 +275,14 @@ static __inline__ void msb(__uint128_t *acc, const uint64_t *a, const uint64_t *
            : [b]"m"(*b), [a]"m"(*a)
            : "rax", "rdx", "cc");
   #endif
-  *acc = (((__uint128_t)(hi))<<64) | lo;
+  *acc = (((__uint128_t)(hi)) << 64) | lo;
 }
 
-static __inline__ void msb2(__uint128_t *acc, const uint64_t *a, const uint64_t *b) {
-  uint64_t lo = *acc, hi = *acc>>64;
+static __inline__ void msb2(__uint128_t *acc, const uint64_t *a,
+                            const uint64_t *b)
+{
+  uint64_t lo = *acc, hi = *acc >> 64;
+
   #ifdef __BMI2__
       uint64_t c,d;
       __asm__ volatile
@@ -287,8 +309,10 @@ static __inline__ void msb2(__uint128_t *acc, const uint64_t *a, const uint64_t
   
 }
 
-static __inline__ void mrs(__uint128_t *acc, const uint64_t *a, const uint64_t *b) {
-  uint64_t c,d, lo = *acc, hi = *acc>>64;
+static __inline__ void mrs(__uint128_t *acc, const uint64_t *a,
+                           const uint64_t *b)
+{
+  uint64_t c,d, lo = *acc, hi = *acc >> 64;
   __asm__ volatile
       ("movq %[a], %%rdx; "
        "mulx %[b], %[c], %[d]; "
@@ -297,16 +321,18 @@ static __inline__ void mrs(__uint128_t *acc, const uint64_t *a, const uint64_t *
        : [c]"=r"(c), [d]"=r"(d), [lo]"+r"(lo), [hi]"+r"(hi)
        : [b]"m"(*b), [a]"m"(*a)
        : "rdx", "cc");
-  *acc = (((__uint128_t)(d))<<64) | c;
+  *acc = (((__uint128_t)(d)) << 64) | c;
 }
 
-static __inline__ uint64_t word_is_zero(uint64_t x) {
+static __inline__ uint64_t word_is_zero(uint64_t x)
+{
   __asm__ volatile("neg %0; sbb %0, %0;" : "+r"(x));
   return ~x;
 }
 
-static inline uint64_t shrld(__uint128_t x, int n) {
-    return x>>n;
+static inline uint64_t shrld(__uint128_t x, int n)
+{
+    return x >> n;
 }
 
 #endif /* __ARCH_X86_64_ARCH_INTRINSICS_H__ */