x86_64 assembly pack: make Windows build more robust.
[openssl.git] / crypto / modes / modes_lcl.h
1 /* ====================================================================
2  * Copyright (c) 2010 The OpenSSL Project.  All rights reserved.
3  *
4  * Redistribution and use is governed by OpenSSL license.
5  * ====================================================================
6  */
7
8 #include <openssl/modes.h>
9
10
11 #if (defined(_WIN32) || defined(_WIN64)) && !defined(__MINGW32__)
12 typedef __int64 i64;
13 typedef unsigned __int64 u64;
14 #define U64(C) C##UI64
15 #elif defined(__arch64__)
16 typedef long i64;
17 typedef unsigned long u64;
18 #define U64(C) C##UL
19 #else
20 typedef long long i64;
21 typedef unsigned long long u64;
22 #define U64(C) C##ULL
23 #endif
24
25 typedef unsigned int u32;
26 typedef unsigned char u8;
27
28 #define STRICT_ALIGNMENT 1
29 #if defined(__i386)     || defined(__i386__)    || \
30     defined(__x86_64)   || defined(__x86_64__)  || \
31     defined(_M_IX86)    || defined(_M_AMD64)    || defined(_M_X64) || \
32     defined(__s390__)   || defined(__s390x__)   || \
33     ( (defined(__arm__) || defined(__arm)) && \
34       (defined(__ARM_ARCH_7__)  || defined(__ARM_ARCH_7A__) || \
35        defined(__ARM_ARCH_7R__) || defined(__ARM_ARCH_7M__)) )
36 # undef STRICT_ALIGNMENT
37 #endif
38
39 #if !defined(PEDANTIC) && !defined(OPENSSL_NO_ASM) && !defined(OPENSSL_NO_INLINE_ASM)
40 #if defined(__GNUC__) && __GNUC__>=2
41 # if defined(__x86_64) || defined(__x86_64__)
42 #  define BSWAP8(x) ({  u64 ret=(x);                    \
43                         asm ("bswapq %0"                \
44                         : "+r"(ret));   ret;            })
45 #  define BSWAP4(x) ({  u32 ret=(x);                    \
46                         asm ("bswapl %0"                \
47                         : "+r"(ret));   ret;            })
48 # elif (defined(__i386) || defined(__i386__)) && !defined(I386_ONLY)
49 #  define BSWAP8(x) ({  u32 lo=(u64)(x)>>32,hi=(x);     \
50                         asm ("bswapl %0; bswapl %1"     \
51                         : "+r"(hi),"+r"(lo));           \
52                         (u64)hi<<32|lo;                 })
53 #  define BSWAP4(x) ({  u32 ret=(x);                    \
54                         asm ("bswapl %0"                \
55                         : "+r"(ret));   ret;            })
56 # elif (defined(__arm__) || defined(__arm)) && !defined(STRICT_ALIGNMENT)
57 #  define BSWAP8(x) ({  u32 lo=(u64)(x)>>32,hi=(x);     \
58                         asm ("rev %0,%0; rev %1,%1"     \
59                         : "+r"(hi),"+r"(lo));           \
60                         (u64)hi<<32|lo;                 })
61 #  define BSWAP4(x) ({  u32 ret;                        \
62                         asm ("rev %0,%1"                \
63                         : "=r"(ret) : "r"((u32)(x)));   \
64                         ret;                            })
65 # endif
66 #elif defined(_MSC_VER)
67 # if _MSC_VER>=1300
68 #  pragma intrinsic(_byteswap_uint64,_byteswap_ulong)
69 #  define BSWAP8(x)     _byteswap_uint64((u64)(x))
70 #  define BSWAP4(x)     _byteswap_ulong((u32)(x))
71 # elif defined(_M_IX86)
72    __inline u32 _bswap4(u32 val) {
73         _asm mov eax,val
74         _asm bswap eax
75    }
76 #  define BSWAP4(x)     _bswap4(x)
77 # endif
78 #endif
79 #endif
80
81 #if defined(BSWAP4) && !defined(STRICT_ALIGNMENT)
82 #define GETU32(p)       BSWAP4(*(const u32 *)(p))
83 #define PUTU32(p,v)     *(u32 *)(p) = BSWAP4(v)
84 #else
85 #define GETU32(p)       ((u32)(p)[0]<<24|(u32)(p)[1]<<16|(u32)(p)[2]<<8|(u32)(p)[3])
86 #define PUTU32(p,v)     ((p)[0]=(u8)((v)>>24),(p)[1]=(u8)((v)>>16),(p)[2]=(u8)((v)>>8),(p)[3]=(u8)(v))
87 #endif
88
89 /* GCM definitions */
90
91 typedef struct { u64 hi,lo; } u128;
92
93 #ifdef  TABLE_BITS
94 #undef  TABLE_BITS
95 #endif
96 /*
97  * Even though permitted values for TABLE_BITS are 8, 4 and 1, it should
98  * never be set to 8 [or 1]. For further information see gcm128.c.
99  */
100 #define TABLE_BITS 4
101
102 struct gcm128_context {
103         /* Following 6 names follow names in GCM specification */
104         union { u64 u[2]; u32 d[4]; u8 c[16]; size_t t[16/sizeof(size_t)]; }
105           Yi,EKi,EK0,len,Xi,H;
106         /* Relative position of Xi, H and pre-computed Htable is used
107          * in some assembler modules, i.e. don't change the order! */
108 #if TABLE_BITS==8
109         u128 Htable[256];
110 #else
111         u128 Htable[16];
112         void (*gmult)(u64 Xi[2],const u128 Htable[16]);
113         void (*ghash)(u64 Xi[2],const u128 Htable[16],const u8 *inp,size_t len);
114 #endif
115         unsigned int mres, ares;
116         block128_f block;
117         void *key;
118 };
119
120 struct xts128_context {
121         void      *key1, *key2;
122         block128_f block1,block2;
123 };
124
125 struct ccm128_context {
126         union { u64 u[2]; u8 c[16]; } nonce, cmac;
127         u64 blocks;
128         block128_f block;
129         void *key;
130 };
131