2f5ab1f58eae17713dd50ee5d21d8cb72de68132
[openssl.git] / crypto / sha / sha_locl.h
1 /* crypto/sha/sha_locl.h */
2 /* Copyright (C) 1995-1998 Eric Young (eay@cryptsoft.com)
3  * All rights reserved.
4  *
5  * This package is an SSL implementation written
6  * by Eric Young (eay@cryptsoft.com).
7  * The implementation was written so as to conform with Netscapes SSL.
8  * 
9  * This library is free for commercial and non-commercial use as long as
10  * the following conditions are aheared to.  The following conditions
11  * apply to all code found in this distribution, be it the RC4, RSA,
12  * lhash, DES, etc., code; not just the SSL code.  The SSL documentation
13  * included with this distribution is covered by the same copyright terms
14  * except that the holder is Tim Hudson (tjh@cryptsoft.com).
15  * 
16  * Copyright remains Eric Young's, and as such any Copyright notices in
17  * the code are not to be removed.
18  * If this package is used in a product, Eric Young should be given attribution
19  * as the author of the parts of the library used.
20  * This can be in the form of a textual message at program startup or
21  * in documentation (online or textual) provided with the package.
22  * 
23  * Redistribution and use in source and binary forms, with or without
24  * modification, are permitted provided that the following conditions
25  * are met:
26  * 1. Redistributions of source code must retain the copyright
27  *    notice, this list of conditions and the following disclaimer.
28  * 2. Redistributions in binary form must reproduce the above copyright
29  *    notice, this list of conditions and the following disclaimer in the
30  *    documentation and/or other materials provided with the distribution.
31  * 3. All advertising materials mentioning features or use of this software
32  *    must display the following acknowledgement:
33  *    "This product includes cryptographic software written by
34  *     Eric Young (eay@cryptsoft.com)"
35  *    The word 'cryptographic' can be left out if the rouines from the library
36  *    being used are not cryptographic related :-).
37  * 4. If you include any Windows specific code (or a derivative thereof) from 
38  *    the apps directory (application code) you must include an acknowledgement:
39  *    "This product includes software written by Tim Hudson (tjh@cryptsoft.com)"
40  * 
41  * THIS SOFTWARE IS PROVIDED BY ERIC YOUNG ``AS IS'' AND
42  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
43  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
44  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
45  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
46  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
47  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
48  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
49  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
50  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
51  * SUCH DAMAGE.
52  * 
53  * The licence and distribution terms for any publically available version or
54  * derivative of this code cannot be changed.  i.e. this code cannot simply be
55  * copied and put under another distribution licence
56  * [including the GNU Public Licence.]
57  */
58
59 #include <stdlib.h>
60 #include <string.h>
61
62 #include <openssl/opensslconf.h>
63 #include <openssl/sha.h>
64
65 #ifndef SHA_LONG_LOG2
66 #define SHA_LONG_LOG2   2       /* default to 32 bits */
67 #endif
68
69 #define DATA_ORDER_IS_BIG_ENDIAN
70
71 #define HASH_LONG               SHA_LONG
72 #define HASH_LONG_LOG2          SHA_LONG_LOG2
73 #define HASH_CTX                SHA_CTX
74 #define HASH_CBLOCK             SHA_CBLOCK
75 #define HASH_LBLOCK             SHA_LBLOCK
76 #define HASH_MAKE_STRING(c,s)   do {    \
77         unsigned long ll;               \
78         ll=(c)->h0; HOST_l2c(ll,(s));   \
79         ll=(c)->h1; HOST_l2c(ll,(s));   \
80         ll=(c)->h2; HOST_l2c(ll,(s));   \
81         ll=(c)->h3; HOST_l2c(ll,(s));   \
82         ll=(c)->h4; HOST_l2c(ll,(s));   \
83         } while (0)
84
85 #if defined(SHA_0)
86
87 # define HASH_UPDATE                    SHA_Update
88 # define HASH_TRANSFORM                 SHA_Transform
89 # define HASH_FINAL                     SHA_Final
90 # define HASH_INIT                      SHA_Init
91 # define HASH_BLOCK_HOST_ORDER          sha_block_host_order
92 # define HASH_BLOCK_DATA_ORDER          sha_block_data_order
93 # define Xupdate(a,ix,ia,ib,ic,id)      (ix=(a)=(ia^ib^ic^id))
94
95   void sha_block_host_order (SHA_CTX *c, const void *p,size_t num);
96   void sha_block_data_order (SHA_CTX *c, const void *p,size_t num);
97
98 #elif defined(SHA_1)
99
100 # define HASH_UPDATE                    SHA1_Update
101 # define HASH_TRANSFORM                 SHA1_Transform
102 # define HASH_FINAL                     SHA1_Final
103 # define HASH_INIT                      SHA1_Init
104 # define HASH_BLOCK_HOST_ORDER          sha1_block_host_order
105 # define HASH_BLOCK_DATA_ORDER          sha1_block_data_order
106 # if defined(__MWERKS__) && defined(__MC68K__)
107    /* Metrowerks for Motorola fails otherwise:-( <appro@fy.chalmers.se> */
108 #  define Xupdate(a,ix,ia,ib,ic,id)     do { (a)=(ia^ib^ic^id);         \
109                                              ix=(a)=ROTATE((a),1);      \
110                                         } while (0)
111 # else
112 #  define Xupdate(a,ix,ia,ib,ic,id)     ( (a)=(ia^ib^ic^id),    \
113                                           ix=(a)=ROTATE((a),1)  \
114                                         )
115 # endif
116
117 # ifdef SHA1_ASM
118 #  if defined(__i386) || defined(__i386__) || defined(_M_IX86) || defined(__INTEL__) \
119    || defined(__x86_64) || defined(__x86_64__) || defined(_M_AMD64) || defined(_M_X64)
120 #   define sha1_block_host_order                sha1_block_asm_host_order
121 #   define DONT_IMPLEMENT_BLOCK_HOST_ORDER
122 #   define sha1_block_data_order                sha1_block_asm_data_order
123 #   define DONT_IMPLEMENT_BLOCK_DATA_ORDER
124 #   define HASH_BLOCK_DATA_ORDER_ALIGNED        sha1_block_asm_data_order
125 #  elif defined(__ia64) || defined(__ia64__) || defined(_M_IA64)
126 #   define sha1_block_host_order                sha1_block_asm_host_order
127 #   define DONT_IMPLEMENT_BLOCK_HOST_ORDER
128 #   define sha1_block_data_order                sha1_block_asm_data_order
129 #   define DONT_IMPLEMENT_BLOCK_DATA_ORDER
130 #  elif defined(_ARCH_PPC) || defined(_ARCH_PPC64) || \
131         defined(__ppc) || defined(__ppc__) || defined(__powerpc) || \
132         defined(__ppc64) || defined(__ppc64__) || defined(__powerpc64)
133 #   define sha1_block_host_order                sha1_block_asm_data_order
134 #   define DONT_IMPLEMENT_BLOCK_HOST_ORDER
135 #   define sha1_block_data_order                sha1_block_asm_data_order
136 #   define DONT_IMPLEMENT_BLOCK_DATA_ORDER
137 #  endif
138 # endif
139   void sha1_block_host_order (SHA_CTX *c, const void *p,size_t num);
140   void sha1_block_data_order (SHA_CTX *c, const void *p,size_t num);
141
142 #else
143 # error "Either SHA_0 or SHA_1 must be defined."
144 #endif
145
146 #include "md32_common.h"
147
148 #define INIT_DATA_h0 0x67452301UL
149 #define INIT_DATA_h1 0xefcdab89UL
150 #define INIT_DATA_h2 0x98badcfeUL
151 #define INIT_DATA_h3 0x10325476UL
152 #define INIT_DATA_h4 0xc3d2e1f0UL
153
154 int HASH_INIT (SHA_CTX *c)
155         {
156         c->h0=INIT_DATA_h0;
157         c->h1=INIT_DATA_h1;
158         c->h2=INIT_DATA_h2;
159         c->h3=INIT_DATA_h3;
160         c->h4=INIT_DATA_h4;
161         c->Nl=0;
162         c->Nh=0;
163         c->num=0;
164         return 1;
165         }
166
167 #define K_00_19 0x5a827999UL
168 #define K_20_39 0x6ed9eba1UL
169 #define K_40_59 0x8f1bbcdcUL
170 #define K_60_79 0xca62c1d6UL
171
172 /* As  pointed out by Wei Dai <weidai@eskimo.com>, F() below can be
173  * simplified to the code in F_00_19.  Wei attributes these optimisations
174  * to Peter Gutmann's SHS code, and he attributes it to Rich Schroeppel.
175  * #define F(x,y,z) (((x) & (y))  |  ((~(x)) & (z)))
176  * I've just become aware of another tweak to be made, again from Wei Dai,
177  * in F_40_59, (x&a)|(y&a) -> (x|y)&a
178  */
179 #define F_00_19(b,c,d)  ((((c) ^ (d)) & (b)) ^ (d)) 
180 #define F_20_39(b,c,d)  ((b) ^ (c) ^ (d))
181 #define F_40_59(b,c,d)  (((b) & (c)) | (((b)|(c)) & (d))) 
182 #define F_60_79(b,c,d)  F_20_39(b,c,d)
183
184 #ifndef OPENSSL_SMALL_FOOTPRINT
185
186 #define BODY_00_15(i,a,b,c,d,e,f,xi) \
187         (f)=xi+(e)+K_00_19+ROTATE((a),5)+F_00_19((b),(c),(d)); \
188         (b)=ROTATE((b),30);
189
190 #define BODY_16_19(i,a,b,c,d,e,f,xi,xa,xb,xc,xd) \
191         Xupdate(f,xi,xa,xb,xc,xd); \
192         (f)+=(e)+K_00_19+ROTATE((a),5)+F_00_19((b),(c),(d)); \
193         (b)=ROTATE((b),30);
194
195 #define BODY_20_31(i,a,b,c,d,e,f,xi,xa,xb,xc,xd) \
196         Xupdate(f,xi,xa,xb,xc,xd); \
197         (f)+=(e)+K_20_39+ROTATE((a),5)+F_20_39((b),(c),(d)); \
198         (b)=ROTATE((b),30);
199
200 #define BODY_32_39(i,a,b,c,d,e,f,xa,xb,xc,xd) \
201         Xupdate(f,xa,xa,xb,xc,xd); \
202         (f)+=(e)+K_20_39+ROTATE((a),5)+F_20_39((b),(c),(d)); \
203         (b)=ROTATE((b),30);
204
205 #define BODY_40_59(i,a,b,c,d,e,f,xa,xb,xc,xd) \
206         Xupdate(f,xa,xa,xb,xc,xd); \
207         (f)+=(e)+K_40_59+ROTATE((a),5)+F_40_59((b),(c),(d)); \
208         (b)=ROTATE((b),30);
209
210 #define BODY_60_79(i,a,b,c,d,e,f,xa,xb,xc,xd) \
211         Xupdate(f,xa,xa,xb,xc,xd); \
212         (f)=xa+(e)+K_60_79+ROTATE((a),5)+F_60_79((b),(c),(d)); \
213         (b)=ROTATE((b),30);
214
215 #ifdef X
216 #undef X
217 #endif
218 #ifndef MD32_XARRAY
219   /*
220    * Originally X was an array. As it's automatic it's natural
221    * to expect RISC compiler to accomodate at least part of it in
222    * the register bank, isn't it? Unfortunately not all compilers
223    * "find" this expectation reasonable:-( On order to make such
224    * compilers generate better code I replace X[] with a bunch of
225    * X0, X1, etc. See the function body below...
226    *                                    <appro@fy.chalmers.se>
227    */
228 # define X(i)   XX##i
229 #else
230   /*
231    * However! Some compilers (most notably HP C) get overwhelmed by
232    * that many local variables so that we have to have the way to
233    * fall down to the original behavior.
234    */
235 # define X(i)   XX[i]
236 #endif
237
238 #ifndef DONT_IMPLEMENT_BLOCK_HOST_ORDER
239 void HASH_BLOCK_HOST_ORDER (SHA_CTX *c, const void *d, size_t num)
240         {
241         const SHA_LONG *W=d;
242         register unsigned MD32_REG_T A,B,C,D,E,T;
243 #ifndef MD32_XARRAY
244         unsigned MD32_REG_T     XX0, XX1, XX2, XX3, XX4, XX5, XX6, XX7,
245                                 XX8, XX9,XX10,XX11,XX12,XX13,XX14,XX15;
246 #else
247         SHA_LONG        XX[16];
248 #endif
249
250         A=c->h0;
251         B=c->h1;
252         C=c->h2;
253         D=c->h3;
254         E=c->h4;
255
256         for (;;)
257                 {
258         BODY_00_15( 0,A,B,C,D,E,T,W[ 0]);
259         BODY_00_15( 1,T,A,B,C,D,E,W[ 1]);
260         BODY_00_15( 2,E,T,A,B,C,D,W[ 2]);
261         BODY_00_15( 3,D,E,T,A,B,C,W[ 3]);
262         BODY_00_15( 4,C,D,E,T,A,B,W[ 4]);
263         BODY_00_15( 5,B,C,D,E,T,A,W[ 5]);
264         BODY_00_15( 6,A,B,C,D,E,T,W[ 6]);
265         BODY_00_15( 7,T,A,B,C,D,E,W[ 7]);
266         BODY_00_15( 8,E,T,A,B,C,D,W[ 8]);
267         BODY_00_15( 9,D,E,T,A,B,C,W[ 9]);
268         BODY_00_15(10,C,D,E,T,A,B,W[10]);
269         BODY_00_15(11,B,C,D,E,T,A,W[11]);
270         BODY_00_15(12,A,B,C,D,E,T,W[12]);
271         BODY_00_15(13,T,A,B,C,D,E,W[13]);
272         BODY_00_15(14,E,T,A,B,C,D,W[14]);
273         BODY_00_15(15,D,E,T,A,B,C,W[15]);
274
275         BODY_16_19(16,C,D,E,T,A,B,X( 0),W[ 0],W[ 2],W[ 8],W[13]);
276         BODY_16_19(17,B,C,D,E,T,A,X( 1),W[ 1],W[ 3],W[ 9],W[14]);
277         BODY_16_19(18,A,B,C,D,E,T,X( 2),W[ 2],W[ 4],W[10],W[15]);
278         BODY_16_19(19,T,A,B,C,D,E,X( 3),W[ 3],W[ 5],W[11],X( 0));
279
280         BODY_20_31(20,E,T,A,B,C,D,X( 4),W[ 4],W[ 6],W[12],X( 1));
281         BODY_20_31(21,D,E,T,A,B,C,X( 5),W[ 5],W[ 7],W[13],X( 2));
282         BODY_20_31(22,C,D,E,T,A,B,X( 6),W[ 6],W[ 8],W[14],X( 3));
283         BODY_20_31(23,B,C,D,E,T,A,X( 7),W[ 7],W[ 9],W[15],X( 4));
284         BODY_20_31(24,A,B,C,D,E,T,X( 8),W[ 8],W[10],X( 0),X( 5));
285         BODY_20_31(25,T,A,B,C,D,E,X( 9),W[ 9],W[11],X( 1),X( 6));
286         BODY_20_31(26,E,T,A,B,C,D,X(10),W[10],W[12],X( 2),X( 7));
287         BODY_20_31(27,D,E,T,A,B,C,X(11),W[11],W[13],X( 3),X( 8));
288         BODY_20_31(28,C,D,E,T,A,B,X(12),W[12],W[14],X( 4),X( 9));
289         BODY_20_31(29,B,C,D,E,T,A,X(13),W[13],W[15],X( 5),X(10));
290         BODY_20_31(30,A,B,C,D,E,T,X(14),W[14],X( 0),X( 6),X(11));
291         BODY_20_31(31,T,A,B,C,D,E,X(15),W[15],X( 1),X( 7),X(12));
292
293         BODY_32_39(32,E,T,A,B,C,D,X( 0),X( 2),X( 8),X(13));
294         BODY_32_39(33,D,E,T,A,B,C,X( 1),X( 3),X( 9),X(14));
295         BODY_32_39(34,C,D,E,T,A,B,X( 2),X( 4),X(10),X(15));
296         BODY_32_39(35,B,C,D,E,T,A,X( 3),X( 5),X(11),X( 0));
297         BODY_32_39(36,A,B,C,D,E,T,X( 4),X( 6),X(12),X( 1));
298         BODY_32_39(37,T,A,B,C,D,E,X( 5),X( 7),X(13),X( 2));
299         BODY_32_39(38,E,T,A,B,C,D,X( 6),X( 8),X(14),X( 3));
300         BODY_32_39(39,D,E,T,A,B,C,X( 7),X( 9),X(15),X( 4));
301
302         BODY_40_59(40,C,D,E,T,A,B,X( 8),X(10),X( 0),X( 5));
303         BODY_40_59(41,B,C,D,E,T,A,X( 9),X(11),X( 1),X( 6));
304         BODY_40_59(42,A,B,C,D,E,T,X(10),X(12),X( 2),X( 7));
305         BODY_40_59(43,T,A,B,C,D,E,X(11),X(13),X( 3),X( 8));
306         BODY_40_59(44,E,T,A,B,C,D,X(12),X(14),X( 4),X( 9));
307         BODY_40_59(45,D,E,T,A,B,C,X(13),X(15),X( 5),X(10));
308         BODY_40_59(46,C,D,E,T,A,B,X(14),X( 0),X( 6),X(11));
309         BODY_40_59(47,B,C,D,E,T,A,X(15),X( 1),X( 7),X(12));
310         BODY_40_59(48,A,B,C,D,E,T,X( 0),X( 2),X( 8),X(13));
311         BODY_40_59(49,T,A,B,C,D,E,X( 1),X( 3),X( 9),X(14));
312         BODY_40_59(50,E,T,A,B,C,D,X( 2),X( 4),X(10),X(15));
313         BODY_40_59(51,D,E,T,A,B,C,X( 3),X( 5),X(11),X( 0));
314         BODY_40_59(52,C,D,E,T,A,B,X( 4),X( 6),X(12),X( 1));
315         BODY_40_59(53,B,C,D,E,T,A,X( 5),X( 7),X(13),X( 2));
316         BODY_40_59(54,A,B,C,D,E,T,X( 6),X( 8),X(14),X( 3));
317         BODY_40_59(55,T,A,B,C,D,E,X( 7),X( 9),X(15),X( 4));
318         BODY_40_59(56,E,T,A,B,C,D,X( 8),X(10),X( 0),X( 5));
319         BODY_40_59(57,D,E,T,A,B,C,X( 9),X(11),X( 1),X( 6));
320         BODY_40_59(58,C,D,E,T,A,B,X(10),X(12),X( 2),X( 7));
321         BODY_40_59(59,B,C,D,E,T,A,X(11),X(13),X( 3),X( 8));
322
323         BODY_60_79(60,A,B,C,D,E,T,X(12),X(14),X( 4),X( 9));
324         BODY_60_79(61,T,A,B,C,D,E,X(13),X(15),X( 5),X(10));
325         BODY_60_79(62,E,T,A,B,C,D,X(14),X( 0),X( 6),X(11));
326         BODY_60_79(63,D,E,T,A,B,C,X(15),X( 1),X( 7),X(12));
327         BODY_60_79(64,C,D,E,T,A,B,X( 0),X( 2),X( 8),X(13));
328         BODY_60_79(65,B,C,D,E,T,A,X( 1),X( 3),X( 9),X(14));
329         BODY_60_79(66,A,B,C,D,E,T,X( 2),X( 4),X(10),X(15));
330         BODY_60_79(67,T,A,B,C,D,E,X( 3),X( 5),X(11),X( 0));
331         BODY_60_79(68,E,T,A,B,C,D,X( 4),X( 6),X(12),X( 1));
332         BODY_60_79(69,D,E,T,A,B,C,X( 5),X( 7),X(13),X( 2));
333         BODY_60_79(70,C,D,E,T,A,B,X( 6),X( 8),X(14),X( 3));
334         BODY_60_79(71,B,C,D,E,T,A,X( 7),X( 9),X(15),X( 4));
335         BODY_60_79(72,A,B,C,D,E,T,X( 8),X(10),X( 0),X( 5));
336         BODY_60_79(73,T,A,B,C,D,E,X( 9),X(11),X( 1),X( 6));
337         BODY_60_79(74,E,T,A,B,C,D,X(10),X(12),X( 2),X( 7));
338         BODY_60_79(75,D,E,T,A,B,C,X(11),X(13),X( 3),X( 8));
339         BODY_60_79(76,C,D,E,T,A,B,X(12),X(14),X( 4),X( 9));
340         BODY_60_79(77,B,C,D,E,T,A,X(13),X(15),X( 5),X(10));
341         BODY_60_79(78,A,B,C,D,E,T,X(14),X( 0),X( 6),X(11));
342         BODY_60_79(79,T,A,B,C,D,E,X(15),X( 1),X( 7),X(12));
343         
344         c->h0=(c->h0+E)&0xffffffffL; 
345         c->h1=(c->h1+T)&0xffffffffL;
346         c->h2=(c->h2+A)&0xffffffffL;
347         c->h3=(c->h3+B)&0xffffffffL;
348         c->h4=(c->h4+C)&0xffffffffL;
349
350         if (--num == 0) break;
351
352         A=c->h0;
353         B=c->h1;
354         C=c->h2;
355         D=c->h3;
356         E=c->h4;
357
358         W+=SHA_LBLOCK;
359                 }
360         }
361 #endif
362
363 #ifndef DONT_IMPLEMENT_BLOCK_DATA_ORDER
364 void HASH_BLOCK_DATA_ORDER (SHA_CTX *c, const void *p, size_t num)
365         {
366         const unsigned char *data=p;
367         register unsigned MD32_REG_T A,B,C,D,E,T,l;
368 #ifndef MD32_XARRAY
369         unsigned MD32_REG_T     XX0, XX1, XX2, XX3, XX4, XX5, XX6, XX7,
370                                 XX8, XX9,XX10,XX11,XX12,XX13,XX14,XX15;
371 #else
372         SHA_LONG        XX[16];
373 #endif
374
375         A=c->h0;
376         B=c->h1;
377         C=c->h2;
378         D=c->h3;
379         E=c->h4;
380
381         for (;;)
382                 {
383
384         HOST_c2l(data,l); X( 0)=l;              HOST_c2l(data,l); X( 1)=l;
385         BODY_00_15( 0,A,B,C,D,E,T,X( 0));       HOST_c2l(data,l); X( 2)=l;
386         BODY_00_15( 1,T,A,B,C,D,E,X( 1));       HOST_c2l(data,l); X( 3)=l;
387         BODY_00_15( 2,E,T,A,B,C,D,X( 2));       HOST_c2l(data,l); X( 4)=l;
388         BODY_00_15( 3,D,E,T,A,B,C,X( 3));       HOST_c2l(data,l); X( 5)=l;
389         BODY_00_15( 4,C,D,E,T,A,B,X( 4));       HOST_c2l(data,l); X( 6)=l;
390         BODY_00_15( 5,B,C,D,E,T,A,X( 5));       HOST_c2l(data,l); X( 7)=l;
391         BODY_00_15( 6,A,B,C,D,E,T,X( 6));       HOST_c2l(data,l); X( 8)=l;
392         BODY_00_15( 7,T,A,B,C,D,E,X( 7));       HOST_c2l(data,l); X( 9)=l;
393         BODY_00_15( 8,E,T,A,B,C,D,X( 8));       HOST_c2l(data,l); X(10)=l;
394         BODY_00_15( 9,D,E,T,A,B,C,X( 9));       HOST_c2l(data,l); X(11)=l;
395         BODY_00_15(10,C,D,E,T,A,B,X(10));       HOST_c2l(data,l); X(12)=l;
396         BODY_00_15(11,B,C,D,E,T,A,X(11));       HOST_c2l(data,l); X(13)=l;
397         BODY_00_15(12,A,B,C,D,E,T,X(12));       HOST_c2l(data,l); X(14)=l;
398         BODY_00_15(13,T,A,B,C,D,E,X(13));       HOST_c2l(data,l); X(15)=l;
399         BODY_00_15(14,E,T,A,B,C,D,X(14));
400         BODY_00_15(15,D,E,T,A,B,C,X(15));
401
402         BODY_16_19(16,C,D,E,T,A,B,X( 0),X( 0),X( 2),X( 8),X(13));
403         BODY_16_19(17,B,C,D,E,T,A,X( 1),X( 1),X( 3),X( 9),X(14));
404         BODY_16_19(18,A,B,C,D,E,T,X( 2),X( 2),X( 4),X(10),X(15));
405         BODY_16_19(19,T,A,B,C,D,E,X( 3),X( 3),X( 5),X(11),X( 0));
406
407         BODY_20_31(20,E,T,A,B,C,D,X( 4),X( 4),X( 6),X(12),X( 1));
408         BODY_20_31(21,D,E,T,A,B,C,X( 5),X( 5),X( 7),X(13),X( 2));
409         BODY_20_31(22,C,D,E,T,A,B,X( 6),X( 6),X( 8),X(14),X( 3));
410         BODY_20_31(23,B,C,D,E,T,A,X( 7),X( 7),X( 9),X(15),X( 4));
411         BODY_20_31(24,A,B,C,D,E,T,X( 8),X( 8),X(10),X( 0),X( 5));
412         BODY_20_31(25,T,A,B,C,D,E,X( 9),X( 9),X(11),X( 1),X( 6));
413         BODY_20_31(26,E,T,A,B,C,D,X(10),X(10),X(12),X( 2),X( 7));
414         BODY_20_31(27,D,E,T,A,B,C,X(11),X(11),X(13),X( 3),X( 8));
415         BODY_20_31(28,C,D,E,T,A,B,X(12),X(12),X(14),X( 4),X( 9));
416         BODY_20_31(29,B,C,D,E,T,A,X(13),X(13),X(15),X( 5),X(10));
417         BODY_20_31(30,A,B,C,D,E,T,X(14),X(14),X( 0),X( 6),X(11));
418         BODY_20_31(31,T,A,B,C,D,E,X(15),X(15),X( 1),X( 7),X(12));
419
420         BODY_32_39(32,E,T,A,B,C,D,X( 0),X( 2),X( 8),X(13));
421         BODY_32_39(33,D,E,T,A,B,C,X( 1),X( 3),X( 9),X(14));
422         BODY_32_39(34,C,D,E,T,A,B,X( 2),X( 4),X(10),X(15));
423         BODY_32_39(35,B,C,D,E,T,A,X( 3),X( 5),X(11),X( 0));
424         BODY_32_39(36,A,B,C,D,E,T,X( 4),X( 6),X(12),X( 1));
425         BODY_32_39(37,T,A,B,C,D,E,X( 5),X( 7),X(13),X( 2));
426         BODY_32_39(38,E,T,A,B,C,D,X( 6),X( 8),X(14),X( 3));
427         BODY_32_39(39,D,E,T,A,B,C,X( 7),X( 9),X(15),X( 4));
428
429         BODY_40_59(40,C,D,E,T,A,B,X( 8),X(10),X( 0),X( 5));
430         BODY_40_59(41,B,C,D,E,T,A,X( 9),X(11),X( 1),X( 6));
431         BODY_40_59(42,A,B,C,D,E,T,X(10),X(12),X( 2),X( 7));
432         BODY_40_59(43,T,A,B,C,D,E,X(11),X(13),X( 3),X( 8));
433         BODY_40_59(44,E,T,A,B,C,D,X(12),X(14),X( 4),X( 9));
434         BODY_40_59(45,D,E,T,A,B,C,X(13),X(15),X( 5),X(10));
435         BODY_40_59(46,C,D,E,T,A,B,X(14),X( 0),X( 6),X(11));
436         BODY_40_59(47,B,C,D,E,T,A,X(15),X( 1),X( 7),X(12));
437         BODY_40_59(48,A,B,C,D,E,T,X( 0),X( 2),X( 8),X(13));
438         BODY_40_59(49,T,A,B,C,D,E,X( 1),X( 3),X( 9),X(14));
439         BODY_40_59(50,E,T,A,B,C,D,X( 2),X( 4),X(10),X(15));
440         BODY_40_59(51,D,E,T,A,B,C,X( 3),X( 5),X(11),X( 0));
441         BODY_40_59(52,C,D,E,T,A,B,X( 4),X( 6),X(12),X( 1));
442         BODY_40_59(53,B,C,D,E,T,A,X( 5),X( 7),X(13),X( 2));
443         BODY_40_59(54,A,B,C,D,E,T,X( 6),X( 8),X(14),X( 3));
444         BODY_40_59(55,T,A,B,C,D,E,X( 7),X( 9),X(15),X( 4));
445         BODY_40_59(56,E,T,A,B,C,D,X( 8),X(10),X( 0),X( 5));
446         BODY_40_59(57,D,E,T,A,B,C,X( 9),X(11),X( 1),X( 6));
447         BODY_40_59(58,C,D,E,T,A,B,X(10),X(12),X( 2),X( 7));
448         BODY_40_59(59,B,C,D,E,T,A,X(11),X(13),X( 3),X( 8));
449
450         BODY_60_79(60,A,B,C,D,E,T,X(12),X(14),X( 4),X( 9));
451         BODY_60_79(61,T,A,B,C,D,E,X(13),X(15),X( 5),X(10));
452         BODY_60_79(62,E,T,A,B,C,D,X(14),X( 0),X( 6),X(11));
453         BODY_60_79(63,D,E,T,A,B,C,X(15),X( 1),X( 7),X(12));
454         BODY_60_79(64,C,D,E,T,A,B,X( 0),X( 2),X( 8),X(13));
455         BODY_60_79(65,B,C,D,E,T,A,X( 1),X( 3),X( 9),X(14));
456         BODY_60_79(66,A,B,C,D,E,T,X( 2),X( 4),X(10),X(15));
457         BODY_60_79(67,T,A,B,C,D,E,X( 3),X( 5),X(11),X( 0));
458         BODY_60_79(68,E,T,A,B,C,D,X( 4),X( 6),X(12),X( 1));
459         BODY_60_79(69,D,E,T,A,B,C,X( 5),X( 7),X(13),X( 2));
460         BODY_60_79(70,C,D,E,T,A,B,X( 6),X( 8),X(14),X( 3));
461         BODY_60_79(71,B,C,D,E,T,A,X( 7),X( 9),X(15),X( 4));
462         BODY_60_79(72,A,B,C,D,E,T,X( 8),X(10),X( 0),X( 5));
463         BODY_60_79(73,T,A,B,C,D,E,X( 9),X(11),X( 1),X( 6));
464         BODY_60_79(74,E,T,A,B,C,D,X(10),X(12),X( 2),X( 7));
465         BODY_60_79(75,D,E,T,A,B,C,X(11),X(13),X( 3),X( 8));
466         BODY_60_79(76,C,D,E,T,A,B,X(12),X(14),X( 4),X( 9));
467         BODY_60_79(77,B,C,D,E,T,A,X(13),X(15),X( 5),X(10));
468         BODY_60_79(78,A,B,C,D,E,T,X(14),X( 0),X( 6),X(11));
469         BODY_60_79(79,T,A,B,C,D,E,X(15),X( 1),X( 7),X(12));
470         
471         c->h0=(c->h0+E)&0xffffffffL; 
472         c->h1=(c->h1+T)&0xffffffffL;
473         c->h2=(c->h2+A)&0xffffffffL;
474         c->h3=(c->h3+B)&0xffffffffL;
475         c->h4=(c->h4+C)&0xffffffffL;
476
477         if (--num == 0) break;
478
479         A=c->h0;
480         B=c->h1;
481         C=c->h2;
482         D=c->h3;
483         E=c->h4;
484
485                 }
486         }
487 #endif
488
489 #else   /* OPENSSL_SMALL_FOOTPRINT */
490
491 #define BODY_00_15(xi)           do {   \
492         T=E+K_00_19+F_00_19(B,C,D);     \
493         E=D, D=C, C=ROTATE(B,30), B=A;  \
494         A=ROTATE(A,5)+T+xi;         } while(0)
495
496 #define BODY_16_19(xa,xb,xc,xd)  do {   \
497         Xupdate(T,xa,xa,xb,xc,xd);      \
498         T+=E+K_00_19+F_00_19(B,C,D);    \
499         E=D, D=C, C=ROTATE(B,30), B=A;  \
500         A=ROTATE(A,5)+T;            } while(0)
501
502 #define BODY_20_39(xa,xb,xc,xd)  do {   \
503         Xupdate(T,xa,xa,xb,xc,xd);      \
504         T+=E+K_20_39+F_20_39(B,C,D);    \
505         E=D, D=C, C=ROTATE(B,30), B=A;  \
506         A=ROTATE(A,5)+T;            } while(0)
507
508 #define BODY_40_59(xa,xb,xc,xd)  do {   \
509         Xupdate(T,xa,xa,xb,xc,xd);      \
510         T+=E+K_40_59+F_40_59(B,C,D);    \
511         E=D, D=C, C=ROTATE(B,30), B=A;  \
512         A=ROTATE(A,5)+T;            } while(0)
513
514 #define BODY_60_79(xa,xb,xc,xd)  do {   \
515         Xupdate(T,xa,xa,xb,xc,xd);      \
516         T=E+K_60_79+F_60_79(B,C,D);     \
517         E=D, D=C, C=ROTATE(B,30), B=A;  \
518         A=ROTATE(A,5)+T+xa;         } while(0)
519
520 #ifndef DONT_IMPLEMENT_BLOCK_HOST_ORDER
521 void HASH_BLOCK_HOST_ORDER (SHA_CTX *c, const void *d, size_t num)
522         {
523         const SHA_LONG *W=d;
524         register unsigned MD32_REG_T A,B,C,D,E,T;
525         int i;
526         SHA_LONG        X[16];
527
528         A=c->h0;
529         B=c->h1;
530         C=c->h2;
531         D=c->h3;
532         E=c->h4;
533
534         for (;;)
535                 {
536         for (i=0;i<16;i++)
537         { X[i]=W[i]; BODY_00_15(X[i]); }
538         for (i=0;i<4;i++)
539         { BODY_16_19(X[i],       X[i+2],      X[i+8],     X[(i+13)&15]); }
540         for (;i<24;i++)
541         { BODY_20_39(X[i&15],    X[(i+2)&15], X[(i+8)&15],X[(i+13)&15]); }
542         for (i=0;i<20;i++)
543         { BODY_40_59(X[(i+8)&15],X[(i+10)&15],X[i&15],    X[(i+5)&15]);  }
544         for (i=4;i<24;i++)
545         { BODY_60_79(X[(i+8)&15],X[(i+10)&15],X[i&15],    X[(i+5)&15]);  }
546         
547         c->h0=(c->h0+A)&0xffffffffL; 
548         c->h1=(c->h1+B)&0xffffffffL;
549         c->h2=(c->h2+C)&0xffffffffL;
550         c->h3=(c->h3+D)&0xffffffffL;
551         c->h4=(c->h4+E)&0xffffffffL;
552
553         if (--num == 0) break;
554
555         A=c->h0;
556         B=c->h1;
557         C=c->h2;
558         D=c->h3;
559         E=c->h4;
560
561         W+=SHA_LBLOCK;
562                 }
563         }
564 #endif
565
566 #ifndef DONT_IMPLEMENT_BLOCK_DATA_ORDER
567 void HASH_BLOCK_DATA_ORDER (SHA_CTX *c, const void *p, size_t num)
568         {
569         const unsigned char *data=p;
570         register unsigned MD32_REG_T A,B,C,D,E,T,l;
571         int i;
572         SHA_LONG        X[16];
573
574         A=c->h0;
575         B=c->h1;
576         C=c->h2;
577         D=c->h3;
578         E=c->h4;
579
580         for (;;)
581                 {
582         for (i=0;i<16;i++)
583         { HOST_c2l(data,l); X[i]=l; BODY_00_15(X[i]); }
584         for (i=0;i<4;i++)
585         { BODY_16_19(X[i],       X[i+2],      X[i+8],     X[(i+13)&15]); }
586         for (;i<24;i++)
587         { BODY_20_39(X[i&15],    X[(i+2)&15], X[(i+8)&15],X[(i+13)&15]); }
588         for (i=0;i<20;i++)
589         { BODY_40_59(X[(i+8)&15],X[(i+10)&15],X[i&15],    X[(i+5)&15]);  }
590         for (i=4;i<24;i++)
591         { BODY_60_79(X[(i+8)&15],X[(i+10)&15],X[i&15],    X[(i+5)&15]);  }
592
593         c->h0=(c->h0+A)&0xffffffffL; 
594         c->h1=(c->h1+B)&0xffffffffL;
595         c->h2=(c->h2+C)&0xffffffffL;
596         c->h3=(c->h3+D)&0xffffffffL;
597         c->h4=(c->h4+E)&0xffffffffL;
598
599         if (--num == 0) break;
600
601         A=c->h0;
602         B=c->h1;
603         C=c->h2;
604         D=c->h3;
605         E=c->h4;
606
607                 }
608         }
609 #endif
610
611 #endif