Engage SHA1 IA64 assembler on IA64 platforms.
[openssl.git] / crypto / sha / sha_locl.h
1 /* crypto/sha/sha_locl.h */
2 /* Copyright (C) 1995-1998 Eric Young (eay@cryptsoft.com)
3  * All rights reserved.
4  *
5  * This package is an SSL implementation written
6  * by Eric Young (eay@cryptsoft.com).
7  * The implementation was written so as to conform with Netscapes SSL.
8  * 
9  * This library is free for commercial and non-commercial use as long as
10  * the following conditions are aheared to.  The following conditions
11  * apply to all code found in this distribution, be it the RC4, RSA,
12  * lhash, DES, etc., code; not just the SSL code.  The SSL documentation
13  * included with this distribution is covered by the same copyright terms
14  * except that the holder is Tim Hudson (tjh@cryptsoft.com).
15  * 
16  * Copyright remains Eric Young's, and as such any Copyright notices in
17  * the code are not to be removed.
18  * If this package is used in a product, Eric Young should be given attribution
19  * as the author of the parts of the library used.
20  * This can be in the form of a textual message at program startup or
21  * in documentation (online or textual) provided with the package.
22  * 
23  * Redistribution and use in source and binary forms, with or without
24  * modification, are permitted provided that the following conditions
25  * are met:
26  * 1. Redistributions of source code must retain the copyright
27  *    notice, this list of conditions and the following disclaimer.
28  * 2. Redistributions in binary form must reproduce the above copyright
29  *    notice, this list of conditions and the following disclaimer in the
30  *    documentation and/or other materials provided with the distribution.
31  * 3. All advertising materials mentioning features or use of this software
32  *    must display the following acknowledgement:
33  *    "This product includes cryptographic software written by
34  *     Eric Young (eay@cryptsoft.com)"
35  *    The word 'cryptographic' can be left out if the rouines from the library
36  *    being used are not cryptographic related :-).
37  * 4. If you include any Windows specific code (or a derivative thereof) from 
38  *    the apps directory (application code) you must include an acknowledgement:
39  *    "This product includes software written by Tim Hudson (tjh@cryptsoft.com)"
40  * 
41  * THIS SOFTWARE IS PROVIDED BY ERIC YOUNG ``AS IS'' AND
42  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
43  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
44  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
45  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
46  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
47  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
48  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
49  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
50  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
51  * SUCH DAMAGE.
52  * 
53  * The licence and distribution terms for any publically available version or
54  * derivative of this code cannot be changed.  i.e. this code cannot simply be
55  * copied and put under another distribution licence
56  * [including the GNU Public Licence.]
57  */
58
59 #include <stdlib.h>
60 #include <string.h>
61
62 #include <openssl/opensslconf.h>
63 #include <openssl/sha.h>
64
65 #ifndef SHA_LONG_LOG2
66 #define SHA_LONG_LOG2   2       /* default to 32 bits */
67 #endif
68
69 #define DATA_ORDER_IS_BIG_ENDIAN
70
71 #define HASH_LONG               SHA_LONG
72 #define HASH_LONG_LOG2          SHA_LONG_LOG2
73 #define HASH_CTX                SHA_CTX
74 #define HASH_CBLOCK             SHA_CBLOCK
75 #define HASH_LBLOCK             SHA_LBLOCK
76 #define HASH_MAKE_STRING(c,s)   do {    \
77         unsigned long ll;               \
78         ll=(c)->h0; HOST_l2c(ll,(s));   \
79         ll=(c)->h1; HOST_l2c(ll,(s));   \
80         ll=(c)->h2; HOST_l2c(ll,(s));   \
81         ll=(c)->h3; HOST_l2c(ll,(s));   \
82         ll=(c)->h4; HOST_l2c(ll,(s));   \
83         } while (0)
84
85 #if defined(SHA_0)
86
87 # define HASH_UPDATE                    SHA_Update
88 # define HASH_TRANSFORM                 SHA_Transform
89 # define HASH_FINAL                     SHA_Final
90 # define HASH_INIT                      SHA_Init
91 # define HASH_BLOCK_HOST_ORDER          sha_block_host_order
92 # define HASH_BLOCK_DATA_ORDER          sha_block_data_order
93 # define Xupdate(a,ix,ia,ib,ic,id)      (ix=(a)=(ia^ib^ic^id))
94
95   void sha_block_host_order (SHA_CTX *c, const void *p,size_t num);
96   void sha_block_data_order (SHA_CTX *c, const void *p,size_t num);
97
98 #elif defined(SHA_1)
99
100 # define HASH_UPDATE                    SHA1_Update
101 # define HASH_TRANSFORM                 SHA1_Transform
102 # define HASH_FINAL                     SHA1_Final
103 # define HASH_INIT                      SHA1_Init
104 # define HASH_BLOCK_HOST_ORDER          sha1_block_host_order
105 # define HASH_BLOCK_DATA_ORDER          sha1_block_data_order
106 # if defined(__MWERKS__) && defined(__MC68K__)
107    /* Metrowerks for Motorola fails otherwise:-( <appro@fy.chalmers.se> */
108 #  define Xupdate(a,ix,ia,ib,ic,id)     do { (a)=(ia^ib^ic^id);         \
109                                              ix=(a)=ROTATE((a),1);      \
110                                         } while (0)
111 # else
112 #  define Xupdate(a,ix,ia,ib,ic,id)     ( (a)=(ia^ib^ic^id),    \
113                                           ix=(a)=ROTATE((a),1)  \
114                                         )
115 # endif
116
117 # ifdef SHA1_ASM
118 #  if defined(__i386) || defined(__i386__) || defined(_M_IX86) || defined(__INTEL__)
119 #   define sha1_block_host_order                sha1_block_asm_host_order
120 #   define DONT_IMPLEMENT_BLOCK_HOST_ORDER
121 #   define sha1_block_data_order                sha1_block_asm_data_order
122 #   define DONT_IMPLEMENT_BLOCK_DATA_ORDER
123 #   define HASH_BLOCK_DATA_ORDER_ALIGNED        sha1_block_asm_data_order
124 #  elif defined(__ia64) || defined(__ia64__) || defined(_M_IA64)
125 #   define sha1_block_host_order                sha1_block_asm_host_order
126 #   define DONT_IMPLEMENT_BLOCK_HOST_ORDER
127 #   define sha1_block_data_order                sha1_block_asm_data_order
128 #   define DONT_IMPLEMENT_BLOCK_DATA_ORDER
129 #  endif
130 # endif
131   void sha1_block_host_order (SHA_CTX *c, const void *p,size_t num);
132   void sha1_block_data_order (SHA_CTX *c, const void *p,size_t num);
133
134 #else
135 # error "Either SHA_0 or SHA_1 must be defined."
136 #endif
137
138 #include "md32_common.h"
139
140 #define INIT_DATA_h0 0x67452301UL
141 #define INIT_DATA_h1 0xefcdab89UL
142 #define INIT_DATA_h2 0x98badcfeUL
143 #define INIT_DATA_h3 0x10325476UL
144 #define INIT_DATA_h4 0xc3d2e1f0UL
145
146 int HASH_INIT (SHA_CTX *c)
147         {
148         c->h0=INIT_DATA_h0;
149         c->h1=INIT_DATA_h1;
150         c->h2=INIT_DATA_h2;
151         c->h3=INIT_DATA_h3;
152         c->h4=INIT_DATA_h4;
153         c->Nl=0;
154         c->Nh=0;
155         c->num=0;
156         return 1;
157         }
158
159 #define K_00_19 0x5a827999UL
160 #define K_20_39 0x6ed9eba1UL
161 #define K_40_59 0x8f1bbcdcUL
162 #define K_60_79 0xca62c1d6UL
163
164 /* As  pointed out by Wei Dai <weidai@eskimo.com>, F() below can be
165  * simplified to the code in F_00_19.  Wei attributes these optimisations
166  * to Peter Gutmann's SHS code, and he attributes it to Rich Schroeppel.
167  * #define F(x,y,z) (((x) & (y))  |  ((~(x)) & (z)))
168  * I've just become aware of another tweak to be made, again from Wei Dai,
169  * in F_40_59, (x&a)|(y&a) -> (x|y)&a
170  */
171 #define F_00_19(b,c,d)  ((((c) ^ (d)) & (b)) ^ (d)) 
172 #define F_20_39(b,c,d)  ((b) ^ (c) ^ (d))
173 #define F_40_59(b,c,d)  (((b) & (c)) | (((b)|(c)) & (d))) 
174 #define F_60_79(b,c,d)  F_20_39(b,c,d)
175
176 #ifndef OPENSSL_SMALL_FOOTPRINT
177
178 #define BODY_00_15(i,a,b,c,d,e,f,xi) \
179         (f)=xi+(e)+K_00_19+ROTATE((a),5)+F_00_19((b),(c),(d)); \
180         (b)=ROTATE((b),30);
181
182 #define BODY_16_19(i,a,b,c,d,e,f,xi,xa,xb,xc,xd) \
183         Xupdate(f,xi,xa,xb,xc,xd); \
184         (f)+=(e)+K_00_19+ROTATE((a),5)+F_00_19((b),(c),(d)); \
185         (b)=ROTATE((b),30);
186
187 #define BODY_20_31(i,a,b,c,d,e,f,xi,xa,xb,xc,xd) \
188         Xupdate(f,xi,xa,xb,xc,xd); \
189         (f)+=(e)+K_20_39+ROTATE((a),5)+F_20_39((b),(c),(d)); \
190         (b)=ROTATE((b),30);
191
192 #define BODY_32_39(i,a,b,c,d,e,f,xa,xb,xc,xd) \
193         Xupdate(f,xa,xa,xb,xc,xd); \
194         (f)+=(e)+K_20_39+ROTATE((a),5)+F_20_39((b),(c),(d)); \
195         (b)=ROTATE((b),30);
196
197 #define BODY_40_59(i,a,b,c,d,e,f,xa,xb,xc,xd) \
198         Xupdate(f,xa,xa,xb,xc,xd); \
199         (f)+=(e)+K_40_59+ROTATE((a),5)+F_40_59((b),(c),(d)); \
200         (b)=ROTATE((b),30);
201
202 #define BODY_60_79(i,a,b,c,d,e,f,xa,xb,xc,xd) \
203         Xupdate(f,xa,xa,xb,xc,xd); \
204         (f)=xa+(e)+K_60_79+ROTATE((a),5)+F_60_79((b),(c),(d)); \
205         (b)=ROTATE((b),30);
206
207 #ifdef X
208 #undef X
209 #endif
210 #ifndef MD32_XARRAY
211   /*
212    * Originally X was an array. As it's automatic it's natural
213    * to expect RISC compiler to accomodate at least part of it in
214    * the register bank, isn't it? Unfortunately not all compilers
215    * "find" this expectation reasonable:-( On order to make such
216    * compilers generate better code I replace X[] with a bunch of
217    * X0, X1, etc. See the function body below...
218    *                                    <appro@fy.chalmers.se>
219    */
220 # define X(i)   XX##i
221 #else
222   /*
223    * However! Some compilers (most notably HP C) get overwhelmed by
224    * that many local variables so that we have to have the way to
225    * fall down to the original behavior.
226    */
227 # define X(i)   XX[i]
228 #endif
229
230 #ifndef DONT_IMPLEMENT_BLOCK_HOST_ORDER
231 void HASH_BLOCK_HOST_ORDER (SHA_CTX *c, const void *d, size_t num)
232         {
233         const SHA_LONG *W=d;
234         register unsigned MD32_REG_T A,B,C,D,E,T;
235 #ifndef MD32_XARRAY
236         unsigned MD32_REG_T     XX0, XX1, XX2, XX3, XX4, XX5, XX6, XX7,
237                                 XX8, XX9,XX10,XX11,XX12,XX13,XX14,XX15;
238 #else
239         SHA_LONG        XX[16];
240 #endif
241
242         A=c->h0;
243         B=c->h1;
244         C=c->h2;
245         D=c->h3;
246         E=c->h4;
247
248         for (;;)
249                 {
250         BODY_00_15( 0,A,B,C,D,E,T,W[ 0]);
251         BODY_00_15( 1,T,A,B,C,D,E,W[ 1]);
252         BODY_00_15( 2,E,T,A,B,C,D,W[ 2]);
253         BODY_00_15( 3,D,E,T,A,B,C,W[ 3]);
254         BODY_00_15( 4,C,D,E,T,A,B,W[ 4]);
255         BODY_00_15( 5,B,C,D,E,T,A,W[ 5]);
256         BODY_00_15( 6,A,B,C,D,E,T,W[ 6]);
257         BODY_00_15( 7,T,A,B,C,D,E,W[ 7]);
258         BODY_00_15( 8,E,T,A,B,C,D,W[ 8]);
259         BODY_00_15( 9,D,E,T,A,B,C,W[ 9]);
260         BODY_00_15(10,C,D,E,T,A,B,W[10]);
261         BODY_00_15(11,B,C,D,E,T,A,W[11]);
262         BODY_00_15(12,A,B,C,D,E,T,W[12]);
263         BODY_00_15(13,T,A,B,C,D,E,W[13]);
264         BODY_00_15(14,E,T,A,B,C,D,W[14]);
265         BODY_00_15(15,D,E,T,A,B,C,W[15]);
266
267         BODY_16_19(16,C,D,E,T,A,B,X( 0),W[ 0],W[ 2],W[ 8],W[13]);
268         BODY_16_19(17,B,C,D,E,T,A,X( 1),W[ 1],W[ 3],W[ 9],W[14]);
269         BODY_16_19(18,A,B,C,D,E,T,X( 2),W[ 2],W[ 4],W[10],W[15]);
270         BODY_16_19(19,T,A,B,C,D,E,X( 3),W[ 3],W[ 5],W[11],X( 0));
271
272         BODY_20_31(20,E,T,A,B,C,D,X( 4),W[ 4],W[ 6],W[12],X( 1));
273         BODY_20_31(21,D,E,T,A,B,C,X( 5),W[ 5],W[ 7],W[13],X( 2));
274         BODY_20_31(22,C,D,E,T,A,B,X( 6),W[ 6],W[ 8],W[14],X( 3));
275         BODY_20_31(23,B,C,D,E,T,A,X( 7),W[ 7],W[ 9],W[15],X( 4));
276         BODY_20_31(24,A,B,C,D,E,T,X( 8),W[ 8],W[10],X( 0),X( 5));
277         BODY_20_31(25,T,A,B,C,D,E,X( 9),W[ 9],W[11],X( 1),X( 6));
278         BODY_20_31(26,E,T,A,B,C,D,X(10),W[10],W[12],X( 2),X( 7));
279         BODY_20_31(27,D,E,T,A,B,C,X(11),W[11],W[13],X( 3),X( 8));
280         BODY_20_31(28,C,D,E,T,A,B,X(12),W[12],W[14],X( 4),X( 9));
281         BODY_20_31(29,B,C,D,E,T,A,X(13),W[13],W[15],X( 5),X(10));
282         BODY_20_31(30,A,B,C,D,E,T,X(14),W[14],X( 0),X( 6),X(11));
283         BODY_20_31(31,T,A,B,C,D,E,X(15),W[15],X( 1),X( 7),X(12));
284
285         BODY_32_39(32,E,T,A,B,C,D,X( 0),X( 2),X( 8),X(13));
286         BODY_32_39(33,D,E,T,A,B,C,X( 1),X( 3),X( 9),X(14));
287         BODY_32_39(34,C,D,E,T,A,B,X( 2),X( 4),X(10),X(15));
288         BODY_32_39(35,B,C,D,E,T,A,X( 3),X( 5),X(11),X( 0));
289         BODY_32_39(36,A,B,C,D,E,T,X( 4),X( 6),X(12),X( 1));
290         BODY_32_39(37,T,A,B,C,D,E,X( 5),X( 7),X(13),X( 2));
291         BODY_32_39(38,E,T,A,B,C,D,X( 6),X( 8),X(14),X( 3));
292         BODY_32_39(39,D,E,T,A,B,C,X( 7),X( 9),X(15),X( 4));
293
294         BODY_40_59(40,C,D,E,T,A,B,X( 8),X(10),X( 0),X( 5));
295         BODY_40_59(41,B,C,D,E,T,A,X( 9),X(11),X( 1),X( 6));
296         BODY_40_59(42,A,B,C,D,E,T,X(10),X(12),X( 2),X( 7));
297         BODY_40_59(43,T,A,B,C,D,E,X(11),X(13),X( 3),X( 8));
298         BODY_40_59(44,E,T,A,B,C,D,X(12),X(14),X( 4),X( 9));
299         BODY_40_59(45,D,E,T,A,B,C,X(13),X(15),X( 5),X(10));
300         BODY_40_59(46,C,D,E,T,A,B,X(14),X( 0),X( 6),X(11));
301         BODY_40_59(47,B,C,D,E,T,A,X(15),X( 1),X( 7),X(12));
302         BODY_40_59(48,A,B,C,D,E,T,X( 0),X( 2),X( 8),X(13));
303         BODY_40_59(49,T,A,B,C,D,E,X( 1),X( 3),X( 9),X(14));
304         BODY_40_59(50,E,T,A,B,C,D,X( 2),X( 4),X(10),X(15));
305         BODY_40_59(51,D,E,T,A,B,C,X( 3),X( 5),X(11),X( 0));
306         BODY_40_59(52,C,D,E,T,A,B,X( 4),X( 6),X(12),X( 1));
307         BODY_40_59(53,B,C,D,E,T,A,X( 5),X( 7),X(13),X( 2));
308         BODY_40_59(54,A,B,C,D,E,T,X( 6),X( 8),X(14),X( 3));
309         BODY_40_59(55,T,A,B,C,D,E,X( 7),X( 9),X(15),X( 4));
310         BODY_40_59(56,E,T,A,B,C,D,X( 8),X(10),X( 0),X( 5));
311         BODY_40_59(57,D,E,T,A,B,C,X( 9),X(11),X( 1),X( 6));
312         BODY_40_59(58,C,D,E,T,A,B,X(10),X(12),X( 2),X( 7));
313         BODY_40_59(59,B,C,D,E,T,A,X(11),X(13),X( 3),X( 8));
314
315         BODY_60_79(60,A,B,C,D,E,T,X(12),X(14),X( 4),X( 9));
316         BODY_60_79(61,T,A,B,C,D,E,X(13),X(15),X( 5),X(10));
317         BODY_60_79(62,E,T,A,B,C,D,X(14),X( 0),X( 6),X(11));
318         BODY_60_79(63,D,E,T,A,B,C,X(15),X( 1),X( 7),X(12));
319         BODY_60_79(64,C,D,E,T,A,B,X( 0),X( 2),X( 8),X(13));
320         BODY_60_79(65,B,C,D,E,T,A,X( 1),X( 3),X( 9),X(14));
321         BODY_60_79(66,A,B,C,D,E,T,X( 2),X( 4),X(10),X(15));
322         BODY_60_79(67,T,A,B,C,D,E,X( 3),X( 5),X(11),X( 0));
323         BODY_60_79(68,E,T,A,B,C,D,X( 4),X( 6),X(12),X( 1));
324         BODY_60_79(69,D,E,T,A,B,C,X( 5),X( 7),X(13),X( 2));
325         BODY_60_79(70,C,D,E,T,A,B,X( 6),X( 8),X(14),X( 3));
326         BODY_60_79(71,B,C,D,E,T,A,X( 7),X( 9),X(15),X( 4));
327         BODY_60_79(72,A,B,C,D,E,T,X( 8),X(10),X( 0),X( 5));
328         BODY_60_79(73,T,A,B,C,D,E,X( 9),X(11),X( 1),X( 6));
329         BODY_60_79(74,E,T,A,B,C,D,X(10),X(12),X( 2),X( 7));
330         BODY_60_79(75,D,E,T,A,B,C,X(11),X(13),X( 3),X( 8));
331         BODY_60_79(76,C,D,E,T,A,B,X(12),X(14),X( 4),X( 9));
332         BODY_60_79(77,B,C,D,E,T,A,X(13),X(15),X( 5),X(10));
333         BODY_60_79(78,A,B,C,D,E,T,X(14),X( 0),X( 6),X(11));
334         BODY_60_79(79,T,A,B,C,D,E,X(15),X( 1),X( 7),X(12));
335         
336         c->h0=(c->h0+E)&0xffffffffL; 
337         c->h1=(c->h1+T)&0xffffffffL;
338         c->h2=(c->h2+A)&0xffffffffL;
339         c->h3=(c->h3+B)&0xffffffffL;
340         c->h4=(c->h4+C)&0xffffffffL;
341
342         if (--num == 0) break;
343
344         A=c->h0;
345         B=c->h1;
346         C=c->h2;
347         D=c->h3;
348         E=c->h4;
349
350         W+=SHA_LBLOCK;
351                 }
352         }
353 #endif
354
355 #ifndef DONT_IMPLEMENT_BLOCK_DATA_ORDER
356 void HASH_BLOCK_DATA_ORDER (SHA_CTX *c, const void *p, size_t num)
357         {
358         const unsigned char *data=p;
359         register unsigned MD32_REG_T A,B,C,D,E,T,l;
360 #ifndef MD32_XARRAY
361         unsigned MD32_REG_T     XX0, XX1, XX2, XX3, XX4, XX5, XX6, XX7,
362                                 XX8, XX9,XX10,XX11,XX12,XX13,XX14,XX15;
363 #else
364         SHA_LONG        XX[16];
365 #endif
366
367         A=c->h0;
368         B=c->h1;
369         C=c->h2;
370         D=c->h3;
371         E=c->h4;
372
373         for (;;)
374                 {
375
376         HOST_c2l(data,l); X( 0)=l;              HOST_c2l(data,l); X( 1)=l;
377         BODY_00_15( 0,A,B,C,D,E,T,X( 0));       HOST_c2l(data,l); X( 2)=l;
378         BODY_00_15( 1,T,A,B,C,D,E,X( 1));       HOST_c2l(data,l); X( 3)=l;
379         BODY_00_15( 2,E,T,A,B,C,D,X( 2));       HOST_c2l(data,l); X( 4)=l;
380         BODY_00_15( 3,D,E,T,A,B,C,X( 3));       HOST_c2l(data,l); X( 5)=l;
381         BODY_00_15( 4,C,D,E,T,A,B,X( 4));       HOST_c2l(data,l); X( 6)=l;
382         BODY_00_15( 5,B,C,D,E,T,A,X( 5));       HOST_c2l(data,l); X( 7)=l;
383         BODY_00_15( 6,A,B,C,D,E,T,X( 6));       HOST_c2l(data,l); X( 8)=l;
384         BODY_00_15( 7,T,A,B,C,D,E,X( 7));       HOST_c2l(data,l); X( 9)=l;
385         BODY_00_15( 8,E,T,A,B,C,D,X( 8));       HOST_c2l(data,l); X(10)=l;
386         BODY_00_15( 9,D,E,T,A,B,C,X( 9));       HOST_c2l(data,l); X(11)=l;
387         BODY_00_15(10,C,D,E,T,A,B,X(10));       HOST_c2l(data,l); X(12)=l;
388         BODY_00_15(11,B,C,D,E,T,A,X(11));       HOST_c2l(data,l); X(13)=l;
389         BODY_00_15(12,A,B,C,D,E,T,X(12));       HOST_c2l(data,l); X(14)=l;
390         BODY_00_15(13,T,A,B,C,D,E,X(13));       HOST_c2l(data,l); X(15)=l;
391         BODY_00_15(14,E,T,A,B,C,D,X(14));
392         BODY_00_15(15,D,E,T,A,B,C,X(15));
393
394         BODY_16_19(16,C,D,E,T,A,B,X( 0),X( 0),X( 2),X( 8),X(13));
395         BODY_16_19(17,B,C,D,E,T,A,X( 1),X( 1),X( 3),X( 9),X(14));
396         BODY_16_19(18,A,B,C,D,E,T,X( 2),X( 2),X( 4),X(10),X(15));
397         BODY_16_19(19,T,A,B,C,D,E,X( 3),X( 3),X( 5),X(11),X( 0));
398
399         BODY_20_31(20,E,T,A,B,C,D,X( 4),X( 4),X( 6),X(12),X( 1));
400         BODY_20_31(21,D,E,T,A,B,C,X( 5),X( 5),X( 7),X(13),X( 2));
401         BODY_20_31(22,C,D,E,T,A,B,X( 6),X( 6),X( 8),X(14),X( 3));
402         BODY_20_31(23,B,C,D,E,T,A,X( 7),X( 7),X( 9),X(15),X( 4));
403         BODY_20_31(24,A,B,C,D,E,T,X( 8),X( 8),X(10),X( 0),X( 5));
404         BODY_20_31(25,T,A,B,C,D,E,X( 9),X( 9),X(11),X( 1),X( 6));
405         BODY_20_31(26,E,T,A,B,C,D,X(10),X(10),X(12),X( 2),X( 7));
406         BODY_20_31(27,D,E,T,A,B,C,X(11),X(11),X(13),X( 3),X( 8));
407         BODY_20_31(28,C,D,E,T,A,B,X(12),X(12),X(14),X( 4),X( 9));
408         BODY_20_31(29,B,C,D,E,T,A,X(13),X(13),X(15),X( 5),X(10));
409         BODY_20_31(30,A,B,C,D,E,T,X(14),X(14),X( 0),X( 6),X(11));
410         BODY_20_31(31,T,A,B,C,D,E,X(15),X(15),X( 1),X( 7),X(12));
411
412         BODY_32_39(32,E,T,A,B,C,D,X( 0),X( 2),X( 8),X(13));
413         BODY_32_39(33,D,E,T,A,B,C,X( 1),X( 3),X( 9),X(14));
414         BODY_32_39(34,C,D,E,T,A,B,X( 2),X( 4),X(10),X(15));
415         BODY_32_39(35,B,C,D,E,T,A,X( 3),X( 5),X(11),X( 0));
416         BODY_32_39(36,A,B,C,D,E,T,X( 4),X( 6),X(12),X( 1));
417         BODY_32_39(37,T,A,B,C,D,E,X( 5),X( 7),X(13),X( 2));
418         BODY_32_39(38,E,T,A,B,C,D,X( 6),X( 8),X(14),X( 3));
419         BODY_32_39(39,D,E,T,A,B,C,X( 7),X( 9),X(15),X( 4));
420
421         BODY_40_59(40,C,D,E,T,A,B,X( 8),X(10),X( 0),X( 5));
422         BODY_40_59(41,B,C,D,E,T,A,X( 9),X(11),X( 1),X( 6));
423         BODY_40_59(42,A,B,C,D,E,T,X(10),X(12),X( 2),X( 7));
424         BODY_40_59(43,T,A,B,C,D,E,X(11),X(13),X( 3),X( 8));
425         BODY_40_59(44,E,T,A,B,C,D,X(12),X(14),X( 4),X( 9));
426         BODY_40_59(45,D,E,T,A,B,C,X(13),X(15),X( 5),X(10));
427         BODY_40_59(46,C,D,E,T,A,B,X(14),X( 0),X( 6),X(11));
428         BODY_40_59(47,B,C,D,E,T,A,X(15),X( 1),X( 7),X(12));
429         BODY_40_59(48,A,B,C,D,E,T,X( 0),X( 2),X( 8),X(13));
430         BODY_40_59(49,T,A,B,C,D,E,X( 1),X( 3),X( 9),X(14));
431         BODY_40_59(50,E,T,A,B,C,D,X( 2),X( 4),X(10),X(15));
432         BODY_40_59(51,D,E,T,A,B,C,X( 3),X( 5),X(11),X( 0));
433         BODY_40_59(52,C,D,E,T,A,B,X( 4),X( 6),X(12),X( 1));
434         BODY_40_59(53,B,C,D,E,T,A,X( 5),X( 7),X(13),X( 2));
435         BODY_40_59(54,A,B,C,D,E,T,X( 6),X( 8),X(14),X( 3));
436         BODY_40_59(55,T,A,B,C,D,E,X( 7),X( 9),X(15),X( 4));
437         BODY_40_59(56,E,T,A,B,C,D,X( 8),X(10),X( 0),X( 5));
438         BODY_40_59(57,D,E,T,A,B,C,X( 9),X(11),X( 1),X( 6));
439         BODY_40_59(58,C,D,E,T,A,B,X(10),X(12),X( 2),X( 7));
440         BODY_40_59(59,B,C,D,E,T,A,X(11),X(13),X( 3),X( 8));
441
442         BODY_60_79(60,A,B,C,D,E,T,X(12),X(14),X( 4),X( 9));
443         BODY_60_79(61,T,A,B,C,D,E,X(13),X(15),X( 5),X(10));
444         BODY_60_79(62,E,T,A,B,C,D,X(14),X( 0),X( 6),X(11));
445         BODY_60_79(63,D,E,T,A,B,C,X(15),X( 1),X( 7),X(12));
446         BODY_60_79(64,C,D,E,T,A,B,X( 0),X( 2),X( 8),X(13));
447         BODY_60_79(65,B,C,D,E,T,A,X( 1),X( 3),X( 9),X(14));
448         BODY_60_79(66,A,B,C,D,E,T,X( 2),X( 4),X(10),X(15));
449         BODY_60_79(67,T,A,B,C,D,E,X( 3),X( 5),X(11),X( 0));
450         BODY_60_79(68,E,T,A,B,C,D,X( 4),X( 6),X(12),X( 1));
451         BODY_60_79(69,D,E,T,A,B,C,X( 5),X( 7),X(13),X( 2));
452         BODY_60_79(70,C,D,E,T,A,B,X( 6),X( 8),X(14),X( 3));
453         BODY_60_79(71,B,C,D,E,T,A,X( 7),X( 9),X(15),X( 4));
454         BODY_60_79(72,A,B,C,D,E,T,X( 8),X(10),X( 0),X( 5));
455         BODY_60_79(73,T,A,B,C,D,E,X( 9),X(11),X( 1),X( 6));
456         BODY_60_79(74,E,T,A,B,C,D,X(10),X(12),X( 2),X( 7));
457         BODY_60_79(75,D,E,T,A,B,C,X(11),X(13),X( 3),X( 8));
458         BODY_60_79(76,C,D,E,T,A,B,X(12),X(14),X( 4),X( 9));
459         BODY_60_79(77,B,C,D,E,T,A,X(13),X(15),X( 5),X(10));
460         BODY_60_79(78,A,B,C,D,E,T,X(14),X( 0),X( 6),X(11));
461         BODY_60_79(79,T,A,B,C,D,E,X(15),X( 1),X( 7),X(12));
462         
463         c->h0=(c->h0+E)&0xffffffffL; 
464         c->h1=(c->h1+T)&0xffffffffL;
465         c->h2=(c->h2+A)&0xffffffffL;
466         c->h3=(c->h3+B)&0xffffffffL;
467         c->h4=(c->h4+C)&0xffffffffL;
468
469         if (--num == 0) break;
470
471         A=c->h0;
472         B=c->h1;
473         C=c->h2;
474         D=c->h3;
475         E=c->h4;
476
477                 }
478         }
479 #endif
480
481 #else   /* OPENSSL_SMALL_FOOTPRINT */
482
483 #define BODY_00_15(xi)           do {   \
484         T=E+K_00_19+F_00_19(B,C,D);     \
485         E=D, D=C, C=ROTATE(B,30), B=A;  \
486         A=ROTATE(A,5)+T+xi;         } while(0)
487
488 #define BODY_16_19(xa,xb,xc,xd)  do {   \
489         Xupdate(T,xa,xa,xb,xc,xd);      \
490         T+=E+K_00_19+F_00_19(B,C,D);    \
491         E=D, D=C, C=ROTATE(B,30), B=A;  \
492         A=ROTATE(A,5)+T;            } while(0)
493
494 #define BODY_20_39(xa,xb,xc,xd)  do {   \
495         Xupdate(T,xa,xa,xb,xc,xd);      \
496         T+=E+K_20_39+F_20_39(B,C,D);    \
497         E=D, D=C, C=ROTATE(B,30), B=A;  \
498         A=ROTATE(A,5)+T;            } while(0)
499
500 #define BODY_40_59(xa,xb,xc,xd)  do {   \
501         Xupdate(T,xa,xa,xb,xc,xd);      \
502         T+=E+K_40_59+F_40_59(B,C,D);    \
503         E=D, D=C, C=ROTATE(B,30), B=A;  \
504         A=ROTATE(A,5)+T;            } while(0)
505
506 #define BODY_60_79(xa,xb,xc,xd)  do {   \
507         Xupdate(T,xa,xa,xb,xc,xd);      \
508         T=E+K_60_79+F_60_79(B,C,D);     \
509         E=D, D=C, C=ROTATE(B,30), B=A;  \
510         A=ROTATE(A,5)+T+xa;         } while(0)
511
512 #ifndef DONT_IMPLEMENT_BLOCK_HOST_ORDER
513 void HASH_BLOCK_HOST_ORDER (SHA_CTX *c, const void *d, size_t num)
514         {
515         const SHA_LONG *W=d;
516         register unsigned MD32_REG_T A,B,C,D,E,T;
517         int i;
518         SHA_LONG        X[16];
519
520         A=c->h0;
521         B=c->h1;
522         C=c->h2;
523         D=c->h3;
524         E=c->h4;
525
526         for (;;)
527                 {
528         for (i=0;i<16;i++)
529         { X[i]=W[i]; BODY_00_15(X[i]); }
530         for (i=0;i<4;i++)
531         { BODY_16_19(X[i],       X[i+2],      X[i+8],     X[(i+13)&15]); }
532         for (;i<24;i++)
533         { BODY_20_39(X[i&15],    X[(i+2)&15], X[(i+8)&15],X[(i+13)&15]); }
534         for (i=0;i<20;i++)
535         { BODY_40_59(X[(i+8)&15],X[(i+10)&15],X[i&15],    X[(i+5)&15]);  }
536         for (i=4;i<24;i++)
537         { BODY_60_79(X[(i+8)&15],X[(i+10)&15],X[i&15],    X[(i+5)&15]);  }
538         
539         c->h0=(c->h0+A)&0xffffffffL; 
540         c->h1=(c->h1+B)&0xffffffffL;
541         c->h2=(c->h2+C)&0xffffffffL;
542         c->h3=(c->h3+D)&0xffffffffL;
543         c->h4=(c->h4+E)&0xffffffffL;
544
545         if (--num == 0) break;
546
547         A=c->h0;
548         B=c->h1;
549         C=c->h2;
550         D=c->h3;
551         E=c->h4;
552
553         W+=SHA_LBLOCK;
554                 }
555         }
556 #endif
557
558 #ifndef DONT_IMPLEMENT_BLOCK_DATA_ORDER
559 void HASH_BLOCK_DATA_ORDER (SHA_CTX *c, const void *p, size_t num)
560         {
561         const unsigned char *data=p;
562         register unsigned MD32_REG_T A,B,C,D,E,T,l;
563         int i;
564         SHA_LONG        X[16];
565
566         A=c->h0;
567         B=c->h1;
568         C=c->h2;
569         D=c->h3;
570         E=c->h4;
571
572         for (;;)
573                 {
574         for (i=0;i<16;i++)
575         { HOST_c2l(data,l); X[i]=l; BODY_00_15(X[i]); }
576         for (i=0;i<4;i++)
577         { BODY_16_19(X[i],       X[i+2],      X[i+8],     X[(i+13)&15]); }
578         for (;i<24;i++)
579         { BODY_20_39(X[i&15],    X[(i+2)&15], X[(i+8)&15],X[(i+13)&15]); }
580         for (i=0;i<20;i++)
581         { BODY_40_59(X[(i+8)&15],X[(i+10)&15],X[i&15],    X[(i+5)&15]);  }
582         for (i=4;i<24;i++)
583         { BODY_60_79(X[(i+8)&15],X[(i+10)&15],X[i&15],    X[(i+5)&15]);  }
584
585         c->h0=(c->h0+A)&0xffffffffL; 
586         c->h1=(c->h1+B)&0xffffffffL;
587         c->h2=(c->h2+C)&0xffffffffL;
588         c->h3=(c->h3+D)&0xffffffffL;
589         c->h4=(c->h4+E)&0xffffffffL;
590
591         if (--num == 0) break;
592
593         A=c->h0;
594         B=c->h1;
595         C=c->h2;
596         D=c->h3;
597         E=c->h4;
598
599                 }
600         }
601 #endif
602
603 #endif