crypto/sparc_arch.h: reserve more SPARCv9 capability bits.
[openssl.git] / crypto / sparcv9cap.c
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <string.h>
4 #include <setjmp.h>
5 #include <signal.h>
6 #include <sys/time.h>
7 #include <unistd.h>
8 #include <openssl/bn.h>
9
10 #include "sparc_arch.h"
11
12 #if defined(__GNUC__) && defined(__linux)
13 __attribute__ ((visibility("hidden")))
14 #endif
15 unsigned int OPENSSL_sparcv9cap_P[2] = { SPARCV9_TICK_PRIVILEGED, 0 };
16
17 int bn_mul_mont(BN_ULONG *rp, const BN_ULONG *ap, const BN_ULONG *bp,
18                 const BN_ULONG *np, const BN_ULONG *n0, int num)
19 {
20     int bn_mul_mont_vis3(BN_ULONG *rp, const BN_ULONG *ap, const BN_ULONG *bp,
21                          const BN_ULONG *np, const BN_ULONG *n0, int num);
22     int bn_mul_mont_fpu(BN_ULONG *rp, const BN_ULONG *ap, const BN_ULONG *bp,
23                         const BN_ULONG *np, const BN_ULONG *n0, int num);
24     int bn_mul_mont_int(BN_ULONG *rp, const BN_ULONG *ap, const BN_ULONG *bp,
25                         const BN_ULONG *np, const BN_ULONG *n0, int num);
26
27     if (!(num & 1) && num >= 6) {
28         if ((num & 15) == 0 && num <= 64 &&
29             (OPENSSL_sparcv9cap_P[1] & (CFR_MONTMUL | CFR_MONTSQR)) ==
30             (CFR_MONTMUL | CFR_MONTSQR)) {
31             typedef int (*bn_mul_mont_f) (BN_ULONG *rp, const BN_ULONG *ap,
32                                           const BN_ULONG *bp,
33                                           const BN_ULONG *np,
34                                           const BN_ULONG *n0);
35             int bn_mul_mont_t4_8(BN_ULONG *rp, const BN_ULONG *ap,
36                                  const BN_ULONG *bp, const BN_ULONG *np,
37                                  const BN_ULONG *n0);
38             int bn_mul_mont_t4_16(BN_ULONG *rp, const BN_ULONG *ap,
39                                   const BN_ULONG *bp, const BN_ULONG *np,
40                                   const BN_ULONG *n0);
41             int bn_mul_mont_t4_24(BN_ULONG *rp, const BN_ULONG *ap,
42                                   const BN_ULONG *bp, const BN_ULONG *np,
43                                   const BN_ULONG *n0);
44             int bn_mul_mont_t4_32(BN_ULONG *rp, const BN_ULONG *ap,
45                                   const BN_ULONG *bp, const BN_ULONG *np,
46                                   const BN_ULONG *n0);
47             static const bn_mul_mont_f funcs[4] = {
48                 bn_mul_mont_t4_8, bn_mul_mont_t4_16,
49                 bn_mul_mont_t4_24, bn_mul_mont_t4_32
50             };
51             bn_mul_mont_f worker = funcs[num / 16 - 1];
52
53             if ((*worker) (rp, ap, bp, np, n0))
54                 return 1;
55             /* retry once and fall back */
56             if ((*worker) (rp, ap, bp, np, n0))
57                 return 1;
58             return bn_mul_mont_vis3(rp, ap, bp, np, n0, num);
59         }
60         if ((OPENSSL_sparcv9cap_P[0] & SPARCV9_VIS3))
61             return bn_mul_mont_vis3(rp, ap, bp, np, n0, num);
62         else if (num >= 8 &&
63                  (OPENSSL_sparcv9cap_P[0] &
64                   (SPARCV9_PREFER_FPU | SPARCV9_VIS1)) ==
65                  (SPARCV9_PREFER_FPU | SPARCV9_VIS1))
66             return bn_mul_mont_fpu(rp, ap, bp, np, n0, num);
67     }
68     return bn_mul_mont_int(rp, ap, bp, np, n0, num);
69 }
70
71 unsigned long _sparcv9_rdtick(void);
72 void _sparcv9_vis1_probe(void);
73 unsigned long _sparcv9_vis1_instrument(void);
74 void _sparcv9_vis2_probe(void);
75 void _sparcv9_fmadd_probe(void);
76 unsigned long _sparcv9_rdcfr(void);
77 void _sparcv9_vis3_probe(void);
78 unsigned long _sparcv9_random(void);
79 size_t _sparcv9_vis1_instrument_bus(unsigned int *, size_t);
80 size_t _sparcv9_vis1_instrument_bus2(unsigned int *, size_t, size_t);
81
82 unsigned long OPENSSL_rdtsc(void)
83 {
84     if (OPENSSL_sparcv9cap_P[0] & SPARCV9_TICK_PRIVILEGED)
85 #if defined(__sun) && defined(__SVR4)
86         return gethrtime();
87 #else
88         return 0;
89 #endif
90     else
91         return _sparcv9_rdtick();
92 }
93
94 size_t OPENSSL_instrument_bus(unsigned int *out, size_t cnt)
95 {
96     if ((OPENSSL_sparcv9cap_P[0] & (SPARCV9_TICK_PRIVILEGED | SPARCV9_BLK)) ==
97         SPARCV9_BLK)
98         return _sparcv9_vis1_instrument_bus(out, cnt);
99     else
100         return 0;
101 }
102
103 size_t OPENSSL_instrument_bus2(unsigned int *out, size_t cnt, size_t max)
104 {
105     if ((OPENSSL_sparcv9cap_P[0] & (SPARCV9_TICK_PRIVILEGED | SPARCV9_BLK)) ==
106         SPARCV9_BLK)
107         return _sparcv9_vis1_instrument_bus2(out, cnt, max);
108     else
109         return 0;
110 }
111
112 static sigjmp_buf common_jmp;
113 static void common_handler(int sig)
114 {
115     siglongjmp(common_jmp, sig);
116 }
117
118 #if defined(__sun) && defined(__SVR4)
119 # if defined(__GNUC__) && __GNUC__>=2
120 extern unsigned int getisax(unsigned int vec[], unsigned int sz) __attribute__ ((weak));
121 # elif defined(__SUNPRO_C)
122 #pragma weak getisax
123 extern unsigned int getisax(unsigned int vec[], unsigned int sz);
124 # else
125 static unsigned int (*getisax) (unsigned int vec[], unsigned int sz) = NULL;
126 # endif
127 #endif
128
129 void OPENSSL_cpuid_setup(void)
130 {
131     char *e;
132     struct sigaction common_act, ill_oact, bus_oact;
133     sigset_t all_masked, oset;
134     static int trigger = 0;
135
136     if (trigger)
137         return;
138     trigger = 1;
139
140     if ((e = getenv("OPENSSL_sparcv9cap"))) {
141         OPENSSL_sparcv9cap_P[0] = strtoul(e, NULL, 0);
142         if ((e = strchr(e, ':')))
143             OPENSSL_sparcv9cap_P[1] = strtoul(e + 1, NULL, 0);
144         return;
145     }
146
147 #if defined(__sun) && defined(__SVR4)
148     if (getisax != NULL) {
149         unsigned int vec[1];
150
151         if (getisax (vec,1)) {
152             if (vec[0]&0x00020) OPENSSL_sparcv9cap_P[0] |= SPARCV9_VIS1;
153             if (vec[0]&0x00040) OPENSSL_sparcv9cap_P[0] |= SPARCV9_VIS2;
154             if (vec[0]&0x00080) OPENSSL_sparcv9cap_P[0] |= SPARCV9_BLK;
155             if (vec[0]&0x00100) OPENSSL_sparcv9cap_P[0] |= SPARCV9_FMADD;
156             if (vec[0]&0x00400) OPENSSL_sparcv9cap_P[0] |= SPARCV9_VIS3;
157             if (vec[0]&0x01000) OPENSSL_sparcv9cap_P[0] |= SPARCV9_FJHPCACE;
158             if (vec[0]&0x02000) OPENSSL_sparcv9cap_P[0] |= SPARCV9_FJDESX;
159             if (vec[0]&0x08000) OPENSSL_sparcv9cap_P[0] |= SPARCV9_IMA;
160             if (vec[0]&0x10000) OPENSSL_sparcv9cap_P[0] |= SPARCV9_FJAESX;
161             if (vec[1]&0x00008) OPENSSL_sparcv9cap_P[0] |= SPARCV9_VIS4;
162
163             /* reconstruct %cfr copy */
164             OPENSSL_sparcv9cap_P[1] = (vec[0]>>17)&0x3ff;
165             OPENSSL_sparcv9cap_P[1] |= (OPENSSL_sparcv9cap_P[1]&CFR_MONTMUL)<<1;
166             if (vec[0]&0x20000000) OPENSSL_sparcv9cap_P[1] |= CFR_CRC32C;
167             if (vec[1]&0x00000020) OPENSSL_sparcv9cap_P[1] |= CFR_XMPMUL;
168             if (vec[1]&0x00000040)
169                 OPENSSL_sparcv9cap_P[1] |= CFR_XMONTMUL|CFR_XMONTSQR;
170
171             /* Some heuristics */
172             /* all known VIS2-capable CPUs have unprivileged tick counter */
173             if (OPENSSL_sparcv9cap_P[0]&SPARCV9_VIS2)
174                 OPENSSL_sparcv9cap_P[0] &= ~SPARCV9_TICK_PRIVILEGED;
175
176             OPENSSL_sparcv9cap_P[0] |= SPARCV9_PREFER_FPU;
177
178             /* detect UltraSPARC-Tx, see sparccpud.S for details... */
179             if ((OPENSSL_sparcv9cap_P[0]&SPARCV9_VIS1) &&
180                 _sparcv9_vis1_instrument() >= 12)
181                 OPENSSL_sparcv9cap_P[0] &= ~(SPARCV9_VIS1 | SPARCV9_PREFER_FPU);
182         }
183
184         if (sizeof(size_t) == 8)
185             OPENSSL_sparcv9cap_P[0] |= SPARCV9_64BIT_STACK;
186
187         return;
188     }
189 #endif
190
191     /* Initial value, fits UltraSPARC-I&II... */
192     OPENSSL_sparcv9cap_P[0] = SPARCV9_PREFER_FPU | SPARCV9_TICK_PRIVILEGED;
193
194     sigfillset(&all_masked);
195     sigdelset(&all_masked, SIGILL);
196     sigdelset(&all_masked, SIGTRAP);
197 # ifdef SIGEMT
198     sigdelset(&all_masked, SIGEMT);
199 # endif
200     sigdelset(&all_masked, SIGFPE);
201     sigdelset(&all_masked, SIGBUS);
202     sigdelset(&all_masked, SIGSEGV);
203     sigprocmask(SIG_SETMASK, &all_masked, &oset);
204
205     memset(&common_act, 0, sizeof(common_act));
206     common_act.sa_handler = common_handler;
207     common_act.sa_mask = all_masked;
208
209     sigaction(SIGILL, &common_act, &ill_oact);
210     sigaction(SIGBUS, &common_act, &bus_oact); /* T1 fails 16-bit ldda [on
211                                                 * Linux] */
212
213     if (sigsetjmp(common_jmp, 1) == 0) {
214         _sparcv9_rdtick();
215         OPENSSL_sparcv9cap_P[0] &= ~SPARCV9_TICK_PRIVILEGED;
216     }
217
218     if (sigsetjmp(common_jmp, 1) == 0) {
219         _sparcv9_vis1_probe();
220         OPENSSL_sparcv9cap_P[0] |= SPARCV9_VIS1 | SPARCV9_BLK;
221         /* detect UltraSPARC-Tx, see sparccpud.S for details... */
222         if (_sparcv9_vis1_instrument() >= 12)
223             OPENSSL_sparcv9cap_P[0] &= ~(SPARCV9_VIS1 | SPARCV9_PREFER_FPU);
224         else {
225             _sparcv9_vis2_probe();
226             OPENSSL_sparcv9cap_P[0] |= SPARCV9_VIS2;
227         }
228     }
229
230     if (sigsetjmp(common_jmp, 1) == 0) {
231         _sparcv9_fmadd_probe();
232         OPENSSL_sparcv9cap_P[0] |= SPARCV9_FMADD;
233     }
234
235     /*
236      * VIS3 flag is tested independently from VIS1, unlike VIS2 that is,
237      * because VIS3 defines even integer instructions.
238      */
239     if (sigsetjmp(common_jmp, 1) == 0) {
240         _sparcv9_vis3_probe();
241         OPENSSL_sparcv9cap_P[0] |= SPARCV9_VIS3;
242     }
243
244     if (sigsetjmp(common_jmp, 1) == 0) {
245         _sparcv9_fjaesx_probe();
246         OPENSSL_sparcv9cap_P[0] |= SPARCV9_FJAESX;
247     }
248
249     /*
250      * In wait for better solution _sparcv9_rdcfr is masked by
251      * VIS3 flag, because it goes to uninterruptable endless
252      * loop on UltraSPARC II running Solaris. Things might be
253      * different on Linux...
254      */
255     if ((OPENSSL_sparcv9cap_P[0] & SPARCV9_VIS3) &&
256         sigsetjmp(common_jmp, 1) == 0) {
257         OPENSSL_sparcv9cap_P[1] = (unsigned int)_sparcv9_rdcfr();
258     }
259
260     sigaction(SIGBUS, &bus_oact, NULL);
261     sigaction(SIGILL, &ill_oact, NULL);
262
263     sigprocmask(SIG_SETMASK, &oset, NULL);
264
265     if (sizeof(size_t) == 8)
266         OPENSSL_sparcv9cap_P[0] |= SPARCV9_64BIT_STACK;
267 # ifdef __linux
268     else {
269         int ret = syscall(340);
270
271         if (ret >= 0 && ret & 1)
272             OPENSSL_sparcv9cap_P[0] |= SPARCV9_64BIT_STACK;
273     }
274 # endif
275 }