Fix grammar in certificates.txt
[openssl.git] / apps / rehash.c
1 /*
2  * Copyright 2015-2020 The OpenSSL Project Authors. All Rights Reserved.
3  * Copyright (c) 2013-2014 Timo Teräs <timo.teras@gmail.com>
4  *
5  * Licensed under the Apache License 2.0 (the "License").  You may not use
6  * this file except in compliance with the License.  You can obtain a copy
7  * in the file LICENSE in the source distribution or at
8  * https://www.openssl.org/source/license.html
9  */
10
11 #include "apps.h"
12 #include "progs.h"
13
14 #if defined(OPENSSL_SYS_UNIX) || defined(__APPLE__) || \
15     (defined(__VMS) && defined(__DECC) && __CRTL_VER >= 80300000)
16 # include <unistd.h>
17 # include <stdio.h>
18 # include <limits.h>
19 # include <errno.h>
20 # include <string.h>
21 # include <ctype.h>
22 # include <sys/stat.h>
23
24 /*
25  * Make sure that the processing of symbol names is treated the same as when
26  * libcrypto is built.  This is done automatically for public headers (see
27  * include/openssl/__DECC_INCLUDE_PROLOGUE.H and __DECC_INCLUDE_EPILOGUE.H),
28  * but not for internal headers.
29  */
30 # ifdef __VMS
31 #  pragma names save
32 #  pragma names as_is,shortened
33 # endif
34
35 # include "internal/o_dir.h"
36
37 # ifdef __VMS
38 #  pragma names restore
39 # endif
40
41 # include <openssl/evp.h>
42 # include <openssl/pem.h>
43 # include <openssl/x509.h>
44
45 # ifndef PATH_MAX
46 #  define PATH_MAX 4096
47 # endif
48 # ifndef NAME_MAX
49 #  define NAME_MAX 255
50 # endif
51 # define MAX_COLLISIONS  256
52
53 # if defined(OPENSSL_SYS_VXWORKS)
54 /*
55  * VxWorks has no symbolic links
56  */
57
58 #  define lstat(path, buf) stat(path, buf)
59
60 int symlink(const char *target, const char *linkpath)
61 {
62     errno = ENOSYS;
63     return -1;
64 }
65
66 ssize_t readlink(const char *pathname, char *buf, size_t bufsiz)
67 {
68     errno = ENOSYS;
69     return -1;
70 }
71 # endif
72
73 typedef struct hentry_st {
74     struct hentry_st *next;
75     char *filename;
76     unsigned short old_id;
77     unsigned char need_symlink;
78     unsigned char digest[EVP_MAX_MD_SIZE];
79 } HENTRY;
80
81 typedef struct bucket_st {
82     struct bucket_st *next;
83     HENTRY *first_entry, *last_entry;
84     unsigned int hash;
85     unsigned short type;
86     unsigned short num_needed;
87 } BUCKET;
88
89 enum Type {
90     /* Keep in sync with |suffixes|, below. */
91     TYPE_CERT=0, TYPE_CRL=1
92 };
93
94 enum Hash {
95     HASH_OLD, HASH_NEW, HASH_BOTH
96 };
97
98
99 static int evpmdsize;
100 static const EVP_MD *evpmd;
101 static int remove_links = 1;
102 static int verbose = 0;
103 static BUCKET *hash_table[257];
104
105 static const char *suffixes[] = { "", "r" };
106 static const char *extensions[] = { "pem", "crt", "cer", "crl" };
107
108
109 static void bit_set(unsigned char *set, unsigned int bit)
110 {
111     set[bit >> 3] |= 1 << (bit & 0x7);
112 }
113
114 static int bit_isset(unsigned char *set, unsigned int bit)
115 {
116     return set[bit >> 3] & (1 << (bit & 0x7));
117 }
118
119
120 /*
121  * Process an entry; return number of errors.
122  */
123 static int add_entry(enum Type type, unsigned int hash, const char *filename,
124                       const unsigned char *digest, int need_symlink,
125                       unsigned short old_id)
126 {
127     static BUCKET nilbucket;
128     static HENTRY nilhentry;
129     BUCKET *bp;
130     HENTRY *ep, *found = NULL;
131     unsigned int ndx = (type + hash) % OSSL_NELEM(hash_table);
132
133     for (bp = hash_table[ndx]; bp; bp = bp->next)
134         if (bp->type == type && bp->hash == hash)
135             break;
136     if (bp == NULL) {
137         bp = app_malloc(sizeof(*bp), "hash bucket");
138         *bp = nilbucket;
139         bp->next = hash_table[ndx];
140         bp->type = type;
141         bp->hash = hash;
142         hash_table[ndx] = bp;
143     }
144
145     for (ep = bp->first_entry; ep; ep = ep->next) {
146         if (digest && memcmp(digest, ep->digest, evpmdsize) == 0) {
147             BIO_printf(bio_err,
148                        "%s: warning: skipping duplicate %s in %s\n",
149                        opt_getprog(),
150                        type == TYPE_CERT ? "certificate" : "CRL", filename);
151             return 0;
152         }
153         if (strcmp(filename, ep->filename) == 0) {
154             found = ep;
155             if (digest == NULL)
156                 break;
157         }
158     }
159     ep = found;
160     if (ep == NULL) {
161         if (bp->num_needed >= MAX_COLLISIONS) {
162             BIO_printf(bio_err,
163                        "%s: error: hash table overflow for %s\n",
164                        opt_getprog(), filename);
165             return 1;
166         }
167         ep = app_malloc(sizeof(*ep), "collision bucket");
168         *ep = nilhentry;
169         ep->old_id = ~0;
170         ep->filename = OPENSSL_strdup(filename);
171         if (bp->last_entry)
172             bp->last_entry->next = ep;
173         if (bp->first_entry == NULL)
174             bp->first_entry = ep;
175         bp->last_entry = ep;
176     }
177
178     if (old_id < ep->old_id)
179         ep->old_id = old_id;
180     if (need_symlink && !ep->need_symlink) {
181         ep->need_symlink = 1;
182         bp->num_needed++;
183         memcpy(ep->digest, digest, evpmdsize);
184     }
185     return 0;
186 }
187
188 /*
189  * Check if a symlink goes to the right spot; return 0 if okay.
190  * This can be -1 if bad filename, or an error count.
191  */
192 static int handle_symlink(const char *filename, const char *fullpath)
193 {
194     unsigned int hash = 0;
195     int i, type, id;
196     unsigned char ch;
197     char linktarget[PATH_MAX], *endptr;
198     ossl_ssize_t n;
199
200     for (i = 0; i < 8; i++) {
201         ch = filename[i];
202         if (!isxdigit(ch))
203             return -1;
204         hash <<= 4;
205         hash += OPENSSL_hexchar2int(ch);
206     }
207     if (filename[i++] != '.')
208         return -1;
209     for (type = OSSL_NELEM(suffixes) - 1; type > 0; type--) {
210         const char *suffix = suffixes[type];
211         if (strncasecmp(suffix, &filename[i], strlen(suffix)) == 0)
212             break;
213     }
214     i += strlen(suffixes[type]);
215
216     id = strtoul(&filename[i], &endptr, 10);
217     if (*endptr != '\0')
218         return -1;
219
220     n = readlink(fullpath, linktarget, sizeof(linktarget));
221     if (n < 0 || n >= (int)sizeof(linktarget))
222         return -1;
223     linktarget[n] = 0;
224
225     return add_entry(type, hash, linktarget, NULL, 0, id);
226 }
227
228 /*
229  * process a file, return number of errors.
230  */
231 static int do_file(const char *filename, const char *fullpath, enum Hash h)
232 {
233     STACK_OF (X509_INFO) *inf = NULL;
234     X509_INFO *x;
235     const X509_NAME *name = NULL;
236     BIO *b;
237     const char *ext;
238     unsigned char digest[EVP_MAX_MD_SIZE];
239     int type, errs = 0;
240     size_t i;
241
242     /* Does it end with a recognized extension? */
243     if ((ext = strrchr(filename, '.')) == NULL)
244         goto end;
245     for (i = 0; i < OSSL_NELEM(extensions); i++) {
246         if (strcasecmp(extensions[i], ext + 1) == 0)
247             break;
248     }
249     if (i >= OSSL_NELEM(extensions))
250         goto end;
251
252     /* Does it have X.509 data in it? */
253     if ((b = BIO_new_file(fullpath, "r")) == NULL) {
254         BIO_printf(bio_err, "%s: error: skipping %s, cannot open file\n",
255                    opt_getprog(), filename);
256         errs++;
257         goto end;
258     }
259     inf = PEM_X509_INFO_read_bio(b, NULL, NULL, NULL);
260     BIO_free(b);
261     if (inf == NULL)
262         goto end;
263
264     if (sk_X509_INFO_num(inf) != 1) {
265         BIO_printf(bio_err,
266                    "%s: warning: skipping %s,"
267                    "it does not contain exactly one certificate or CRL\n",
268                    opt_getprog(), filename);
269         /* This is not an error. */
270         goto end;
271     }
272     x = sk_X509_INFO_value(inf, 0);
273     if (x->x509 != NULL) {
274         type = TYPE_CERT;
275         name = X509_get_subject_name(x->x509);
276         if (!X509_digest(x->x509, evpmd, digest, NULL)) {
277             BIO_printf(bio_err, "out of memory\n");
278             ++errs;
279             goto end;
280         }
281     } else if (x->crl != NULL) {
282         type = TYPE_CRL;
283         name = X509_CRL_get_issuer(x->crl);
284         if (!X509_CRL_digest(x->crl, evpmd, digest, NULL)) {
285             BIO_printf(bio_err, "out of memory\n");
286             ++errs;
287             goto end;
288         }
289     } else {
290         ++errs;
291         goto end;
292     }
293     if (name != NULL) {
294         if ((h == HASH_NEW) || (h == HASH_BOTH))
295             errs += add_entry(type, X509_NAME_hash(name), filename, digest, 1, ~0);
296         if ((h == HASH_OLD) || (h == HASH_BOTH))
297             errs += add_entry(type, X509_NAME_hash_old(name), filename, digest, 1, ~0);
298     }
299
300 end:
301     sk_X509_INFO_pop_free(inf, X509_INFO_free);
302     return errs;
303 }
304
305 static void str_free(char *s)
306 {
307     OPENSSL_free(s);
308 }
309
310 static int ends_with_dirsep(const char *path)
311 {
312     if (*path != '\0')
313         path += strlen(path) - 1;
314 # if defined __VMS
315     if (*path == ']' || *path == '>' || *path == ':')
316         return 1;
317 # elif defined _WIN32
318     if (*path == '\\')
319         return 1;
320 # endif
321     return *path == '/';
322 }
323
324 /*
325  * Process a directory; return number of errors found.
326  */
327 static int do_dir(const char *dirname, enum Hash h)
328 {
329     BUCKET *bp, *nextbp;
330     HENTRY *ep, *nextep;
331     OPENSSL_DIR_CTX *d = NULL;
332     struct stat st;
333     unsigned char idmask[MAX_COLLISIONS / 8];
334     int n, numfiles, nextid, buflen, errs = 0;
335     size_t i;
336     const char *pathsep;
337     const char *filename;
338     char *buf, *copy = NULL;
339     STACK_OF(OPENSSL_STRING) *files = NULL;
340
341     if (app_access(dirname, W_OK) < 0) {
342         BIO_printf(bio_err, "Skipping %s, can't write\n", dirname);
343         return 1;
344     }
345     buflen = strlen(dirname);
346     pathsep = (buflen && !ends_with_dirsep(dirname)) ? "/": "";
347     buflen += NAME_MAX + 1 + 1;
348     buf = app_malloc(buflen, "filename buffer");
349
350     if (verbose)
351         BIO_printf(bio_out, "Doing %s\n", dirname);
352
353     if ((files = sk_OPENSSL_STRING_new_null()) == NULL) {
354         BIO_printf(bio_err, "Skipping %s, out of memory\n", dirname);
355         errs = 1;
356         goto err;
357     }
358     while ((filename = OPENSSL_DIR_read(&d, dirname)) != NULL) {
359         if ((copy = OPENSSL_strdup(filename)) == NULL
360                 || sk_OPENSSL_STRING_push(files, copy) == 0) {
361             OPENSSL_free(copy);
362             BIO_puts(bio_err, "out of memory\n");
363             errs = 1;
364             goto err;
365         }
366     }
367     OPENSSL_DIR_end(&d);
368     sk_OPENSSL_STRING_sort(files);
369
370     numfiles = sk_OPENSSL_STRING_num(files);
371     for (n = 0; n < numfiles; ++n) {
372         filename = sk_OPENSSL_STRING_value(files, n);
373         if (BIO_snprintf(buf, buflen, "%s%s%s",
374                          dirname, pathsep, filename) >= buflen)
375             continue;
376         if (lstat(buf, &st) < 0)
377             continue;
378         if (S_ISLNK(st.st_mode) && handle_symlink(filename, buf) == 0)
379             continue;
380         errs += do_file(filename, buf, h);
381     }
382
383     for (i = 0; i < OSSL_NELEM(hash_table); i++) {
384         for (bp = hash_table[i]; bp; bp = nextbp) {
385             nextbp = bp->next;
386             nextid = 0;
387             memset(idmask, 0, (bp->num_needed + 7) / 8);
388             for (ep = bp->first_entry; ep; ep = ep->next)
389                 if (ep->old_id < bp->num_needed)
390                     bit_set(idmask, ep->old_id);
391
392             for (ep = bp->first_entry; ep; ep = nextep) {
393                 nextep = ep->next;
394                 if (ep->old_id < bp->num_needed) {
395                     /* Link exists, and is used as-is */
396                     BIO_snprintf(buf, buflen, "%08x.%s%d", bp->hash,
397                                  suffixes[bp->type], ep->old_id);
398                     if (verbose)
399                         BIO_printf(bio_out, "link %s -> %s\n",
400                                    ep->filename, buf);
401                 } else if (ep->need_symlink) {
402                     /* New link needed (it may replace something) */
403                     while (bit_isset(idmask, nextid))
404                         nextid++;
405
406                     BIO_snprintf(buf, buflen, "%s%s%n%08x.%s%d",
407                                  dirname, pathsep, &n, bp->hash,
408                                  suffixes[bp->type], nextid);
409                     if (verbose)
410                         BIO_printf(bio_out, "link %s -> %s\n",
411                                    ep->filename, &buf[n]);
412                     if (unlink(buf) < 0 && errno != ENOENT) {
413                         BIO_printf(bio_err,
414                                    "%s: Can't unlink %s, %s\n",
415                                    opt_getprog(), buf, strerror(errno));
416                         errs++;
417                     }
418                     if (symlink(ep->filename, buf) < 0) {
419                         BIO_printf(bio_err,
420                                    "%s: Can't symlink %s, %s\n",
421                                    opt_getprog(), ep->filename,
422                                    strerror(errno));
423                         errs++;
424                     }
425                     bit_set(idmask, nextid);
426                 } else if (remove_links) {
427                     /* Link to be deleted */
428                     BIO_snprintf(buf, buflen, "%s%s%n%08x.%s%d",
429                                  dirname, pathsep, &n, bp->hash,
430                                  suffixes[bp->type], ep->old_id);
431                     if (verbose)
432                         BIO_printf(bio_out, "unlink %s\n",
433                                    &buf[n]);
434                     if (unlink(buf) < 0 && errno != ENOENT) {
435                         BIO_printf(bio_err,
436                                    "%s: Can't unlink %s, %s\n",
437                                    opt_getprog(), buf, strerror(errno));
438                         errs++;
439                     }
440                 }
441                 OPENSSL_free(ep->filename);
442                 OPENSSL_free(ep);
443             }
444             OPENSSL_free(bp);
445         }
446         hash_table[i] = NULL;
447     }
448
449  err:
450     sk_OPENSSL_STRING_pop_free(files, str_free);
451     OPENSSL_free(buf);
452     return errs;
453 }
454
455 typedef enum OPTION_choice {
456     OPT_ERR = -1, OPT_EOF = 0, OPT_HELP,
457     OPT_COMPAT, OPT_OLD, OPT_N, OPT_VERBOSE,
458     OPT_PROV_ENUM
459 } OPTION_CHOICE;
460
461 const OPTIONS rehash_options[] = {
462     {OPT_HELP_STR, 1, '-', "Usage: %s [options] [directory...]\n"},
463
464     OPT_SECTION("General"),
465     {"help", OPT_HELP, '-', "Display this summary"},
466     {"h", OPT_HELP, '-', "Display this summary"},
467     {"compat", OPT_COMPAT, '-', "Create both new- and old-style hash links"},
468     {"old", OPT_OLD, '-', "Use old-style hash to generate links"},
469     {"n", OPT_N, '-', "Do not remove existing links"},
470
471     OPT_SECTION("Output"),
472     {"v", OPT_VERBOSE, '-', "Verbose output"},
473
474     OPT_PROV_OPTIONS,
475
476     OPT_PARAMETERS(),
477     {"directory", 0, 0, "One or more directories to process (optional)"},
478     {NULL}
479 };
480
481
482 int rehash_main(int argc, char **argv)
483 {
484     const char *env, *prog;
485     char *e, *m;
486     int errs = 0;
487     OPTION_CHOICE o;
488     enum Hash h = HASH_NEW;
489
490     prog = opt_init(argc, argv, rehash_options);
491     while ((o = opt_next()) != OPT_EOF) {
492         switch (o) {
493         case OPT_EOF:
494         case OPT_ERR:
495             BIO_printf(bio_err, "%s: Use -help for summary.\n", prog);
496             goto end;
497         case OPT_HELP:
498             opt_help(rehash_options);
499             goto end;
500         case OPT_COMPAT:
501             h = HASH_BOTH;
502             break;
503         case OPT_OLD:
504             h = HASH_OLD;
505             break;
506         case OPT_N:
507             remove_links = 0;
508             break;
509         case OPT_VERBOSE:
510             verbose = 1;
511             break;
512         case OPT_PROV_CASES:
513             if (!opt_provider(o))
514                 goto end;
515             break;
516         }
517     }
518     argc = opt_num_rest();
519     argv = opt_rest();
520
521     evpmd = EVP_sha1();
522     evpmdsize = EVP_MD_size(evpmd);
523
524     if (*argv != NULL) {
525         while (*argv != NULL)
526             errs += do_dir(*argv++, h);
527     } else if ((env = getenv(X509_get_default_cert_dir_env())) != NULL) {
528         char lsc[2] = { LIST_SEPARATOR_CHAR, '\0' };
529         m = OPENSSL_strdup(env);
530         for (e = strtok(m, lsc); e != NULL; e = strtok(NULL, lsc))
531             errs += do_dir(e, h);
532         OPENSSL_free(m);
533     } else {
534         errs += do_dir(X509_get_default_cert_dir(), h);
535     }
536
537  end:
538     return errs;
539 }
540
541 #else
542 const OPTIONS rehash_options[] = {
543     {NULL}
544 };
545
546 int rehash_main(int argc, char **argv)
547 {
548     BIO_printf(bio_err, "Not available; use c_rehash script\n");
549     return 1;
550 }
551
552 #endif /* defined(OPENSSL_SYS_UNIX) || defined(__APPLE__) */