x86[_64]cpuid.pl: add function accessing rdrand instruction.
authorAndy Polyakov <appro@openssl.org>
Sat, 4 Jun 2011 12:20:45 +0000 (12:20 +0000)
committerAndy Polyakov <appro@openssl.org>
Sat, 4 Jun 2011 12:20:45 +0000 (12:20 +0000)
crypto/perlasm/x86_64-xlate.pl
crypto/perlasm/x86asm.pl
crypto/x86_64cpuid.pl
crypto/x86cpuid.pl
doc/crypto/OPENSSL_ia32cap.pod

index 91017c69f313dadae2cc40b490704ec1d03732d0..a6b718b5e883ba9488c8450f0d398e7336490dad 100755 (executable)
@@ -625,7 +625,7 @@ my %globals;
                /\.comm/    && do { my @str=split(/,\s*/,$line);
                                    my $v=undef;
                                    if ($nasm) {
-                                       $v.="common     $prefix@str[0] @str[1]:near";
+                                       $v.="common     $prefix@str[0] @str[1]";
                                    } else {
                                        $v="$current_segment\tENDS\n" if ($current_segment);
                                        $current_segment = ".data";
@@ -757,6 +757,19 @@ my $pclmulqdq = sub {
     }
 };
 
+my $rdrand = sub {
+    if (shift =~ /%[er](\w+)/) {
+      my @opcode=();
+      my $dst=$1;
+       if ($dst !~ /[0-9]+/) { $dst = $regrm{"%e$dst"}; }
+       rex(\@opcode,0,$1,8);
+       push @opcode,0x0f,0xc7,0xf0|($dst&7);
+       @opcode;
+    } else {
+       ();
+    }
+};
+
 if ($nasm) {
     print <<___;
 default        rel
index efa7b61ce8d2e3cc9dc44c3106bf7363dc3c4024..b7ddb8137f306011dfe327e3d431c3d213b437f4 100644 (file)
@@ -123,6 +123,14 @@ sub ::pclmulqdq
     {  &::generic("pclmulqdq",@_);             }
 }
 
+sub ::rdrand
+{ my ($dst)=@_;
+    if ($dst =~ /(e[a-dsd][ixp])/)
+    {  &::data_byte(0x0f,0xc7,0xf0|$regrm{$dst});      }
+    else
+    {  &::generic("rdrand",@_);        }
+}
+
 # label management
 $lbdecor="L";          # local label decoration, set by package
 $label="000";
index 7b76522bd881f8eac8a53939a07941d19f957185..26b8e5cc08455791838e5e2929263f1566f87f06 100644 (file)
@@ -7,7 +7,11 @@ if ($flavour =~ /\./) { $output = $flavour; undef $flavour; }
 $win64=0; $win64=1 if ($flavour =~ /[nm]asm|mingw64/ || $output =~ /\.asm$/);
 
 $0 =~ m/(.*[\/\\])[^\/\\]+$/; $dir=$1;
-open STDOUT,"| $^X ${dir}perlasm/x86_64-xlate.pl $flavour $output";
+( $xlate="${dir}x86_64-xlate.pl" and -f $xlate ) or
+( $xlate="${dir}perlasm/x86_64-xlate.pl" and -f $xlate) or
+die "can't locate x86_64-xlate.pl";
+
+open STDOUT,"| $^X $xlate $flavour $output";
 
 ($arg1,$arg2,$arg3,$arg4)=$win64?("%rcx","%rdx","%r8", "%r9") :        # Win64 order
                                 ("%rdi","%rsi","%rdx","%rcx"); # Unix order
@@ -349,4 +353,21 @@ OPENSSL_instrument_bus2:
 ___
 }
 
+print<<___;
+.globl OPENSSL_ia32_rdrand
+.type  OPENSSL_ia32_rdrand,\@abi-omnipotent
+.align 16
+OPENSSL_ia32_rdrand:
+       mov     \$8,%ecx
+.Loop_rdrand:
+       rdrand  %rax
+       jc      .Lbreak_rdrand
+       loop    .Loop_rdrand
+.Lbreak_rdrand:
+       cmp     \$0,%rax
+       cmove   %rcx,%rax
+       ret
+.size  OPENSSL_ia32_rdrand,.-OPENSSL_ia32_rdarnd
+___
+
 close STDOUT;  # flush
index 70c8a2d671a50ee3347672e2278eb273507c94b8..6595ff35fc1bbcbf6a4619a56088e48e7b2bd39b 100644 (file)
@@ -442,6 +442,18 @@ my $max = "ebp";
 &function_end("OPENSSL_instrument_bus2");
 }
 
+&function_begin_B("OPENSSL_ia32_rdrand");
+       &mov    ("ecx",8);
+&set_label("loop");
+       &rdrand ("eax");
+       &jc     (&label("break"));
+       &loop   (&label("loop"));
+&set_label("break");
+       &cmp    ("eax",0);
+       &cmove  ("eax","ecx");
+       &ret    ();
+&function_end_B("OPENSSL_ia32_rdrand");
+
 &initseg("OPENSSL_cpuid_setup");
 
 &asm_finish();
index 3f6458c6bd1e2cfbf6b74421de4622ce09117e36..17189ed843aabb4ecdc34fb195ecfd7c916bf9c4 100644 (file)
@@ -51,6 +51,8 @@ moment of this writing following bits are significant:
 
 =item bit #60 denoting AVX extension;
 
+=item bit #62 denoting availability of RDRAND instruction;
+
 For example, clearing bit #26 at run-time disables high-performance
 SSE2 code present in the crypto library, while clearing bit #24
 disables SSE2 code operating on 128-bit XMM register bank. You might