alphacpuid.pl: fix alignment bug.
[openssl.git] / crypto / bn / asm / alpha-mont.pl
index 09f53a3622bad2330f3eb60e4246e1ff8b7227f8..03596e2014d4035d02440316cc1cf025f726d772 100644 (file)
@@ -41,8 +41,12 @@ $j="s4";
 $m1="s5";
 
 $code=<<___;
+#ifdef __linux__
+#include <asm/regdef.h>
+#else
 #include <asm.h>
 #include <regdef.h>
+#endif
 
 .text
 
@@ -53,15 +57,15 @@ $code=<<___;
 .align 5
 .ent   bn_mul_mont
 bn_mul_mont:
-       lda     sp,-40(sp)
+       lda     sp,-48(sp)
        stq     ra,0(sp)
        stq     s3,8(sp)
        stq     s4,16(sp)
        stq     s5,24(sp)
        stq     fp,32(sp)
        mov     sp,fp
-       .mask   0x0400f000,-40
-       .frame  fp,40,ra
+       .mask   0x0400f000,-48
+       .frame  fp,48,ra
        .prologue 0
 
        .align  4
@@ -76,7 +80,7 @@ bn_mul_mont:
        ldq     $aj,8($ap)
        subq    sp,AT,sp
        ldq     $bi,0($bp)      # bp[0]
-       mov     -4096,AT
+       lda     AT,-4096(zero)  # mov   -4096,AT
        ldq     $n0,0($n0)
        and     sp,AT,sp
 
@@ -106,9 +110,9 @@ bn_mul_mont:
 .align 4
 .L1st:
        .set    noreorder
-       ldq     $aj,($aj)
+       ldq     $aj,0($aj)
        addl    $j,1,$j
-       ldq     $nj,($nj)
+       ldq     $nj,0($nj)
        lda     $tp,8($tp)
 
        addq    $alo,$hi0,$lo0
@@ -159,12 +163,12 @@ bn_mul_mont:
 .align 4
 .Louter:
        s8addq  $i,$bp,$bi
-       ldq     $hi0,($ap)
+       ldq     $hi0,0($ap)
        ldq     $aj,8($ap)
-       ldq     $bi,($bi)
-       ldq     $hi1,($np)
+       ldq     $bi,0($bi)
+       ldq     $hi1,0($np)
        ldq     $nj,8($np)
-       ldq     $tj,(sp)
+       ldq     $tj,0(sp)
 
        mulq    $hi0,$bi,$lo0
        umulh   $hi0,$bi,$hi0
@@ -195,10 +199,10 @@ bn_mul_mont:
        .set    noreorder
        ldq     $tj,8($tp)      #L0
        nop                     #U1
-       ldq     $aj,($aj)       #L1
+       ldq     $aj,0($aj)      #L1
        s8addq  $j,$np,$nj      #U0
 
-       ldq     $nj,($nj)       #L0
+       ldq     $nj,0($nj)      #L0
        nop                     #U1
        addq    $alo,$hi0,$lo0  #L1
        lda     $tp,8($tp)
@@ -247,7 +251,7 @@ bn_mul_mont:
        addq    $hi1,v0,$hi1
 
        addq    $hi1,$hi0,$lo1
-       stq     $j,($tp)
+       stq     $j,0($tp)
        cmpult  $lo1,$hi0,$hi1
        addq    $lo1,$tj,$lo1
        cmpult  $lo1,$tj,AT
@@ -262,13 +266,11 @@ bn_mul_mont:
        mov     $rp,$bp         # put rp aside
        mov     sp,$tp
        mov     sp,$ap
-       srl     $nj,62,AT       # boundary condition...
-       beq     AT,.Lcopy       # ... is met
        mov     0,$hi0          # clear borrow bit
 
 .align 4
-.Lsub: ldq     $lo0,($tp)
-       ldq     $lo1,($np)
+.Lsub: ldq     $lo0,0($tp)
+       ldq     $lo1,0($np)
        lda     $tp,8($tp)
        lda     $np,8($np)
        subq    $lo0,$lo1,$lo1  # tp[i]-np[i]
@@ -276,7 +278,7 @@ bn_mul_mont:
        subq    $lo1,$hi0,$lo0
        cmpult  $lo1,$lo0,$hi0
        or      $hi0,AT,$hi0
-       stq     $lo0,($rp)
+       stq     $lo0,0($rp)
        cmpult  $tp,$tj,v0
        lda     $rp,8($rp)
        bne     v0,.Lsub
@@ -290,7 +292,7 @@ bn_mul_mont:
        bis     $bp,$ap,$ap     # ap=borrow?tp:rp
 
 .align 4
-.Lcopy:        ldq     $aj,($ap)       # copy or in-place refresh
+.Lcopy:        ldq     $aj,0($ap)      # copy or in-place refresh
        lda     $tp,8($tp)
        lda     $rp,8($rp)
        lda     $ap,8($ap)
@@ -308,11 +310,11 @@ bn_mul_mont:
        ldq     s4,16(sp)
        ldq     s5,24(sp)
        ldq     fp,32(sp)
-       lda     sp,40(sp)
+       lda     sp,48(sp)
        ret     (ra)
 .end   bn_mul_mont
-.rdata
-.asciiz        "Montgomery Multiplication for Alpha, CRYPTOGAMS by <appro\@openssl.org>"
+.ascii "Montgomery Multiplication for Alpha, CRYPTOGAMS by <appro\@openssl.org>"
+.align 2
 ___
 
 print $code;