Try this for faster multiply? - Printable Version

Code:
__MUL16:    ; Mutiplies HL with the last value stored into de stack

            ; Works for both signed and unsigned



        PROC



        LOCAL __MUL16LOOP1

                LOCAL __MUL16NOADD1

        LOCAL __MUL16LOOP2

                LOCAL __MUL16NOADD2



        

        ex de, hl

        pop hl        ; Return address

        ex (sp), hl ; CALLEE caller convention



;;__MUL16_FAST:    ; __FASTCALL ENTRY: HL = 1st operand, DE = 2nd Operand

;;        ld c, h

;;        ld a, l     ; C,A => 1st Operand

;;

;;        ld hl, 0 ; Accumulator

;;        ld b, 16

;;

;;__MUL16LOOP:

;;        sra c    ; C,A >> 1  (Arithmetic)

;;        rra

;;

;;        jr nc, __MUL16NOADD

;;        add hl, de

;;

;;__MUL16NOADD:

;;        sla e

;;        rl d

;;            

;;        djnz __MUL16LOOP



__MUL16_FAST:

        ld b, 8

        ld a, d

        ld c, e

        ex de, hl

        ld hl, 0



__MUL16LOOP1:

        add hl, hl  ; hl << 1

        ;sla c

        rla         ; a,c << 1

        jr nc, __MUL16NOADD1

        add hl, de



__MUL16NOADD1:

        djnz __MUL16LOOP1



        ld a,c

        ld b,8



__MUL16LOOP2:

        add hl, hl  ; hl << 1

        rla         ; a,c << 1

        jr nc, __MUL16NOADD2

        add hl, de



__MUL16NOADD2:

        djnz __MUL16LOOP2







        ret    ; Result in hl (16 lower bits)



        ENDP