lpackbit $mabid $ln0 $t # t=2*mab nop dvmulu $lmt0v32 $lmt0v32 $nowrite dvfmad $lmt0v32 $lmt0v32 $mauf $nowrite dvmulu $lmt128v32 $lmt128v32 $nowrite; l1bmrdfadd $mauf $lb0 dvfmad $lmt128v32 $lmt128v32 $mauf $nowrite; l1bmm $lbi $nowrite lpassa $lbf $lm256v; l1bmrdfadd $mauf $lb0 l1bmm $lbi $lm264v lpackbit $mabid $ls256 $t nop l1bmrdfadd $lmt256v $lb0 l1bmm $lbi $ln0v