Lines Matching full:q0

60  * registers q0-q3.  It performs matrix operations on four words in parallel,
74 vadd.i32 q0, q0, q1
75 veor q3, q3, q0
85 vadd.i32 q0, q0, q1
86 veor q3, q3, q0
104 vadd.i32 q0, q0, q1
105 veor q3, q3, q0
115 vadd.i32 q0, q0, q1
116 veor q3, q3, q0
148 vld1.32 {q0-q1}, [r0]
151 vmov q8, q0
163 vadd.i32 q0, q0, q8
164 veor q0, q0, q4
179 vst1.8 {q0-q1}, [r1]
191 vld1.32 {q0-q1}, [r0]!
197 vst1.32 {q0}, [r1]!
230 vld1.32 {q0-q1}, [r0]
251 vdup.32 q0, d0[0]
263 vadd.i32 q0, q0, q4
268 veor q12, q12, q0
308 vadd.i32 q0, q0, q4
313 veor q12, q12, q0
360 vadd.i32 q0, q0, q5
365 veor q15, q15, q0
405 vadd.i32 q0, q0, q5
410 veor q15, q15, q0
454 // x0..7[0-3] are in q0-q7, x10..15[0-3] are in q10-q15.
460 vzip.32 q0, q1 // => (0 1 0 1) (0 1 0 1)
471 // Swap q1 and q4 so that we'll free up consecutive registers (q0-q1)
475 // First two rows of each block are (q0 q1) (q2 q6) (q4 q5) (q3 q7)
478 vadd.u32 q0, q0, q8
491 veor q8, q8, q0
503 vld1.32 {q0-q1}, [r0] // load s8..15
512 vadd.u32 q8, q8, q0
513 vadd.u32 q10, q10, q0
514 vadd.u32 q9, q9, q0
515 vadd.u32 q11, q11, q0
525 vld1.8 {q0-q1}, [r2]!
527 veor q0, q0, q8
530 vst1.8 {q0-q1}, [r1]!
532 vld1.8 {q0-q1}, [r2]!
534 veor q0, q0, q2
537 vst1.8 {q0-q1}, [r1]!
539 vld1.8 {q0-q1}, [r2]!
541 veor q0, q0, q10
544 vst1.8 {q0-q1}, [r1]!
546 vld1.8 {q0-q1}, [r2]!
548 veor q0, q0, q4
551 vst1.8 {q0-q1}, [r1]!
553 vld1.8 {q0-q1}, [r2]!
555 veor q0, q0, q9
558 vst1.8 {q0-q1}, [r1]!
560 vld1.8 {q0-q1}, [r2]!
562 veor q0, q0, q3
566 vst1.8 {q0-q1}, [r1]!
568 vld1.8 {q0-q1}, [r2]
569 veor q0, q0, q11
571 vst1.8 {q0-q1}, [r1]
586 // [r1] in q0-q1.
609 vst1.8 {q0-q1}, [r1]