|
|
@ -49,7 +49,8 @@ if (ENABLE_SSE)
|
|
|
|
b = _mm256_loadu_ps( src );
|
|
|
|
b = _mm256_loadu_ps( src );
|
|
|
|
c = _mm256_add_ps( a, b );
|
|
|
|
c = _mm256_add_ps( a, b );
|
|
|
|
_mm256_storeu_ps( dst, c );
|
|
|
|
_mm256_storeu_ps( dst, c );
|
|
|
|
for( int i = 0; i < 8; i++ ){
|
|
|
|
int i = 0;
|
|
|
|
|
|
|
|
for( i = 0; i < 8; i++ ){
|
|
|
|
if( ( src[i] + src[i] ) != dst[i] ){
|
|
|
|
if( ( src[i] + src[i] ) != dst[i] ){
|
|
|
|
return -1;
|
|
|
|
return -1;
|
|
|
|
}
|
|
|
|
}
|
|
|
@ -82,7 +83,8 @@ if (ENABLE_SSE)
|
|
|
|
b = _mm256_loadu_si256( (__m256i*)src );
|
|
|
|
b = _mm256_loadu_si256( (__m256i*)src );
|
|
|
|
c = _mm256_add_epi32( a, b );
|
|
|
|
c = _mm256_add_epi32( a, b );
|
|
|
|
_mm256_storeu_si256( (__m256i*)dst, c );
|
|
|
|
_mm256_storeu_si256( (__m256i*)dst, c );
|
|
|
|
for( int i = 0; i < 8; i++ ){
|
|
|
|
int i = 0;
|
|
|
|
|
|
|
|
for( i = 0; i < 8; i++ ){
|
|
|
|
if( ( src[i] + src[i] ) != dst[i] ){
|
|
|
|
if( ( src[i] + src[i] ) != dst[i] ){
|
|
|
|
return -1;
|
|
|
|
return -1;
|
|
|
|
}
|
|
|
|
}
|
|
|
|