From 9e2226421b7051e0a0f7c4377d620a0ca984d598 Mon Sep 17 00:00:00 2001 From: Bernhard Manfred Gruber Date: Thu, 5 May 2022 20:32:22 +0200 Subject: [PATCH] reduce debug output to console --- src/avx_sorthelper.cpp | 80 +++++++++++++++++++++--------------------- 1 file changed, 40 insertions(+), 40 deletions(-) diff --git a/src/avx_sorthelper.cpp b/src/avx_sorthelper.cpp index fba2480d0..78d2ad503 100644 --- a/src/avx_sorthelper.cpp +++ b/src/avx_sorthelper.cpp @@ -71,71 +71,71 @@ Vc_CONST AVX2::short_v sorted(AVX2::short_v x_ // sort pairs (one min/max) auto x = AVX::lo128(x_.data()); auto y = AVX::hi128(x_.data()); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); auto l = _mm_min_epi16(x, y); auto h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); // merge left & right quads (two min/max) x = _mm_unpacklo_epi16(l, h); y = _mm_unpackhi_epi16(h, l); - Vc_DEBUG << "8x2 sorted xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "8x2 sorted xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epi16(x, y); h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = Mem::permuteLo(Mem::blend(l, h)); y = Mem::permuteHi(Mem::blend(h, l)); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epi16(x, y); h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); // merge quads into octs (three min/max) x = _mm_unpacklo_epi16(h, l); y = _mm_unpackhi_epi16(l, h); - Vc_DEBUG << "4x4 sorted xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "4x4 sorted xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epi16(x, y); h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = Mem::permuteLo(Mem::blend(h, l)); y = Mem::permuteHi(Mem::blend(l, h)); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epi16(x, y); h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = Mem::permuteHi(Mem::blend(l, h)); y = Mem::permuteLo(Mem::blend(h, l)); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epi16(x, y); h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h) << " done?"; + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h) << " done?"; // merge octs into hexa (four min/max) x = _mm_unpacklo_epi16(l, h); y = _mm_unpackhi_epi16(h, l); - Vc_DEBUG << "2x8 sorted xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "2x8 sorted xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epi16(x, y); h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = _mm_unpacklo_epi64(l, h); y = _mm_unpackhi_epi64(l, h); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epi16(x, y); h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = _mm_castps_si128(Mem::permute(Mem::blend(_mm_castsi128_ps(h), _mm_castsi128_ps(l)))); y = _mm_castps_si128(Mem::blend(_mm_castsi128_ps(l), _mm_castsi128_ps(h))); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epi16(x, y); h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = Mem::blend(l, h); y = Mem::permuteLo( Mem::permuteHi(Mem::blend(h, l))); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epi16(x, y); h = _mm_max_epi16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = _mm_unpacklo_epi16(l, h); y = _mm_unpackhi_epi16(l, h); return AVX::concat(x, y); @@ -147,71 +147,71 @@ Vc_CONST AVX2::ushort_v sorted(AVX2::ushort_v // sort pairs (one min/max) auto x = AVX::lo128(x_.data()); auto y = AVX::hi128(x_.data()); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); auto l = _mm_min_epu16(x, y); auto h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); // merge left & right quads (two min/max) x = _mm_unpacklo_epi16(l, h); y = _mm_unpackhi_epi16(h, l); - Vc_DEBUG << "8x2 sorted xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "8x2 sorted xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epu16(x, y); h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = Mem::permuteLo(Mem::blend(l, h)); y = Mem::permuteHi(Mem::blend(h, l)); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epu16(x, y); h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); // merge quads into octs (three min/max) x = _mm_unpacklo_epi16(h, l); y = _mm_unpackhi_epi16(l, h); - Vc_DEBUG << "4x4 sorted xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "4x4 sorted xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epu16(x, y); h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = Mem::permuteLo(Mem::blend(h, l)); y = Mem::permuteHi(Mem::blend(l, h)); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epu16(x, y); h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = Mem::permuteHi(Mem::blend(l, h)); y = Mem::permuteLo(Mem::blend(h, l)); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epu16(x, y); h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h) << " done?"; + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h) << " done?"; // merge octs into hexa (four min/max) x = _mm_unpacklo_epi16(l, h); y = _mm_unpackhi_epi16(h, l); - Vc_DEBUG << "2x8 sorted xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "2x8 sorted xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epu16(x, y); h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = _mm_unpacklo_epi64(l, h); y = _mm_unpackhi_epi64(l, h); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epu16(x, y); h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = _mm_castps_si128(Mem::permute(Mem::blend(_mm_castsi128_ps(h), _mm_castsi128_ps(l)))); y = _mm_castps_si128(Mem::blend(_mm_castsi128_ps(l), _mm_castsi128_ps(h))); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epu16(x, y); h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = Mem::blend(l, h); y = Mem::permuteLo( Mem::permuteHi(Mem::blend(h, l))); - Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); + // Vc_DEBUG << "xy: " << AVX::addType(x) << AVX::addType(y); l = _mm_min_epu16(x, y); h = _mm_max_epu16(x, y); - Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); + // Vc_DEBUG << "lh: " << AVX::addType(l) << AVX::addType(h); x = _mm_unpacklo_epi16(l, h); y = _mm_unpackhi_epi16(l, h); return AVX::concat(x, y);