[PULL,v2,03/60] host-utils: move udiv_qrnnd() to host-utils

Message ID	20211029043329.1518029-4-richard.henderson@linaro.org
State	New
Headers	show Delivered-To: patch@linaro.org Received-SPF: pass (google.com: domain of qemu-devel-bounces+patch=linaro.org@nongnu.org designates 209.51.188.17 as permitted sender) client-ip=209.51.188.17; From: Richard Henderson <richard.henderson@linaro.org> To: qemu-devel@nongnu.org Subject: [PULL v2 03/60] host-utils: move udiv_qrnnd() to host-utils Date: Thu, 28 Oct 2021 21:32:32 -0700 Message-Id: <20211029043329.1518029-4-richard.henderson@linaro.org> In-Reply-To: <20211029043329.1518029-1-richard.henderson@linaro.org> References: <20211029043329.1518029-1-richard.henderson@linaro.org> MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Received-SPF: pass client-ip=2607:f8b0:4864:20::52d; envelope-from=richard.henderson@linaro.org; helo=mail-pg1-x52d.google.com X-Spam_score_int: -1 X-Spam_score: -0.2 X-Spam_bar: / X-Spam_report: (-0.2 / 5.0 requ) DKIM_SIGNED=0.1, DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1, RCVD_IN_DNSWL_NONE=-0.0001, SPF_HELO_NONE=0.001, SPF_PASS=-0.001 autolearn=ham autolearn_force=no X-Spam_action: no action Precedence: list Cc: Luis Pires <luis.pires@eldorado.org.br> Errors-To: qemu-devel-bounces+patch=linaro.org@nongnu.org Sender: "Qemu-devel" <qemu-devel-bounces+patch=linaro.org@nongnu.org>
Series	tcg patch queue \| expand [PULL,v2,00/60] tcg patch queue [PULL,v2,01/60] qemu/int128: Add int128_{not,xor} [PULL,v2,02/60] host-utils: move checks out of divu128/divs128 [PULL,v2,03/60] host-utils: move udiv_qrnnd() to host-utils [PULL,v2,04/60] host-utils: add 128-bit quotient support to divu128/divs128 [PULL,v2,05/60] host-utils: add unit tests for divu128/divs128 [PULL,v2,06/60] tcg/optimize: Rename "mask" to "z_mask" [PULL,v2,07/60] tcg/optimize: Split out OptContext [PULL,v2,08/60] tcg/optimize: Remove do_default label [PULL,v2,09/60] tcg/optimize: Change tcg_opt_gen_{mov, movi} interface [PULL,v2,10/60] tcg/optimize: Move prev_mb into OptContext [PULL,v2,11/60] tcg/optimize: Split out init_arguments [PULL,v2,12/60] tcg/optimize: Split out copy_propagate [PULL,v2,13/60] tcg/optimize: Split out fold_call [PULL,v2,14/60] tcg/optimize: Drop nb_oargs, nb_iargs locals [PULL,v2,15/60] tcg/optimize: Change fail return for do_constant_folding_cond* [PULL,v2,16/60] tcg/optimize: Return true from tcg_opt_gen_{mov, movi} [PULL,v2,17/60] tcg/optimize: Split out finish_folding [PULL,v2,18/60] tcg/optimize: Use a boolean to avoid a mass of continues [PULL,v2,19/60] tcg/optimize: Split out fold_mb, fold_qemu_{ld,st} [PULL,v2,20/60] tcg/optimize: Split out fold_const{1,2} [PULL,v2,21/60] tcg/optimize: Split out fold_setcond2 [PULL,v2,22/60] tcg/optimize: Split out fold_brcond2 [PULL,v2,23/60] tcg/optimize: Split out fold_brcond [PULL,v2,24/60] tcg/optimize: Split out fold_setcond [PULL,v2,25/60] tcg/optimize: Split out fold_mulu2_i32 [PULL,v2,26/60] tcg/optimize: Split out fold_addsub2_i32 [PULL,v2,27/60] tcg/optimize: Split out fold_movcond [PULL,v2,28/60] tcg/optimize: Split out fold_extract2 [PULL,v2,29/60] tcg/optimize: Split out fold_extract, fold_sextract [PULL,v2,30/60] tcg/optimize: Split out fold_deposit [PULL,v2,31/60] tcg/optimize: Split out fold_count_zeros [PULL,v2,32/60] tcg/optimize: Split out fold_bswap [PULL,v2,33/60] tcg/optimize: Split out fold_dup, fold_dup2 [PULL,v2,34/60] tcg/optimize: Split out fold_mov [PULL,v2,35/60] tcg/optimize: Split out fold_xx_to_i [PULL,v2,36/60] tcg/optimize: Split out fold_xx_to_x [PULL,v2,37/60] tcg/optimize: Split out fold_xi_to_i [PULL,v2,38/60] tcg/optimize: Add type to OptContext [PULL,v2,39/60] tcg/optimize: Split out fold_to_not [PULL,v2,40/60] tcg/optimize: Split out fold_sub_to_neg [PULL,v2,41/60] tcg/optimize: Split out fold_xi_to_x [PULL,v2,42/60] tcg/optimize: Split out fold_ix_to_i [PULL,v2,43/60] tcg/optimize: Split out fold_masks [PULL,v2,44/60] tcg/optimize: Expand fold_mulu2_i32 to all 4-arg multiplies [PULL,v2,45/60] tcg/optimize: Expand fold_addsub2_i32 to 64-bit ops [PULL,v2,46/60] tcg/optimize: Sink commutative operand swapping into fold functions [PULL,v2,47/60] tcg: Extend call args using the correct opcodes [PULL,v2,48/60] tcg/optimize: Stop forcing z_mask to "garbage" for 32-bit values [PULL,v2,49/60] tcg/optimize: Use fold_xx_to_i for orc [PULL,v2,50/60] tcg/optimize: Use fold_xi_to_x for mul [PULL,v2,51/60] tcg/optimize: Use fold_xi_to_x for div [PULL,v2,52/60] tcg/optimize: Use fold_xx_to_i for rem [PULL,v2,53/60] tcg/optimize: Optimize sign extensions [PULL,v2,54/60] tcg/optimize: Propagate sign info for logical operations [PULL,v2,55/60] tcg/optimize: Propagate sign info for setcond [PULL,v2,56/60] tcg/optimize: Propagate sign info for bit counting [PULL,v2,57/60] tcg/optimize: Propagate sign info for shifting [PULL,v2,58/60] softmmu: fix watchpoint processing in icount mode [PULL,v2,59/60] softmmu: remove useless condition in watchpoint check [PULL,v2,60/60] softmmu: fix for "after access" watchpoints

Message ID

20211029043329.1518029-4-richard.henderson@linaro.org

State

New

Headers

Received-SPF: pass (google.com: domain of
	qemu-devel-bounces+patch=linaro.org@nongnu.org designates
	209.51.188.17 as permitted sender) client-ip=209.51.188.17; 
From: Richard Henderson <richard.henderson@linaro.org>
To: qemu-devel@nongnu.org
Subject: [PULL v2 03/60] host-utils: move udiv_qrnnd() to host-utils
Date: Thu, 28 Oct 2021 21:32:32 -0700
Message-Id: <20211029043329.1518029-4-richard.henderson@linaro.org>
In-Reply-To: <20211029043329.1518029-1-richard.henderson@linaro.org>
References: <20211029043329.1518029-1-richard.henderson@linaro.org>
MIME-Version: 1.0
Content-Transfer-Encoding: 8bit
Received-SPF: pass client-ip=2607:f8b0:4864:20::52d;
	envelope-from=richard.henderson@linaro.org;
	helo=mail-pg1-x52d.google.com
X-Spam_score_int: -1
X-Spam_score: -0.2
X-Spam_bar: /
X-Spam_report: (-0.2 / 5.0 requ) DKIM_SIGNED=0.1, DKIM_VALID=-0.1,
	DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1, RCVD_IN_DNSWL_NONE=-0.0001,
	SPF_HELO_NONE=0.001, SPF_PASS=-0.001 autolearn=ham autolearn_force=no
X-Spam_action: no action
X-BeenThere: qemu-devel@nongnu.org
X-Mailman-Version: 2.1.23
Precedence: list
List-Id: <qemu-devel.nongnu.org>
List-Unsubscribe: <https://lists.nongnu.org/mailman/options/qemu-devel>,
	<mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>
List-Archive: <https://lists.nongnu.org/archive/html/qemu-devel>
List-Post: <mailto:qemu-devel@nongnu.org>
List-Help: <mailto:qemu-devel-request@nongnu.org?subject=help>
List-Subscribe: <https://lists.nongnu.org/mailman/listinfo/qemu-devel>,
	<mailto:qemu-devel-request@nongnu.org?subject=subscribe>
Cc: Luis Pires <luis.pires@eldorado.org.br>
Errors-To: qemu-devel-bounces+patch=linaro.org@nongnu.org
Sender: "Qemu-devel" <qemu-devel-bounces+patch=linaro.org@nongnu.org>

Series

tcg patch queue | expand

Commit Message

Richard Henderson Oct. 29, 2021, 4:32 a.m. UTC

From: Luis Pires <luis.pires@eldorado.org.br>


Move udiv_qrnnd() from include/fpu/softfloat-macros.h to host-utils,
so it can be reused by divu128().

Signed-off-by: Luis Pires <luis.pires@eldorado.org.br>

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>

Message-Id: <20211025191154.350831-3-luis.pires@eldorado.org.br>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>

---
 include/fpu/softfloat-macros.h | 82 ----------------------------------
 include/qemu/host-utils.h      | 81 +++++++++++++++++++++++++++++++++
 2 files changed, 81 insertions(+), 82 deletions(-)

-- 
2.25.1

diff --git a/include/fpu/softfloat-macros.h b/include/fpu/softfloat-macros.h
index 81c3fe8256..f35cdbfa63 100644
--- a/include/fpu/softfloat-macros.h
+++ b/include/fpu/softfloat-macros.h
@@ -8,7 +8,6 @@ 
  * so some portions are provided under:
  *  the SoftFloat-2a license
  *  the BSD license
- *  GPL-v2-or-later
  *
  * Any future contributions to this file after December 1st 2014 will be
  * taken to be licensed under the Softfloat-2a license unless specifically
@@ -75,10 +74,6 @@  this code that are retained.
  * THE POSSIBILITY OF SUCH DAMAGE.
  */
 
-/* Portions of this work are licensed under the terms of the GNU GPL,
- * version 2 or later. See the COPYING file in the top-level directory.
- */
-
 #ifndef FPU_SOFTFLOAT_MACROS_H
 #define FPU_SOFTFLOAT_MACROS_H
 
@@ -585,83 +580,6 @@  static inline uint64_t estimateDiv128To64(uint64_t a0, uint64_t a1, uint64_t b)
 
 }
 
-/* From the GNU Multi Precision Library - longlong.h __udiv_qrnnd
- * (https://gmplib.org/repo/gmp/file/tip/longlong.h)
- *
- * Licensed under the GPLv2/LGPLv3
- */
-static inline uint64_t udiv_qrnnd(uint64_t *r, uint64_t n1,
-                                  uint64_t n0, uint64_t d)
-{
-#if defined(__x86_64__)
-    uint64_t q;
-    asm("divq %4" : "=a"(q), "=d"(*r) : "0"(n0), "1"(n1), "rm"(d));
-    return q;
-#elif defined(__s390x__) && !defined(__clang__)
-    /* Need to use a TImode type to get an even register pair for DLGR.  */
-    unsigned __int128 n = (unsigned __int128)n1 << 64 | n0;
-    asm("dlgr %0, %1" : "+r"(n) : "r"(d));
-    *r = n >> 64;
-    return n;
-#elif defined(_ARCH_PPC64) && defined(_ARCH_PWR7)
-    /* From Power ISA 2.06, programming note for divdeu.  */
-    uint64_t q1, q2, Q, r1, r2, R;
-    asm("divdeu %0,%2,%4; divdu %1,%3,%4"
-        : "=&r"(q1), "=r"(q2)
-        : "r"(n1), "r"(n0), "r"(d));
-    r1 = -(q1 * d);         /* low part of (n1<<64) - (q1 * d) */
-    r2 = n0 - (q2 * d);
-    Q = q1 + q2;
-    R = r1 + r2;
-    if (R >= d || R < r2) { /* overflow implies R > d */
-        Q += 1;
-        R -= d;
-    }
-    *r = R;
-    return Q;
-#else
-    uint64_t d0, d1, q0, q1, r1, r0, m;
-
-    d0 = (uint32_t)d;
-    d1 = d >> 32;
-
-    r1 = n1 % d1;
-    q1 = n1 / d1;
-    m = q1 * d0;
-    r1 = (r1 << 32) | (n0 >> 32);
-    if (r1 < m) {
-        q1 -= 1;
-        r1 += d;
-        if (r1 >= d) {
-            if (r1 < m) {
-                q1 -= 1;
-                r1 += d;
-            }
-        }
-    }
-    r1 -= m;
-
-    r0 = r1 % d1;
-    q0 = r1 / d1;
-    m = q0 * d0;
-    r0 = (r0 << 32) | (uint32_t)n0;
-    if (r0 < m) {
-        q0 -= 1;
-        r0 += d;
-        if (r0 >= d) {
-            if (r0 < m) {
-                q0 -= 1;
-                r0 += d;
-            }
-        }
-    }
-    r0 -= m;
-
-    *r = r0;
-    return (q1 << 32) | q0;
-#endif
-}
-
 /*----------------------------------------------------------------------------
 | Returns an approximation to the square root of the 32-bit significand given
 | by `a'.  Considered as an integer, `a' must be at least 2^31.  If bit 0 of
diff --git a/include/qemu/host-utils.h b/include/qemu/host-utils.h
index e82e6239af..08a17e16e5 100644
--- a/include/qemu/host-utils.h
+++ b/include/qemu/host-utils.h
@@ -23,6 +23,10 @@ 
  * THE SOFTWARE.
  */
 
+/* Portions of this work are licensed under the terms of the GNU GPL,
+ * version 2 or later. See the COPYING file in the top-level directory.
+ */
+
 #ifndef HOST_UTILS_H
 #define HOST_UTILS_H
 
@@ -726,4 +730,81 @@  void urshift(uint64_t *plow, uint64_t *phigh, int32_t shift);
  */
 void ulshift(uint64_t *plow, uint64_t *phigh, int32_t shift, bool *overflow);
 
+/* From the GNU Multi Precision Library - longlong.h __udiv_qrnnd
+ * (https://gmplib.org/repo/gmp/file/tip/longlong.h)
+ *
+ * Licensed under the GPLv2/LGPLv3
+ */
+static inline uint64_t udiv_qrnnd(uint64_t *r, uint64_t n1,
+                                  uint64_t n0, uint64_t d)
+{
+#if defined(__x86_64__)
+    uint64_t q;
+    asm("divq %4" : "=a"(q), "=d"(*r) : "0"(n0), "1"(n1), "rm"(d));
+    return q;
+#elif defined(__s390x__) && !defined(__clang__)
+    /* Need to use a TImode type to get an even register pair for DLGR.  */
+    unsigned __int128 n = (unsigned __int128)n1 << 64 | n0;
+    asm("dlgr %0, %1" : "+r"(n) : "r"(d));
+    *r = n >> 64;
+    return n;
+#elif defined(_ARCH_PPC64) && defined(_ARCH_PWR7)
+    /* From Power ISA 2.06, programming note for divdeu.  */
+    uint64_t q1, q2, Q, r1, r2, R;
+    asm("divdeu %0,%2,%4; divdu %1,%3,%4"
+        : "=&r"(q1), "=r"(q2)
+        : "r"(n1), "r"(n0), "r"(d));
+    r1 = -(q1 * d);         /* low part of (n1<<64) - (q1 * d) */
+    r2 = n0 - (q2 * d);
+    Q = q1 + q2;
+    R = r1 + r2;
+    if (R >= d || R < r2) { /* overflow implies R > d */
+        Q += 1;
+        R -= d;
+    }
+    *r = R;
+    return Q;
+#else
+    uint64_t d0, d1, q0, q1, r1, r0, m;
+
+    d0 = (uint32_t)d;
+    d1 = d >> 32;
+
+    r1 = n1 % d1;
+    q1 = n1 / d1;
+    m = q1 * d0;
+    r1 = (r1 << 32) | (n0 >> 32);
+    if (r1 < m) {
+        q1 -= 1;
+        r1 += d;
+        if (r1 >= d) {
+            if (r1 < m) {
+                q1 -= 1;
+                r1 += d;
+            }
+        }
+    }
+    r1 -= m;
+
+    r0 = r1 % d1;
+    q0 = r1 / d1;
+    m = q0 * d0;
+    r0 = (r0 << 32) | (uint32_t)n0;
+    if (r0 < m) {
+        q0 -= 1;
+        r0 += d;
+        if (r0 >= d) {
+            if (r0 < m) {
+                q0 -= 1;
+                r0 += d;
+            }
+        }
+    }
+    r0 -= m;
+
+    *r = r0;
+    return (q1 << 32) | q0;
+#endif
+}
+
 #endif

[PULL,v2,03/60] host-utils: move udiv_qrnnd() to host-utils

Commit Message

Patch