[PULL,v2,26/60] tcg/optimize: Split out fold_addsub2_i32

Message ID	20211029043329.1518029-27-richard.henderson@linaro.org
State	New
Headers	show Delivered-To: patch@linaro.org Received-SPF: pass (google.com: domain of qemu-devel-bounces+patch=linaro.org@nongnu.org designates 209.51.188.17 as permitted sender) client-ip=209.51.188.17; From: Richard Henderson <richard.henderson@linaro.org> To: qemu-devel@nongnu.org Subject: [PULL v2 26/60] tcg/optimize: Split out fold_addsub2_i32 Date: Thu, 28 Oct 2021 21:32:55 -0700 Message-Id: <20211029043329.1518029-27-richard.henderson@linaro.org> In-Reply-To: <20211029043329.1518029-1-richard.henderson@linaro.org> References: <20211029043329.1518029-1-richard.henderson@linaro.org> MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Received-SPF: pass client-ip=2607:f8b0:4864:20::633; envelope-from=richard.henderson@linaro.org; helo=mail-pl1-x633.google.com X-Spam_score_int: -1 X-Spam_score: -0.2 X-Spam_bar: / X-Spam_report: (-0.2 / 5.0 requ) DKIM_SIGNED=0.1, DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1, RCVD_IN_DNSWL_NONE=-0.0001, SPF_HELO_NONE=0.001, SPF_PASS=-0.001 autolearn=ham autolearn_force=no X-Spam_action: no action Precedence: list Cc: Luis Pires <luis.pires@eldorado.org.br>, =?utf-8?q?Philippe_Mathieu-Da?= =?utf-8?q?ud=C3=A9?= <f4bug@amsat.org> Errors-To: qemu-devel-bounces+patch=linaro.org@nongnu.org Sender: "Qemu-devel" <qemu-devel-bounces+patch=linaro.org@nongnu.org>
Series	tcg patch queue \| expand [PULL,v2,00/60] tcg patch queue [PULL,v2,01/60] qemu/int128: Add int128_{not,xor} [PULL,v2,02/60] host-utils: move checks out of divu128/divs128 [PULL,v2,03/60] host-utils: move udiv_qrnnd() to host-utils [PULL,v2,04/60] host-utils: add 128-bit quotient support to divu128/divs128 [PULL,v2,05/60] host-utils: add unit tests for divu128/divs128 [PULL,v2,06/60] tcg/optimize: Rename "mask" to "z_mask" [PULL,v2,07/60] tcg/optimize: Split out OptContext [PULL,v2,08/60] tcg/optimize: Remove do_default label [PULL,v2,09/60] tcg/optimize: Change tcg_opt_gen_{mov, movi} interface [PULL,v2,10/60] tcg/optimize: Move prev_mb into OptContext [PULL,v2,11/60] tcg/optimize: Split out init_arguments [PULL,v2,12/60] tcg/optimize: Split out copy_propagate [PULL,v2,13/60] tcg/optimize: Split out fold_call [PULL,v2,14/60] tcg/optimize: Drop nb_oargs, nb_iargs locals [PULL,v2,15/60] tcg/optimize: Change fail return for do_constant_folding_cond* [PULL,v2,16/60] tcg/optimize: Return true from tcg_opt_gen_{mov, movi} [PULL,v2,17/60] tcg/optimize: Split out finish_folding [PULL,v2,18/60] tcg/optimize: Use a boolean to avoid a mass of continues [PULL,v2,19/60] tcg/optimize: Split out fold_mb, fold_qemu_{ld,st} [PULL,v2,20/60] tcg/optimize: Split out fold_const{1,2} [PULL,v2,21/60] tcg/optimize: Split out fold_setcond2 [PULL,v2,22/60] tcg/optimize: Split out fold_brcond2 [PULL,v2,23/60] tcg/optimize: Split out fold_brcond [PULL,v2,24/60] tcg/optimize: Split out fold_setcond [PULL,v2,25/60] tcg/optimize: Split out fold_mulu2_i32 [PULL,v2,26/60] tcg/optimize: Split out fold_addsub2_i32 [PULL,v2,27/60] tcg/optimize: Split out fold_movcond [PULL,v2,28/60] tcg/optimize: Split out fold_extract2 [PULL,v2,29/60] tcg/optimize: Split out fold_extract, fold_sextract [PULL,v2,30/60] tcg/optimize: Split out fold_deposit [PULL,v2,31/60] tcg/optimize: Split out fold_count_zeros [PULL,v2,32/60] tcg/optimize: Split out fold_bswap [PULL,v2,33/60] tcg/optimize: Split out fold_dup, fold_dup2 [PULL,v2,34/60] tcg/optimize: Split out fold_mov [PULL,v2,35/60] tcg/optimize: Split out fold_xx_to_i [PULL,v2,36/60] tcg/optimize: Split out fold_xx_to_x [PULL,v2,37/60] tcg/optimize: Split out fold_xi_to_i [PULL,v2,38/60] tcg/optimize: Add type to OptContext [PULL,v2,39/60] tcg/optimize: Split out fold_to_not [PULL,v2,40/60] tcg/optimize: Split out fold_sub_to_neg [PULL,v2,41/60] tcg/optimize: Split out fold_xi_to_x [PULL,v2,42/60] tcg/optimize: Split out fold_ix_to_i [PULL,v2,43/60] tcg/optimize: Split out fold_masks [PULL,v2,44/60] tcg/optimize: Expand fold_mulu2_i32 to all 4-arg multiplies [PULL,v2,45/60] tcg/optimize: Expand fold_addsub2_i32 to 64-bit ops [PULL,v2,46/60] tcg/optimize: Sink commutative operand swapping into fold functions [PULL,v2,47/60] tcg: Extend call args using the correct opcodes [PULL,v2,48/60] tcg/optimize: Stop forcing z_mask to "garbage" for 32-bit values [PULL,v2,49/60] tcg/optimize: Use fold_xx_to_i for orc [PULL,v2,50/60] tcg/optimize: Use fold_xi_to_x for mul [PULL,v2,51/60] tcg/optimize: Use fold_xi_to_x for div [PULL,v2,52/60] tcg/optimize: Use fold_xx_to_i for rem [PULL,v2,53/60] tcg/optimize: Optimize sign extensions [PULL,v2,54/60] tcg/optimize: Propagate sign info for logical operations [PULL,v2,55/60] tcg/optimize: Propagate sign info for setcond [PULL,v2,56/60] tcg/optimize: Propagate sign info for bit counting [PULL,v2,57/60] tcg/optimize: Propagate sign info for shifting [PULL,v2,58/60] softmmu: fix watchpoint processing in icount mode [PULL,v2,59/60] softmmu: remove useless condition in watchpoint check [PULL,v2,60/60] softmmu: fix for "after access" watchpoints

Message ID

20211029043329.1518029-27-richard.henderson@linaro.org

State

New

Headers

Received-SPF: pass (google.com: domain of
	qemu-devel-bounces+patch=linaro.org@nongnu.org designates
	209.51.188.17 as permitted sender) client-ip=209.51.188.17; 
From: Richard Henderson <richard.henderson@linaro.org>
To: qemu-devel@nongnu.org
Subject: [PULL v2 26/60] tcg/optimize: Split out fold_addsub2_i32
Date: Thu, 28 Oct 2021 21:32:55 -0700
Message-Id: <20211029043329.1518029-27-richard.henderson@linaro.org>
In-Reply-To: <20211029043329.1518029-1-richard.henderson@linaro.org>
References: <20211029043329.1518029-1-richard.henderson@linaro.org>
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
Received-SPF: pass client-ip=2607:f8b0:4864:20::633;
	envelope-from=richard.henderson@linaro.org;
	helo=mail-pl1-x633.google.com
X-Spam_score_int: -1
X-Spam_score: -0.2
X-Spam_bar: /
X-Spam_report: (-0.2 / 5.0 requ) DKIM_SIGNED=0.1, DKIM_VALID=-0.1,
	DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1, RCVD_IN_DNSWL_NONE=-0.0001,
	SPF_HELO_NONE=0.001, SPF_PASS=-0.001 autolearn=ham autolearn_force=no
X-Spam_action: no action
X-BeenThere: qemu-devel@nongnu.org
X-Mailman-Version: 2.1.23
Precedence: list
List-Id: <qemu-devel.nongnu.org>
List-Unsubscribe: <https://lists.nongnu.org/mailman/options/qemu-devel>,
	<mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>
List-Archive: <https://lists.nongnu.org/archive/html/qemu-devel>
List-Post: <mailto:qemu-devel@nongnu.org>
List-Help: <mailto:qemu-devel-request@nongnu.org?subject=help>
List-Subscribe: <https://lists.nongnu.org/mailman/listinfo/qemu-devel>,
	<mailto:qemu-devel-request@nongnu.org?subject=subscribe>
Cc: Luis Pires <luis.pires@eldorado.org.br>, =?utf-8?q?Philippe_Mathieu-Da?=
	=?utf-8?q?ud=C3=A9?= <f4bug@amsat.org>
Errors-To: qemu-devel-bounces+patch=linaro.org@nongnu.org
Sender: "Qemu-devel" <qemu-devel-bounces+patch=linaro.org@nongnu.org>

Series

tcg patch queue | expand

Commit Message

Richard Henderson Oct. 29, 2021, 4:32 a.m. UTC

Add two additional helpers, fold_add2_i32 and fold_sub2_i32
which will not be simple wrappers forever.

Reviewed-by: Luis Pires <luis.pires@eldorado.org.br>

Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>

---
 tcg/optimize.c | 70 +++++++++++++++++++++++++++++++-------------------
 1 file changed, 44 insertions(+), 26 deletions(-)

-- 
2.25.1

diff --git a/tcg/optimize.c b/tcg/optimize.c
index 805522f99d..9d1d045363 100644
--- a/tcg/optimize.c
+++ b/tcg/optimize.c
@@ -704,6 +704,39 @@  static bool fold_add(OptContext *ctx, TCGOp *op)
     return fold_const2(ctx, op);
 }
 
+static bool fold_addsub2_i32(OptContext *ctx, TCGOp *op, bool add)
+{
+    if (arg_is_const(op->args[2]) && arg_is_const(op->args[3]) &&
+        arg_is_const(op->args[4]) && arg_is_const(op->args[5])) {
+        uint32_t al = arg_info(op->args[2])->val;
+        uint32_t ah = arg_info(op->args[3])->val;
+        uint32_t bl = arg_info(op->args[4])->val;
+        uint32_t bh = arg_info(op->args[5])->val;
+        uint64_t a = ((uint64_t)ah << 32) | al;
+        uint64_t b = ((uint64_t)bh << 32) | bl;
+        TCGArg rl, rh;
+        TCGOp *op2 = tcg_op_insert_before(ctx->tcg, op, INDEX_op_mov_i32);
+
+        if (add) {
+            a += b;
+        } else {
+            a -= b;
+        }
+
+        rl = op->args[0];
+        rh = op->args[1];
+        tcg_opt_gen_movi(ctx, op, rl, (int32_t)a);
+        tcg_opt_gen_movi(ctx, op2, rh, (int32_t)(a >> 32));
+        return true;
+    }
+    return false;
+}
+
+static bool fold_add2_i32(OptContext *ctx, TCGOp *op)
+{
+    return fold_addsub2_i32(ctx, op, true);
+}
+
 static bool fold_and(OptContext *ctx, TCGOp *op)
 {
     return fold_const2(ctx, op);
@@ -1056,6 +1089,11 @@  static bool fold_sub(OptContext *ctx, TCGOp *op)
     return fold_const2(ctx, op);
 }
 
+static bool fold_sub2_i32(OptContext *ctx, TCGOp *op)
+{
+    return fold_addsub2_i32(ctx, op, false);
+}
+
 static bool fold_xor(OptContext *ctx, TCGOp *op)
 {
     return fold_const2(ctx, op);
@@ -1701,32 +1739,6 @@  void tcg_optimize(TCGContext *s)
             }
             break;
 
-        case INDEX_op_add2_i32:
-        case INDEX_op_sub2_i32:
-            if (arg_is_const(op->args[2]) && arg_is_const(op->args[3])
-                && arg_is_const(op->args[4]) && arg_is_const(op->args[5])) {
-                uint32_t al = arg_info(op->args[2])->val;
-                uint32_t ah = arg_info(op->args[3])->val;
-                uint32_t bl = arg_info(op->args[4])->val;
-                uint32_t bh = arg_info(op->args[5])->val;
-                uint64_t a = ((uint64_t)ah << 32) | al;
-                uint64_t b = ((uint64_t)bh << 32) | bl;
-                TCGArg rl, rh;
-                TCGOp *op2 = tcg_op_insert_before(s, op, INDEX_op_mov_i32);
-
-                if (opc == INDEX_op_add2_i32) {
-                    a += b;
-                } else {
-                    a -= b;
-                }
-
-                rl = op->args[0];
-                rh = op->args[1];
-                tcg_opt_gen_movi(&ctx, op, rl, (int32_t)a);
-                tcg_opt_gen_movi(&ctx, op2, rh, (int32_t)(a >> 32));
-                continue;
-            }
-            break;
 
         default:
             break;
@@ -1737,6 +1749,9 @@  void tcg_optimize(TCGContext *s)
         CASE_OP_32_64_VEC(add):
             done = fold_add(&ctx, op);
             break;
+        case INDEX_op_add2_i32:
+            done = fold_add2_i32(&ctx, op);
+            break;
         CASE_OP_32_64_VEC(and):
             done = fold_and(&ctx, op);
             break;
@@ -1833,6 +1848,9 @@  void tcg_optimize(TCGContext *s)
         CASE_OP_32_64_VEC(sub):
             done = fold_sub(&ctx, op);
             break;
+        case INDEX_op_sub2_i32:
+            done = fold_sub2_i32(&ctx, op);
+            break;
         CASE_OP_32_64_VEC(xor):
             done = fold_xor(&ctx, op);
             break;

[PULL,v2,26/60] tcg/optimize: Split out fold_addsub2_i32

Commit Message

Patch