gpu: nvgpu: gm20b: halify tpc lookup

Since the number of TPCs is different between GM20B and GK20a, the function to look up the number of TPCs needs to be halified. Change-Id: I19dab9a7105814f86c08c92283a0bb70abb6aa00 Signed-off-by: Mayank Kaushik <mkaushik@nvidia.com> Reviewed-on: http://git-master/r/500064 Reviewed-by: Automatic_Commit_Validation_User GVS: Gerrit_Virtual_Submit Reviewed-by: Terje Bergstrom <tbergstrom@nvidia.com>
2025-12-24 10:34:43 +03:00 · 2014-09-17 18:11:45 -07:00
parent 50d76e9b91
commit 3d313d0657
4 changed files with 67 additions and 26 deletions
--- a/drivers/gpu/nvgpu/gk20a/gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/gk20a.h
@@ -135,6 +135,8 @@ struct gpu_ops {
 				u32 mode);
 		int (*get_zcull_info)(struct gk20a *g, struct gr_gk20a *gr,
 				struct gr_zcull_info *zcull_params);
+		bool (*is_tpc_addr)(u32 addr);
+		u32 (*get_tpc_num)(u32 addr);
 	} gr;
 	const char *name;
 	struct {
--- a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
@@ -5922,13 +5922,13 @@ int gr_gk20a_decode_priv_addr(struct gk20a *g, u32 addr,
 		} else
 			*gpc_num = pri_get_gpc_num(addr);

-		if (pri_is_tpc_addr(gpc_addr)) {
+		if (g->ops.gr.is_tpc_addr(gpc_addr)) {
 			*addr_type = CTXSW_ADDR_TYPE_TPC;
 			if (pri_is_tpc_addr_shared(gpc_addr)) {
 				*broadcast_flags |= PRI_BROADCAST_FLAGS_TPC;
 				return 0;
 			}
-			*tpc_num = pri_get_tpc_num(gpc_addr);
+			*tpc_num = g->ops.gr.get_tpc_num(gpc_addr);
 		}
 		return 0;
 	} else if (pri_is_be_addr(addr)) {
@@ -6261,7 +6261,7 @@ static void gr_gk20a_access_smpc_reg(struct gk20a *g, u32 quad, u32 offset)

 	gpc = pri_get_gpc_num(offset);
 	gpc_tpc_addr = pri_gpccs_addr_mask(offset);
-	tpc = pri_get_tpc_num(gpc_tpc_addr);
+	tpc = g->ops.gr.get_tpc_num(gpc_tpc_addr);

 	quad_ctrl = quad & 0x1; /* first bit tells us quad */
 	half_ctrl = (quad >> 1) & 0x1; /* second bit tells us half */
@@ -6364,8 +6364,8 @@ static int gr_gk20a_find_priv_offset_in_ext_buffer(struct gk20a *g,
 		u32 gpc_addr = 0;
 		gpc_num = pri_get_gpc_num(addr);
 		gpc_addr = pri_gpccs_addr_mask(addr);
-		if (pri_is_tpc_addr(gpc_addr))
-			tpc_num = pri_get_tpc_num(gpc_addr);
+		if (g->ops.gr.is_tpc_addr(gpc_addr))
+			tpc_num = g->ops.gr.get_tpc_num(gpc_addr);
 		else
 			return -EINVAL;

@@ -7174,6 +7174,30 @@ void gk20a_init_gr(struct gk20a *g)
 	init_waitqueue_head(&g->gr.init_wq);
 }

+static bool gr_gk20a_is_tpc_addr(u32 addr)
+{
+	return ((addr >= proj_tpc_in_gpc_base_v()) &&
+		(addr < proj_tpc_in_gpc_base_v() +
+		 (proj_scal_litter_num_tpc_per_gpc_v() *
+		  proj_tpc_in_gpc_stride_v())))
+		|| pri_is_tpc_addr_shared(addr);
+}
+
+static u32 gr_gk20a_get_tpc_num(u32 addr)
+{
+	u32 i, start;
+	u32 num_tpcs = proj_scal_litter_num_tpc_per_gpc_v();
+
+	for (i = 0; i < num_tpcs; i++) {
+		start = proj_tpc_in_gpc_base_v() +
+			(i * proj_tpc_in_gpc_stride_v());
+		if ((addr >= start) &&
+		    (addr < (start + proj_tpc_in_gpc_stride_v())))
+			return i;
+	}
+	return 0;
+}
+
 void gk20a_init_gr_ops(struct gpu_ops *gops)
 {
 	gops->gr.access_smpc_reg = gr_gk20a_access_smpc_reg;
@@ -7205,4 +7229,6 @@ void gk20a_init_gr_ops(struct gpu_ops *gops)
 	gops->gr.free_obj_ctx = gk20a_free_obj_ctx;
 	gops->gr.bind_ctxsw_zcull = gr_gk20a_bind_ctxsw_zcull;
 	gops->gr.get_zcull_info = gr_gk20a_get_zcull_info;
+	gops->gr.is_tpc_addr = gr_gk20a_is_tpc_addr;
+	gops->gr.get_tpc_num = gr_gk20a_get_tpc_num;
 }
--- a/drivers/gpu/nvgpu/gk20a/gr_pri_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/gr_pri_gk20a.h
@@ -1,7 +1,7 @@
 /*
 * GK20A Graphics Context Pri Register Addressing
 *
- * Copyright (c) 2013, NVIDIA CORPORATION.  All rights reserved.
+ * Copyright (c) 2014, NVIDIA CORPORATION.  All rights reserved.
 *
 * This program is free software; you can redistribute it and/or modify it
 * under the terms and conditions of the GNU General Public License,
@@ -85,26 +85,6 @@ static inline bool pri_is_tpc_addr_shared(u32 addr)
 		(addr < (proj_tpc_in_gpc_shared_base_v() +
 			 proj_tpc_in_gpc_stride_v()));
 }
-static inline bool pri_is_tpc_addr(u32 addr)
-{
-	return ((addr >= proj_tpc_in_gpc_base_v()) &&
-		(addr < proj_tpc_in_gpc_base_v() + (proj_scal_litter_num_tpc_per_gpc_v() *
-						    proj_tpc_in_gpc_stride_v())))
-		||
-		pri_is_tpc_addr_shared(addr);
-}
-static inline u32 pri_get_tpc_num(u32 addr)
-{
-	u32 i, start;
-	u32 num_tpcs = proj_scal_litter_num_tpc_per_gpc_v();
-
-	for (i = 0; i < num_tpcs; i++) {
-		start = proj_tpc_in_gpc_base_v() + (i * proj_tpc_in_gpc_stride_v());
-		if ((addr >= start) && (addr < (start + proj_tpc_in_gpc_stride_v())))
-			return i;
-	}
-	return 0;
-}

 /*
 * BE pri addressing
--- a/drivers/gpu/nvgpu/gm20b/gr_gm20b.c
+++ b/drivers/gpu/nvgpu/gm20b/gr_gm20b.c
@@ -614,6 +614,37 @@ static int gr_gm20b_load_ctxsw_ucode_segments(struct gk20a *g, u64 addr_base,
 	return 0;
 }

+static bool gr_gm20b_is_tpc_addr_shared(u32 addr)
+{
+	return (addr >= proj_tpc_in_gpc_shared_base_v()) &&
+		(addr < (proj_tpc_in_gpc_shared_base_v() +
+			 proj_tpc_in_gpc_stride_v()));
+}
+
+static bool gr_gm20b_is_tpc_addr(u32 addr)
+{
+	return ((addr >= proj_tpc_in_gpc_base_v()) &&
+		(addr < proj_tpc_in_gpc_base_v() +
+		 (proj_scal_litter_num_tpc_per_gpc_v() *
+		  proj_tpc_in_gpc_stride_v())))
+		|| gr_gm20b_is_tpc_addr_shared(addr);
+}
+
+static u32 gr_gm20b_get_tpc_num(u32 addr)
+{
+	u32 i, start;
+	u32 num_tpcs = proj_scal_litter_num_tpc_per_gpc_v();
+
+	for (i = 0; i < num_tpcs; i++) {
+		start = proj_tpc_in_gpc_base_v() +
+			(i * proj_tpc_in_gpc_stride_v());
+		if ((addr >= start) &&
+		    (addr < (start + proj_tpc_in_gpc_stride_v())))
+			return i;
+	}
+	return 0;
+}
+
 #ifdef CONFIG_TEGRA_ACR
 static void gr_gm20b_load_gpccs_with_bootloader(struct gk20a *g)
 {
@@ -748,4 +779,6 @@ void gm20b_init_gr(struct gpu_ops *gops)
 	gops->gr.free_obj_ctx = gk20a_free_obj_ctx;
 	gops->gr.bind_ctxsw_zcull = gr_gk20a_bind_ctxsw_zcull;
 	gops->gr.get_zcull_info = gr_gk20a_get_zcull_info;
+	gops->gr.is_tpc_addr = gr_gm20b_is_tpc_addr;
+	gops->gr.get_tpc_num = gr_gm20b_get_tpc_num;
 }