gpu:nvgpu: add enable flag for KMD_SCHEDULING_WORKER_THREAD support

Currently KMD_SCHEDULING_WORKER_THREAD can be enabled/disabled using compile time flag but this flag does give ability to control the feature based on the chip. GSP is enabled only on ga10b where KMD_SCHEDULING_WORKER_THREAD should be disabled while should be enabled for other chips at the same time to support GVS tests. Change adds enabled flag to control KMD_SCHEDULING_WORKER_THREAD based on the chip. Bug 3935433 Change-Id: I9d2f34cf172d22472bdc4614073d1fb88ea204d7 Signed-off-by: prsethi <prsethi@nvidia.com> Reviewed-on: https://git-master.nvidia.com/r/c/linux-nvgpu/+/2867023 Tested-by: mobile promotions <svcmobile_promotions@nvidia.com> Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com>
2025-12-22 09:12:24 +03:00 · 2023-03-07 12:19:48 +00:00
parent 1aaa6e439c
commit 6b2c080f8f
11 changed files with 115 additions and 63 deletions
--- a/drivers/gpu/nvgpu/common/fifo/runlist.c
+++ b/drivers/gpu/nvgpu/common/fifo/runlist.c
@@ -602,12 +602,16 @@ int nvgpu_runlist_reschedule(struct nvgpu_channel *ch, bool preempt_next,
 	 * and can be disabled.
 	 */
 #if defined(CONFIG_KMD_SCHEDULING_WORKER_THREAD)
+	if (nvgpu_is_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD)) {
 		ret = g->nvs_worker_submit(g, runlist, runlist->domain, wait_preempt);
 		if (ret == 1) {
 			ret = 0;
 		} else if (ret != 0) {
 			goto done;
 		}
+	} else {
+		ret = nvgpu_rl_domain_sync_submit(g, runlist, runlist->domain, wait_preempt);
+	}
 #endif /* CONFIG_KMD_SCHEDULING_WORKER_THREAD */
 	/*
 	 * The else path is for some platforms that doesn't itself support
@@ -683,6 +687,7 @@ static int nvgpu_runlist_do_update(struct gk20a *g, struct nvgpu_runlist *rl,
 		* and can be disabled.
 		*/
 #if defined(CONFIG_KMD_SCHEDULING_WORKER_THREAD)
+		if (nvgpu_is_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD)) {
 			if ((domain != NULL) && (domain->domain_id != SHADOW_DOMAIN_ID)) {
 				domain->remove = !add;
 				rl_dbg(g, "domain-id %llu is_remove %d",
@@ -694,6 +699,9 @@ static int nvgpu_runlist_do_update(struct gk20a *g, struct nvgpu_runlist *rl,
 			if (ret == 1) {
 				ret = 0;
 			}
+		} else {
+			ret = nvgpu_rl_domain_sync_submit(g, rl, domain, wait_for_finish);
+		}
 #endif /* CONFIG_KMD_SCHEDULING_WORKER_THREAD */
 		/*
 		* The else path is for some platforms that doesn't itself support
--- a/drivers/gpu/nvgpu/common/init/nvgpu_init.c
+++ b/drivers/gpu/nvgpu/common/init/nvgpu_init.c
@@ -321,7 +321,9 @@ int nvgpu_prepare_poweroff(struct gk20a *g)

 #ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
 	/* Ensure that thread is paused before Engines suspend below */
+	if (nvgpu_is_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD)) {
 		nvgpu_nvs_worker_pause(g);
+	}
 #endif

 #ifdef CONFIG_NVGPU_LS_PMU
--- a/drivers/gpu/nvgpu/common/nvs/nvs_sched.c
+++ b/drivers/gpu/nvgpu/common/nvs/nvs_sched.c
@@ -710,7 +710,9 @@ int nvgpu_nvs_open(struct gk20a *g)
 		/* resuming from railgate */
 		nvgpu_mutex_release(&g->sched_mutex);
 #ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
+		if (nvgpu_is_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD)) {
 			nvgpu_nvs_worker_resume(g);
+		}
 #endif
 		return err;
 	}
@@ -757,6 +759,7 @@ int nvgpu_nvs_open(struct gk20a *g)
 	nvgpu_wmb();

 #ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
+	if (nvgpu_is_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD)) {
 		err = nvgpu_nvs_worker_init(g);
 		if (err != 0) {
 			nvgpu_nvs_remove_shadow_domain(g);
@@ -775,6 +778,7 @@ unlock:
 			if (g->sched_ctrl_fifo)
 				nvgpu_nvs_ctrl_fifo_destroy(g);
 		}
+	}
 #endif

 	nvgpu_mutex_release(&g->sched_mutex);
--- a/drivers/gpu/nvgpu/common/nvs/nvs_sched_ctrl.c
+++ b/drivers/gpu/nvgpu/common/nvs/nvs_sched_ctrl.c
@@ -540,6 +540,7 @@ int nvgpu_nvs_buffer_alloc(struct nvgpu_nvs_domain_ctrl_fifo *sched_ctrl,
 	}

 #ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
+	if (nvgpu_is_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD)) {
 		if (mask == NVGPU_NVS_CTRL_FIFO_QUEUE_EXCLUSIVE_CLIENT_WRITE) {
 			send_queue_receiver = nvs_control_fifo_receiver_initialize(g,
 				(struct nvs_domain_msg_fifo * const)buf->mem.cpu_va, bytes);
@@ -555,6 +556,7 @@ int nvgpu_nvs_buffer_alloc(struct nvgpu_nvs_domain_ctrl_fifo *sched_ctrl,
 			}
 			nvgpu_nvs_domain_ctrl_fifo_set_sender(g, receiver_queue_sender);
 		}
+	}
 #endif

 	buf->valid = true;
@@ -592,6 +594,7 @@ void nvgpu_nvs_buffer_free(struct nvgpu_nvs_domain_ctrl_fifo *sched_ctrl,
 	mask = buf->mask;

 #ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
+	if (nvgpu_is_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD)) {
 		send_queue_receiver = nvgpu_nvs_domain_ctrl_fifo_get_receiver(g);
 		receiver_queue_sender = nvgpu_nvs_domain_ctrl_fifo_get_sender(g);

@@ -606,6 +609,7 @@ void nvgpu_nvs_buffer_free(struct nvgpu_nvs_domain_ctrl_fifo *sched_ctrl,
 				nvs_control_fifo_sender_exit(g, receiver_queue_sender);
 			}
 		}
+	}
 #endif

 	if (nvgpu_mem_is_valid(&buf->mem)) {
--- a/drivers/gpu/nvgpu/hal/init/hal_ga100.c
+++ b/drivers/gpu/nvgpu/hal/init/hal_ga100.c
@@ -2021,6 +2021,12 @@ int ga100_init_hal(struct gk20a *g)
 	{
 		nvgpu_set_enabled(g, NVGPU_GR_USE_DMA_FOR_FW_BOOTSTRAP, true);
 	}
+#ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
+	/*
+	 * enabled kmd sheduling worker thread
+	 */
+	nvgpu_set_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD, true);
+#endif
 	nvgpu_set_enabled(g, NVGPU_SUPPORT_PES_FS, true);
 	g->name = "ga100";

--- a/drivers/gpu/nvgpu/hal/init/hal_ga10b.c
+++ b/drivers/gpu/nvgpu/hal/init/hal_ga10b.c
@@ -1976,6 +1976,12 @@ int ga10b_init_hal(struct gk20a *g)
 	nvgpu_set_enabled(g, NVGPU_SUPPORT_GSP_SCHED, true);
 	nvgpu_set_enabled(g, NVGPU_SUPPORT_GSP_STEST, true);
 #endif
+#ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
+	/*
+	 * enabled kmd sheduling worker thread
+	 */
+	nvgpu_set_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD, true);
+#endif

 	/*
 	 * enable GSP VM for gsp scheduler firmware
--- a/drivers/gpu/nvgpu/hal/init/hal_gm20b.c
+++ b/drivers/gpu/nvgpu/hal/init/hal_gm20b.c
@@ -1258,6 +1258,12 @@ int gm20b_init_hal(struct gk20a *g)
 	nvgpu_set_enabled(g, NVGPU_SUPPORT_PREEMPTION_GFXP, false);
 #endif
 	nvgpu_set_enabled(g, NVGPU_SUPPORT_SET_CTX_MMU_DEBUG_MODE, true);
+#ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
+	/*
+	 * enabled kmd sheduling worker thread
+	 */
+	nvgpu_set_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD, true);
+#endif

 	g->max_sm_diversity_config_count =
 		NVGPU_DEFAULT_SM_DIVERSITY_CONFIG_COUNT;
--- a/drivers/gpu/nvgpu/hal/init/hal_gv11b.c
+++ b/drivers/gpu/nvgpu/hal/init/hal_gv11b.c
@@ -1663,6 +1663,12 @@ int gv11b_init_hal(struct gk20a *g)
 	nvgpu_set_enabled(g, NVGPU_SUPPORT_PLATFORM_ATOMIC, true);
 	nvgpu_set_enabled(g, NVGPU_SUPPORT_SET_CTX_MMU_DEBUG_MODE, true);

+#ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
+	/*
+	 * enabled kmd sheduling worker thread
+	 */
+	nvgpu_set_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD, true);
+#endif
 	/*
 	 * gv11b bypasses the IOMMU since it uses a special nvlink path to
 	 * memory.
--- a/drivers/gpu/nvgpu/hal/init/hal_tu104.c
+++ b/drivers/gpu/nvgpu/hal/init/hal_tu104.c
@@ -1926,6 +1926,12 @@ int tu104_init_hal(struct gk20a *g)
 	}
 #ifdef CONFIG_NVGPU_CLK_ARB
 	nvgpu_set_enabled(g, NVGPU_CLK_ARB_ENABLED, false);
+#endif
+#ifdef CONFIG_KMD_SCHEDULING_WORKER_THREAD
+	/*
+	 * enabled kmd sheduling worker thread
+	 */
+	nvgpu_set_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD, true);
 #endif
 	nvgpu_set_enabled(g, NVGPU_SUPPORT_PES_FS, true);
 	g->name = "tu10x";
--- a/drivers/gpu/nvgpu/hal/rc/rc_gv11b.c
+++ b/drivers/gpu/nvgpu/hal/rc/rc_gv11b.c
@@ -129,6 +129,7 @@ static void gv11b_fifo_locked_abort_runlist_active_tsgs(struct gk20a *g,
 			 * and can be disabled.
 			 */
 #if defined(CONFIG_KMD_SCHEDULING_WORKER_THREAD)
+			if (nvgpu_is_enabled(g, NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD)) {
 				/* Special case. Submit the recovery runlist now */
 				err = g->nvs_worker_submit(g, runlist, runlist->domain, false);
 				if (err == 1) {
@@ -136,6 +137,7 @@ static void gv11b_fifo_locked_abort_runlist_active_tsgs(struct gk20a *g,
 				} else if (err != 0) {
 					nvgpu_err(g, "runlist id %d is not cleaned up", runlist->id);
 				}
+			}
 #endif /*CONFIG_KMD_SCHEDULING_WORKER_THREAD*/
 			/*
 			 * The else path is for some traditional platforms that doesn't itself support
--- a/drivers/gpu/nvgpu/include/nvgpu/enabled.h
+++ b/drivers/gpu/nvgpu/include/nvgpu/enabled.h
@@ -235,6 +235,8 @@ struct gk20a;
 	DEFINE_FLAG(NVGPU_SUPPORT_GSP_SCHED, "To enable gsp sheduler"),	\
 	DEFINE_FLAG(NVGPU_SUPPORT_GSP_STEST,				\
 		"Support GSP stress test"),				\
+	DEFINE_FLAG(NVGPU_SUPPORT_KMD_SCHEDULING_WORKER_THREAD, 	\
+		"To enable kmd sheduling worker thread"),		\
 	DEFINE_FLAG(NVGPU_SUPPORT_MULTI_PROCESS_TSG_SHARING,		\
 			"Multi process TSG sharing support"),		\
 	DEFINE_FLAG(NVGPU_MAX_ENABLED_BITS, "Marks max number of flags"),