From 571cd14d65d716a36da287dbe94d13e29c707009 Mon Sep 17 00:00:00 2001
From: Sagar Kamble <skamble@nvidia.com>
Date: Tue, 19 Mar 2019 10:21:19 +0530
Subject: [PATCH] gpu: nvgpu: prepare pmu queues unit

PMU command and message handling should not deal with different PMU queues
implementation. Only generic queue APIs should be invoked. Prepare PMU
queues unit for this.

JIRA NVGPU-1970

Change-Id: Ic409d721563dc622183f0cabb7becd39899305d5
Signed-off-by: Sagar Kamble <skamble@nvidia.com>
Reviewed-on: https://git-master.nvidia.com/r/2079143
Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com>
Tested-by: mobile promotions <svcmobile_promotions@nvidia.com>
---
 drivers/gpu/nvgpu/Makefile                  |   1 +
 drivers/gpu/nvgpu/Makefile.sources          |   1 +
 drivers/gpu/nvgpu/common/pmu/pmu.c          |  35 +--
 drivers/gpu/nvgpu/common/pmu/pmu_gk20a.c    |   4 +-
 drivers/gpu/nvgpu/common/pmu/pmu_ipc.c      | 245 ++-------------
 drivers/gpu/nvgpu/common/pmu/pmu_queue.c    | 326 ++++++++++++++++++++
 drivers/gpu/nvgpu/include/nvgpu/pmu.h       |  16 +-
 drivers/gpu/nvgpu/include/nvgpu/pmu/queue.h |  62 ++++
 8 files changed, 420 insertions(+), 270 deletions(-)
 create mode 100644 drivers/gpu/nvgpu/common/pmu/pmu_queue.c
 create mode 100644 drivers/gpu/nvgpu/include/nvgpu/pmu/queue.h

diff --git a/drivers/gpu/nvgpu/Makefile b/drivers/gpu/nvgpu/Makefile
index 0b78e27e4..fdf2ed48c 100644
--- a/drivers/gpu/nvgpu/Makefile
+++ b/drivers/gpu/nvgpu/Makefile
@@ -89,6 +89,7 @@ nvgpu-y += \
 	common/pmu/pmu.o \
 	common/pmu/pmu_ipc.o \
 	common/pmu/pmu_mutex.o \
+	common/pmu/pmu_queue.o \
 	common/pmu/pmu_seq.o \
 	common/pmu/pmu_fw.o \
 	common/pmu/pg/pmu_pg.o \
diff --git a/drivers/gpu/nvgpu/Makefile.sources b/drivers/gpu/nvgpu/Makefile.sources
index c1d6e20c8..b12786111 100644
--- a/drivers/gpu/nvgpu/Makefile.sources
+++ b/drivers/gpu/nvgpu/Makefile.sources
@@ -128,6 +128,7 @@ srcs += common/sim.c \
 	common/pmu/pmu.c \
 	common/pmu/pmu_ipc.c \
 	common/pmu/pmu_mutex.c \
+	common/pmu/pmu_queue.c \
 	common/pmu/pmu_seq.c \
 	common/pmu/pmu_fw.c \
 	common/pmu/pg/pmu_pg.c \
diff --git a/drivers/gpu/nvgpu/common/pmu/pmu.c b/drivers/gpu/nvgpu/common/pmu/pmu.c
index 945dce604..c9ff183dd 100644
--- a/drivers/gpu/nvgpu/common/pmu/pmu.c
+++ b/drivers/gpu/nvgpu/common/pmu/pmu.c
@@ -415,8 +415,6 @@ int nvgpu_pmu_process_init_msg(struct nvgpu_pmu *pmu,
 	union pmu_init_msg_pmu *init;
 	struct pmu_sha1_gid_data gid_data;
 	int err = 0;
-	u32 i = 0U;
-	u32 j = 0U;
 
 	nvgpu_log_fn(g, " ");
 
@@ -461,30 +459,10 @@ int nvgpu_pmu_process_init_msg(struct nvgpu_pmu *pmu,
 	}
 
 
-	if (nvgpu_is_enabled(g, NVGPU_SUPPORT_PMU_RTOS_FBQ)) {
-		pmu->queue_type = QUEUE_TYPE_FB;
-		for (i = 0; i < PMU_QUEUE_COUNT; i++) {
-			err = nvgpu_pmu_queue_init_fb(pmu, i, init);
-			if (err != 0) {
-				for (j = 0; j < i; j++) {
-					nvgpu_pmu_queue_free(pmu, j);
-				}
-				nvgpu_err(g, "PMU queue init failed");
-				return err;
-			}
-		}
-	} else {
-		pmu->queue_type = QUEUE_TYPE_DMEM;
-		for (i = 0; i < PMU_QUEUE_COUNT; i++) {
-			err = nvgpu_pmu_queue_init(pmu, i, init);
-			if (err != 0) {
-				for (j = 0; j < i; j++) {
-					nvgpu_pmu_queue_free(pmu, j);
-				}
-				nvgpu_err(g, "PMU queue init failed");
-				return err;
-			}
-		}
+	err = nvgpu_pmu_queues_init(g, init, &pmu->queues,
+				    &pmu->super_surface_buf);
+	if (err != 0) {
+		return err;
 	}
 
 	if (!nvgpu_alloc_initialized(&pmu->dmem)) {
@@ -534,7 +512,6 @@ int nvgpu_pmu_destroy(struct gk20a *g)
 {
 	struct nvgpu_pmu *pmu = &g->pmu;
 	struct pmu_pg_stats_data pg_stat_data = { 0 };
-	u32 i;
 
 	nvgpu_log_fn(g, " ");
 
@@ -561,9 +538,7 @@ int nvgpu_pmu_destroy(struct gk20a *g)
 	pmu->isr_enabled = false;
 	nvgpu_mutex_release(&pmu->isr_mutex);
 
-	for (i = 0U; i < PMU_QUEUE_COUNT; i++) {
-		nvgpu_pmu_queue_free(pmu, i);
-	}
+	nvgpu_pmu_queues_free(g, &pmu->queues);
 
 	nvgpu_pmu_state_change(g, PMU_STATE_OFF, false);
 	pmu->pmu_ready = false;
diff --git a/drivers/gpu/nvgpu/common/pmu/pmu_gk20a.c b/drivers/gpu/nvgpu/common/pmu/pmu_gk20a.c
index 6d3c8b162..44c884956 100644
--- a/drivers/gpu/nvgpu/common/pmu/pmu_gk20a.c
+++ b/drivers/gpu/nvgpu/common/pmu/pmu_gk20a.c
@@ -23,6 +23,7 @@
  */
 
 #include <nvgpu/nvgpu_common.h>
+#include <nvgpu/pmu/queue.h>
 #include <nvgpu/timers.h>
 #include <nvgpu/kmem.h>
 #include <nvgpu/dma.h>
@@ -635,7 +636,8 @@ void gk20a_pmu_isr(struct gk20a *g)
 	gk20a_writel(g, pwr_falcon_irqsclr_r(), intr);
 
 	if (recheck) {
-		if (!nvgpu_pmu_queue_is_empty(pmu, PMU_MESSAGE_QUEUE)) {
+		if (!nvgpu_pmu_queue_is_empty(&pmu->queues,
+					      PMU_MESSAGE_QUEUE)) {
 			gk20a_writel(g, pwr_falcon_irqsset_r(),
 				pwr_falcon_irqsset_swgen0_set_f());
 		}
diff --git a/drivers/gpu/nvgpu/common/pmu/pmu_ipc.c b/drivers/gpu/nvgpu/common/pmu/pmu_ipc.c
index 52b370f21..be7c62f40 100644
--- a/drivers/gpu/nvgpu/common/pmu/pmu_ipc.c
+++ b/drivers/gpu/nvgpu/common/pmu/pmu_ipc.c
@@ -28,178 +28,16 @@
 #include <nvgpu/pmuif/nvgpu_gpmu_cmdif.h>
 #include <nvgpu/pmuif/gpmu_super_surf_if.h>
 #include <nvgpu/falcon.h>
-#include <nvgpu/engine_queue.h>
 #include <nvgpu/engine_fb_queue.h>
 #include <nvgpu/gk20a.h>
 #include <nvgpu/string.h>
 #include <nvgpu/pmu/seq.h>
-
-/* FB queue init */
-int nvgpu_pmu_queue_init_fb(struct nvgpu_pmu *pmu,
-		u32 id, union pmu_init_msg_pmu *init)
-{
-	struct gk20a *g = gk20a_from_pmu(pmu);
-	struct nvgpu_engine_fb_queue_params params = {0};
-	u32 oflag = 0;
-	int err = 0;
-	u32 tmp_id = id;
-
-	/* init queue parameters */
-	if (PMU_IS_COMMAND_QUEUE(id)) {
-
-		/* currently PMU FBQ support SW command queue only */
-		if (!PMU_IS_SW_COMMAND_QUEUE(id)) {
-			pmu->queue[id] = NULL;
-			err = 0;
-			goto exit;
-		}
-
-		/*
-		 * set OFLAG_WRITE for command queue
-		 * i.e, push from nvgpu &
-		 * pop form falcon ucode
-		 */
-		oflag = OFLAG_WRITE;
-
-		params.super_surface_mem =
-			&pmu->super_surface_buf;
-		params.fbq_offset = (u32)offsetof(
-			struct nv_pmu_super_surface,
-			fbq.cmd_queues.queue[id]);
-		params.size = NV_PMU_FBQ_CMD_NUM_ELEMENTS;
-		params.fbq_element_size = NV_PMU_FBQ_CMD_ELEMENT_SIZE;
-	} else if (PMU_IS_MESSAGE_QUEUE(id)) {
-		/*
-		 * set OFLAG_READ for message queue
-		 * i.e, push from falcon ucode &
-		 * pop form nvgpu
-		 */
-		oflag = OFLAG_READ;
-
-		params.super_surface_mem =
-				&pmu->super_surface_buf;
-		params.fbq_offset = (u32)offsetof(
-				struct nv_pmu_super_surface,
-				fbq.msg_queue);
-		params.size = NV_PMU_FBQ_MSG_NUM_ELEMENTS;
-		params.fbq_element_size = NV_PMU_FBQ_MSG_ELEMENT_SIZE;
-	} else {
-		nvgpu_err(g, "invalid queue-id %d", id);
-		err = -EINVAL;
-		goto exit;
-	}
-
-	params.g = g;
-	params.flcn_id = FALCON_ID_PMU;
-	params.id = id;
-	params.oflag = oflag;
-	params.queue_head = g->ops.pmu.pmu_queue_head;
-	params.queue_tail = g->ops.pmu.pmu_queue_tail;
-
-	if (tmp_id == PMU_COMMAND_QUEUE_HPQ) {
-		tmp_id = PMU_QUEUE_HPQ_IDX_FOR_V3;
-	} else if (tmp_id == PMU_COMMAND_QUEUE_LPQ) {
-		tmp_id = PMU_QUEUE_LPQ_IDX_FOR_V3;
-	} else if (tmp_id == PMU_MESSAGE_QUEUE) {
-		tmp_id = PMU_QUEUE_MSG_IDX_FOR_V5;
-	} else {
-		/* return if queue id not supported*/
-		goto exit;
-	}
-	params.index = init->v5.queue_index[tmp_id];
-
-	err = nvgpu_engine_fb_queue_init(&pmu->fb_queue[id], params);
-	if (err != 0) {
-		nvgpu_err(g, "queue-%d init failed", id);
-	}
-
-exit:
-	return err;
-}
-
-/* DMEM queue init */
-int nvgpu_pmu_queue_init(struct nvgpu_pmu *pmu,
-		u32 id, union pmu_init_msg_pmu *init)
-{
-	struct gk20a *g = gk20a_from_pmu(pmu);
-	struct nvgpu_engine_mem_queue_params params = {0};
-	u32 oflag = 0;
-	int err = 0;
-
-	if (PMU_IS_COMMAND_QUEUE(id)) {
-		/*
-		 * set OFLAG_WRITE for command queue
-		 * i.e, push from nvgpu &
-		 * pop form falcon ucode
-		 */
-		oflag = OFLAG_WRITE;
-	} else if (PMU_IS_MESSAGE_QUEUE(id)) {
-		/*
-		 * set OFLAG_READ for message queue
-		 * i.e, push from falcon ucode &
-		 * pop form nvgpu
-		 */
-		oflag = OFLAG_READ;
-	} else {
-		nvgpu_err(g, "invalid queue-id %d", id);
-		err = -EINVAL;
-		goto exit;
-	}
-
-	/* init queue parameters */
-	params.g = g;
-	params.flcn_id = FALCON_ID_PMU;
-	params.id = id;
-	params.oflag = oflag;
-	params.queue_head = g->ops.pmu.pmu_queue_head;
-	params.queue_tail = g->ops.pmu.pmu_queue_tail;
-	params.queue_type = QUEUE_TYPE_DMEM;
-	g->ops.pmu_ver.get_pmu_init_msg_pmu_queue_params(id, init,
-							 &params.index,
-							 &params.offset,
-							 &params.size);
-	err = nvgpu_engine_mem_queue_init(&pmu->queue[id], params);
-	if (err != 0) {
-		nvgpu_err(g, "queue-%d init failed", id);
-	}
-
-exit:
-	return err;
-}
-
-void nvgpu_pmu_queue_free(struct nvgpu_pmu *pmu, u32 id)
-{
-	struct gk20a *g = gk20a_from_pmu(pmu);
-
-	if (!PMU_IS_COMMAND_QUEUE(id) && !PMU_IS_MESSAGE_QUEUE(id)) {
-		nvgpu_err(g, "invalid queue-id %d", id);
-		goto exit;
-	}
-
-	if (pmu->queue_type == QUEUE_TYPE_FB) {
-		if (pmu->fb_queue[id] == NULL) {
-			goto exit;
-		}
-
-		nvgpu_engine_fb_queue_free(&pmu->fb_queue[id]);
-	} else {
-		if (pmu->queue[id] == NULL) {
-			goto exit;
-		}
-
-		nvgpu_engine_mem_queue_free(&pmu->queue[id]);
-	}
-
-exit:
-	return;
-}
+#include <nvgpu/pmu/queue.h>
 
 static bool pmu_validate_cmd(struct nvgpu_pmu *pmu, struct pmu_cmd *cmd,
 			struct pmu_payload *payload, u32 queue_id)
 {
 	struct gk20a *g = gk20a_from_pmu(pmu);
-	struct nvgpu_engine_fb_queue *fb_queue = NULL;
-	struct nvgpu_engine_mem_queue *queue = NULL;
 	u32 queue_size;
 	u32 in_size, out_size;
 
@@ -207,18 +45,13 @@ static bool pmu_validate_cmd(struct nvgpu_pmu *pmu, struct pmu_cmd *cmd,
 		goto invalid_cmd;
 	}
 
-	if (pmu->queue_type == QUEUE_TYPE_FB) {
-		fb_queue = pmu->fb_queue[queue_id];
-		queue_size = nvgpu_engine_fb_queue_get_element_size(fb_queue);
-	} else {
-		queue = pmu->queue[queue_id];
-		queue_size = nvgpu_engine_mem_queue_get_size(queue);
-	}
 
 	if (cmd->hdr.size < PMU_CMD_HDR_SIZE) {
 		goto invalid_cmd;
 	}
 
+	queue_size = nvgpu_pmu_queue_get_size(&pmu->queues, queue_id);
+
 	if (cmd->hdr.size > (queue_size >> 1)) {
 		goto invalid_cmd;
 	}
@@ -283,8 +116,6 @@ static int pmu_write_cmd(struct nvgpu_pmu *pmu, struct pmu_cmd *cmd,
 			u32 queue_id)
 {
 	struct gk20a *g = gk20a_from_pmu(pmu);
-	struct nvgpu_engine_fb_queue *fb_queue = NULL;
-	struct nvgpu_engine_mem_queue *queue = NULL;
 	struct nvgpu_timeout timeout;
 	int err;
 
@@ -293,16 +124,8 @@ static int pmu_write_cmd(struct nvgpu_pmu *pmu, struct pmu_cmd *cmd,
 	nvgpu_timeout_init(g, &timeout, U32_MAX, NVGPU_TIMER_CPU_TIMER);
 
 	do {
-		if (pmu->queue_type == QUEUE_TYPE_FB) {
-			fb_queue = pmu->fb_queue[queue_id];
-			err = nvgpu_engine_fb_queue_push(fb_queue,
-							 cmd, cmd->hdr.size);
-		} else {
-			queue = pmu->queue[queue_id];
-			err = nvgpu_engine_mem_queue_push(&pmu->flcn, queue,
-							  cmd, cmd->hdr.size);
-		}
-
+		err = nvgpu_pmu_queue_push(&pmu->queues, &pmu->flcn,
+					   queue_id, cmd);
 		if (err == -EAGAIN && nvgpu_timeout_expired(&timeout) == 0) {
 			nvgpu_usleep_range(1000, 2000);
 		} else {
@@ -338,7 +161,7 @@ static int pmu_payload_allocate(struct gk20a *g, struct pmu_sequence *seq,
 		nvgpu_pmu_vidmem_surface_alloc(g, alloc->fb_surface, alloc->fb_size);
 	}
 
-	if (pmu->queue_type == QUEUE_TYPE_FB) {
+	if (nvgpu_pmu_fb_queue_enabled(&pmu->queues)) {
 		buffer_size = nvgpu_pmu_seq_get_buffer_size(seq);
 		nvgpu_pmu_seq_set_fbq_out_offset(seq, buffer_size);
 		/* Save target address in FBQ work buffer. */
@@ -382,7 +205,7 @@ static int pmu_cmd_payload_setup_rpc(struct gk20a *g, struct pmu_cmd *cmd,
 
 	alloc.dmem_size = payload->rpc.size_rpc;
 
-	if (pmu->queue_type == QUEUE_TYPE_FB) {
+	if (nvgpu_pmu_fb_queue_enabled(&pmu->queues)) {
 		/* copy payload to FBQ work buffer */
 		nvgpu_memcpy((u8 *)
 			nvgpu_engine_fb_queue_get_work_buffer(queue) +
@@ -473,14 +296,14 @@ static int pmu_cmd_payload_setup(struct gk20a *g, struct pmu_cmd *cmd,
 			nvgpu_mem_wr_n(g, alloc.fb_surface, 0,
 				payload->in.buf, payload->in.fb_size);
 
-			if (pmu->queue_type == QUEUE_TYPE_FB) {
+			if (nvgpu_pmu_fb_queue_enabled(&pmu->queues)) {
 				alloc.dmem_offset +=
 					nvgpu_pmu_seq_get_fbq_heap_offset(seq);
 				*(pv->pmu_allocation_get_dmem_offset_addr(pmu, in)) =
 					alloc.dmem_offset;
 			}
 		} else {
-			if (pmu->queue_type == QUEUE_TYPE_FB) {
+			if (nvgpu_pmu_fb_queue_enabled(&pmu->queues)) {
 				/* copy payload to FBQ work buffer */
 				nvgpu_memcpy((u8 *)
 					nvgpu_engine_fb_queue_get_work_buffer(
@@ -547,7 +370,7 @@ static int pmu_cmd_payload_setup(struct gk20a *g, struct pmu_cmd *cmd,
 				out));
 		}
 
-		if (pmu->queue_type == QUEUE_TYPE_FB) {
+		if (nvgpu_pmu_fb_queue_enabled(&pmu->queues)) {
 			if (payload->in.buf != payload->out.buf) {
 				*(pv->pmu_allocation_get_dmem_offset_addr(pmu,
 					out)) +=
@@ -710,8 +533,8 @@ int nvgpu_pmu_cmd_post(struct gk20a *g, struct pmu_cmd *cmd,
 	cmd->hdr.ctrl_flags |= PMU_CMD_FLAGS_STATUS;
 	cmd->hdr.ctrl_flags |= PMU_CMD_FLAGS_INTR;
 
-	if (pmu->queue_type == QUEUE_TYPE_FB) {
-		fb_queue = pmu->fb_queue[queue_id];
+	if (nvgpu_pmu_fb_queue_enabled(&pmu->queues)) {
+		fb_queue = nvgpu_pmu_fb_queue(&pmu->queues, queue_id);
 		/* Save the queue in the seq structure. */
 		nvgpu_pmu_seq_set_cmd_queue(seq, fb_queue);
 
@@ -761,7 +584,7 @@ int nvgpu_pmu_cmd_post(struct gk20a *g, struct pmu_cmd *cmd,
 	}
 
 exit:
-	if (pmu->queue_type == QUEUE_TYPE_FB) {
+	if (nvgpu_pmu_fb_queue_enabled(&pmu->queues)) {
 		/* Unlock the FBQ work buffer */
 		nvgpu_engine_fb_queue_unlock_work_buffer(fb_queue);
 	}
@@ -826,7 +649,7 @@ static void pmu_payload_free(struct nvgpu_pmu *pmu, struct pmu_sequence *seq)
 
 	nvgpu_log_fn(g, " ");
 
-	if (pmu->queue_type == QUEUE_TYPE_FB) {
+	if (nvgpu_pmu_fb_queue_enabled(&pmu->queues)) {
 		nvgpu_free(&pmu->dmem, nvgpu_pmu_seq_get_fbq_heap_offset(seq));
 
 		/*
@@ -964,21 +787,11 @@ static bool pmu_engine_mem_queue_read(struct nvgpu_pmu *pmu,
 	u32 bytes_to_read, int *status)
 {
 	struct gk20a *g = gk20a_from_pmu(pmu);
-	struct nvgpu_engine_fb_queue *fb_queue = NULL;
-	struct nvgpu_engine_mem_queue *queue = NULL;
 	u32 bytes_read;
 	int err;
 
-	if (pmu->queue_type == QUEUE_TYPE_FB) {
-		fb_queue = pmu->fb_queue[queue_id];
-		err = nvgpu_engine_fb_queue_pop(fb_queue, data,
-				bytes_to_read, &bytes_read);
-	} else {
-		queue = pmu->queue[queue_id];
-		err = nvgpu_engine_mem_queue_pop(&pmu->flcn, queue, data,
-				bytes_to_read, &bytes_read);
-	}
-
+	err = nvgpu_pmu_queue_pop(&pmu->queues, &pmu->flcn, queue_id, data,
+				  bytes_to_read, &bytes_read);
 	if (err != 0) {
 		nvgpu_err(g, "fail to read msg: err %d", err);
 		*status = err;
@@ -994,34 +807,16 @@ static bool pmu_engine_mem_queue_read(struct nvgpu_pmu *pmu,
 	return true;
 }
 
-bool nvgpu_pmu_queue_is_empty(struct nvgpu_pmu *pmu, u32 queue_id)
-{
-	struct nvgpu_engine_mem_queue *queue = NULL;
-	struct nvgpu_engine_fb_queue *fb_queue = NULL;
-	bool empty = true;
-
-	if (pmu->queue_type == QUEUE_TYPE_FB) {
-		fb_queue = pmu->fb_queue[queue_id];
-		empty = nvgpu_engine_fb_queue_is_empty(fb_queue);
-	} else {
-		queue = pmu->queue[queue_id];
-		empty = nvgpu_engine_mem_queue_is_empty(queue);
-	}
-
-	return empty;
-}
-
 static bool pmu_read_message(struct nvgpu_pmu *pmu, u32 queue_id,
 	struct pmu_msg *msg, int *status)
 {
 	struct gk20a *g = gk20a_from_pmu(pmu);
-	struct nvgpu_engine_mem_queue *queue = NULL;
 	u32 read_size;
 	int err;
 
 	*status = 0;
 
-	if (nvgpu_pmu_queue_is_empty(pmu, queue_id)) {
+	if (nvgpu_pmu_queue_is_empty(&pmu->queues, queue_id)) {
 		return false;
 	}
 
@@ -1032,9 +827,9 @@ static bool pmu_read_message(struct nvgpu_pmu *pmu, u32 queue_id,
 	}
 
 	if (msg->hdr.unit_id == PMU_UNIT_REWIND) {
-		if (pmu->queue_type != QUEUE_TYPE_FB) {
-			queue = pmu->queue[queue_id];
-			err = nvgpu_engine_mem_queue_rewind(&pmu->flcn, queue);
+		if (!nvgpu_pmu_fb_queue_enabled(&pmu->queues)) {
+			err = nvgpu_pmu_queue_rewind(&pmu->queues, queue_id,
+						     &pmu->flcn);
 			if (err != 0) {
 				nvgpu_err(g, "fail to rewind queue %d",
 					  queue_id);
diff --git a/drivers/gpu/nvgpu/common/pmu/pmu_queue.c b/drivers/gpu/nvgpu/common/pmu/pmu_queue.c
new file mode 100644
index 000000000..836aaa17a
--- /dev/null
+++ b/drivers/gpu/nvgpu/common/pmu/pmu_queue.c
@@ -0,0 +1,326 @@
+/*
+ * Copyright (c) 2017-2019, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software"),
+ * to deal in the Software without restriction, including without limitation
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included in
+ * all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
+ * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
+ * DEALINGS IN THE SOFTWARE.
+ */
+
+#include <nvgpu/engine_mem_queue.h>
+#include <nvgpu/engine_fb_queue.h>
+#include <nvgpu/engine_queue.h>
+#include <nvgpu/pmu/queue.h>
+#include <nvgpu/gk20a.h>
+
+/* FB queue init */
+static int pmu_fb_queue_init(struct gk20a *g, struct pmu_queues *queues,
+		u32 id, union pmu_init_msg_pmu *init,
+		struct nvgpu_mem *super_surface_buf)
+{
+	struct nvgpu_engine_fb_queue_params params = {0};
+	u32 oflag = 0;
+	int err = 0;
+	u32 tmp_id = id;
+
+	/* init queue parameters */
+	if (PMU_IS_COMMAND_QUEUE(id)) {
+
+		/* currently PMU FBQ support SW command queue only */
+		if (!PMU_IS_SW_COMMAND_QUEUE(id)) {
+			queues->queue[id] = NULL;
+			err = 0;
+			goto exit;
+		}
+
+		/*
+		 * set OFLAG_WRITE for command queue
+		 * i.e, push from nvgpu &
+		 * pop form falcon ucode
+		 */
+		oflag = OFLAG_WRITE;
+
+		params.super_surface_mem = super_surface_buf;
+		params.fbq_offset = (u32)offsetof(
+			struct nv_pmu_super_surface,
+			fbq.cmd_queues.queue[id]);
+		params.size = NV_PMU_FBQ_CMD_NUM_ELEMENTS;
+		params.fbq_element_size = NV_PMU_FBQ_CMD_ELEMENT_SIZE;
+	} else if (PMU_IS_MESSAGE_QUEUE(id)) {
+		/*
+		 * set OFLAG_READ for message queue
+		 * i.e, push from falcon ucode &
+		 * pop form nvgpu
+		 */
+		oflag = OFLAG_READ;
+
+		params.super_surface_mem = super_surface_buf;
+		params.fbq_offset = (u32)offsetof(
+				struct nv_pmu_super_surface,
+				fbq.msg_queue);
+		params.size = NV_PMU_FBQ_MSG_NUM_ELEMENTS;
+		params.fbq_element_size = NV_PMU_FBQ_MSG_ELEMENT_SIZE;
+	} else {
+		nvgpu_err(g, "invalid queue-id %d", id);
+		err = -EINVAL;
+		goto exit;
+	}
+
+	params.g = g;
+	params.flcn_id = FALCON_ID_PMU;
+	params.id = id;
+	params.oflag = oflag;
+	params.queue_head = g->ops.pmu.pmu_queue_head;
+	params.queue_tail = g->ops.pmu.pmu_queue_tail;
+
+	if (tmp_id == PMU_COMMAND_QUEUE_HPQ) {
+		tmp_id = PMU_QUEUE_HPQ_IDX_FOR_V3;
+	} else if (tmp_id == PMU_COMMAND_QUEUE_LPQ) {
+		tmp_id = PMU_QUEUE_LPQ_IDX_FOR_V3;
+	} else {
+		tmp_id = PMU_QUEUE_MSG_IDX_FOR_V5;
+	}
+
+	params.index = init->v5.queue_index[tmp_id];
+
+	err = nvgpu_engine_fb_queue_init(&queues->fb_queue[id], params);
+	if (err != 0) {
+		nvgpu_err(g, "queue-%d init failed", id);
+	}
+
+exit:
+	return err;
+}
+
+/* DMEM queue init */
+static int pmu_dmem_queue_init(struct gk20a *g, struct pmu_queues *queues,
+		u32 id, union pmu_init_msg_pmu *init)
+{
+	struct nvgpu_engine_mem_queue_params params = {0};
+	u32 oflag = 0;
+	int err = 0;
+
+	if (PMU_IS_COMMAND_QUEUE(id)) {
+		/*
+		 * set OFLAG_WRITE for command queue
+		 * i.e, push from nvgpu &
+		 * pop form falcon ucode
+		 */
+		oflag = OFLAG_WRITE;
+	} else if (PMU_IS_MESSAGE_QUEUE(id)) {
+		/*
+		 * set OFLAG_READ for message queue
+		 * i.e, push from falcon ucode &
+		 * pop form nvgpu
+		 */
+		oflag = OFLAG_READ;
+	} else {
+		nvgpu_err(g, "invalid queue-id %d", id);
+		err = -EINVAL;
+		goto exit;
+	}
+
+	/* init queue parameters */
+	params.g = g;
+	params.flcn_id = FALCON_ID_PMU;
+	params.id = id;
+	params.oflag = oflag;
+	params.queue_head = g->ops.pmu.pmu_queue_head;
+	params.queue_tail = g->ops.pmu.pmu_queue_tail;
+	params.queue_type = QUEUE_TYPE_DMEM;
+	g->ops.pmu_ver.get_pmu_init_msg_pmu_queue_params(id, init,
+							 &params.index,
+							 &params.offset,
+							 &params.size);
+	err = nvgpu_engine_mem_queue_init(&queues->queue[id], params);
+	if (err != 0) {
+		nvgpu_err(g, "queue-%d init failed", id);
+	}
+
+exit:
+	return err;
+}
+
+static void pmu_queue_free(struct gk20a *g, struct pmu_queues *queues, u32 id)
+{
+	if (!PMU_IS_COMMAND_QUEUE(id) && !PMU_IS_MESSAGE_QUEUE(id)) {
+		nvgpu_err(g, "invalid queue-id %d", id);
+		goto exit;
+	}
+
+	if (queues->queue_type == QUEUE_TYPE_FB) {
+		if (queues->fb_queue[id] == NULL) {
+			goto exit;
+		}
+
+		nvgpu_engine_fb_queue_free(&queues->fb_queue[id]);
+	} else {
+		if (queues->queue[id] == NULL) {
+			goto exit;
+		}
+
+		nvgpu_engine_mem_queue_free(&queues->queue[id]);
+	}
+
+exit:
+	return;
+}
+
+int nvgpu_pmu_queues_init(struct gk20a *g,
+			  union pmu_init_msg_pmu *init,
+			  struct pmu_queues *queues,
+			  struct nvgpu_mem *super_surface_buf)
+{
+	u32 i = 0U;
+	u32 j = 0U;
+	int err;
+
+	if (nvgpu_is_enabled(g, NVGPU_SUPPORT_PMU_RTOS_FBQ)) {
+		queues->queue_type = QUEUE_TYPE_FB;
+		for (i = 0; i < PMU_QUEUE_COUNT; i++) {
+			err = pmu_fb_queue_init(g, queues, i, init,
+						super_surface_buf);
+			if (err != 0) {
+				for (j = 0; j < i; j++) {
+					pmu_queue_free(g, queues, j);
+				}
+				nvgpu_err(g, "PMU queue init failed");
+				return err;
+			}
+		}
+	} else {
+		queues->queue_type = QUEUE_TYPE_DMEM;
+		for (i = 0; i < PMU_QUEUE_COUNT; i++) {
+			err = pmu_dmem_queue_init(g, queues, i, init);
+			if (err != 0) {
+				for (j = 0; j < i; j++) {
+					pmu_queue_free(g, queues, j);
+				}
+				nvgpu_err(g, "PMU queue init failed");
+				return err;
+			}
+		}
+	}
+
+	return 0;
+}
+
+void nvgpu_pmu_queues_free(struct gk20a *g, struct pmu_queues *queues)
+{
+	u32 i = 0U;
+
+	for (i = 0U; i < PMU_QUEUE_COUNT; i++) {
+		pmu_queue_free(g, queues, i);
+	}
+}
+
+u32 nvgpu_pmu_queue_get_size(struct pmu_queues *queues, u32 queue_id)
+{
+	struct nvgpu_engine_fb_queue *fb_queue = NULL;
+	struct nvgpu_engine_mem_queue *queue = NULL;
+	u32 queue_size;
+
+	if (queues->queue_type == QUEUE_TYPE_FB) {
+		fb_queue = queues->fb_queue[queue_id];
+		queue_size = nvgpu_engine_fb_queue_get_element_size(fb_queue);
+	} else {
+		queue = queues->queue[queue_id];
+		queue_size = nvgpu_engine_mem_queue_get_size(queue);
+	}
+
+	return queue_size;
+}
+
+int nvgpu_pmu_queue_push(struct pmu_queues *queues, struct nvgpu_falcon *flcn,
+			 u32 queue_id, struct pmu_cmd *cmd)
+{
+	struct nvgpu_engine_fb_queue *fb_queue = NULL;
+	struct nvgpu_engine_mem_queue *queue = NULL;
+	int err;
+
+	if (queues->queue_type == QUEUE_TYPE_FB) {
+		fb_queue = queues->fb_queue[queue_id];
+		err = nvgpu_engine_fb_queue_push(fb_queue,
+						 cmd, cmd->hdr.size);
+	} else {
+		queue = queues->queue[queue_id];
+		err = nvgpu_engine_mem_queue_push(flcn, queue,
+						  cmd, cmd->hdr.size);
+	}
+
+	return err;
+}
+
+int nvgpu_pmu_queue_pop(struct pmu_queues *queues, struct nvgpu_falcon *flcn,
+			u32 queue_id, void *data, u32 bytes_to_read,
+			u32 *bytes_read)
+{
+	struct nvgpu_engine_fb_queue *fb_queue = NULL;
+	struct nvgpu_engine_mem_queue *queue = NULL;
+	int err;
+
+	if (queues->queue_type == QUEUE_TYPE_FB) {
+		fb_queue = queues->fb_queue[queue_id];
+		err = nvgpu_engine_fb_queue_pop(fb_queue, data,
+				bytes_to_read, bytes_read);
+	} else {
+		queue = queues->queue[queue_id];
+		err = nvgpu_engine_mem_queue_pop(flcn, queue, data,
+				bytes_to_read, bytes_read);
+	}
+
+	return err;
+}
+
+bool nvgpu_pmu_queue_is_empty(struct pmu_queues *queues, u32 queue_id)
+{
+	struct nvgpu_engine_mem_queue *queue = NULL;
+	struct nvgpu_engine_fb_queue *fb_queue = NULL;
+	bool empty = true;
+
+	if (queues->queue_type == QUEUE_TYPE_FB) {
+		fb_queue = queues->fb_queue[queue_id];
+		empty = nvgpu_engine_fb_queue_is_empty(fb_queue);
+	} else {
+		queue = queues->queue[queue_id];
+		empty = nvgpu_engine_mem_queue_is_empty(queue);
+	}
+
+	return empty;
+}
+
+bool nvgpu_pmu_fb_queue_enabled(struct pmu_queues *queues)
+{
+	return queues->queue_type == QUEUE_TYPE_FB;
+}
+
+struct nvgpu_engine_fb_queue *nvgpu_pmu_fb_queue(struct pmu_queues *queues,
+						 u32 queue_id)
+{
+	return queues->fb_queue[queue_id];
+}
+
+int nvgpu_pmu_queue_rewind(struct pmu_queues *queues, u32 queue_id,
+			   struct nvgpu_falcon *flcn)
+{
+	struct nvgpu_engine_mem_queue *queue = queues->queue[queue_id];
+
+	if (queues->queue_type == QUEUE_TYPE_FB) {
+		return -EINVAL;
+	}
+
+	return nvgpu_engine_mem_queue_rewind(flcn, queue);
+}
diff --git a/drivers/gpu/nvgpu/include/nvgpu/pmu.h b/drivers/gpu/nvgpu/include/nvgpu/pmu.h
index 49e7e2512..99c38c75f 100644
--- a/drivers/gpu/nvgpu/include/nvgpu/pmu.h
+++ b/drivers/gpu/nvgpu/include/nvgpu/pmu.h
@@ -31,11 +31,11 @@
 #include <nvgpu/pmuif/nvgpu_gpmu_cmdif.h>
 #include <nvgpu/pmuif/gpmu_super_surf_if.h>
 #include <nvgpu/falcon.h>
-#include <nvgpu/engine_mem_queue.h>
 #include <nvgpu/timers.h>
 #include <nvgpu/pmu/pmu_pg.h>
 #include <nvgpu/pmu/seq.h>
 #include <nvgpu/pmu/mutex.h>
+#include <nvgpu/pmu/queue.h>
 
 #define nvgpu_pmu_dbg(g, fmt, args...) \
 	nvgpu_log(g, gpu_dbg_pmu, fmt, ##args)
@@ -267,11 +267,7 @@ struct nvgpu_pmu {
 
 	struct pmu_sha1_gid gid_info;
 
-	struct nvgpu_engine_mem_queue *queue[PMU_QUEUE_COUNT];
-	u32 queue_type;
-
-	struct nvgpu_engine_fb_queue *fb_queue[PMU_QUEUE_COUNT];
-
+	struct pmu_queues queues;
 	struct pmu_sequences sequences;
 
 	struct pmu_mutexes mutexes;
@@ -338,19 +334,11 @@ int nvgpu_pmu_lock_acquire(struct gk20a *g, struct nvgpu_pmu *pmu,
 int nvgpu_pmu_lock_release(struct gk20a *g, struct nvgpu_pmu *pmu,
 			   u32 id, u32 *token);
 
-int nvgpu_pmu_queue_init(struct nvgpu_pmu *pmu, u32 id,
-	union pmu_init_msg_pmu *init);
-void nvgpu_pmu_queue_free(struct nvgpu_pmu *pmu, u32 id);
-
-int nvgpu_pmu_queue_init_fb(struct nvgpu_pmu *pmu,
-	u32 id, union pmu_init_msg_pmu *init);
-
 /* send a cmd to pmu */
 int nvgpu_pmu_cmd_post(struct gk20a *g, struct pmu_cmd *cmd,
 		struct pmu_payload *payload,
 		u32 queue_id, pmu_callback callback, void *cb_param);
 
-bool nvgpu_pmu_queue_is_empty(struct nvgpu_pmu *pmu, u32 queue_id);
 int nvgpu_pmu_process_message(struct nvgpu_pmu *pmu);
 
 /* perfmon */
diff --git a/drivers/gpu/nvgpu/include/nvgpu/pmu/queue.h b/drivers/gpu/nvgpu/include/nvgpu/pmu/queue.h
new file mode 100644
index 000000000..0b98f12a0
--- /dev/null
+++ b/drivers/gpu/nvgpu/include/nvgpu/pmu/queue.h
@@ -0,0 +1,62 @@
+/*
+ * Copyright (c) 2017-2019, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software"),
+ * to deal in the Software without restriction, including without limitation
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included in
+ * all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
+ * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
+ * DEALINGS IN THE SOFTWARE.
+ */
+
+#ifndef NVGPU_PMU_QUEUE_H
+#define NVGPU_PMU_QUEUE_H
+
+#include <nvgpu/pmuif/gpmuif_cmn.h>
+#include <nvgpu/types.h>
+
+union pmu_init_msg_pmu;
+struct nvgpu_falcon;
+struct nvgpu_mem;
+struct pmu_cmd;
+struct gk20a;
+
+struct pmu_queues {
+	struct nvgpu_engine_fb_queue *fb_queue[PMU_QUEUE_COUNT];
+	struct nvgpu_engine_mem_queue *queue[PMU_QUEUE_COUNT];
+	u32 queue_type;
+};
+
+int nvgpu_pmu_queues_init(struct gk20a *g,
+			  union pmu_init_msg_pmu *init,
+			  struct pmu_queues *queues,
+			  struct nvgpu_mem *super_surface_buf);
+
+void nvgpu_pmu_queues_free(struct gk20a *g, struct pmu_queues *queues);
+
+bool nvgpu_pmu_queue_is_empty(struct pmu_queues *queues, u32 queue_id);
+u32 nvgpu_pmu_queue_get_size(struct pmu_queues *queues, u32 queue_id);
+int nvgpu_pmu_queue_push(struct pmu_queues *queues, struct nvgpu_falcon *flcn,
+			 u32 queue_id, struct pmu_cmd *cmd);
+int nvgpu_pmu_queue_pop(struct pmu_queues *queues, struct nvgpu_falcon *flcn,
+			u32 queue_id, void *data, u32 bytes_to_read,
+			u32 *bytes_read);
+
+bool nvgpu_pmu_fb_queue_enabled(struct pmu_queues *queues);
+struct nvgpu_engine_fb_queue *nvgpu_pmu_fb_queue(struct pmu_queues *queues,
+						 u32 queue_id);
+int nvgpu_pmu_queue_rewind(struct pmu_queues *queues, u32 queue_id,
+			   struct nvgpu_falcon *flcn);
+
+#endif /* NVGPU_PMU_QUEUE_H */