From 906fd57c189ab419c95a276c52f628508f3054d0 Mon Sep 17 00:00:00 2001
From: Seema Khowala <seemaj@nvidia.com>
Date: Wed, 17 Apr 2019 11:42:11 -0700
Subject: [PATCH] gpu: nvgpu: add fb/gmmu mmu_fault_gv11b.[ch]

Move mmu fault related functions from fb_gv11b.c
to hal/fb/fb_mmu_fault_gv11b.c and hal/mm/gmmu/gmmu_mmu_fault_gv11b.c

Rename
mmfault to mmufault
fb_gv11b_write_mmu_fault_buffer_lo_hi -> gv11b_fb_write_mmu_fault_buffer_lo_hi
fb_gv11b_read_mmu_fault_buffer_get -> gv11b_fb_read_mmu_fault_buffer_get
fb_gv11b_read_mmu_fault_buffer_put -> gv11b_fb_read_mmu_fault_buffer_put
fb_gv11b_read_mmu_fault_buffer_size -> gv11b_fb_read_mmu_fault_buffer_size
fb_gv11b_write_mmu_fault_buffer_size -> gv11b_fb_write_mmu_fault_buffer_size
fb_gv11b_read_mmu_fault_addr_lo_hi -> gv11b_fb_read_mmu_fault_addr_lo_hi
fb_gv11b_read_mmu_fault_inst_lo_hi -> gv11b_fb_read_mmu_fault_inst_lo_hi
fb_gv11b_read_mmu_fault_info -> gv11b_fb_read_mmu_fault_info
fb_gv11b_read_mmu_fault_status -> gv11b_fb_read_mmu_fault_status
fb_gv11b_write_mmu_fault_status -> gv11b_fb_write_mmu_fault_status
gv11b_fb_parse_mmfault -> gv11b_fb_parse_mmu_fault_info
gv11b_fb_print_fault_info -> gv11b_fb_mmu_fault_info_dump

Rename and move to gmmu
gv11b_fb_parse_mmu_fault_info -> gv11b_gmmu_parse_mmu_fault_info
gv11b_fb_handle_mmu_nonreplay_replay_fault -> gv11b_gmmu_handle_mmu_nonreplay_replay_fault
gv11b_fb_handle_mmu_fault_common -> gv11b_gmmu_handle_mmu_fault_common
gv11b_fb_handle_other_fault_notify -> gv11b_gmmu_handle_other_fault_notify

JIRA NVGPU-1313

Change-Id: Ia69a0b6b50347d11764e3ff34a5ea67ea8d64915
Signed-off-by: Seema Khowala <seemaj@nvidia.com>
Reviewed-on: https://git-master.nvidia.com/r/2107771
Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com>
Tested-by: mobile promotions <svcmobile_promotions@nvidia.com>
---
 drivers/gpu/nvgpu/Makefile                    |    2 +
 drivers/gpu/nvgpu/Makefile.sources            |    2 +
 .../nvgpu/common/vgpu/gv11b/vgpu_hal_gv11b.c  |   21 +-
 drivers/gpu/nvgpu/hal/fb/fb_gv11b.c           | 1210 +----------------
 drivers/gpu/nvgpu/hal/fb/fb_gv11b.h           |   40 -
 drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.c |  685 ++++++++++
 drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.h |   80 ++
 drivers/gpu/nvgpu/hal/fb/fb_tu104.c           |    8 +-
 drivers/gpu/nvgpu/hal/fb/intr/fb_intr_gv11b.c |    1 +
 drivers/gpu/nvgpu/hal/init/hal_gv100.c        |   21 +-
 drivers/gpu/nvgpu/hal/init/hal_gv11b.c        |   21 +-
 drivers/gpu/nvgpu/hal/init/hal_tu104.c        |    1 +
 .../nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.c  |  596 ++++++++
 .../nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.h  |   37 +
 drivers/gpu/nvgpu/libnvgpu-drv.export         |    8 +-
 .../mm/page_table_faults/page_table_faults.c  |   12 +-
 16 files changed, 1461 insertions(+), 1284 deletions(-)
 create mode 100644 drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.c
 create mode 100644 drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.h
 create mode 100644 drivers/gpu/nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.c
 create mode 100644 drivers/gpu/nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.h

diff --git a/drivers/gpu/nvgpu/Makefile b/drivers/gpu/nvgpu/Makefile
index 5931016b3..ecc1a889e 100644
--- a/drivers/gpu/nvgpu/Makefile
+++ b/drivers/gpu/nvgpu/Makefile
@@ -150,6 +150,7 @@ nvgpu-y += \
 	common/nvlink/nvlink_tu104.o \
 	hal/mm/cache/flush_gk20a.o \
 	hal/mm/cache/flush_gv11b.o \
+	hal/mm/gmmu/gmmu_mmu_fault_gv11b.o \
 	hal/mm/gmmu/gmmu_gk20a.o \
 	hal/mm/gmmu/gmmu_gm20b.o \
 	hal/mm/gmmu/gmmu_gp10b.o \
@@ -249,6 +250,7 @@ nvgpu-y += \
 	hal/fb/fb_gv11b.o \
 	hal/fb/fb_gv100.o \
 	hal/fb/fb_tu104.o \
+	hal/fb/fb_mmu_fault_gv11b.o \
 	hal/fb/intr/fb_intr_gv100.o \
 	hal/fb/intr/fb_intr_gv11b.o \
 	hal/fb/intr/fb_intr_tu104.o \
diff --git a/drivers/gpu/nvgpu/Makefile.sources b/drivers/gpu/nvgpu/Makefile.sources
index d26d097ac..3a815cfbc 100644
--- a/drivers/gpu/nvgpu/Makefile.sources
+++ b/drivers/gpu/nvgpu/Makefile.sources
@@ -252,6 +252,7 @@ srcs += common/sim/sim.c \
 	tu104/mm_tu104.c \
 	hal/mm/cache/flush_gk20a.c \
 	hal/mm/cache/flush_gv11b.c \
+	hal/mm/gmmu/gmmu_mmu_fault_gv11b.c \
 	hal/mm/gmmu/gmmu_gk20a.c \
 	hal/mm/gmmu/gmmu_gm20b.c \
 	hal/mm/gmmu/gmmu_gp10b.c \
@@ -351,6 +352,7 @@ srcs += common/sim/sim.c \
 	hal/fb/fb_gv100.c \
 	hal/fb/fb_gv11b.c \
 	hal/fb/fb_tu104.c \
+	hal/fb/fb_mmu_fault_gv11b.c \
 	hal/fb/intr/fb_intr_gv100.c \
 	hal/fb/intr/fb_intr_gv11b.c \
 	hal/fb/intr/fb_intr_tu104.c \
diff --git a/drivers/gpu/nvgpu/common/vgpu/gv11b/vgpu_hal_gv11b.c b/drivers/gpu/nvgpu/common/vgpu/gv11b/vgpu_hal_gv11b.c
index a4714dd83..da496415c 100644
--- a/drivers/gpu/nvgpu/common/vgpu/gv11b/vgpu_hal_gv11b.c
+++ b/drivers/gpu/nvgpu/common/vgpu/gv11b/vgpu_hal_gv11b.c
@@ -56,6 +56,7 @@
 #include "hal/fb/fb_gm20b.h"
 #include "hal/fb/fb_gp10b.h"
 #include "hal/fb/fb_gv11b.h"
+#include "hal/fb/fb_mmu_fault_gv11b.h"
 #include "hal/fb/intr/fb_intr_gv11b.h"
 #include "hal/gr/init/gr_init_gm20b.h"
 #include "hal/gr/init/gr_init_gp10b.h"
@@ -448,22 +449,22 @@ static const struct gpu_ops vgpu_gv11b_ops = {
 		.set_debug_mode = vgpu_mm_mmu_set_debug_mode,
 		.tlb_invalidate = vgpu_mm_tlb_invalidate,
 		.write_mmu_fault_buffer_lo_hi =
-				fb_gv11b_write_mmu_fault_buffer_lo_hi,
+				gv11b_fb_write_mmu_fault_buffer_lo_hi,
 		.write_mmu_fault_buffer_get =
 				fb_gv11b_write_mmu_fault_buffer_get,
 		.write_mmu_fault_buffer_size =
-				fb_gv11b_write_mmu_fault_buffer_size,
-		.write_mmu_fault_status = fb_gv11b_write_mmu_fault_status,
+				gv11b_fb_write_mmu_fault_buffer_size,
+		.write_mmu_fault_status = gv11b_fb_write_mmu_fault_status,
 		.read_mmu_fault_buffer_get =
-				fb_gv11b_read_mmu_fault_buffer_get,
+				gv11b_fb_read_mmu_fault_buffer_get,
 		.read_mmu_fault_buffer_put =
-				fb_gv11b_read_mmu_fault_buffer_put,
+				gv11b_fb_read_mmu_fault_buffer_put,
 		.read_mmu_fault_buffer_size =
-				fb_gv11b_read_mmu_fault_buffer_size,
-		.read_mmu_fault_addr_lo_hi = fb_gv11b_read_mmu_fault_addr_lo_hi,
-		.read_mmu_fault_inst_lo_hi = fb_gv11b_read_mmu_fault_inst_lo_hi,
-		.read_mmu_fault_info = fb_gv11b_read_mmu_fault_info,
-		.read_mmu_fault_status = fb_gv11b_read_mmu_fault_status,
+				gv11b_fb_read_mmu_fault_buffer_size,
+		.read_mmu_fault_addr_lo_hi = gv11b_fb_read_mmu_fault_addr_lo_hi,
+		.read_mmu_fault_inst_lo_hi = gv11b_fb_read_mmu_fault_inst_lo_hi,
+		.read_mmu_fault_info = gv11b_fb_read_mmu_fault_info,
+		.read_mmu_fault_status = gv11b_fb_read_mmu_fault_status,
 		.intr = {
 			.enable = gv11b_fb_intr_enable,
 			.disable = gv11b_fb_intr_disable,
diff --git a/drivers/gpu/nvgpu/hal/fb/fb_gv11b.c b/drivers/gpu/nvgpu/hal/fb/fb_gv11b.c
index 5e4bdd409..2482a6fb3 100644
--- a/drivers/gpu/nvgpu/hal/fb/fb_gv11b.c
+++ b/drivers/gpu/nvgpu/hal/fb/fb_gv11b.c
@@ -35,11 +35,8 @@
 #include <nvgpu/timers.h>
 #include <nvgpu/fifo.h>
 #include <nvgpu/gk20a.h>
-#include <nvgpu/channel.h>
-#include <nvgpu/tsg.h>
 #include <nvgpu/nvgpu_err.h>
 #include <nvgpu/ltc.h>
-#include <nvgpu/rc.h>
 
 #include "gk20a/mm_gk20a.h"
 
@@ -48,10 +45,6 @@
 #include "fb_gv11b.h"
 
 #include <nvgpu/hw/gv11b/hw_fb_gv11b.h>
-#include <nvgpu/hw/gv11b/hw_gmmu_gv11b.h>
-
-static int gv11b_fb_fix_page_fault(struct gk20a *g,
-		 struct mmu_fault_info *mmfault);
 
 static void gv11b_init_nvlink_soc_credits(struct gk20a *g)
 {
@@ -86,10 +79,10 @@ static void gv11b_fb_set_atomic_mode(struct gk20a *g)
 	nvgpu_writel(g, fb_hshub_num_active_ltcs_r(), reg_val);
 
 	nvgpu_log(g,  gpu_dbg_info, "fb_mmu_ctrl_r 0x%x",
-					gk20a_readl(g, fb_mmu_ctrl_r()));
+					nvgpu_readl(g, fb_mmu_ctrl_r()));
 
 	nvgpu_log(g,   gpu_dbg_info, "fb_hshub_num_active_ltcs_r 0x%x",
-			gk20a_readl(g, fb_hshub_num_active_ltcs_r()));
+			nvgpu_readl(g, fb_hshub_num_active_ltcs_r()));
 }
 
 void gv11b_fb_init_hw(struct gk20a *g)
@@ -108,16 +101,16 @@ void gv11b_fb_init_fs_state(struct gk20a *g)
 	gv11b_fb_set_atomic_mode(g);
 
 	nvgpu_log(g, gpu_dbg_info, "fbhub active ltcs %x",
-			gk20a_readl(g, fb_fbhub_num_active_ltcs_r()));
+			nvgpu_readl(g, fb_fbhub_num_active_ltcs_r()));
 
 	nvgpu_log(g, gpu_dbg_info, "mmu active ltcs %u",
 			fb_mmu_num_active_ltcs_count_v(
-			gk20a_readl(g, fb_mmu_num_active_ltcs_r())));
+			nvgpu_readl(g, fb_mmu_num_active_ltcs_r())));
 
 	if (!nvgpu_is_enabled(g, NVGPU_SEC_PRIVSECURITY)) {
 		/* Bypass MMU check for non-secure boot. For
 		 * secure-boot,this register write has no-effect */
-		gk20a_writel(g, fb_priv_mmu_phy_secure_r(), 0xffffffffU);
+		nvgpu_writel(g, fb_priv_mmu_phy_secure_r(), U32_MAX);
 	}
 }
 
@@ -157,1204 +150,17 @@ void gv11b_fb_cbc_configure(struct gk20a *g, struct nvgpu_cbc *cbc)
 			g->ops.cbc.fix_config(g, compbit_base_post_divide);
 	}
 
-	gk20a_writel(g, fb_mmu_cbc_base_r(),
+	nvgpu_writel(g, fb_mmu_cbc_base_r(),
 		fb_mmu_cbc_base_address_f(compbit_base_post_divide));
 
 	nvgpu_log(g, gpu_dbg_info | gpu_dbg_map_v | gpu_dbg_pte,
 		"compbit base.pa: 0x%x,%08x cbc_base:0x%08x\n",
 		(u32)(compbit_store_iova >> 32),
-		(u32)(compbit_store_iova & 0xffffffffU),
+		(u32)(compbit_store_iova & U32_MAX),
 		compbit_base_post_divide);
 	nvgpu_log(g, gpu_dbg_fn, "cbc base %x",
-		gk20a_readl(g, fb_mmu_cbc_base_r()));
+		nvgpu_readl(g, fb_mmu_cbc_base_r()));
 
 	cbc->compbit_store.base_hw = compbit_base_post_divide;
 
 }
-
-static const char * const invalid_str = "invalid";
-
-static const char *const fault_type_descs_gv11b[] = {
-	"invalid pde",
-	"invalid pde size",
-	"invalid pte",
-	"limit violation",
-	"unbound inst block",
-	"priv violation",
-	"write",
-	"read",
-	"pitch mask violation",
-	"work creation",
-	"unsupported aperture",
-	"compression failure",
-	"unsupported kind",
-	"region violation",
-	"poison",
-	"atomic"
-};
-
-static const char *const fault_client_type_descs_gv11b[] = {
-	"gpc",
-	"hub",
-};
-
-static const char *const fault_access_type_descs_gv11b[] = {
-	"virt read",
-	"virt write",
-	"virt atomic strong",
-	"virt prefetch",
-	"virt atomic weak",
-	"xxx",
-	"xxx",
-	"xxx",
-	"phys read",
-	"phys write",
-	"phys atomic",
-	"phys prefetch",
-};
-
-static const char *const hub_client_descs_gv11b[] = {
-	"vip", "ce0", "ce1", "dniso", "fe", "fecs", "host", "host cpu",
-	"host cpu nb", "iso", "mmu", "nvdec", "nvenc1", "nvenc2",
-	"niso", "p2p", "pd", "perf", "pmu", "raster twod", "scc",
-	"scc nb", "sec", "ssync", "gr copy", "xv", "mmu nb",
-	"nvenc", "d falcon", "sked", "a falcon", "hsce0", "hsce1",
-	"hsce2", "hsce3", "hsce4", "hsce5", "hsce6", "hsce7", "hsce8",
-	"hsce9", "hshub", "ptp x0", "ptp x1", "ptp x2", "ptp x3",
-	"ptp x4", "ptp x5", "ptp x6", "ptp x7", "vpr scrubber0",
-	"vpr scrubber1", "dwbif", "fbfalcon", "ce shim", "gsp",
-	"dont care"
-};
-
-static const char *const gpc_client_descs_gv11b[] = {
-	"t1 0", "t1 1", "t1 2", "t1 3",
-	"t1 4", "t1 5", "t1 6", "t1 7",
-	"pe 0", "pe 1", "pe 2", "pe 3",
-	"pe 4", "pe 5", "pe 6", "pe 7",
-	"rast", "gcc", "gpccs",
-	"prop 0", "prop 1", "prop 2", "prop 3",
-	"gpm",
-	"ltp utlb 0", "ltp utlb 1", "ltp utlb 2", "ltp utlb 3",
-	"ltp utlb 4", "ltp utlb 5", "ltp utlb 6", "ltp utlb 7",
-	"utlb",
-	"t1 8", "t1 9", "t1 10", "t1 11",
-	"t1 12", "t1 13", "t1 14", "t1 15",
-	"tpccs 0", "tpccs 1", "tpccs 2", "tpccs 3",
-	"tpccs 4", "tpccs 5", "tpccs 6", "tpccs 7",
-	"pe 8", "pe 9", "tpccs 8", "tpccs 9",
-	"t1 16", "t1 17", "t1 18", "t1 19",
-	"pe 10", "pe 11", "tpccs 10", "tpccs 11",
-	"t1 20", "t1 21", "t1 22", "t1 23",
-	"pe 12", "pe 13", "tpccs 12", "tpccs 13",
-	"t1 24", "t1 25", "t1 26", "t1 27",
-	"pe 14", "pe 15", "tpccs 14", "tpccs 15",
-	"t1 28", "t1 29", "t1 30", "t1 31",
-	"pe 16", "pe 17", "tpccs 16", "tpccs 17",
-	"t1 32", "t1 33", "t1 34", "t1 35",
-	"pe 18", "pe 19", "tpccs 18", "tpccs 19",
-	"t1 36", "t1 37", "t1 38", "t1 39",
-};
-
-bool gv11b_fb_is_fault_buf_enabled(struct gk20a *g, u32 index)
-{
-	u32 reg_val;
-
-	reg_val = g->ops.fb.read_mmu_fault_buffer_size(g, index);
-	return fb_mmu_fault_buffer_size_enable_v(reg_val) != 0U;
-}
-
-static void gv11b_fb_fault_buffer_get_ptr_update(struct gk20a *g,
-				 u32 index, u32 next)
-{
-	u32 reg_val;
-
-	nvgpu_log(g, gpu_dbg_intr, "updating get index with = %d", next);
-
-	reg_val = g->ops.fb.read_mmu_fault_buffer_get(g, index);
-	reg_val = set_field(reg_val, fb_mmu_fault_buffer_get_ptr_m(),
-			 fb_mmu_fault_buffer_get_ptr_f(next));
-
-	/* while the fault is being handled it is possible for overflow
-	 * to happen,
-	 */
-	if ((reg_val & fb_mmu_fault_buffer_get_overflow_m()) != 0U) {
-		reg_val |= fb_mmu_fault_buffer_get_overflow_clear_f();
-	}
-
-	g->ops.fb.write_mmu_fault_buffer_get(g, index, reg_val);
-
-	/* make sure get ptr update is visible to everyone to avoid
-	 * reading already read entry
-	 */
-	nvgpu_mb();
-}
-
-static u32 gv11b_fb_fault_buffer_get_index(struct gk20a *g, u32 index)
-{
-	u32 reg_val;
-
-	reg_val = g->ops.fb.read_mmu_fault_buffer_get(g, index);
-	return fb_mmu_fault_buffer_get_ptr_v(reg_val);
-}
-
-static u32 gv11b_fb_fault_buffer_put_index(struct gk20a *g, u32 index)
-{
-	u32 reg_val;
-
-	reg_val = g->ops.fb.read_mmu_fault_buffer_put(g, index);
-	return fb_mmu_fault_buffer_put_ptr_v(reg_val);
-}
-
-static u32 gv11b_fb_fault_buffer_size_val(struct gk20a *g, u32 index)
-{
-	u32 reg_val;
-
-	reg_val = g->ops.fb.read_mmu_fault_buffer_size(g, index);
-	return fb_mmu_fault_buffer_size_val_v(reg_val);
-}
-
-static bool gv11b_fb_is_fault_buffer_empty(struct gk20a *g,
-		 u32 index, u32 *get_idx)
-{
-	u32 put_idx;
-
-	*get_idx = gv11b_fb_fault_buffer_get_index(g, index);
-	put_idx = gv11b_fb_fault_buffer_put_index(g, index);
-
-	return *get_idx == put_idx;
-}
-
-static bool gv11b_fb_is_fault_buffer_full(struct gk20a *g, u32 index)
-{
-	u32 get_idx, put_idx, entries;
-
-
-	get_idx = gv11b_fb_fault_buffer_get_index(g, index);
-
-	put_idx = gv11b_fb_fault_buffer_put_index(g, index);
-
-	entries = gv11b_fb_fault_buffer_size_val(g, index);
-
-	return get_idx == ((put_idx + 1U) % entries);
-}
-
-void gv11b_fb_fault_buf_set_state_hw(struct gk20a *g,
-		 u32 index, u32 state)
-{
-	u32 fault_status;
-	u32 reg_val;
-	int err = 0;
-
-	nvgpu_log_fn(g, " ");
-
-	reg_val = g->ops.fb.read_mmu_fault_buffer_size(g, index);
-	if (state == NVGPU_FB_MMU_FAULT_BUF_ENABLED) {
-		if (gv11b_fb_is_fault_buf_enabled(g, index)) {
-			nvgpu_log_info(g, "fault buffer is already enabled");
-		} else {
-			reg_val |= fb_mmu_fault_buffer_size_enable_true_f();
-			g->ops.fb.write_mmu_fault_buffer_size(g, index,
-				reg_val);
-		}
-
-	} else {
-		struct nvgpu_timeout timeout;
-		u32 delay = POLL_DELAY_MIN_US;
-
-		err = nvgpu_timeout_init(g, &timeout, nvgpu_get_poll_timeout(g),
-			   NVGPU_TIMER_CPU_TIMER);
-		if (err != 0) {
-			nvgpu_err(g, "nvgpu_timeout_init failed err=%d", err);
-		}
-
-		reg_val &= (~(fb_mmu_fault_buffer_size_enable_m()));
-		g->ops.fb.write_mmu_fault_buffer_size(g, index, reg_val);
-
-		fault_status = g->ops.fb.read_mmu_fault_status(g);
-
-		do {
-			if ((fault_status &
-			     fb_mmu_fault_status_busy_true_f()) == 0U) {
-				break;
-			}
-			/*
-			 * Make sure fault buffer is disabled.
-			 * This is to avoid accessing fault buffer by hw
-			 * during the window BAR2 is being unmapped by s/w
-			 */
-			nvgpu_log_info(g, "fault status busy set, check again");
-			fault_status = g->ops.fb.read_mmu_fault_status(g);
-
-			nvgpu_usleep_range(delay, delay * 2U);
-			delay = min_t(u32, delay << 1, POLL_DELAY_MAX_US);
-		} while (nvgpu_timeout_expired_msg(&timeout,
-				"fault status busy set") == 0);
-	}
-}
-
-void gv11b_fb_fault_buf_configure_hw(struct gk20a *g, u32 index)
-{
-	u32 addr_lo;
-	u32 addr_hi;
-
-	nvgpu_log_fn(g, " ");
-
-	gv11b_fb_fault_buf_set_state_hw(g, index,
-					 NVGPU_FB_MMU_FAULT_BUF_DISABLED);
-	addr_lo = u64_lo32(g->mm.hw_fault_buf[index].gpu_va >>
-					fb_mmu_fault_buffer_lo_addr_b());
-	addr_hi = u64_hi32(g->mm.hw_fault_buf[index].gpu_va);
-
-	g->ops.fb.write_mmu_fault_buffer_lo_hi(g, index,
-		fb_mmu_fault_buffer_lo_addr_f(addr_lo),
-		fb_mmu_fault_buffer_hi_addr_f(addr_hi));
-
-	g->ops.fb.write_mmu_fault_buffer_size(g, index,
-		fb_mmu_fault_buffer_size_val_f(g->ops.channel.count(g)) |
-		fb_mmu_fault_buffer_size_overflow_intr_enable_f());
-
-	gv11b_fb_fault_buf_set_state_hw(g, index, NVGPU_FB_MMU_FAULT_BUF_ENABLED);
-}
-
-static void gv11b_fb_parse_mmfault(struct mmu_fault_info *mmfault)
-{
-	if (mmfault->fault_type >= ARRAY_SIZE(fault_type_descs_gv11b)) {
-		nvgpu_do_assert();
-		mmfault->fault_type_desc =  invalid_str;
-	} else {
-		mmfault->fault_type_desc =
-			 fault_type_descs_gv11b[mmfault->fault_type];
-	}
-
-	if (mmfault->client_type >= ARRAY_SIZE(fault_client_type_descs_gv11b)) {
-		nvgpu_do_assert();
-		mmfault->client_type_desc = invalid_str;
-	} else {
-		mmfault->client_type_desc =
-			 fault_client_type_descs_gv11b[mmfault->client_type];
-	}
-
-	mmfault->client_id_desc = invalid_str;
-	if (mmfault->client_type == gmmu_fault_client_type_hub_v()) {
-		if (!(mmfault->client_id >=
-				 ARRAY_SIZE(hub_client_descs_gv11b))) {
-			mmfault->client_id_desc =
-				 hub_client_descs_gv11b[mmfault->client_id];
-		} else {
-			nvgpu_do_assert();
-		}
-	} else if (mmfault->client_type ==
-			gmmu_fault_client_type_gpc_v()) {
-		if (!(mmfault->client_id >=
-				 ARRAY_SIZE(gpc_client_descs_gv11b))) {
-			mmfault->client_id_desc =
-				 gpc_client_descs_gv11b[mmfault->client_id];
-		} else {
-			nvgpu_do_assert();
-		}
-	}
-
-}
-
-static void gv11b_fb_print_fault_info(struct gk20a *g,
-			 struct mmu_fault_info *mmfault)
-{
-	if (mmfault != NULL && mmfault->valid) {
-		nvgpu_err(g, "[MMU FAULT] "
-			"mmu engine id:  %d, "
-			"ch id:  %d, "
-			"fault addr: 0x%llx, "
-			"fault addr aperture: %d, "
-			"fault type: %s, "
-			"access type: %s, ",
-			mmfault->mmu_engine_id,
-			mmfault->chid,
-			mmfault->fault_addr,
-			mmfault->fault_addr_aperture,
-			mmfault->fault_type_desc,
-			fault_access_type_descs_gv11b[mmfault->access_type]);
-		nvgpu_err(g, "[MMU FAULT] "
-			"protected mode: %d, "
-			"client type: %s, "
-			"client id:  %s, "
-			"gpc id if client type is gpc: %d, ",
-			mmfault->protected_mode,
-			mmfault->client_type_desc,
-			mmfault->client_id_desc,
-			mmfault->gpc_id);
-
-		nvgpu_log(g, gpu_dbg_intr, "[MMU FAULT] "
-			"faulted act eng id if any: 0x%x, "
-			"faulted veid if any: 0x%x, "
-			"faulted pbdma id if any: 0x%x, ",
-			mmfault->faulted_engine,
-			mmfault->faulted_subid,
-			mmfault->faulted_pbdma);
-		nvgpu_log(g, gpu_dbg_intr, "[MMU FAULT] "
-			"inst ptr: 0x%llx, "
-			"inst ptr aperture: %d, "
-			"replayable fault: %d, "
-			"replayable fault en:  %d "
-			"timestamp hi:lo 0x%08x:0x%08x, ",
-			mmfault->inst_ptr,
-			mmfault->inst_aperture,
-			mmfault->replayable_fault,
-			mmfault->replay_fault_en,
-			mmfault->timestamp_hi, mmfault->timestamp_lo);
-	}
-}
-
-/*
- *Fault buffer format
- *
- * 31    28     24 23           16 15            8 7     4       0
- *.-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-.
- *|              inst_lo                  |0 0|apr|0 0 0 0 0 0 0 0|
- *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
- *|                             inst_hi                           |
- *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
- *|              addr_31_12               |                   |AP |
- *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
- *|                            addr_63_32                         |
- *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
- *|                          timestamp_lo                         |
- *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
- *|                          timestamp_hi                         |
- *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
- *|                           (reserved)        |    engine_id    |
- *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
- *|V|R|P|  gpc_id |0 0 0|t|0|acctp|0|   client    |RF0 0|faulttype|
- */
-
-static void gv11b_fb_copy_from_hw_fault_buf(struct gk20a *g,
-	 struct nvgpu_mem *mem, u32 offset, struct mmu_fault_info *mmfault)
-{
-	u32 rd32_val;
-	u32 addr_lo, addr_hi;
-	u64 inst_ptr;
-	u32 chid = FIFO_INVAL_CHANNEL_ID;
-	struct channel_gk20a *refch;
-
-	(void) memset(mmfault, 0, sizeof(*mmfault));
-
-	rd32_val = nvgpu_mem_rd32(g, mem, offset +
-			 gmmu_fault_buf_entry_inst_lo_w());
-	addr_lo = gmmu_fault_buf_entry_inst_lo_v(rd32_val);
-	addr_lo = addr_lo << gmmu_fault_buf_entry_inst_lo_b();
-
-	addr_hi = nvgpu_mem_rd32(g, mem, offset +
-				 gmmu_fault_buf_entry_inst_hi_w());
-	addr_hi = gmmu_fault_buf_entry_inst_hi_v(addr_hi);
-
-	inst_ptr = hi32_lo32_to_u64(addr_hi, addr_lo);
-
-	/* refch will be put back after fault is handled */
-	refch = nvgpu_channel_refch_from_inst_ptr(g, inst_ptr);
-	if (refch != NULL) {
-		chid = refch->chid;
-	}
-
-	/* it is ok to continue even if refch is NULL */
-	mmfault->refch = refch;
-	mmfault->chid = chid;
-	mmfault->inst_ptr = inst_ptr;
-	mmfault->inst_aperture = gmmu_fault_buf_entry_inst_aperture_v(rd32_val);
-
-	rd32_val = nvgpu_mem_rd32(g, mem, offset +
-			 gmmu_fault_buf_entry_addr_lo_w());
-
-	mmfault->fault_addr_aperture =
-		gmmu_fault_buf_entry_addr_phys_aperture_v(rd32_val);
-	addr_lo = gmmu_fault_buf_entry_addr_lo_v(rd32_val);
-	addr_lo = addr_lo << gmmu_fault_buf_entry_addr_lo_b();
-
-	rd32_val = nvgpu_mem_rd32(g, mem, offset +
-			 gmmu_fault_buf_entry_addr_hi_w());
-	addr_hi = gmmu_fault_buf_entry_addr_hi_v(rd32_val);
-	mmfault->fault_addr = hi32_lo32_to_u64(addr_hi, addr_lo);
-
-	rd32_val = nvgpu_mem_rd32(g, mem, offset +
-			 gmmu_fault_buf_entry_timestamp_lo_w());
-	mmfault->timestamp_lo =
-		 gmmu_fault_buf_entry_timestamp_lo_v(rd32_val);
-
-	rd32_val = nvgpu_mem_rd32(g, mem, offset +
-			 gmmu_fault_buf_entry_timestamp_hi_w());
-	mmfault->timestamp_hi =
-		 gmmu_fault_buf_entry_timestamp_hi_v(rd32_val);
-
-	rd32_val = nvgpu_mem_rd32(g, mem, offset +
-			 gmmu_fault_buf_entry_engine_id_w());
-
-	mmfault->mmu_engine_id =
-		 gmmu_fault_buf_entry_engine_id_v(rd32_val);
-	nvgpu_engine_mmu_fault_id_to_eng_ve_pbdma_id(g, mmfault->mmu_engine_id,
-		 &mmfault->faulted_engine, &mmfault->faulted_subid,
-		 &mmfault->faulted_pbdma);
-
-	rd32_val = nvgpu_mem_rd32(g, mem, offset +
-			gmmu_fault_buf_entry_fault_type_w());
-	mmfault->client_id =
-		 gmmu_fault_buf_entry_client_v(rd32_val);
-	mmfault->replayable_fault =
-		(gmmu_fault_buf_entry_replayable_fault_v(rd32_val) ==
-			gmmu_fault_buf_entry_replayable_fault_true_v());
-
-	mmfault->fault_type =
-		 gmmu_fault_buf_entry_fault_type_v(rd32_val);
-	mmfault->access_type =
-		 gmmu_fault_buf_entry_access_type_v(rd32_val);
-
-	mmfault->client_type =
-		gmmu_fault_buf_entry_mmu_client_type_v(rd32_val);
-
-	mmfault->gpc_id =
-		 gmmu_fault_buf_entry_gpc_id_v(rd32_val);
-	mmfault->protected_mode =
-		gmmu_fault_buf_entry_protected_mode_v(rd32_val);
-
-	mmfault->replay_fault_en =
-		gmmu_fault_buf_entry_replayable_fault_en_v(rd32_val);
-
-	mmfault->valid = (gmmu_fault_buf_entry_valid_v(rd32_val) ==
-				gmmu_fault_buf_entry_valid_true_v());
-
-	rd32_val = nvgpu_mem_rd32(g, mem, offset +
-			gmmu_fault_buf_entry_fault_type_w());
-	rd32_val &= ~(gmmu_fault_buf_entry_valid_m());
-	nvgpu_mem_wr32(g, mem, offset + gmmu_fault_buf_entry_valid_w(),
-					 rd32_val);
-
-	gv11b_fb_parse_mmfault(mmfault);
-}
-
-static void gv11b_fb_handle_mmu_fault_common(struct gk20a *g,
-		 struct mmu_fault_info *mmfault, u32 *invalidate_replay_val)
-{
-	unsigned int id_type = ID_TYPE_UNKNOWN;
-	u32 num_lce, act_eng_bitmask = 0;
-	int err = 0;
-	u32 id = FIFO_INVAL_TSG_ID;
-	unsigned int rc_type = RC_TYPE_NO_RC;
-	struct tsg_gk20a *tsg = NULL;
-
-	if (!mmfault->valid) {
-		return;
-	}
-
-	gv11b_fb_print_fault_info(g, mmfault);
-
-	num_lce = g->ops.top.get_num_lce(g);
-	if ((mmfault->mmu_engine_id >=
-			gmmu_fault_mmu_eng_id_ce0_v()) &&
-			(mmfault->mmu_engine_id <
-			gmmu_fault_mmu_eng_id_ce0_v() + num_lce)) {
-		/* CE page faults are not reported as replayable */
-		nvgpu_log(g, gpu_dbg_intr, "CE Faulted");
-		err = gv11b_fb_fix_page_fault(g, mmfault);
-		if ((mmfault->refch != NULL) &&
-		    ((u32)mmfault->refch->tsgid != FIFO_INVAL_TSG_ID)) {
-			tsg = nvgpu_tsg_get_from_id(g, mmfault->refch->tsgid);
-			nvgpu_tsg_reset_faulted_eng_pbdma(g, tsg, true, true);
-		}
-		if (err == 0) {
-			nvgpu_log(g, gpu_dbg_intr, "CE Page Fault Fixed");
-			*invalidate_replay_val = 0;
-			if (mmfault->refch != NULL) {
-				gk20a_channel_put(mmfault->refch);
-				mmfault->refch = NULL;
-			}
-			return;
-		}
-		/* Do recovery */
-		nvgpu_log(g, gpu_dbg_intr, "CE Page Fault Not Fixed");
-	}
-
-	if (!mmfault->replayable_fault) {
-		if (mmfault->fault_type ==
-				gmmu_fault_type_unbound_inst_block_v()) {
-		/*
-		 * Bug 1847172: When an engine faults due to an unbound
-		 * instance block, the fault cannot be isolated to a
-		 * single context so we need to reset the entire runlist
-		 */
-			rc_type = RC_TYPE_MMU_FAULT;
-
-		} else if (mmfault->refch != NULL) {
-			if (mmfault->refch->mmu_nack_handled) {
-				/* We have already recovered for the same
-				 * context, skip doing another recovery.
-				 */
-				mmfault->refch->mmu_nack_handled = false;
-				/*
-				 * Recovery path can be entered twice for the
-				 * same error in case of mmu nack. If mmu
-				 * nack interrupt is handled before mmu fault
-				 * then channel reference is increased to avoid
-				 * closing the channel by userspace. Decrement
-				 * channel reference.
-				 */
-				gk20a_channel_put(mmfault->refch);
-				/* refch in mmfault is assigned at the time
-				 * of copying fault info from snap reg or bar2
-				 * fault buf.
-				 */
-				gk20a_channel_put(mmfault->refch);
-				return;
-			} else {
-				/* Indicate recovery is handled if mmu fault is
-				 * a result of mmu nack.
-				 */
-				mmfault->refch->mmu_nack_handled = true;
-			}
-
-			tsg = tsg_gk20a_from_ch(mmfault->refch);
-			if (tsg != NULL) {
-				id = mmfault->refch->tsgid;
-				id_type = ID_TYPE_TSG;
-				rc_type = RC_TYPE_MMU_FAULT;
-			} else {
-				nvgpu_err(g, "chid: %d is referenceable but "
-						"not bound to tsg",
-						mmfault->refch->chid);
-				id_type = ID_TYPE_CHANNEL;
-				rc_type = RC_TYPE_NO_RC;
-			}
-		}
-
-		/* engine is faulted */
-		if (mmfault->faulted_engine != FIFO_INVAL_ENGINE_ID) {
-			act_eng_bitmask = BIT32(mmfault->faulted_engine);
-			rc_type = RC_TYPE_MMU_FAULT;
-		}
-
-		/* refch in mmfault is assigned at the time of copying
-		 * fault info from snap reg or bar2 fault buf
-		 */
-		if (mmfault->refch != NULL) {
-			gk20a_channel_put(mmfault->refch);
-			mmfault->refch = NULL;
-		}
-
-		if (rc_type != RC_TYPE_NO_RC) {
-			g->ops.fifo.recover(g, act_eng_bitmask,
-				id, id_type, rc_type, mmfault);
-		}
-	} else {
-		if (mmfault->fault_type == gmmu_fault_type_pte_v()) {
-			nvgpu_log(g, gpu_dbg_intr, "invalid pte! try to fix");
-			err = gv11b_fb_fix_page_fault(g, mmfault);
-			if (err != 0) {
-				*invalidate_replay_val |=
-					fb_mmu_invalidate_replay_cancel_global_f();
-			} else {
-				*invalidate_replay_val |=
-					fb_mmu_invalidate_replay_start_ack_all_f();
-			}
-		} else {
-			/* cancel faults other than invalid pte */
-			*invalidate_replay_val |=
-				fb_mmu_invalidate_replay_cancel_global_f();
-		}
-		/* refch in mmfault is assigned at the time of copying
-		 * fault info from snap reg or bar2 fault buf
-		 */
-		if (mmfault->refch != NULL) {
-			gk20a_channel_put(mmfault->refch);
-			mmfault->refch = NULL;
-		}
-	}
-}
-
-static int gv11b_fb_replay_or_cancel_faults(struct gk20a *g,
-			 u32 invalidate_replay_val)
-{
-	int err = 0;
-
-	nvgpu_log_fn(g, " ");
-
-	if ((invalidate_replay_val &
-	     fb_mmu_invalidate_replay_cancel_global_f()) != 0U) {
-		/*
-		 * cancel faults so that next time it faults as
-		 * replayable faults and channel recovery can be done
-		 */
-		err = g->ops.fb.mmu_invalidate_replay(g,
-			fb_mmu_invalidate_replay_cancel_global_f());
-	} else if ((invalidate_replay_val &
-		    fb_mmu_invalidate_replay_start_ack_all_f()) != 0U) {
-		/* pte valid is fixed. replay faulting request */
-		err = g->ops.fb.mmu_invalidate_replay(g,
-			fb_mmu_invalidate_replay_start_ack_all_f());
-	}
-
-	return err;
-}
-
-void gv11b_fb_handle_mmu_nonreplay_replay_fault(struct gk20a *g,
-		 u32 fault_status, u32 index)
-{
-	u32 get_indx, offset, rd32_val, entries;
-	struct nvgpu_mem *mem;
-	struct mmu_fault_info *mmfault;
-	u32 invalidate_replay_val = 0;
-	u64 prev_fault_addr =  0ULL;
-	u64 next_fault_addr =  0ULL;
-	int err = 0;
-
-	if (gv11b_fb_is_fault_buffer_empty(g, index, &get_indx)) {
-		nvgpu_log(g, gpu_dbg_intr,
-			"SPURIOUS mmu fault: reg index:%d", index);
-		return;
-	}
-	nvgpu_log(g, gpu_dbg_intr, "%s MMU FAULT" ,
-			index == NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX ?
-					"REPLAY" : "NON-REPLAY");
-
-	nvgpu_log(g, gpu_dbg_intr, "get ptr = %d", get_indx);
-
-	mem = &g->mm.hw_fault_buf[index];
-	mmfault = &g->mm.fault_info[index];
-
-	entries = gv11b_fb_fault_buffer_size_val(g, index);
-	nvgpu_log(g, gpu_dbg_intr, "buffer num entries = %d", entries);
-
-	offset = (get_indx * gmmu_fault_buf_size_v()) / U32(sizeof(u32));
-	nvgpu_log(g, gpu_dbg_intr, "starting word offset = 0x%x", offset);
-
-	rd32_val = nvgpu_mem_rd32(g, mem,
-		 offset + gmmu_fault_buf_entry_valid_w());
-	nvgpu_log(g, gpu_dbg_intr, "entry valid offset val = 0x%x", rd32_val);
-
-	while ((rd32_val & gmmu_fault_buf_entry_valid_m()) != 0U) {
-
-		nvgpu_log(g, gpu_dbg_intr, "entry valid = 0x%x", rd32_val);
-
-		gv11b_fb_copy_from_hw_fault_buf(g, mem, offset, mmfault);
-
-		get_indx = (get_indx + 1U) % entries;
-		nvgpu_log(g, gpu_dbg_intr, "new get index = %d", get_indx);
-
-		gv11b_fb_fault_buffer_get_ptr_update(g, index, get_indx);
-
-		offset = (get_indx * gmmu_fault_buf_size_v()) /
-			 U32(sizeof(u32));
-		nvgpu_log(g, gpu_dbg_intr, "next word offset = 0x%x", offset);
-
-		rd32_val = nvgpu_mem_rd32(g, mem,
-			 offset + gmmu_fault_buf_entry_valid_w());
-
-		if (index == NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX &&
-		    mmfault->fault_addr != 0ULL) {
-			/* fault_addr "0" is not supposed to be fixed ever.
-			 * For the first time when prev = 0, next = 0 and
-			 * fault addr is also 0 then handle_mmu_fault_common will
-			 * not be called. Fix by checking fault_addr not equal to 0
-			 */
-			prev_fault_addr = next_fault_addr;
-			next_fault_addr = mmfault->fault_addr;
-			if (prev_fault_addr == next_fault_addr) {
-				nvgpu_log(g, gpu_dbg_intr, "pte already scanned");
-				if (mmfault->refch != NULL) {
-					gk20a_channel_put(mmfault->refch);
-					mmfault->refch = NULL;
-				}
-				continue;
-			}
-		}
-
-		gv11b_fb_handle_mmu_fault_common(g, mmfault,
-				 &invalidate_replay_val);
-
-	}
-	if (index == NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX &&
-	    invalidate_replay_val != 0U) {
-		err = gv11b_fb_replay_or_cancel_faults(g,
-			invalidate_replay_val);
-		if (err != 0) {
-			nvgpu_err(g, "replay_or_cancel_faults failed err=%d",
-				err);
-		}
-	}
-}
-
-static void gv11b_mm_copy_from_fault_snap_reg(struct gk20a *g,
-		u32 fault_status, struct mmu_fault_info *mmfault)
-{
-	u32 reg_val;
-	u32 addr_lo, addr_hi;
-	u64 inst_ptr;
-	u32 chid = FIFO_INVAL_CHANNEL_ID;
-	struct channel_gk20a *refch;
-
-	(void) memset(mmfault, 0, sizeof(*mmfault));
-
-	if ((fault_status & fb_mmu_fault_status_valid_set_f()) == 0U) {
-
-		nvgpu_log(g, gpu_dbg_intr, "mmu fault status valid not set");
-		return;
-	}
-
-	g->ops.fb.read_mmu_fault_inst_lo_hi(g, &reg_val, &addr_hi);
-
-	addr_lo = fb_mmu_fault_inst_lo_addr_v(reg_val);
-	addr_lo = addr_lo << fb_mmu_fault_inst_lo_addr_b();
-
-	addr_hi = fb_mmu_fault_inst_hi_addr_v(addr_hi);
-	inst_ptr = hi32_lo32_to_u64(addr_hi, addr_lo);
-
-	/* refch will be put back after fault is handled */
-	refch = nvgpu_channel_refch_from_inst_ptr(g, inst_ptr);
-	if (refch != NULL) {
-		chid = refch->chid;
-	}
-
-	/* It is still ok to continue if refch is NULL */
-	mmfault->refch = refch;
-	mmfault->chid = chid;
-	mmfault->inst_ptr = inst_ptr;
-	mmfault->inst_aperture = fb_mmu_fault_inst_lo_aperture_v(reg_val);
-	mmfault->mmu_engine_id = fb_mmu_fault_inst_lo_engine_id_v(reg_val);
-
-	nvgpu_engine_mmu_fault_id_to_eng_ve_pbdma_id(g, mmfault->mmu_engine_id,
-		 &mmfault->faulted_engine, &mmfault->faulted_subid,
-		 &mmfault->faulted_pbdma);
-
-	g->ops.fb.read_mmu_fault_addr_lo_hi(g, &reg_val, &addr_hi);
-
-	addr_lo = fb_mmu_fault_addr_lo_addr_v(reg_val);
-	addr_lo = addr_lo << fb_mmu_fault_addr_lo_addr_b();
-
-	mmfault->fault_addr_aperture =
-			 fb_mmu_fault_addr_lo_phys_aperture_v(reg_val);
-
-	addr_hi = fb_mmu_fault_addr_hi_addr_v(addr_hi);
-	mmfault->fault_addr = hi32_lo32_to_u64(addr_hi, addr_lo);
-
-	reg_val = g->ops.fb.read_mmu_fault_info(g);
-	mmfault->fault_type = fb_mmu_fault_info_fault_type_v(reg_val);
-	mmfault->replayable_fault =
-			(fb_mmu_fault_info_replayable_fault_v(reg_val) == 1U);
-	mmfault->client_id = fb_mmu_fault_info_client_v(reg_val);
-	mmfault->access_type = fb_mmu_fault_info_access_type_v(reg_val);
-	mmfault->client_type = fb_mmu_fault_info_client_type_v(reg_val);
-	mmfault->gpc_id = fb_mmu_fault_info_gpc_id_v(reg_val);
-	mmfault->protected_mode =
-			 fb_mmu_fault_info_protected_mode_v(reg_val);
-	mmfault->replay_fault_en =
-			fb_mmu_fault_info_replayable_fault_en_v(reg_val);
-
-	mmfault->valid = (fb_mmu_fault_info_valid_v(reg_val) == 1U);
-
-	fault_status &= ~(fb_mmu_fault_status_valid_m());
-	g->ops.fb.write_mmu_fault_status(g, fault_status);
-
-	gv11b_fb_parse_mmfault(mmfault);
-
-}
-
-void gv11b_fb_handle_replay_fault_overflow(struct gk20a *g,
-			 u32 fault_status)
-{
-	u32 reg_val;
-	u32 index = NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX;
-
-	reg_val = g->ops.fb.read_mmu_fault_buffer_get(g, index);
-
-	if ((fault_status &
-	     fb_mmu_fault_status_replayable_getptr_corrupted_m()) != 0U) {
-
-		nvgpu_err(g, "replayable getptr corrupted set");
-
-		gv11b_fb_fault_buf_configure_hw(g, index);
-
-		reg_val = set_field(reg_val,
-			fb_mmu_fault_buffer_get_getptr_corrupted_m(),
-			fb_mmu_fault_buffer_get_getptr_corrupted_clear_f());
-	}
-
-	if ((fault_status &
-	     fb_mmu_fault_status_replayable_overflow_m()) != 0U) {
-		bool buffer_full = gv11b_fb_is_fault_buffer_full(g, index);
-
-		nvgpu_err(g, "replayable overflow: buffer full:%s",
-				buffer_full?"true":"false");
-
-		reg_val = set_field(reg_val,
-			fb_mmu_fault_buffer_get_overflow_m(),
-			fb_mmu_fault_buffer_get_overflow_clear_f());
-	}
-
-	g->ops.fb.write_mmu_fault_buffer_get(g, index, reg_val);
-}
-
-void gv11b_fb_handle_nonreplay_fault_overflow(struct gk20a *g,
-			 u32 fault_status)
-{
-	u32 reg_val;
-	u32 index = NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX;
-
-	reg_val = g->ops.fb.read_mmu_fault_buffer_get(g, index);
-
-	if ((fault_status &
-	     fb_mmu_fault_status_non_replayable_getptr_corrupted_m()) != 0U) {
-
-		nvgpu_err(g, "non replayable getptr corrupted set");
-
-		gv11b_fb_fault_buf_configure_hw(g, index);
-
-		reg_val = set_field(reg_val,
-			fb_mmu_fault_buffer_get_getptr_corrupted_m(),
-			fb_mmu_fault_buffer_get_getptr_corrupted_clear_f());
-	}
-
-	if ((fault_status &
-	     fb_mmu_fault_status_non_replayable_overflow_m()) != 0U) {
-
-		bool buffer_full = gv11b_fb_is_fault_buffer_full(g, index);
-
-		nvgpu_err(g, "non replayable overflow: buffer full:%s",
-				buffer_full?"true":"false");
-
-		reg_val = set_field(reg_val,
-			fb_mmu_fault_buffer_get_overflow_m(),
-			fb_mmu_fault_buffer_get_overflow_clear_f());
-	}
-
-	g->ops.fb.write_mmu_fault_buffer_get(g, index, reg_val);
-}
-
-static void gv11b_fb_handle_bar2_fault(struct gk20a *g,
-			struct mmu_fault_info *mmfault, u32 fault_status)
-{
-	int err = 0;
-
-	if ((fault_status &
-	     fb_mmu_fault_status_non_replayable_error_m()) != 0U) {
-		if (gv11b_fb_is_fault_buf_enabled(g,
-				NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX)) {
-			gv11b_fb_fault_buf_configure_hw(g, NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX);
-		}
-	}
-
-	if ((fault_status & fb_mmu_fault_status_replayable_error_m()) != 0U) {
-		if (gv11b_fb_is_fault_buf_enabled(g,
-				NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX)) {
-			gv11b_fb_fault_buf_configure_hw(g,
-				NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX);
-		}
-	}
-	g->ops.ce.mthd_buffer_fault_in_bar2_fault(g);
-
-	err = g->ops.bus.bar2_bind(g, &g->mm.bar2.inst_block);
-	if (err != 0) {
-		nvgpu_err(g, "bar2_bind failed err=%d", err);
-	}
-
-	if (mmfault->refch != NULL) {
-		gk20a_channel_put(mmfault->refch);
-		mmfault->refch = NULL;
-	}
-}
-
-void gv11b_fb_handle_other_fault_notify(struct gk20a *g,
-			 u32 fault_status)
-{
-	struct mmu_fault_info *mmfault;
-	u32 invalidate_replay_val = 0;
-	int err = 0;
-
-	mmfault = &g->mm.fault_info[NVGPU_MM_MMU_FAULT_TYPE_OTHER_AND_NONREPLAY];
-
-	gv11b_mm_copy_from_fault_snap_reg(g, fault_status, mmfault);
-
-	/* BAR2/Physical faults will not be snapped in hw fault buf */
-	if (mmfault->mmu_engine_id == gmmu_fault_mmu_eng_id_bar2_v()) {
-		nvgpu_err(g, "BAR2 MMU FAULT");
-		gv11b_fb_handle_bar2_fault(g, mmfault, fault_status);
-
-	} else if (mmfault->mmu_engine_id ==
-			gmmu_fault_mmu_eng_id_physical_v()) {
-		/* usually means VPR or out of bounds physical accesses */
-		nvgpu_err(g, "PHYSICAL MMU FAULT");
-
-	} else {
-		gv11b_fb_handle_mmu_fault_common(g, mmfault,
-				 &invalidate_replay_val);
-
-		if (invalidate_replay_val != 0U) {
-			err = gv11b_fb_replay_or_cancel_faults(g,
-					invalidate_replay_val);
-			if (err != 0) {
-				nvgpu_err(g, "replay_or_cancel_faults err=%d",
-					err);
-			}
-		}
-	}
-}
-
-void gv11b_fb_handle_dropped_mmu_fault(struct gk20a *g, u32 fault_status)
-{
-	u32 dropped_faults = 0;
-
-	dropped_faults = fb_mmu_fault_status_dropped_bar1_phys_set_f() |
-			fb_mmu_fault_status_dropped_bar1_virt_set_f() |
-			fb_mmu_fault_status_dropped_bar2_phys_set_f() |
-			fb_mmu_fault_status_dropped_bar2_virt_set_f() |
-			fb_mmu_fault_status_dropped_ifb_phys_set_f() |
-			fb_mmu_fault_status_dropped_ifb_virt_set_f() |
-			fb_mmu_fault_status_dropped_other_phys_set_f()|
-			fb_mmu_fault_status_dropped_other_virt_set_f();
-
-	if ((fault_status & dropped_faults) != 0U) {
-		nvgpu_err(g, "dropped mmu fault (0x%08x)",
-				 fault_status & dropped_faults);
-		g->ops.fb.write_mmu_fault_status(g, dropped_faults);
-	}
-}
-
-void gv11b_fb_handle_replayable_mmu_fault(struct gk20a *g)
-{
-	u32 fault_status = gk20a_readl(g, fb_mmu_fault_status_r());
-
-	if ((fault_status & fb_mmu_fault_status_replayable_m()) == 0U) {
-		return;
-	}
-
-	if (gv11b_fb_is_fault_buf_enabled(g,
-			NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX)) {
-		gv11b_fb_handle_mmu_nonreplay_replay_fault(g,
-				fault_status,
-				NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX);
-	}
-}
-
-void gv11b_fb_handle_mmu_fault(struct gk20a *g, u32 niso_intr)
-{
-	u32 fault_status = g->ops.fb.read_mmu_fault_status(g);
-
-	nvgpu_log(g, gpu_dbg_intr, "mmu_fault_status = 0x%08x", fault_status);
-
-	if ((niso_intr &
-	     fb_niso_intr_mmu_other_fault_notify_m()) != 0U) {
-
-		gv11b_fb_handle_dropped_mmu_fault(g, fault_status);
-
-		gv11b_fb_handle_other_fault_notify(g, fault_status);
-	}
-
-	if (gv11b_fb_is_fault_buf_enabled(g, NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX)) {
-
-		if ((niso_intr &
-		     fb_niso_intr_mmu_nonreplayable_fault_notify_m()) != 0U) {
-
-			gv11b_fb_handle_mmu_nonreplay_replay_fault(g,
-					fault_status,
-					NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX);
-
-			/*
-			 * When all the faults are processed,
-			 * GET and PUT will have same value and mmu fault status
-			 * bit will be reset by HW
-			 */
-		}
-		if ((niso_intr &
-		     fb_niso_intr_mmu_nonreplayable_fault_overflow_m()) != 0U) {
-
-			gv11b_fb_handle_nonreplay_fault_overflow(g,
-				 fault_status);
-		}
-
-	}
-
-	if (gv11b_fb_is_fault_buf_enabled(g, NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX)) {
-
-		if ((niso_intr &
-		     fb_niso_intr_mmu_replayable_fault_notify_m()) != 0U) {
-
-			gv11b_fb_handle_mmu_nonreplay_replay_fault(g,
-					fault_status,
-					NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX);
-		}
-		if ((niso_intr &
-		     fb_niso_intr_mmu_replayable_fault_overflow_m()) != 0U) {
-
-			gv11b_fb_handle_replay_fault_overflow(g,
-				 fault_status);
-		}
-
-	}
-
-	nvgpu_log(g, gpu_dbg_intr, "clear mmu fault status");
-	g->ops.fb.write_mmu_fault_status(g,
-			fb_mmu_fault_status_valid_clear_f());
-}
-
-int gv11b_fb_mmu_invalidate_replay(struct gk20a *g,
-			 u32 invalidate_replay_val)
-{
-	int err = 0;
-	u32 reg_val;
-	struct nvgpu_timeout timeout;
-
-	nvgpu_log_fn(g, " ");
-
-	nvgpu_mutex_acquire(&g->mm.tlb_lock);
-
-	reg_val = gk20a_readl(g, fb_mmu_invalidate_r());
-
-	reg_val |= fb_mmu_invalidate_all_va_true_f() |
-		fb_mmu_invalidate_all_pdb_true_f() |
-		invalidate_replay_val |
-		fb_mmu_invalidate_trigger_true_f();
-
-	gk20a_writel(g, fb_mmu_invalidate_r(), reg_val);
-
-	/* retry 200 times */
-	err = nvgpu_timeout_init(g, &timeout, 200, NVGPU_TIMER_RETRY_TIMER);
-	if (err != 0) {
-		nvgpu_err(g, "nvgpu_timeout_init failed err=%d", err);
-		goto out;
-	}
-
-	err = -ETIMEDOUT;
-	do {
-		reg_val = gk20a_readl(g, fb_mmu_ctrl_r());
-		if (fb_mmu_ctrl_pri_fifo_empty_v(reg_val) !=
-			fb_mmu_ctrl_pri_fifo_empty_false_f()) {
-			err = 0;
-			break;
-		}
-		nvgpu_udelay(5);
-	} while (nvgpu_timeout_expired_msg(&timeout,
-			    "invalidate replay failed on 0x%llx") == 0);
-	if (err != 0) {
-		nvgpu_err(g, "invalidate replay timedout");
-	}
-
-out:
-	nvgpu_mutex_release(&g->mm.tlb_lock);
-	return err;
-}
-
-static int gv11b_fb_fix_page_fault(struct gk20a *g,
-			 struct mmu_fault_info *mmfault)
-{
-	int err = 0;
-	u32 pte[2];
-
-	if (mmfault->refch == NULL) {
-		nvgpu_log(g, gpu_dbg_intr, "refch from mmu_fault_info is NULL");
-		return -EINVAL;
-	}
-
-	err = __nvgpu_get_pte(g,
-			mmfault->refch->vm, mmfault->fault_addr, &pte[0]);
-	if (err != 0) {
-		nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte, "pte not found");
-		return err;
-	}
-	nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
-			"pte: %#08x %#08x", pte[1], pte[0]);
-
-	if (pte[0] == 0x0U && pte[1] == 0x0U) {
-		nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
-				"pte all zeros, do not set valid");
-		return -1;
-	}
-	if ((pte[0] & gmmu_new_pte_valid_true_f()) != 0U) {
-		nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
-				"pte valid already set");
-		return -1;
-	}
-
-	pte[0] |= gmmu_new_pte_valid_true_f();
-	if ((pte[0] & gmmu_new_pte_read_only_true_f()) != 0U) {
-		pte[0] &= ~(gmmu_new_pte_read_only_true_f());
-	}
-	nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
-			"new pte: %#08x %#08x", pte[1], pte[0]);
-
-	err = __nvgpu_set_pte(g,
-			mmfault->refch->vm, mmfault->fault_addr, &pte[0]);
-	if (err != 0) {
-		nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte, "pte not fixed");
-		return err;
-	}
-	/* invalidate tlb so that GMMU does not use old cached translation */
-	err = g->ops.fb.tlb_invalidate(g, mmfault->refch->vm->pdb.mem);
-	if (err != 0) {
-		nvgpu_err(g, "tlb_invalidate failed err=%d", err);
-		return err;
-	}
-
-	err = __nvgpu_get_pte(g,
-			mmfault->refch->vm, mmfault->fault_addr, &pte[0]);
-	nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
-			"pte after tlb invalidate: %#08x %#08x",
-			pte[1], pte[0]);
-	return err;
-}
-
-void fb_gv11b_write_mmu_fault_buffer_lo_hi(struct gk20a *g, u32 index,
-	u32 addr_lo, u32 addr_hi)
-{
-	nvgpu_writel(g, fb_mmu_fault_buffer_lo_r(index), addr_lo);
-	nvgpu_writel(g, fb_mmu_fault_buffer_hi_r(index), addr_hi);
-}
-
-u32 fb_gv11b_read_mmu_fault_buffer_get(struct gk20a *g, u32 index)
-{
-	return nvgpu_readl(g, fb_mmu_fault_buffer_get_r(index));
-}
-
-void fb_gv11b_write_mmu_fault_buffer_get(struct gk20a *g, u32 index,
-	u32 reg_val)
-{
-	nvgpu_writel(g, fb_mmu_fault_buffer_get_r(index), reg_val);
-}
-
-u32 fb_gv11b_read_mmu_fault_buffer_put(struct gk20a *g, u32 index)
-{
-	return nvgpu_readl(g, fb_mmu_fault_buffer_put_r(index));
-}
-
-u32 fb_gv11b_read_mmu_fault_buffer_size(struct gk20a *g, u32 index)
-{
-	return nvgpu_readl(g, fb_mmu_fault_buffer_size_r(index));
-}
-
-void fb_gv11b_write_mmu_fault_buffer_size(struct gk20a *g, u32 index,
-	u32 reg_val)
-{
-	nvgpu_writel(g, fb_mmu_fault_buffer_size_r(index), reg_val);
-}
-
-void fb_gv11b_read_mmu_fault_addr_lo_hi(struct gk20a *g,
-	u32 *addr_lo, u32 *addr_hi)
-{
-	*addr_lo = nvgpu_readl(g, fb_mmu_fault_addr_lo_r());
-	*addr_hi = nvgpu_readl(g, fb_mmu_fault_addr_hi_r());
-}
-
-void fb_gv11b_read_mmu_fault_inst_lo_hi(struct gk20a *g,
-	u32 *inst_lo, u32 *inst_hi)
-{
-	*inst_lo = nvgpu_readl(g, fb_mmu_fault_inst_lo_r());
-	*inst_hi = nvgpu_readl(g, fb_mmu_fault_inst_hi_r());
-}
-
-u32 fb_gv11b_read_mmu_fault_info(struct gk20a *g)
-{
-	return nvgpu_readl(g, fb_mmu_fault_info_r());
-}
-
-u32 fb_gv11b_read_mmu_fault_status(struct gk20a *g)
-{
-	return nvgpu_readl(g, fb_mmu_fault_status_r());
-}
-
-void fb_gv11b_write_mmu_fault_status(struct gk20a *g, u32 reg_val)
-{
-	nvgpu_writel(g, fb_mmu_fault_status_r(), reg_val);
-}
diff --git a/drivers/gpu/nvgpu/hal/fb/fb_gv11b.h b/drivers/gpu/nvgpu/hal/fb/fb_gv11b.h
index 16a599775..f942d6a3e 100644
--- a/drivers/gpu/nvgpu/hal/fb/fb_gv11b.h
+++ b/drivers/gpu/nvgpu/hal/fb/fb_gv11b.h
@@ -25,52 +25,12 @@
 #ifndef NVGPU_FB_GV11B_H
 #define NVGPU_FB_GV11B_H
 
-#define	NONREPLAY_REG_INDEX		0
-#define	REPLAY_REG_INDEX		1
-
 struct gk20a;
-struct gr_gk20a;
 struct nvgpu_cbc;
 
 void gv11b_fb_init_hw(struct gk20a *g);
-void gv11b_fb_handle_mmu_fault(struct gk20a *g, u32 niso_intr);
 void gv11b_fb_init_fs_state(struct gk20a *g);
 void gv11b_fb_cbc_configure(struct gk20a *g, struct nvgpu_cbc *cbc);
 void gv11b_fb_reset(struct gk20a *g);
 
-bool gv11b_fb_is_fault_buf_enabled(struct gk20a *g, u32 index	);
-void gv11b_fb_fault_buf_set_state_hw(struct gk20a *g,
-		 u32 index, u32 state);
-void gv11b_fb_fault_buf_configure_hw(struct gk20a *g, u32 index);
-void gv11b_fb_handle_dropped_mmu_fault(struct gk20a *g, u32 fault_status);
-void gv11b_fb_handle_other_fault_notify(struct gk20a *g,
-			 u32 fault_status);
-void gv11b_fb_handle_mmu_nonreplay_replay_fault(struct gk20a *g,
-		 u32 fault_status, u32 index);
-void gv11b_fb_handle_nonreplay_fault_overflow(struct gk20a *g,
-			 u32 fault_status);
-void gv11b_fb_handle_replay_fault_overflow(struct gk20a *g,
-			 u32 fault_status);
-void gv11b_fb_handle_replayable_mmu_fault(struct gk20a *g);
-
-void fb_gv11b_write_mmu_fault_buffer_lo_hi(struct gk20a *g, u32 index,
-	u32 addr_lo, u32 addr_hi);
-u32 fb_gv11b_read_mmu_fault_buffer_get(struct gk20a *g, u32 index);
-void fb_gv11b_write_mmu_fault_buffer_get(struct gk20a *g, u32 index,
-	u32 reg_val);
-u32 fb_gv11b_read_mmu_fault_buffer_put(struct gk20a *g, u32 index);
-u32 fb_gv11b_read_mmu_fault_buffer_size(struct gk20a *g, u32 index);
-void fb_gv11b_write_mmu_fault_buffer_size(struct gk20a *g, u32 index,
-	u32 reg_val);
-void fb_gv11b_read_mmu_fault_addr_lo_hi(struct gk20a *g,
-	u32 *addr_lo, u32 *addr_hi);
-void fb_gv11b_read_mmu_fault_inst_lo_hi(struct gk20a *g,
-	u32 *inst_lo, u32 *inst_hi);
-u32 fb_gv11b_read_mmu_fault_info(struct gk20a *g);
-u32 fb_gv11b_read_mmu_fault_status(struct gk20a *g);
-void fb_gv11b_write_mmu_fault_status(struct gk20a *g, u32 reg_val);
-
-int gv11b_fb_mmu_invalidate_replay(struct gk20a *g,
-			 u32 invalidate_replay_val);
-
 #endif /* NVGPU_FB_GV11B_H */
diff --git a/drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.c b/drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.c
new file mode 100644
index 000000000..ed1c0a6e6
--- /dev/null
+++ b/drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.c
@@ -0,0 +1,685 @@
+/*
+ * Copyright (c) 2016-2019, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software"),
+ * to deal in the Software without restriction, including without limitation
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included in
+ * all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
+ * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
+ * DEALINGS IN THE SOFTWARE.
+ */
+
+#include <nvgpu/dma.h>
+#include <nvgpu/log.h>
+#include <nvgpu/enabled.h>
+#include <nvgpu/gmmu.h>
+#include <nvgpu/barrier.h>
+#include <nvgpu/bug.h>
+#include <nvgpu/soc.h>
+#include <nvgpu/ptimer.h>
+#include <nvgpu/io.h>
+#include <nvgpu/utils.h>
+#include <nvgpu/timers.h>
+#include <nvgpu/fifo.h>
+#include <nvgpu/gk20a.h>
+#include <nvgpu/channel.h>
+#include <nvgpu/tsg.h>
+#include <nvgpu/nvgpu_err.h>
+#include <nvgpu/ltc.h>
+#include <nvgpu/rc.h>
+
+#include "hal/fb/fb_mmu_fault_gv11b.h"
+#include "hal/mm/gmmu/gmmu_mmu_fault_gv11b.h"
+
+#include "gk20a/mm_gk20a.h"
+
+#include "fb_gm20b.h"
+#include "fb_gp10b.h"
+#include "fb_gv11b.h"
+
+#include <nvgpu/hw/gv11b/hw_fb_gv11b.h>
+
+static const char *const gv11b_fault_access_type_descs[] = {
+	"virt read",
+	"virt write",
+	"virt atomic strong",
+	"virt prefetch",
+	"virt atomic weak",
+	"xxx",
+	"xxx",
+	"xxx",
+	"phys read",
+	"phys write",
+	"phys atomic",
+	"phys prefetch",
+};
+
+bool gv11b_fb_is_fault_buf_enabled(struct gk20a *g, u32 index)
+{
+	u32 reg_val;
+
+	reg_val = g->ops.fb.read_mmu_fault_buffer_size(g, index);
+	return fb_mmu_fault_buffer_size_enable_v(reg_val) != 0U;
+}
+
+void gv11b_fb_fault_buffer_get_ptr_update(struct gk20a *g,
+				 u32 index, u32 next)
+{
+	u32 reg_val;
+
+	nvgpu_log(g, gpu_dbg_intr, "updating get index with = %d", next);
+
+	reg_val = g->ops.fb.read_mmu_fault_buffer_get(g, index);
+	reg_val = set_field(reg_val, fb_mmu_fault_buffer_get_ptr_m(),
+			 fb_mmu_fault_buffer_get_ptr_f(next));
+
+	/*
+	 * while the fault is being handled it is possible for overflow
+	 * to happen,
+	 */
+	if ((reg_val & fb_mmu_fault_buffer_get_overflow_m()) != 0U) {
+		reg_val |= fb_mmu_fault_buffer_get_overflow_clear_f();
+	}
+
+	g->ops.fb.write_mmu_fault_buffer_get(g, index, reg_val);
+
+	/*
+	 * make sure get ptr update is visible to everyone to avoid
+	 * reading already read entry
+	 */
+	nvgpu_mb();
+}
+
+static u32 gv11b_fb_fault_buffer_get_index(struct gk20a *g, u32 index)
+{
+	u32 reg_val;
+
+	reg_val = g->ops.fb.read_mmu_fault_buffer_get(g, index);
+	return fb_mmu_fault_buffer_get_ptr_v(reg_val);
+}
+
+static u32 gv11b_fb_fault_buffer_put_index(struct gk20a *g, u32 index)
+{
+	u32 reg_val;
+
+	reg_val = g->ops.fb.read_mmu_fault_buffer_put(g, index);
+	return fb_mmu_fault_buffer_put_ptr_v(reg_val);
+}
+
+u32 gv11b_fb_fault_buffer_size_val(struct gk20a *g, u32 index)
+{
+	u32 reg_val;
+
+	reg_val = g->ops.fb.read_mmu_fault_buffer_size(g, index);
+	return fb_mmu_fault_buffer_size_val_v(reg_val);
+}
+
+bool gv11b_fb_is_fault_buffer_empty(struct gk20a *g,
+		 u32 index, u32 *get_idx)
+{
+	u32 put_idx;
+
+	*get_idx = gv11b_fb_fault_buffer_get_index(g, index);
+	put_idx = gv11b_fb_fault_buffer_put_index(g, index);
+
+	return *get_idx == put_idx;
+}
+
+static bool gv11b_fb_is_fault_buffer_full(struct gk20a *g, u32 index)
+{
+	u32 get_idx, put_idx, entries;
+
+
+	get_idx = gv11b_fb_fault_buffer_get_index(g, index);
+
+	put_idx = gv11b_fb_fault_buffer_put_index(g, index);
+
+	entries = gv11b_fb_fault_buffer_size_val(g, index);
+
+	return get_idx == ((put_idx + 1U) % entries);
+}
+
+void gv11b_fb_fault_buf_set_state_hw(struct gk20a *g,
+		 u32 index, u32 state)
+{
+	u32 fault_status;
+	u32 reg_val;
+
+	nvgpu_log_fn(g, " ");
+
+	reg_val = g->ops.fb.read_mmu_fault_buffer_size(g, index);
+	if (state == NVGPU_FB_MMU_FAULT_BUF_ENABLED) {
+		if (gv11b_fb_is_fault_buf_enabled(g, index)) {
+			nvgpu_log_info(g, "fault buffer is already enabled");
+		} else {
+			reg_val |= fb_mmu_fault_buffer_size_enable_true_f();
+			g->ops.fb.write_mmu_fault_buffer_size(g, index,
+				reg_val);
+		}
+
+	} else {
+		struct nvgpu_timeout timeout;
+		u32 delay = POLL_DELAY_MIN_US;
+
+		nvgpu_timeout_init(g, &timeout, nvgpu_get_poll_timeout(g),
+			   NVGPU_TIMER_CPU_TIMER);
+
+		reg_val &= (~(fb_mmu_fault_buffer_size_enable_m()));
+		g->ops.fb.write_mmu_fault_buffer_size(g, index, reg_val);
+
+		fault_status = g->ops.fb.read_mmu_fault_status(g);
+
+		do {
+			if ((fault_status &
+			     fb_mmu_fault_status_busy_true_f()) == 0U) {
+				break;
+			}
+			/*
+			 * Make sure fault buffer is disabled.
+			 * This is to avoid accessing fault buffer by hw
+			 * during the window BAR2 is being unmapped by s/w
+			 */
+			nvgpu_log_info(g, "fault status busy set, check again");
+			fault_status = g->ops.fb.read_mmu_fault_status(g);
+
+			nvgpu_usleep_range(delay, delay * 2U);
+			delay = min_t(u32, delay << 1, POLL_DELAY_MAX_US);
+		} while (nvgpu_timeout_expired_msg(&timeout,
+				"fault status busy set") == 0);
+	}
+}
+
+void gv11b_fb_fault_buf_configure_hw(struct gk20a *g, u32 index)
+{
+	u32 addr_lo;
+	u32 addr_hi;
+
+	nvgpu_log_fn(g, " ");
+
+	gv11b_fb_fault_buf_set_state_hw(g, index,
+					 NVGPU_FB_MMU_FAULT_BUF_DISABLED);
+	addr_lo = u64_lo32(g->mm.hw_fault_buf[index].gpu_va >>
+					fb_mmu_fault_buffer_lo_addr_b());
+	addr_hi = u64_hi32(g->mm.hw_fault_buf[index].gpu_va);
+
+	g->ops.fb.write_mmu_fault_buffer_lo_hi(g, index,
+		fb_mmu_fault_buffer_lo_addr_f(addr_lo),
+		fb_mmu_fault_buffer_hi_addr_f(addr_hi));
+
+	g->ops.fb.write_mmu_fault_buffer_size(g, index,
+		fb_mmu_fault_buffer_size_val_f(g->ops.channel.count(g)) |
+		fb_mmu_fault_buffer_size_overflow_intr_enable_f());
+
+	gv11b_fb_fault_buf_set_state_hw(g, index, NVGPU_FB_MMU_FAULT_BUF_ENABLED);
+}
+
+void gv11b_fb_write_mmu_fault_buffer_lo_hi(struct gk20a *g, u32 index,
+	u32 addr_lo, u32 addr_hi)
+{
+	nvgpu_writel(g, fb_mmu_fault_buffer_lo_r(index), addr_lo);
+	nvgpu_writel(g, fb_mmu_fault_buffer_hi_r(index), addr_hi);
+}
+
+u32 gv11b_fb_read_mmu_fault_buffer_get(struct gk20a *g, u32 index)
+{
+	return nvgpu_readl(g, fb_mmu_fault_buffer_get_r(index));
+}
+
+void fb_gv11b_write_mmu_fault_buffer_get(struct gk20a *g, u32 index,
+	u32 reg_val)
+{
+	nvgpu_writel(g, fb_mmu_fault_buffer_get_r(index), reg_val);
+}
+
+u32 gv11b_fb_read_mmu_fault_buffer_put(struct gk20a *g, u32 index)
+{
+	return nvgpu_readl(g, fb_mmu_fault_buffer_put_r(index));
+}
+
+u32 gv11b_fb_read_mmu_fault_buffer_size(struct gk20a *g, u32 index)
+{
+	return nvgpu_readl(g, fb_mmu_fault_buffer_size_r(index));
+}
+
+void gv11b_fb_write_mmu_fault_buffer_size(struct gk20a *g, u32 index,
+	u32 reg_val)
+{
+	nvgpu_writel(g, fb_mmu_fault_buffer_size_r(index), reg_val);
+}
+
+void gv11b_fb_read_mmu_fault_addr_lo_hi(struct gk20a *g,
+	u32 *addr_lo, u32 *addr_hi)
+{
+	*addr_lo = nvgpu_readl(g, fb_mmu_fault_addr_lo_r());
+	*addr_hi = nvgpu_readl(g, fb_mmu_fault_addr_hi_r());
+}
+
+void gv11b_fb_read_mmu_fault_inst_lo_hi(struct gk20a *g,
+	u32 *inst_lo, u32 *inst_hi)
+{
+	*inst_lo = nvgpu_readl(g, fb_mmu_fault_inst_lo_r());
+	*inst_hi = nvgpu_readl(g, fb_mmu_fault_inst_hi_r());
+}
+
+u32 gv11b_fb_read_mmu_fault_info(struct gk20a *g)
+{
+	return nvgpu_readl(g, fb_mmu_fault_info_r());
+}
+
+u32 gv11b_fb_read_mmu_fault_status(struct gk20a *g)
+{
+	return nvgpu_readl(g, fb_mmu_fault_status_r());
+}
+
+void gv11b_fb_write_mmu_fault_status(struct gk20a *g, u32 reg_val)
+{
+
+	nvgpu_writel(g, fb_mmu_fault_status_r(), reg_val);
+}
+
+int gv11b_fb_replay_or_cancel_faults(struct gk20a *g,
+			 u32 invalidate_replay_val)
+{
+	int err = 0;
+
+	nvgpu_log_fn(g, " ");
+
+	if ((invalidate_replay_val &
+	     fb_mmu_invalidate_replay_cancel_global_f()) != 0U) {
+		/*
+		 * cancel faults so that next time it faults as
+		 * replayable faults and channel recovery can be done
+		 */
+		err = g->ops.fb.mmu_invalidate_replay(g,
+			fb_mmu_invalidate_replay_cancel_global_f());
+	} else if ((invalidate_replay_val &
+		    fb_mmu_invalidate_replay_start_ack_all_f()) != 0U) {
+		/* pte valid is fixed. replay faulting request */
+		err = g->ops.fb.mmu_invalidate_replay(g,
+			fb_mmu_invalidate_replay_start_ack_all_f());
+	}
+
+	return err;
+}
+
+
+void gv11b_fb_mmu_fault_info_dump(struct gk20a *g,
+			 struct mmu_fault_info *mmufault)
+{
+	if (mmufault != NULL && mmufault->valid) {
+		nvgpu_err(g, "[MMU FAULT] "
+			"mmu engine id:  %d, "
+			"ch id:  %d, "
+			"fault addr: 0x%llx, "
+			"fault addr aperture: %d, "
+			"fault type: %s, "
+			"access type: %s, ",
+			mmufault->mmu_engine_id,
+			mmufault->chid,
+			mmufault->fault_addr,
+			mmufault->fault_addr_aperture,
+			mmufault->fault_type_desc,
+			gv11b_fault_access_type_descs[mmufault->access_type]);
+		nvgpu_err(g, "[MMU FAULT] "
+			"protected mode: %d, "
+			"client type: %s, "
+			"client id:  %s, "
+			"gpc id if client type is gpc: %d, ",
+			mmufault->protected_mode,
+			mmufault->client_type_desc,
+			mmufault->client_id_desc,
+			mmufault->gpc_id);
+
+		nvgpu_log(g, gpu_dbg_intr, "[MMU FAULT] "
+			"faulted act eng id if any: 0x%x, "
+			"faulted veid if any: 0x%x, "
+			"faulted pbdma id if any: 0x%x, ",
+			mmufault->faulted_engine,
+			mmufault->faulted_subid,
+			mmufault->faulted_pbdma);
+		nvgpu_log(g, gpu_dbg_intr, "[MMU FAULT] "
+			"inst ptr: 0x%llx, "
+			"inst ptr aperture: %d, "
+			"replayable fault: %d, "
+			"replayable fault en:  %d "
+			"timestamp hi:lo 0x%08x:0x%08x, ",
+			mmufault->inst_ptr,
+			mmufault->inst_aperture,
+			mmufault->replayable_fault,
+			mmufault->replay_fault_en,
+			mmufault->timestamp_hi, mmufault->timestamp_lo);
+	}
+}
+
+void gv11b_mm_copy_from_fault_snap_reg(struct gk20a *g,
+		u32 fault_status, struct mmu_fault_info *mmufault)
+{
+	u32 reg_val;
+	u32 addr_lo, addr_hi;
+	u64 inst_ptr;
+	u32 chid = FIFO_INVAL_CHANNEL_ID;
+	struct channel_gk20a *refch;
+
+	(void) memset(mmufault, 0, sizeof(*mmufault));
+
+	if ((fault_status & fb_mmu_fault_status_valid_set_f()) == 0U) {
+
+		nvgpu_log(g, gpu_dbg_intr, "mmu fault status valid not set");
+		return;
+	}
+
+	g->ops.fb.read_mmu_fault_inst_lo_hi(g, &reg_val, &addr_hi);
+
+	addr_lo = fb_mmu_fault_inst_lo_addr_v(reg_val);
+	addr_lo = addr_lo << fb_mmu_fault_inst_lo_addr_b();
+
+	addr_hi = fb_mmu_fault_inst_hi_addr_v(addr_hi);
+	inst_ptr = hi32_lo32_to_u64(addr_hi, addr_lo);
+
+	/* refch will be put back after fault is handled */
+	refch = nvgpu_channel_refch_from_inst_ptr(g, inst_ptr);
+	if (refch != NULL) {
+		chid = refch->chid;
+	}
+
+	/* It is still ok to continue if refch is NULL */
+	mmufault->refch = refch;
+	mmufault->chid = chid;
+	mmufault->inst_ptr = inst_ptr;
+	mmufault->inst_aperture = fb_mmu_fault_inst_lo_aperture_v(reg_val);
+	mmufault->mmu_engine_id = fb_mmu_fault_inst_lo_engine_id_v(reg_val);
+
+	nvgpu_engine_mmu_fault_id_to_eng_ve_pbdma_id(g, mmufault->mmu_engine_id,
+		 &mmufault->faulted_engine, &mmufault->faulted_subid,
+		 &mmufault->faulted_pbdma);
+
+	g->ops.fb.read_mmu_fault_addr_lo_hi(g, &reg_val, &addr_hi);
+
+	addr_lo = fb_mmu_fault_addr_lo_addr_v(reg_val);
+	addr_lo = addr_lo << fb_mmu_fault_addr_lo_addr_b();
+
+	mmufault->fault_addr_aperture =
+			 fb_mmu_fault_addr_lo_phys_aperture_v(reg_val);
+
+	addr_hi = fb_mmu_fault_addr_hi_addr_v(addr_hi);
+	mmufault->fault_addr = hi32_lo32_to_u64(addr_hi, addr_lo);
+
+	reg_val = g->ops.fb.read_mmu_fault_info(g);
+	mmufault->fault_type = fb_mmu_fault_info_fault_type_v(reg_val);
+	mmufault->replayable_fault =
+			(fb_mmu_fault_info_replayable_fault_v(reg_val) == 1U);
+	mmufault->client_id = fb_mmu_fault_info_client_v(reg_val);
+	mmufault->access_type = fb_mmu_fault_info_access_type_v(reg_val);
+	mmufault->client_type = fb_mmu_fault_info_client_type_v(reg_val);
+	mmufault->gpc_id = fb_mmu_fault_info_gpc_id_v(reg_val);
+	mmufault->protected_mode =
+			 fb_mmu_fault_info_protected_mode_v(reg_val);
+	mmufault->replay_fault_en =
+			fb_mmu_fault_info_replayable_fault_en_v(reg_val);
+
+	mmufault->valid = (fb_mmu_fault_info_valid_v(reg_val) == 1U);
+
+	fault_status &= ~(fb_mmu_fault_status_valid_m());
+	g->ops.fb.write_mmu_fault_status(g, fault_status);
+
+	gv11b_gmmu_parse_mmu_fault_info(mmufault);
+
+}
+
+void gv11b_fb_handle_replay_fault_overflow(struct gk20a *g,
+			 u32 fault_status)
+{
+	u32 reg_val;
+	u32 index = NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX;
+
+	reg_val = g->ops.fb.read_mmu_fault_buffer_get(g, index);
+
+	if ((fault_status &
+	     fb_mmu_fault_status_replayable_getptr_corrupted_m()) != 0U) {
+
+		nvgpu_err(g, "replayable getptr corrupted set");
+
+		gv11b_fb_fault_buf_configure_hw(g, index);
+
+		reg_val = set_field(reg_val,
+			fb_mmu_fault_buffer_get_getptr_corrupted_m(),
+			fb_mmu_fault_buffer_get_getptr_corrupted_clear_f());
+	}
+
+	if ((fault_status &
+	     fb_mmu_fault_status_replayable_overflow_m()) != 0U) {
+		bool buffer_full = gv11b_fb_is_fault_buffer_full(g, index);
+
+		nvgpu_err(g, "replayable overflow: buffer full:%s",
+				buffer_full?"true":"false");
+
+		reg_val = set_field(reg_val,
+			fb_mmu_fault_buffer_get_overflow_m(),
+			fb_mmu_fault_buffer_get_overflow_clear_f());
+	}
+
+	g->ops.fb.write_mmu_fault_buffer_get(g, index, reg_val);
+}
+
+void gv11b_fb_handle_nonreplay_fault_overflow(struct gk20a *g,
+			 u32 fault_status)
+{
+	u32 reg_val;
+	u32 index = NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX;
+
+	reg_val = g->ops.fb.read_mmu_fault_buffer_get(g, index);
+
+	if ((fault_status &
+	     fb_mmu_fault_status_non_replayable_getptr_corrupted_m()) != 0U) {
+
+		nvgpu_err(g, "non replayable getptr corrupted set");
+
+		gv11b_fb_fault_buf_configure_hw(g, index);
+
+		reg_val = set_field(reg_val,
+			fb_mmu_fault_buffer_get_getptr_corrupted_m(),
+			fb_mmu_fault_buffer_get_getptr_corrupted_clear_f());
+	}
+
+	if ((fault_status &
+	     fb_mmu_fault_status_non_replayable_overflow_m()) != 0U) {
+
+		bool buffer_full = gv11b_fb_is_fault_buffer_full(g, index);
+
+		nvgpu_err(g, "non replayable overflow: buffer full:%s",
+				buffer_full?"true":"false");
+
+		reg_val = set_field(reg_val,
+			fb_mmu_fault_buffer_get_overflow_m(),
+			fb_mmu_fault_buffer_get_overflow_clear_f());
+	}
+
+	g->ops.fb.write_mmu_fault_buffer_get(g, index, reg_val);
+}
+
+void gv11b_fb_handle_bar2_fault(struct gk20a *g,
+			struct mmu_fault_info *mmufault, u32 fault_status)
+{
+	if ((fault_status &
+	     fb_mmu_fault_status_non_replayable_error_m()) != 0U) {
+		if (gv11b_fb_is_fault_buf_enabled(g,
+				NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX)) {
+			gv11b_fb_fault_buf_configure_hw(g, NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX);
+		}
+	}
+
+	if ((fault_status & fb_mmu_fault_status_replayable_error_m()) != 0U) {
+		if (gv11b_fb_is_fault_buf_enabled(g,
+				NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX)) {
+			gv11b_fb_fault_buf_configure_hw(g,
+				NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX);
+		}
+	}
+	g->ops.ce.mthd_buffer_fault_in_bar2_fault(g);
+
+	g->ops.bus.bar2_bind(g, &g->mm.bar2.inst_block);
+
+	if (mmufault->refch != NULL) {
+		gk20a_channel_put(mmufault->refch);
+		mmufault->refch = NULL;
+	}
+}
+
+void gv11b_fb_handle_dropped_mmu_fault(struct gk20a *g, u32 fault_status)
+{
+	u32 dropped_faults = 0;
+
+	dropped_faults = fb_mmu_fault_status_dropped_bar1_phys_set_f() |
+			fb_mmu_fault_status_dropped_bar1_virt_set_f() |
+			fb_mmu_fault_status_dropped_bar2_phys_set_f() |
+			fb_mmu_fault_status_dropped_bar2_virt_set_f() |
+			fb_mmu_fault_status_dropped_ifb_phys_set_f() |
+			fb_mmu_fault_status_dropped_ifb_virt_set_f() |
+			fb_mmu_fault_status_dropped_other_phys_set_f()|
+			fb_mmu_fault_status_dropped_other_virt_set_f();
+
+	if ((fault_status & dropped_faults) != 0U) {
+		nvgpu_err(g, "dropped mmu fault (0x%08x)",
+				 fault_status & dropped_faults);
+		g->ops.fb.write_mmu_fault_status(g, dropped_faults);
+	}
+}
+
+void gv11b_fb_handle_replayable_mmu_fault(struct gk20a *g)
+{
+	u32 fault_status = nvgpu_readl(g, fb_mmu_fault_status_r());
+
+	if ((fault_status & fb_mmu_fault_status_replayable_m()) == 0U) {
+		return;
+	}
+
+	if (gv11b_fb_is_fault_buf_enabled(g,
+			NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX)) {
+		gv11b_gmmu_handle_mmu_nonreplay_replay_fault(g,
+				fault_status,
+				NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX);
+	}
+}
+
+void gv11b_fb_handle_mmu_fault(struct gk20a *g, u32 niso_intr)
+{
+	u32 fault_status = g->ops.fb.read_mmu_fault_status(g);
+
+	nvgpu_log(g, gpu_dbg_intr, "mmu_fault_status = 0x%08x", fault_status);
+
+	if ((niso_intr &
+	     fb_niso_intr_mmu_other_fault_notify_m()) != 0U) {
+
+		gv11b_fb_handle_dropped_mmu_fault(g, fault_status);
+
+		gv11b_gmmu_handle_other_fault_notify(g, fault_status);
+	}
+
+	if (gv11b_fb_is_fault_buf_enabled(g, NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX)) {
+
+		if ((niso_intr &
+		     fb_niso_intr_mmu_nonreplayable_fault_notify_m()) != 0U) {
+
+			gv11b_gmmu_handle_mmu_nonreplay_replay_fault(g,
+					fault_status,
+					NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX);
+
+			/*
+			 * When all the faults are processed,
+			 * GET and PUT will have same value and mmu fault status
+			 * bit will be reset by HW
+			 */
+		}
+		if ((niso_intr &
+		     fb_niso_intr_mmu_nonreplayable_fault_overflow_m()) != 0U) {
+
+			gv11b_fb_handle_nonreplay_fault_overflow(g,
+				 fault_status);
+		}
+
+	}
+
+	if (gv11b_fb_is_fault_buf_enabled(g, NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX)) {
+
+		if ((niso_intr &
+		     fb_niso_intr_mmu_replayable_fault_notify_m()) != 0U) {
+
+			gv11b_gmmu_handle_mmu_nonreplay_replay_fault(g,
+					fault_status,
+					NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX);
+		}
+		if ((niso_intr &
+		     fb_niso_intr_mmu_replayable_fault_overflow_m()) != 0U) {
+
+			gv11b_fb_handle_replay_fault_overflow(g,
+				 fault_status);
+		}
+
+	}
+
+	nvgpu_log(g, gpu_dbg_intr, "clear mmu fault status");
+	g->ops.fb.write_mmu_fault_status(g,
+			fb_mmu_fault_status_valid_clear_f());
+}
+
+u32 gv11b_fb_get_replay_cancel_global_val(struct gk20a *g)
+{
+	return fb_mmu_invalidate_replay_cancel_global_f();
+}
+
+u32 gv11b_fb_get_replay_start_ack_all(struct gk20a *g)
+{
+	return fb_mmu_invalidate_replay_start_ack_all_f();
+}
+
+int gv11b_fb_mmu_invalidate_replay(struct gk20a *g,
+			 u32 invalidate_replay_val)
+{
+	int err = -ETIMEDOUT;
+	u32 reg_val;
+	struct nvgpu_timeout timeout;
+
+	nvgpu_log_fn(g, " ");
+
+	nvgpu_mutex_acquire(&g->mm.tlb_lock);
+
+	reg_val = nvgpu_readl(g, fb_mmu_invalidate_r());
+
+	reg_val |= fb_mmu_invalidate_all_va_true_f() |
+		fb_mmu_invalidate_all_pdb_true_f() |
+		invalidate_replay_val |
+		fb_mmu_invalidate_trigger_true_f();
+
+	nvgpu_writel(g, fb_mmu_invalidate_r(), reg_val);
+
+	/* retry 200 times */
+	nvgpu_timeout_init(g, &timeout, 200U, NVGPU_TIMER_RETRY_TIMER);
+	do {
+		reg_val = nvgpu_readl(g, fb_mmu_ctrl_r());
+		if (fb_mmu_ctrl_pri_fifo_empty_v(reg_val) !=
+			fb_mmu_ctrl_pri_fifo_empty_false_f()) {
+			err = 0;
+			break;
+		}
+		nvgpu_udelay(5);
+	} while (nvgpu_timeout_expired_msg(&timeout,
+			    "invalidate replay failed on 0x%llx") == 0);
+	if (err != 0) {
+		nvgpu_err(g, "invalidate replay timedout");
+	}
+
+	nvgpu_mutex_release(&g->mm.tlb_lock);
+
+	return err;
+}
diff --git a/drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.h b/drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.h
new file mode 100644
index 000000000..1138981b3
--- /dev/null
+++ b/drivers/gpu/nvgpu/hal/fb/fb_mmu_fault_gv11b.h
@@ -0,0 +1,80 @@
+/*
+ * Copyright (c) 2016-2019, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software"),
+ * to deal in the Software without restriction, including without limitation
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included in
+ * all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
+ * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
+ * DEALINGS IN THE SOFTWARE.
+ */
+
+#ifndef NVGPU_FB_MMU_FAULT_GV11B_H
+#define NVGPU_FB_MMU_FAULT_GV11B_H
+
+#include <nvgpu/types.h>
+
+struct gk20a;
+struct mmu_fault_info;
+
+bool gv11b_fb_is_fault_buf_enabled(struct gk20a *g, u32 index);
+void gv11b_fb_fault_buffer_get_ptr_update(struct gk20a *g,
+		 u32 index, u32 next);
+u32  gv11b_fb_fault_buffer_size_val(struct gk20a *g, u32 index);
+bool gv11b_fb_is_fault_buffer_empty(struct gk20a *g,
+		 u32 index, u32 *get_idx);
+void gv11b_fb_fault_buf_set_state_hw(struct gk20a *g,
+		 u32 index, u32 state);
+void gv11b_fb_fault_buf_configure_hw(struct gk20a *g, u32 index);
+
+void gv11b_mm_copy_from_fault_snap_reg(struct gk20a *g,
+		u32 fault_status, struct mmu_fault_info *mmufault);
+void gv11b_fb_handle_mmu_fault(struct gk20a *g, u32 niso_intr);
+void gv11b_fb_handle_dropped_mmu_fault(struct gk20a *g, u32 fault_status);
+void gv11b_fb_handle_nonreplay_fault_overflow(struct gk20a *g,
+		 u32 fault_status);
+void gv11b_fb_handle_replay_fault_overflow(struct gk20a *g,
+		 u32 fault_status);
+void gv11b_fb_handle_replayable_mmu_fault(struct gk20a *g);
+void gv11b_fb_handle_bar2_fault(struct gk20a *g,
+		struct mmu_fault_info *mmufault, u32 fault_status);
+
+int  gv11b_fb_mmu_invalidate_replay(struct gk20a *g,
+		u32 invalidate_replay_val);
+int  gv11b_fb_replay_or_cancel_faults(struct gk20a *g,
+		u32 invalidate_replay_val);
+void gv11b_fb_mmu_fault_info_dump(struct gk20a *g,
+		struct mmu_fault_info *mmufault);
+
+void gv11b_fb_write_mmu_fault_buffer_lo_hi(struct gk20a *g, u32 index,
+		u32 addr_lo, u32 addr_hi);
+u32  gv11b_fb_read_mmu_fault_buffer_get(struct gk20a *g, u32 index);
+void fb_gv11b_write_mmu_fault_buffer_get(struct gk20a *g, u32 index,
+		u32 reg_val);
+u32  gv11b_fb_read_mmu_fault_buffer_put(struct gk20a *g, u32 index);
+u32  gv11b_fb_read_mmu_fault_buffer_size(struct gk20a *g, u32 index);
+void gv11b_fb_write_mmu_fault_buffer_size(struct gk20a *g, u32 index,
+		u32 reg_val);
+void gv11b_fb_read_mmu_fault_addr_lo_hi(struct gk20a *g,
+		u32 *addr_lo, u32 *addr_hi);
+void gv11b_fb_read_mmu_fault_inst_lo_hi(struct gk20a *g,
+		u32 *inst_lo, u32 *inst_hi);
+u32  gv11b_fb_read_mmu_fault_info(struct gk20a *g);
+u32  gv11b_fb_read_mmu_fault_status(struct gk20a *g);
+void gv11b_fb_write_mmu_fault_status(struct gk20a *g, u32 reg_val);
+
+u32 gv11b_fb_get_replay_cancel_global_val(struct gk20a *g);
+u32 gv11b_fb_get_replay_start_ack_all(struct gk20a *g);
+
+#endif /* NVGPU_FB_MMU_FAULT_GV11B_H */
diff --git a/drivers/gpu/nvgpu/hal/fb/fb_tu104.c b/drivers/gpu/nvgpu/hal/fb/fb_tu104.c
index 300ce1a4f..932016a95 100644
--- a/drivers/gpu/nvgpu/hal/fb/fb_tu104.c
+++ b/drivers/gpu/nvgpu/hal/fb/fb_tu104.c
@@ -32,6 +32,8 @@
 #include <nvgpu/bug.h>
 
 #include "hal/fb/fb_gv11b.h"
+#include "hal/fb/fb_mmu_fault_gv11b.h"
+#include "hal/mm/gmmu/gmmu_mmu_fault_gv11b.h"
 #include "hal/fb/fb_gv100.h"
 #include "hal/mc/mc_tu104.h"
 
@@ -59,7 +61,7 @@ void tu104_fb_handle_mmu_fault(struct gk20a *g)
 			fb_mmu_int_vector_info_fault_vector_v(info_fault));
 
 		gv11b_fb_handle_dropped_mmu_fault(g, fault_status);
-		gv11b_fb_handle_other_fault_notify(g, fault_status);
+		gv11b_gmmu_handle_other_fault_notify(g, fault_status);
 	}
 
 	if (gv11b_fb_is_fault_buf_enabled(g,
@@ -69,7 +71,7 @@ void tu104_fb_handle_mmu_fault(struct gk20a *g)
 			intr_tu104_intr_clear_leaf_vector(g,
 				fb_mmu_int_vector_fault_notify_v(nonreplay_fault));
 
-			gv11b_fb_handle_mmu_nonreplay_replay_fault(g,
+			gv11b_gmmu_handle_mmu_nonreplay_replay_fault(g,
 					fault_status,
 					NVGPU_FB_MMU_FAULT_NONREPLAY_REG_INDEX);
 
@@ -97,7 +99,7 @@ void tu104_fb_handle_mmu_fault(struct gk20a *g)
 			intr_tu104_intr_clear_leaf_vector(g,
 				fb_mmu_int_vector_fault_notify_v(replay_fault));
 
-			gv11b_fb_handle_mmu_nonreplay_replay_fault(g,
+			gv11b_gmmu_handle_mmu_nonreplay_replay_fault(g,
 					fault_status,
 					NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX);
 		}
diff --git a/drivers/gpu/nvgpu/hal/fb/intr/fb_intr_gv11b.c b/drivers/gpu/nvgpu/hal/fb/intr/fb_intr_gv11b.c
index b8d2a326d..e027f06f7 100644
--- a/drivers/gpu/nvgpu/hal/fb/intr/fb_intr_gv11b.c
+++ b/drivers/gpu/nvgpu/hal/fb/intr/fb_intr_gv11b.c
@@ -27,6 +27,7 @@
 #include <nvgpu/gk20a.h>
 
 #include "hal/fb/fb_gv11b.h"
+#include "hal/fb/fb_mmu_fault_gv11b.h"
 
 #include "fb_intr_gv11b.h"
 #include "fb_intr_ecc_gv11b.h"
diff --git a/drivers/gpu/nvgpu/hal/init/hal_gv100.c b/drivers/gpu/nvgpu/hal/init/hal_gv100.c
index d63104706..f5add5f89 100644
--- a/drivers/gpu/nvgpu/hal/init/hal_gv100.c
+++ b/drivers/gpu/nvgpu/hal/init/hal_gv100.c
@@ -54,6 +54,7 @@
 #include "hal/fb/fb_gp106.h"
 #include "hal/fb/fb_gv11b.h"
 #include "hal/fb/fb_gv100.h"
+#include "hal/fb/fb_mmu_fault_gv11b.h"
 #include "hal/fb/intr/fb_intr_gv100.h"
 #include "hal/fb/intr/fb_intr_gv11b.h"
 #include "hal/fuse/fuse_gm20b.h"
@@ -836,22 +837,22 @@ static const struct gpu_ops gv100_ops = {
 		.init_nvlink = gv100_fb_init_nvlink,
 		.enable_nvlink = gv100_fb_enable_nvlink,
 		.write_mmu_fault_buffer_lo_hi =
-				fb_gv11b_write_mmu_fault_buffer_lo_hi,
+				gv11b_fb_write_mmu_fault_buffer_lo_hi,
 		.write_mmu_fault_buffer_get =
 				fb_gv11b_write_mmu_fault_buffer_get,
 		.write_mmu_fault_buffer_size =
-				fb_gv11b_write_mmu_fault_buffer_size,
-		.write_mmu_fault_status = fb_gv11b_write_mmu_fault_status,
+				gv11b_fb_write_mmu_fault_buffer_size,
+		.write_mmu_fault_status = gv11b_fb_write_mmu_fault_status,
 		.read_mmu_fault_buffer_get =
-				fb_gv11b_read_mmu_fault_buffer_get,
+				gv11b_fb_read_mmu_fault_buffer_get,
 		.read_mmu_fault_buffer_put =
-				fb_gv11b_read_mmu_fault_buffer_put,
+				gv11b_fb_read_mmu_fault_buffer_put,
 		.read_mmu_fault_buffer_size =
-				fb_gv11b_read_mmu_fault_buffer_size,
-		.read_mmu_fault_addr_lo_hi = fb_gv11b_read_mmu_fault_addr_lo_hi,
-		.read_mmu_fault_inst_lo_hi = fb_gv11b_read_mmu_fault_inst_lo_hi,
-		.read_mmu_fault_info = fb_gv11b_read_mmu_fault_info,
-		.read_mmu_fault_status = fb_gv11b_read_mmu_fault_status,
+				gv11b_fb_read_mmu_fault_buffer_size,
+		.read_mmu_fault_addr_lo_hi = gv11b_fb_read_mmu_fault_addr_lo_hi,
+		.read_mmu_fault_inst_lo_hi = gv11b_fb_read_mmu_fault_inst_lo_hi,
+		.read_mmu_fault_info = gv11b_fb_read_mmu_fault_info,
+		.read_mmu_fault_status = gv11b_fb_read_mmu_fault_status,
 		.mmu_invalidate_replay = gv11b_fb_mmu_invalidate_replay,
 		.is_fault_buf_enabled = gv11b_fb_is_fault_buf_enabled,
 		.fault_buf_set_state_hw = gv11b_fb_fault_buf_set_state_hw,
diff --git a/drivers/gpu/nvgpu/hal/init/hal_gv11b.c b/drivers/gpu/nvgpu/hal/init/hal_gv11b.c
index e37e365a6..758614a5e 100644
--- a/drivers/gpu/nvgpu/hal/init/hal_gv11b.c
+++ b/drivers/gpu/nvgpu/hal/init/hal_gv11b.c
@@ -59,6 +59,7 @@
 #include "hal/fb/fb_gm20b.h"
 #include "hal/fb/fb_gp10b.h"
 #include "hal/fb/fb_gv11b.h"
+#include "hal/fb/fb_mmu_fault_gv11b.h"
 #include "hal/fb/intr/fb_intr_gv11b.h"
 #include "hal/fuse/fuse_gm20b.h"
 #include "hal/fuse/fuse_gp10b.h"
@@ -808,22 +809,22 @@ static const struct gpu_ops gv11b_ops = {
 		.handle_replayable_fault = gv11b_fb_handle_replayable_mmu_fault,
 		.mem_unlock = NULL,
 		.write_mmu_fault_buffer_lo_hi =
-				fb_gv11b_write_mmu_fault_buffer_lo_hi,
+				gv11b_fb_write_mmu_fault_buffer_lo_hi,
 		.write_mmu_fault_buffer_get =
 				fb_gv11b_write_mmu_fault_buffer_get,
 		.write_mmu_fault_buffer_size =
-				fb_gv11b_write_mmu_fault_buffer_size,
-		.write_mmu_fault_status = fb_gv11b_write_mmu_fault_status,
+				gv11b_fb_write_mmu_fault_buffer_size,
+		.write_mmu_fault_status = gv11b_fb_write_mmu_fault_status,
 		.read_mmu_fault_buffer_get =
-				fb_gv11b_read_mmu_fault_buffer_get,
+				gv11b_fb_read_mmu_fault_buffer_get,
 		.read_mmu_fault_buffer_put =
-				fb_gv11b_read_mmu_fault_buffer_put,
+				gv11b_fb_read_mmu_fault_buffer_put,
 		.read_mmu_fault_buffer_size =
-				fb_gv11b_read_mmu_fault_buffer_size,
-		.read_mmu_fault_addr_lo_hi = fb_gv11b_read_mmu_fault_addr_lo_hi,
-		.read_mmu_fault_inst_lo_hi = fb_gv11b_read_mmu_fault_inst_lo_hi,
-		.read_mmu_fault_info = fb_gv11b_read_mmu_fault_info,
-		.read_mmu_fault_status = fb_gv11b_read_mmu_fault_status,
+				gv11b_fb_read_mmu_fault_buffer_size,
+		.read_mmu_fault_addr_lo_hi = gv11b_fb_read_mmu_fault_addr_lo_hi,
+		.read_mmu_fault_inst_lo_hi = gv11b_fb_read_mmu_fault_inst_lo_hi,
+		.read_mmu_fault_info = gv11b_fb_read_mmu_fault_info,
+		.read_mmu_fault_status = gv11b_fb_read_mmu_fault_status,
 		.mmu_invalidate_replay = gv11b_fb_mmu_invalidate_replay,
 		.is_fault_buf_enabled = gv11b_fb_is_fault_buf_enabled,
 		.fault_buf_set_state_hw = gv11b_fb_fault_buf_set_state_hw,
diff --git a/drivers/gpu/nvgpu/hal/init/hal_tu104.c b/drivers/gpu/nvgpu/hal/init/hal_tu104.c
index 447b20dd1..40e2998d4 100644
--- a/drivers/gpu/nvgpu/hal/init/hal_tu104.c
+++ b/drivers/gpu/nvgpu/hal/init/hal_tu104.c
@@ -57,6 +57,7 @@
 #include "hal/fb/fb_gv11b.h"
 #include "hal/fb/fb_gv100.h"
 #include "hal/fb/fb_tu104.h"
+#include "hal/fb/fb_mmu_fault_gv11b.h"
 #include "hal/fb/intr/fb_intr_tu104.h"
 #include "hal/ptimer/ptimer_gk20a.h"
 #include "hal/regops/regops_tu104.h"
diff --git a/drivers/gpu/nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.c b/drivers/gpu/nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.c
new file mode 100644
index 000000000..16cbe5dc2
--- /dev/null
+++ b/drivers/gpu/nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.c
@@ -0,0 +1,596 @@
+/*
+ * Copyright (c) 2016-2019, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software"),
+ * to deal in the Software without restriction, including without limitation
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included in
+ * all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
+ * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
+ * DEALINGS IN THE SOFTWARE.
+ */
+
+#include <nvgpu/dma.h>
+#include <nvgpu/log.h>
+#include <nvgpu/enabled.h>
+#include <nvgpu/gmmu.h>
+#include <nvgpu/barrier.h>
+#include <nvgpu/bug.h>
+#include <nvgpu/soc.h>
+#include <nvgpu/ptimer.h>
+#include <nvgpu/io.h>
+#include <nvgpu/utils.h>
+#include <nvgpu/timers.h>
+#include <nvgpu/fifo.h>
+#include <nvgpu/gk20a.h>
+#include <nvgpu/channel.h>
+#include <nvgpu/tsg.h>
+#include <nvgpu/nvgpu_err.h>
+#include <nvgpu/ltc.h>
+#include <nvgpu/rc.h>
+
+#include <hal/fb/fb_mmu_fault_gv11b.h>
+#include <hal/mm/gmmu/gmmu_mmu_fault_gv11b.h>
+
+#include "gk20a/mm_gk20a.h"
+
+#include <nvgpu/hw/gv11b/hw_gmmu_gv11b.h>
+
+static int gv11b_fb_fix_page_fault(struct gk20a *g,
+		 struct mmu_fault_info *mmufault);
+
+static const char * const invalid_str = "invalid";
+
+static const char *const gv11b_fault_type_descs[] = {
+	"invalid pde",
+	"invalid pde size",
+	"invalid pte",
+	"limit violation",
+	"unbound inst block",
+	"priv violation",
+	"write",
+	"read",
+	"pitch mask violation",
+	"work creation",
+	"unsupported aperture",
+	"compression failure",
+	"unsupported kind",
+	"region violation",
+	"poison",
+	"atomic"
+};
+
+static const char *const gv11b_fault_client_type_descs[] = {
+	"gpc",
+	"hub",
+};
+
+static const char *const gv11b_hub_client_descs[] = {
+	"vip", "ce0", "ce1", "dniso", "fe", "fecs", "host", "host cpu",
+	"host cpu nb", "iso", "mmu", "nvdec", "nvenc1", "nvenc2",
+	"niso", "p2p", "pd", "perf", "pmu", "raster twod", "scc",
+	"scc nb", "sec", "ssync", "gr copy", "xv", "mmu nb",
+	"nvenc", "d falcon", "sked", "a falcon", "hsce0", "hsce1",
+	"hsce2", "hsce3", "hsce4", "hsce5", "hsce6", "hsce7", "hsce8",
+	"hsce9", "hshub", "ptp x0", "ptp x1", "ptp x2", "ptp x3",
+	"ptp x4", "ptp x5", "ptp x6", "ptp x7", "vpr scrubber0",
+	"vpr scrubber1", "dwbif", "fbfalcon", "ce shim", "gsp",
+	"dont care"
+};
+
+static const char *const gv11b_gpc_client_descs[] = {
+	"t1 0", "t1 1", "t1 2", "t1 3",
+	"t1 4", "t1 5", "t1 6", "t1 7",
+	"pe 0", "pe 1", "pe 2", "pe 3",
+	"pe 4", "pe 5", "pe 6", "pe 7",
+	"rast", "gcc", "gpccs",
+	"prop 0", "prop 1", "prop 2", "prop 3",
+	"gpm",
+	"ltp utlb 0", "ltp utlb 1", "ltp utlb 2", "ltp utlb 3",
+	"ltp utlb 4", "ltp utlb 5", "ltp utlb 6", "ltp utlb 7",
+	"utlb",
+	"t1 8", "t1 9", "t1 10", "t1 11",
+	"t1 12", "t1 13", "t1 14", "t1 15",
+	"tpccs 0", "tpccs 1", "tpccs 2", "tpccs 3",
+	"tpccs 4", "tpccs 5", "tpccs 6", "tpccs 7",
+	"pe 8", "pe 9", "tpccs 8", "tpccs 9",
+	"t1 16", "t1 17", "t1 18", "t1 19",
+	"pe 10", "pe 11", "tpccs 10", "tpccs 11",
+	"t1 20", "t1 21", "t1 22", "t1 23",
+	"pe 12", "pe 13", "tpccs 12", "tpccs 13",
+	"t1 24", "t1 25", "t1 26", "t1 27",
+	"pe 14", "pe 15", "tpccs 14", "tpccs 15",
+	"t1 28", "t1 29", "t1 30", "t1 31",
+	"pe 16", "pe 17", "tpccs 16", "tpccs 17",
+	"t1 32", "t1 33", "t1 34", "t1 35",
+	"pe 18", "pe 19", "tpccs 18", "tpccs 19",
+	"t1 36", "t1 37", "t1 38", "t1 39",
+};
+
+void gv11b_gmmu_parse_mmu_fault_info(struct mmu_fault_info *mmufault)
+{
+	if (mmufault->fault_type >= ARRAY_SIZE(gv11b_fault_type_descs)) {
+		nvgpu_do_assert();
+		mmufault->fault_type_desc =  invalid_str;
+	} else {
+		mmufault->fault_type_desc =
+			 gv11b_fault_type_descs[mmufault->fault_type];
+	}
+
+	if (mmufault->client_type >=
+			ARRAY_SIZE(gv11b_fault_client_type_descs)) {
+		nvgpu_do_assert();
+		mmufault->client_type_desc = invalid_str;
+	} else {
+		mmufault->client_type_desc =
+			 gv11b_fault_client_type_descs[mmufault->client_type];
+	}
+
+	mmufault->client_id_desc = invalid_str;
+	if (mmufault->client_type == gmmu_fault_client_type_hub_v()) {
+		if (!(mmufault->client_id >=
+				 ARRAY_SIZE(gv11b_hub_client_descs))) {
+			mmufault->client_id_desc =
+				 gv11b_hub_client_descs[mmufault->client_id];
+		} else {
+			nvgpu_do_assert();
+		}
+	} else if (mmufault->client_type ==
+			gmmu_fault_client_type_gpc_v()) {
+		if (!(mmufault->client_id >=
+				 ARRAY_SIZE(gv11b_gpc_client_descs))) {
+			mmufault->client_id_desc =
+				 gv11b_gpc_client_descs[mmufault->client_id];
+		} else {
+			nvgpu_do_assert();
+		}
+	}
+}
+
+/*
+ *Fault buffer format
+ *
+ * 31    28     24 23           16 15            8 7     4       0
+ *.-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-.
+ *|              inst_lo                  |0 0|apr|0 0 0 0 0 0 0 0|
+ *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
+ *|                             inst_hi                           |
+ *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
+ *|              addr_31_12               |                   |AP |
+ *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
+ *|                            addr_63_32                         |
+ *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
+ *|                          timestamp_lo                         |
+ *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
+ *|                          timestamp_hi                         |
+ *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
+ *|                           (reserved)        |    engine_id    |
+ *`-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-'
+ *|V|R|P|  gpc_id |0 0 0|t|0|acctp|0|   client    |RF0 0|faulttype|
+ */
+
+static void gv11b_fb_copy_from_hw_fault_buf(struct gk20a *g,
+	 struct nvgpu_mem *mem, u32 offset, struct mmu_fault_info *mmufault)
+{
+	u32 rd32_val;
+	u32 addr_lo, addr_hi;
+	u64 inst_ptr;
+	u32 chid = FIFO_INVAL_CHANNEL_ID;
+	struct channel_gk20a *refch;
+
+	(void) memset(mmufault, 0, sizeof(*mmufault));
+
+	rd32_val = nvgpu_mem_rd32(g, mem, offset +
+			 gmmu_fault_buf_entry_inst_lo_w());
+	addr_lo = gmmu_fault_buf_entry_inst_lo_v(rd32_val);
+	addr_lo = addr_lo << gmmu_fault_buf_entry_inst_lo_b();
+
+	addr_hi = nvgpu_mem_rd32(g, mem, offset +
+				 gmmu_fault_buf_entry_inst_hi_w());
+	addr_hi = gmmu_fault_buf_entry_inst_hi_v(addr_hi);
+
+	inst_ptr = hi32_lo32_to_u64(addr_hi, addr_lo);
+
+	/* refch will be put back after fault is handled */
+	refch = nvgpu_channel_refch_from_inst_ptr(g, inst_ptr);
+	if (refch != NULL) {
+		chid = refch->chid;
+	}
+
+	/* it is ok to continue even if refch is NULL */
+	mmufault->refch = refch;
+	mmufault->chid = chid;
+	mmufault->inst_ptr = inst_ptr;
+	mmufault->inst_aperture =
+		gmmu_fault_buf_entry_inst_aperture_v(rd32_val);
+
+	rd32_val = nvgpu_mem_rd32(g, mem, offset +
+			 gmmu_fault_buf_entry_addr_lo_w());
+
+	mmufault->fault_addr_aperture =
+		gmmu_fault_buf_entry_addr_phys_aperture_v(rd32_val);
+	addr_lo = gmmu_fault_buf_entry_addr_lo_v(rd32_val);
+	addr_lo = addr_lo << gmmu_fault_buf_entry_addr_lo_b();
+
+	rd32_val = nvgpu_mem_rd32(g, mem, offset +
+			 gmmu_fault_buf_entry_addr_hi_w());
+	addr_hi = gmmu_fault_buf_entry_addr_hi_v(rd32_val);
+	mmufault->fault_addr = hi32_lo32_to_u64(addr_hi, addr_lo);
+
+	rd32_val = nvgpu_mem_rd32(g, mem, offset +
+			 gmmu_fault_buf_entry_timestamp_lo_w());
+	mmufault->timestamp_lo =
+		 gmmu_fault_buf_entry_timestamp_lo_v(rd32_val);
+
+	rd32_val = nvgpu_mem_rd32(g, mem, offset +
+			 gmmu_fault_buf_entry_timestamp_hi_w());
+	mmufault->timestamp_hi =
+		 gmmu_fault_buf_entry_timestamp_hi_v(rd32_val);
+
+	rd32_val = nvgpu_mem_rd32(g, mem, offset +
+			 gmmu_fault_buf_entry_engine_id_w());
+
+	mmufault->mmu_engine_id =
+		 gmmu_fault_buf_entry_engine_id_v(rd32_val);
+	nvgpu_engine_mmu_fault_id_to_eng_ve_pbdma_id(g, mmufault->mmu_engine_id,
+		 &mmufault->faulted_engine, &mmufault->faulted_subid,
+		 &mmufault->faulted_pbdma);
+
+	rd32_val = nvgpu_mem_rd32(g, mem, offset +
+			gmmu_fault_buf_entry_fault_type_w());
+	mmufault->client_id =
+		 gmmu_fault_buf_entry_client_v(rd32_val);
+	mmufault->replayable_fault =
+		(gmmu_fault_buf_entry_replayable_fault_v(rd32_val) ==
+			gmmu_fault_buf_entry_replayable_fault_true_v());
+
+	mmufault->fault_type =
+		 gmmu_fault_buf_entry_fault_type_v(rd32_val);
+	mmufault->access_type =
+		 gmmu_fault_buf_entry_access_type_v(rd32_val);
+
+	mmufault->client_type =
+		gmmu_fault_buf_entry_mmu_client_type_v(rd32_val);
+
+	mmufault->gpc_id =
+		 gmmu_fault_buf_entry_gpc_id_v(rd32_val);
+	mmufault->protected_mode =
+		gmmu_fault_buf_entry_protected_mode_v(rd32_val);
+
+	mmufault->replay_fault_en =
+		gmmu_fault_buf_entry_replayable_fault_en_v(rd32_val);
+
+	mmufault->valid = (gmmu_fault_buf_entry_valid_v(rd32_val) ==
+				gmmu_fault_buf_entry_valid_true_v());
+
+	rd32_val = nvgpu_mem_rd32(g, mem, offset +
+			gmmu_fault_buf_entry_fault_type_w());
+	rd32_val &= ~(gmmu_fault_buf_entry_valid_m());
+	nvgpu_mem_wr32(g, mem, offset + gmmu_fault_buf_entry_valid_w(),
+					 rd32_val);
+
+	gv11b_gmmu_parse_mmu_fault_info(mmufault);
+}
+
+void gv11b_gmmu_handle_mmu_fault_common(struct gk20a *g,
+		 struct mmu_fault_info *mmufault, u32 *invalidate_replay_val)
+{
+	unsigned int id_type = ID_TYPE_UNKNOWN;
+	u32 num_lce, act_eng_bitmask = 0U;
+	int err = 0;
+	u32 id = FIFO_INVAL_TSG_ID;
+	unsigned int rc_type = RC_TYPE_NO_RC;
+	struct tsg_gk20a *tsg = NULL;
+
+	if (!mmufault->valid) {
+		return;
+	}
+
+	gv11b_fb_mmu_fault_info_dump(g, mmufault);
+
+	num_lce = g->ops.top.get_num_lce(g);
+	if ((mmufault->mmu_engine_id >=
+			gmmu_fault_mmu_eng_id_ce0_v()) &&
+			(mmufault->mmu_engine_id <
+			gmmu_fault_mmu_eng_id_ce0_v() + num_lce)) {
+		/* CE page faults are not reported as replayable */
+		nvgpu_log(g, gpu_dbg_intr, "CE Faulted");
+		err = gv11b_fb_fix_page_fault(g, mmufault);
+
+		if (mmufault->refch != NULL) {
+			tsg = tsg_gk20a_from_ch(mmufault->refch);
+			nvgpu_tsg_reset_faulted_eng_pbdma(g, tsg, true, true);
+		}
+		if (err == 0) {
+			nvgpu_log(g, gpu_dbg_intr, "CE Page Fault Fixed");
+			*invalidate_replay_val = 0;
+			if (mmufault->refch != NULL) {
+				gk20a_channel_put(mmufault->refch);
+				mmufault->refch = NULL;
+			}
+			return;
+		}
+		/* Do recovery */
+		nvgpu_log(g, gpu_dbg_intr, "CE Page Fault Not Fixed");
+	}
+
+	if (!mmufault->replayable_fault) {
+		if (mmufault->fault_type ==
+				gmmu_fault_type_unbound_inst_block_v()) {
+		/*
+		 * Bug 1847172: When an engine faults due to an unbound
+		 * instance block, the fault cannot be isolated to a
+		 * single context so we need to reset the entire runlist
+		 */
+			rc_type = RC_TYPE_MMU_FAULT;
+
+		} else if (mmufault->refch != NULL) {
+			if (mmufault->refch->mmu_nack_handled) {
+				/*
+				 * We have already recovered for the same
+				 * context, skip doing another recovery.
+				 */
+				mmufault->refch->mmu_nack_handled = false;
+				/*
+				 * Recovery path can be entered twice for the
+				 * same error in case of mmu nack. If mmu
+				 * nack interrupt is handled before mmu fault
+				 * then channel reference is increased to avoid
+				 * closing the channel by userspace. Decrement
+				 * channel reference.
+				 */
+				gk20a_channel_put(mmufault->refch);
+				/*
+				 * refch in mmufault is assigned at the time
+				 * of copying fault info from snap reg or bar2
+				 * fault buf.
+				 */
+				gk20a_channel_put(mmufault->refch);
+				return;
+			} else {
+				/*
+				 * Indicate recovery is handled if mmu fault is
+				 * a result of mmu nack.
+				 */
+				mmufault->refch->mmu_nack_handled = true;
+			}
+
+			tsg = tsg_gk20a_from_ch(mmufault->refch);
+			if (tsg != NULL) {
+				id = mmufault->refch->tsgid;
+				id_type = ID_TYPE_TSG;
+				rc_type = RC_TYPE_MMU_FAULT;
+			} else {
+				nvgpu_err(g, "chid: %d is referenceable but "
+						"not bound to tsg",
+						mmufault->refch->chid);
+				id_type = ID_TYPE_CHANNEL;
+				rc_type = RC_TYPE_NO_RC;
+			}
+		}
+
+		/* engine is faulted */
+		if (mmufault->faulted_engine != FIFO_INVAL_ENGINE_ID) {
+			act_eng_bitmask = BIT32(mmufault->faulted_engine);
+			rc_type = RC_TYPE_MMU_FAULT;
+		}
+
+		/*
+		 * refch in mmufault is assigned at the time of copying
+		 * fault info from snap reg or bar2 fault buf
+		 */
+		if (mmufault->refch != NULL) {
+			gk20a_channel_put(mmufault->refch);
+			mmufault->refch = NULL;
+		}
+
+		if (rc_type != RC_TYPE_NO_RC) {
+			g->ops.fifo.recover(g, act_eng_bitmask,
+				id, id_type, rc_type, mmufault);
+		}
+	} else {
+		if (mmufault->fault_type == gmmu_fault_type_pte_v()) {
+			nvgpu_log(g, gpu_dbg_intr, "invalid pte! try to fix");
+			err = gv11b_fb_fix_page_fault(g, mmufault);
+			if (err != 0) {
+				*invalidate_replay_val |=
+					gv11b_fb_get_replay_cancel_global_val(g);
+			} else {
+				*invalidate_replay_val |=
+					gv11b_fb_get_replay_start_ack_all(g);
+			}
+		} else {
+			/* cancel faults other than invalid pte */
+			*invalidate_replay_val |=
+				gv11b_fb_get_replay_cancel_global_val(g);
+		}
+		/*
+		 * refch in mmufault is assigned at the time of copying
+		 * fault info from snap reg or bar2 fault buf
+		 */
+		if (mmufault->refch != NULL) {
+			gk20a_channel_put(mmufault->refch);
+			mmufault->refch = NULL;
+		}
+	}
+}
+
+void gv11b_gmmu_handle_mmu_nonreplay_replay_fault(struct gk20a *g,
+		 u32 fault_status, u32 index)
+{
+	u32 get_indx, offset, rd32_val, entries;
+	struct nvgpu_mem *mem;
+	struct mmu_fault_info *mmufault;
+	u32 invalidate_replay_val = 0U;
+	u64 prev_fault_addr =  0ULL;
+	u64 next_fault_addr =  0ULL;
+
+	if (gv11b_fb_is_fault_buffer_empty(g, index, &get_indx)) {
+		nvgpu_log(g, gpu_dbg_intr,
+			"SPURIOUS mmu fault: reg index:%d", index);
+		return;
+	}
+	nvgpu_log(g, gpu_dbg_intr, "%s MMU FAULT",
+			index == NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX ?
+					"REPLAY" : "NON-REPLAY");
+
+	nvgpu_log(g, gpu_dbg_intr, "get ptr = %d", get_indx);
+
+	mem = &g->mm.hw_fault_buf[index];
+	mmufault = &g->mm.fault_info[index];
+
+	entries = gv11b_fb_fault_buffer_size_val(g, index);
+	nvgpu_log(g, gpu_dbg_intr, "buffer num entries = %d", entries);
+
+	offset = (get_indx * gmmu_fault_buf_size_v()) / U32(sizeof(u32));
+	nvgpu_log(g, gpu_dbg_intr, "starting word offset = 0x%x", offset);
+
+	rd32_val = nvgpu_mem_rd32(g, mem,
+		 offset + gmmu_fault_buf_entry_valid_w());
+	nvgpu_log(g, gpu_dbg_intr, "entry valid offset val = 0x%x", rd32_val);
+
+	while ((rd32_val & gmmu_fault_buf_entry_valid_m()) != 0U) {
+
+		nvgpu_log(g, gpu_dbg_intr, "entry valid = 0x%x", rd32_val);
+
+		gv11b_fb_copy_from_hw_fault_buf(g, mem, offset, mmufault);
+
+		get_indx = (get_indx + 1U) % entries;
+		nvgpu_log(g, gpu_dbg_intr, "new get index = %d", get_indx);
+
+		gv11b_fb_fault_buffer_get_ptr_update(g, index, get_indx);
+
+		offset = (get_indx * gmmu_fault_buf_size_v()) /
+			 U32(sizeof(u32));
+		nvgpu_log(g, gpu_dbg_intr, "next word offset = 0x%x", offset);
+
+		rd32_val = nvgpu_mem_rd32(g, mem,
+			 offset + gmmu_fault_buf_entry_valid_w());
+
+		if (index == NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX &&
+		    mmufault->fault_addr != 0ULL) {
+			/*
+			 * fault_addr "0" is not supposed to be fixed ever.
+			 * For the first time when prev = 0, next = 0 and
+			 * fault addr is also 0 then handle_mmu_fault_common
+			 * will not be called. Fix by checking fault_addr not
+			 * equal to 0
+			 */
+			prev_fault_addr = next_fault_addr;
+			next_fault_addr = mmufault->fault_addr;
+			if (prev_fault_addr == next_fault_addr) {
+				nvgpu_log(g, gpu_dbg_intr,
+					"pte already scanned");
+				if (mmufault->refch != NULL) {
+					gk20a_channel_put(mmufault->refch);
+					mmufault->refch = NULL;
+				}
+				continue;
+			}
+		}
+
+		gv11b_gmmu_handle_mmu_fault_common(g, mmufault,
+				 &invalidate_replay_val);
+
+	}
+	if (index == NVGPU_FB_MMU_FAULT_REPLAY_REG_INDEX &&
+	    invalidate_replay_val != 0U) {
+		gv11b_fb_replay_or_cancel_faults(g, invalidate_replay_val);
+	}
+}
+
+void gv11b_gmmu_handle_other_fault_notify(struct gk20a *g,
+			 u32 fault_status)
+{
+	struct mmu_fault_info *mmufault;
+	u32 invalidate_replay_val = 0U;
+
+	mmufault = &g->mm.fault_info[NVGPU_MM_MMU_FAULT_TYPE_OTHER_AND_NONREPLAY];
+
+	gv11b_mm_copy_from_fault_snap_reg(g, fault_status, mmufault);
+
+	/* BAR2/Physical faults will not be snapped in hw fault buf */
+	if (mmufault->mmu_engine_id == gmmu_fault_mmu_eng_id_bar2_v()) {
+		nvgpu_err(g, "BAR2 MMU FAULT");
+		gv11b_fb_handle_bar2_fault(g, mmufault, fault_status);
+
+	} else if (mmufault->mmu_engine_id ==
+			gmmu_fault_mmu_eng_id_physical_v()) {
+		/* usually means VPR or out of bounds physical accesses */
+		nvgpu_err(g, "PHYSICAL MMU FAULT");
+
+	} else {
+		gv11b_gmmu_handle_mmu_fault_common(g, mmufault,
+				 &invalidate_replay_val);
+
+		if (invalidate_replay_val != 0U) {
+			gv11b_fb_replay_or_cancel_faults(g,
+					invalidate_replay_val);
+		}
+	}
+}
+
+static int gv11b_fb_fix_page_fault(struct gk20a *g,
+			 struct mmu_fault_info *mmufault)
+{
+	int err = 0;
+	u32 pte[2];
+
+	if (mmufault->refch == NULL) {
+		nvgpu_log(g, gpu_dbg_intr, "refch from mmu_fault_info is NULL");
+		return -EINVAL;
+	}
+
+	err = __nvgpu_get_pte(g,
+			mmufault->refch->vm, mmufault->fault_addr, &pte[0]);
+	if (err != 0) {
+		nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte, "pte not found");
+		return err;
+	}
+	nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
+			"pte: %#08x %#08x", pte[1], pte[0]);
+
+	if (pte[0] == 0x0U && pte[1] == 0x0U) {
+		nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
+				"pte all zeros, do not set valid");
+		return -1;
+	}
+	if ((pte[0] & gmmu_new_pte_valid_true_f()) != 0U) {
+		nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
+				"pte valid already set");
+		return -1;
+	}
+
+	pte[0] |= gmmu_new_pte_valid_true_f();
+	if ((pte[0] & gmmu_new_pte_read_only_true_f()) != 0U) {
+		pte[0] &= ~(gmmu_new_pte_read_only_true_f());
+	}
+	nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
+			"new pte: %#08x %#08x", pte[1], pte[0]);
+
+	err = __nvgpu_set_pte(g,
+			mmufault->refch->vm, mmufault->fault_addr, &pte[0]);
+	if (err != 0) {
+		nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte, "pte not fixed");
+		return err;
+	}
+	/* invalidate tlb so that GMMU does not use old cached translation */
+	g->ops.fb.tlb_invalidate(g, mmufault->refch->vm->pdb.mem);
+
+	err = __nvgpu_get_pte(g,
+			mmufault->refch->vm, mmufault->fault_addr, &pte[0]);
+	nvgpu_log(g, gpu_dbg_intr | gpu_dbg_pte,
+			"pte after tlb invalidate: %#08x %#08x",
+			pte[1], pte[0]);
+	return err;
+}
diff --git a/drivers/gpu/nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.h b/drivers/gpu/nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.h
new file mode 100644
index 000000000..7d0d54a15
--- /dev/null
+++ b/drivers/gpu/nvgpu/hal/mm/gmmu/gmmu_mmu_fault_gv11b.h
@@ -0,0 +1,37 @@
+/*
+ * Copyright (c) 2016-2019, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software"),
+ * to deal in the Software without restriction, including without limitation
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included in
+ * all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
+ * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
+ * DEALINGS IN THE SOFTWARE.
+ */
+
+#ifndef NVGPU_MM_GMMU_MMU_FAULT_GV11B_H
+#define NVGPU_MM_GMMU_MMU_FAULT_GV11B_H
+
+struct gk20a;
+struct mmu_fault_info;
+
+void gv11b_gmmu_handle_mmu_nonreplay_replay_fault(struct gk20a *g,
+		 u32 fault_status, u32 index);
+void gv11b_gmmu_handle_mmu_fault_common(struct gk20a *g,
+		 struct mmu_fault_info *mmufault, u32 *invalidate_replay_val);
+void gv11b_gmmu_handle_other_fault_notify(struct gk20a *g, u32 fault_status);
+
+void gv11b_gmmu_parse_mmu_fault_info(struct mmu_fault_info *mmufault);
+
+#endif /* NVGPU_MM_GMMU_MMU_FAULT_GV11B_H */
diff --git a/drivers/gpu/nvgpu/libnvgpu-drv.export b/drivers/gpu/nvgpu/libnvgpu-drv.export
index 4f498e5b6..9e1a43697 100644
--- a/drivers/gpu/nvgpu/libnvgpu-drv.export
+++ b/drivers/gpu/nvgpu/libnvgpu-drv.export
@@ -17,10 +17,10 @@ bitmap_set
 bug_handler_cancel
 bug_handler_register
 clear_bit
-fb_gv11b_read_mmu_fault_buffer_size
-fb_gv11b_read_mmu_fault_status
-fb_gv11b_write_mmu_fault_buffer_lo_hi
-fb_gv11b_write_mmu_fault_buffer_size
+gv11b_fb_read_mmu_fault_buffer_size
+gv11b_fb_read_mmu_fault_status
+gv11b_fb_write_mmu_fault_buffer_lo_hi
+gv11b_fb_write_mmu_fault_buffer_size
 find_first_bit
 find_first_zero_bit
 find_next_bit
diff --git a/userspace/units/mm/page_table_faults/page_table_faults.c b/userspace/units/mm/page_table_faults/page_table_faults.c
index 3853f84a8..2f1196908 100644
--- a/userspace/units/mm/page_table_faults/page_table_faults.c
+++ b/userspace/units/mm/page_table_faults/page_table_faults.c
@@ -50,6 +50,7 @@
 #include "hal/fifo/ramin_gk20a.h"
 #include "hal/fifo/ramin_gm20b.h"
 #include "hal/fifo/ramin_gp10b.h"
+#include "hal/fb/fb_mmu_fault_gv11b.h"
 
 #include <nvgpu/hw/gv11b/hw_gmmu_gv11b.h>
 #include <nvgpu/hw/gv11b/hw_fb_gv11b.h>
@@ -141,13 +142,14 @@ static int init_mm(struct unit_module *m, struct gk20a *g)
 	g->ops.fb.intr.enable = gv11b_fb_intr_enable;
 	g->ops.fb.fault_buf_configure_hw = gv11b_fb_fault_buf_configure_hw;
 	g->ops.fb.read_mmu_fault_buffer_size =
-		fb_gv11b_read_mmu_fault_buffer_size;
+		gv11b_fb_read_mmu_fault_buffer_size;
 	g->ops.fb.write_mmu_fault_buffer_size =
-		fb_gv11b_write_mmu_fault_buffer_size;
-	g->ops.fb.read_mmu_fault_status = fb_gv11b_read_mmu_fault_status;
+		gv11b_fb_write_mmu_fault_buffer_size;
+	g->ops.fb.read_mmu_fault_status = gv11b_fb_read_mmu_fault_status;
 	g->ops.fb.write_mmu_fault_buffer_lo_hi =
-		fb_gv11b_write_mmu_fault_buffer_lo_hi;
-	g->ops.fb.intr.is_mmu_fault_pending = gv11b_fb_intr_is_mmu_fault_pending;
+		gv11b_fb_write_mmu_fault_buffer_lo_hi;
+	g->ops.fb.intr.is_mmu_fault_pending =
+		gv11b_fb_intr_is_mmu_fault_pending;
 	g->ops.fb.is_fault_buf_enabled = gv11b_fb_is_fault_buf_enabled;
 	g->ops.fb.fault_buf_set_state_hw = gv11b_fb_fault_buf_set_state_hw;
 	g->ops.ramin.set_big_page_size = gm20b_ramin_set_big_page_size;