gpu: nvgpu: handle falcon copy pointer alignment for misra 11.3 deviation

Function for copying to/form IMEM/DMEM cast pointer to char to pointer to u32 since falcon data registers are read/written in 4-bytes. Firmware data is generally byte stream and hence we won't be able to deal in pointer to u32. Hence we need deviate from misra rule 11.3. Firmware data is also not aligned at word boundary sometimes hence we need to copy it byte by byte to conform to the dev- iation recommendation. Error: MISRA C-2012 Rule 11.3: ./hal/falcon/falcon_gk20a.c:296: misra_violation: The object pointer expression "src" of type "u8 *" is cast to type "u32 *". JIRA NVGPU-3271 Change-Id: Ic081f97226dbbcf08402970829624933402066eb Signed-off-by: Sagar Kamble <skamble@nvidia.com> Reviewed-on: https://git-master.nvidia.com/r/2108547 Reviewed-by: svc-mobile-coverity <svc-mobile-coverity@nvidia.com> Reviewed-by: svc-mobile-misra <svc-mobile-misra@nvidia.com> GVS: Gerrit_Virtual_Submit Reviewed-by: Mahantesh Kumbar <mkumbar@nvidia.com> Reviewed-by: Vijayakumar Subbu <vsubbu@nvidia.com> Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com> Tested-by: mobile promotions <svcmobile_promotions@nvidia.com>
2025-12-24 10:34:43 +03:00 · 2019-04-30 14:17:46 +05:30
parent 60e3d135de
commit 13a7ef2cc7
3 changed files with 100 additions and 41 deletions
--- a/drivers/gpu/nvgpu/common/utils/string.c
+++ b/drivers/gpu/nvgpu/common/utils/string.c
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2018, NVIDIA CORPORATION.  All rights reserved.
+ * Copyright (c) 2018-2019, NVIDIA CORPORATION.  All rights reserved.
 *
 * Permission is hereby granted, free of charge, to any person obtaining a
 * copy of this software and associated documentation files (the "Software"),
@@ -77,3 +77,13 @@ int nvgpu_strnadd_u32(char *dst, const u32 value, size_t size, u32 radix)

 	return n;
 }
+
+bool nvgpu_mem_is_word_aligned(struct gk20a *g, u8 *addr)
+{
+	if ((unsigned long)addr % 4UL != 0UL) {
+		nvgpu_log_info(g, "addr (%p) not 4-byte aligned", addr);
+		return false;
+	}
+
+	return true;
+}
--- a/drivers/gpu/nvgpu/hal/falcon/falcon_gk20a.c
+++ b/drivers/gpu/nvgpu/hal/falcon/falcon_gk20a.c
@@ -22,6 +22,7 @@
 #include <nvgpu/io.h>
 #include <nvgpu/gk20a.h>
 #include <nvgpu/falcon.h>
+#include <nvgpu/string.h>

 #include "falcon_gk20a.h"

@@ -175,7 +176,7 @@ int gk20a_falcon_copy_from_dmem(struct nvgpu_falcon *flcn,

 	nvgpu_log_fn(g, " src dmem offset - %x, size - %x", src, size);

-	words = size >> 2;
+	words = size >> 2U;
 	bytes = size & 0x3U;

 	addr_mask = falcon_falcon_dmemc_offs_m() |
@@ -183,19 +184,25 @@ int gk20a_falcon_copy_from_dmem(struct nvgpu_falcon *flcn,

 	src &= addr_mask;

-	gk20a_writel(g, base_addr + falcon_falcon_dmemc_r(port),
+	nvgpu_writel(g, base_addr + falcon_falcon_dmemc_r(port),
 		src | falcon_falcon_dmemc_aincr_f(1));

-	for (i = 0; i < words; i++) {
-		dst_u32[i] = gk20a_readl(g,
-			base_addr + falcon_falcon_dmemd_r(port));
+	if (unlikely(!nvgpu_mem_is_word_aligned(g, dst))) {
+		for (i = 0; i < words; i++) {
+			data = nvgpu_readl(g,
+				base_addr + falcon_falcon_dmemd_r(port));
+			nvgpu_memcpy(&dst[i * 4U], (u8 *)&data, 4);
+		}
+	} else {
+		for (i = 0; i < words; i++) {
+			dst_u32[i] = nvgpu_readl(g,
+				base_addr + falcon_falcon_dmemd_r(port));
+		}
 	}

 	if (bytes > 0U) {
-		data = gk20a_readl(g, base_addr + falcon_falcon_dmemd_r(port));
-		for (i = 0; i < bytes; i++) {
-			dst[(words << 2) + i] = ((u8 *)&data)[i];
-		}
+		data = nvgpu_readl(g, base_addr + falcon_falcon_dmemd_r(port));
+		nvgpu_memcpy(&dst[words << 2U], (u8 *)&data, bytes);
 	}

 	return 0;
@@ -212,7 +219,7 @@ int gk20a_falcon_copy_to_dmem(struct nvgpu_falcon *flcn,

 	nvgpu_log_fn(g, "dest dmem offset - %x, size - %x", dst, size);

-	words = size >> 2;
+	words = size >> 2U;
 	bytes = size & 0x3U;

 	addr_mask = falcon_falcon_dmemc_offs_m() |
@@ -220,24 +227,30 @@ int gk20a_falcon_copy_to_dmem(struct nvgpu_falcon *flcn,

 	dst &= addr_mask;

-	gk20a_writel(g, base_addr + falcon_falcon_dmemc_r(port),
+	nvgpu_writel(g, base_addr + falcon_falcon_dmemc_r(port),
 		dst | falcon_falcon_dmemc_aincw_f(1));

-	for (i = 0; i < words; i++) {
-		gk20a_writel(g,
-			base_addr + falcon_falcon_dmemd_r(port), src_u32[i]);
+	if (unlikely(!nvgpu_mem_is_word_aligned(g, src))) {
+		for (i = 0; i < words; i++) {
+			nvgpu_memcpy((u8 *)&data, &src[i * 4U], 4);
+			nvgpu_writel(g, base_addr + falcon_falcon_dmemd_r(port),
+				     data);
+		}
+	} else {
+		for (i = 0; i < words; i++) {
+			nvgpu_writel(g, base_addr + falcon_falcon_dmemd_r(port),
+				     src_u32[i]);
+		}
 	}

 	if (bytes > 0U) {
 		data = 0;
-		for (i = 0; i < bytes; i++) {
-			((u8 *)&data)[i] = src[(words << 2) + i];
-		}
-		gk20a_writel(g, base_addr + falcon_falcon_dmemd_r(port), data);
+		nvgpu_memcpy((u8 *)&data, &src[words << 2U], bytes);
+		nvgpu_writel(g, base_addr + falcon_falcon_dmemd_r(port), data);
 	}

 	size = ALIGN(size, 4);
-	data = gk20a_readl(g,
+	data = nvgpu_readl(g,
 		base_addr + falcon_falcon_dmemc_r(port)) & addr_mask;
 	if (data != ((dst + size) & addr_mask)) {
 		nvgpu_warn(g, "copy failed. bytes written %d, expected %d",
@@ -261,28 +274,34 @@ int gk20a_falcon_copy_from_imem(struct nvgpu_falcon *flcn, u32 src,

 	nvgpu_log_info(g, "download %d bytes from 0x%x", size, src);

-	words = size >> 2;
+	words = size >> 2U;
 	bytes = size & 0x3U;
 	blk = src >> 8;

 	nvgpu_log_info(g, "download %d words from 0x%x block %d",
 			words, src, blk);

-	gk20a_writel(g, base_addr + falcon_falcon_imemc_r(port),
+	nvgpu_writel(g, base_addr + falcon_falcon_imemc_r(port),
 		falcon_falcon_imemc_offs_f(src >> 2) |
 		falcon_falcon_imemc_blk_f(blk) |
 		falcon_falcon_dmemc_aincr_f(1));

-	for (i = 0; i < words; i++) {
-		dst_u32[i] = gk20a_readl(g,
-			base_addr + falcon_falcon_imemd_r(port));
+	if (unlikely(!nvgpu_mem_is_word_aligned(g, dst))) {
+		for (i = 0; i < words; i++) {
+			data = nvgpu_readl(g,
+				base_addr + falcon_falcon_imemd_r(port));
+			nvgpu_memcpy(&dst[i * 4U], (u8 *)&data, 4);
+		}
+	} else {
+		for (i = 0; i < words; i++) {
+			dst_u32[i] = nvgpu_readl(g,
+				base_addr + falcon_falcon_imemd_r(port));
+		}
 	}

 	if (bytes > 0U) {
-		data = gk20a_readl(g, base_addr + falcon_falcon_imemd_r(port));
-		for (i = 0; i < bytes; i++) {
-			dst[(words << 2) + i] = ((u8 *)&data)[i];
-		}
+		data = nvgpu_readl(g, base_addr + falcon_falcon_imemd_r(port));
+		nvgpu_memcpy(&dst[words << 2U], (u8 *)&data, bytes);
 	}

 	return 0;
@@ -295,39 +314,58 @@ int gk20a_falcon_copy_to_imem(struct nvgpu_falcon *flcn, u32 dst,
 	u32 base_addr = flcn->flcn_base;
 	u32 *src_u32 = (u32 *)src;
 	u32 words = 0;
+	u32 data = 0;
 	u32 blk = 0;
 	u32 i = 0;

 	nvgpu_log_info(g, "upload %d bytes to 0x%x", size, dst);

-	words = size >> 2;
+	words = size >> 2U;
 	blk = dst >> 8;

 	nvgpu_log_info(g, "upload %d words to 0x%x block %d, tag 0x%x",
 			words, dst, blk, tag);

-	gk20a_writel(g, base_addr + falcon_falcon_imemc_r(port),
+	nvgpu_writel(g, base_addr + falcon_falcon_imemc_r(port),
 			falcon_falcon_imemc_offs_f(dst >> 2) |
 			falcon_falcon_imemc_blk_f(blk) |
 			/* Set Auto-Increment on write */
 			falcon_falcon_imemc_aincw_f(1) |
 			falcon_falcon_imemc_secure_f(sec ? 1U : 0U));

-	for (i = 0U; i < words; i++) {
-		if (i % 64U == 0U) {
-			/* tag is always 256B aligned */
-			gk20a_writel(g, base_addr + falcon_falcon_imemt_r(0),
-				tag);
-			tag++;
-		}
+	if (unlikely(!nvgpu_mem_is_word_aligned(g, src))) {
+		for (i = 0U; i < words; i++) {
+			if (i % 64U == 0U) {
+				/* tag is always 256B aligned */
+				nvgpu_writel(g,
+					base_addr + falcon_falcon_imemt_r(0),
+					tag);
+				tag++;
+			}

-		gk20a_writel(g, base_addr + falcon_falcon_imemd_r(port),
-			src_u32[i]);
+			nvgpu_memcpy((u8 *)&data, &src[i * 4U], 4);
+			nvgpu_writel(g,
+				     base_addr + falcon_falcon_imemd_r(port),
+				     data);
+		}
+	} else {
+		for (i = 0U; i < words; i++) {
+			if (i % 64U == 0U) {
+				/* tag is always 256B aligned */
+				nvgpu_writel(g,
+					base_addr + falcon_falcon_imemt_r(0),
+					tag);
+				tag++;
+			}
+
+			nvgpu_writel(g, base_addr + falcon_falcon_imemd_r(port),
+				     src_u32[i]);
+		}
 	}

 	/* WARNING : setting remaining bytes in block to 0x0 */
 	while (i % 64U != 0U) {
-		gk20a_writel(g, base_addr + falcon_falcon_imemd_r(port), 0);
+		nvgpu_writel(g, base_addr + falcon_falcon_imemd_r(port), 0);
 		i++;
 	}

--- a/drivers/gpu/nvgpu/include/nvgpu/string.h
+++ b/drivers/gpu/nvgpu/include/nvgpu/string.h
@@ -29,6 +29,8 @@
 #include <linux/string.h>
 #endif

+struct gk20a;
+
 /**
 * nvgpu_memcpy - Copy memory buffer
 *
@@ -63,4 +65,13 @@ int nvgpu_memcmp(const u8 *b1, const u8 *b2, size_t n);
 */
 int nvgpu_strnadd_u32(char *dst, const u32 value, size_t size, u32 radix);

+/**
+ * nvgpu_mem_is_word_aligned - Check that memory address is word (4-byte)
+ * aligned.
+ *
+ * @g - struct gk20a.
+ * @addr - memory address.
+ */
+bool nvgpu_mem_is_word_aligned(struct gk20a *g, u8 *addr);
+
 #endif /* NVGPU_STRING_H */