痞子衡嵌入式:簡析i.MXRT1170 Cortex-M7 FlexRAM ECC功能特點、開啟步驟、性能影響
大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是恩智浦i.MXRT1170上Cortex-M7內(nèi)核的FlexRAM ECC功能。
ECC是“Error Correcting Code”的簡寫,ECC能夠?qū)崿F(xiàn)錯誤檢查和糾正,含有ECC功能的內(nèi)存一般稱為ECC內(nèi)存,使用了ECC內(nèi)存的系統(tǒng)在穩(wěn)定性和可靠性上得到很大提升。相比前幾代不帶ECC的i.MXRT10xx型號,新一代i.MXRT1170在ECC上做了全面武裝,從eFuse到FlexRAM,從OCRAM到外部存儲空間全都加上了ECC功能。如下表所示,不同類型的存儲由不同的ECC控制器來守護:
今天痞子衡就先給大家簡單介紹一下i.MXRT1170上Cortex-M7內(nèi)核下的FlexRAM ECC功能:
一、FlexRAM ECC功能簡介
1.1 FlexRAM v2特點
i.MXRT1170上的FlexRAM模塊是v2版本,相比i.MXRT10xx上的FlexRAM v1版本,主要就是增加了ECC功能。關(guān)于FlexRAM v1基本功能,建議你先閱讀痞子衡之前寫過的文章 《恩智浦i.MX RT1xxx系列MCU外設(shè)那些事(2)- 百變星君FlexRAM》,痞子衡今天主要聊v2新增的功能。
我們知道i.MXRT1170是Cortex-M7和Cortex-M4雙核架構(gòu),我們看下它的CM7內(nèi)核系統(tǒng)框圖,F(xiàn)lexRAM本質(zhì)上是為CM7內(nèi)核設(shè)計的,因為其管理的TCM空間僅能由CM7訪問的,不過如果將FlexRAM也分配出一部分給OCRAM,這部分OCRAM(即文章開頭memory map表里從0x20360000開始的空間)其實CM4也能正常訪問。
在框圖中你還會發(fā)現(xiàn),F(xiàn)lexRAM中物理SRAM總大小是640KB,不是我們知道的可自由配置的512KB,這是因為需要額外128KB RAM來存放ECC校驗值,關(guān)于這個細節(jié)在下一節(jié)里展開聊。
1.2 關(guān)于ECC設(shè)計細節(jié)
關(guān)于ECC,大家最早接觸的應(yīng)該是ONFI Raw NAND上的應(yīng)用,NAND Flash因為其物理特性的原因(允許壞塊的存在),必須要包含ECC功能,痞子衡寫過的一篇文章 《并行NAND接口標準(ONFI)及SLC Raw NAND簡介》, 里面的 2.6 Raw NAND壞塊與ECC 簡單介紹了ECC在Raw NAND上的應(yīng)用。
在Raw NAND上,通常是每寫入512bytes數(shù)據(jù)計算出一個ECC校驗值(4bytes),讀取時也是讀完全部512bytes數(shù)據(jù)后進行ECC校驗,ECC校驗?zāi)芰σ话阌?(n+1) bit檢錯,n bit糾錯 來表達,即這512bytes數(shù)據(jù)里如果發(fā)生n+1 bit及以下的錯誤時能夠檢查出來,如果發(fā)生n bit及以下的錯誤時,能夠自動糾正。比如典型的Micron MT29F4G08就是5-bit檢錯,4-bit糾錯。
但是FlexRAM本質(zhì)上是RAM,跟Flash(尤其是NAND)讀寫機制不一樣,RAM是隨機地址按Byte讀寫,NAND是以Page為單位順序讀寫,所以NAND上ECC實現(xiàn)機制不適用于RAM。那么FlexRAM到底采用的是什么樣的ECC設(shè)計呢?
nand_ecc.c,寫得非常經(jīng)典。
| 存儲類型 | ECC校驗數(shù)據(jù)塊大小 | ECC校驗值長度 | ECC校驗?zāi)芰?/th> |
|---|---|---|---|
| Raw NAND | 512 bytes | 4 bytes | 5-bit檢錯,4-bit糾錯 |
| FlexRAM | 4/8 bytes | 7/8 bits | 2-bit檢錯,1-bit糾錯 |
1.2.2 ECC RAM分配
128KB ECC RAM并不是只能用來存儲ECC校驗值的,其也可以當做普通OCRAM來使用,ECC RAM具體功能是根據(jù)當前FlexRAM分配以及ECC是否開啟而定的。eFuse里默認的512KB FlexRAM配置是256KB ITCM, 256KB DTCM, 沒有OCRAM。
在默認FlexRAM配置情況下,如果TCM ECC沒有開啟,那么128KB ECC RAM全部都是普通OCRAM,其地址空間如下表所示:
在默認FlexRAM配置情況下,如果TCM ECC已經(jīng)開啟,那么128KB ECC RAM全部都用來存儲ECC校驗值,這個區(qū)域僅能由FlexRAM模塊內(nèi)部訪問,用戶無法訪問這128KB區(qū)域(不在memory map空間里),畢竟ECC校驗值不能被隨便改。
如果我們在eFuse或者IOMUXC_GPR寄存器里將FlexRAM配置改掉,分配出一部分給OCRAM(比如256KB TCM, 256KB OCRAM),那這128KB ECC RAM功能分配就稍微復(fù)雜一些了。最簡單的情況是TCM和OCRAM ECC都沒有開啟,那么這128KB ECC RAM還是普通OCRAM,map地址是緊跟在FlexRAM OCRAM后面的,如下表所示:
如果TCM和OCRAM ECC都開啟了,那么這128KB ECC RAM就還是全部用來存儲ECC校驗值了,用戶無法訪問。
如果OCRAM ECC沒有開啟,不管TCM ECC是否開啟,這128KB ECC RAM中本用于存儲OCRAM ECC的區(qū)域都將被劃分為普通OCRAM,另一部分用于存儲TCM ECC的區(qū)域(無論是否真的要存儲ECC校驗值)用戶則無法訪問。區(qū)域劃分比例與OCRAM在總FlexRAM大小中占比保持一致,比如512KB FlexRAM(一共16個bank,每個bank 32KB)劃分出了256KB OCRAM,那么128KB ECC RAM(也是16個bank,每個bank 8KB)則劃出了64KB作為普通OCRAM,如下表所示:
1.2.3 ECC錯誤觸發(fā)處理
ECC錯誤分兩種,分別是1-bit錯誤和2-bit錯誤。從軟件層面來看,1-bit錯誤可以不用管,F(xiàn)lexRAM模塊會自動糾錯。我們主要處理2-bit錯誤,由于2-bit錯誤僅能檢錯,無法糾錯,所以發(fā)生了這個錯誤,就意味著讀取的數(shù)據(jù)不可靠了,需要丟棄并重新寫一次(丟棄之前可以再retry read一次看是否還是報錯)。
關(guān)于ECC錯誤處理,可根據(jù)如下FlexRAM寄存器來操作,首先當然是在INT_SIG_EN寄存器中使能multi-bit ECC Error,當有2-bit錯誤發(fā)生時,系統(tǒng)會觸發(fā)FLEXRAM_IRQn(中斷號是50),在中斷處理程序里找到相應(yīng)的ECC_MULTI_ERROR_ADDR,對這個地址重新寫一次初始化數(shù)據(jù)(按ECC校驗塊長度一次性寫入),最后清除INT_STATUS寄存器里的相應(yīng)狀態(tài)位。
需要注意的是,上述處理流程僅對FlexRAM中存放的是普通業(yè)務(wù)數(shù)據(jù)且發(fā)生ECC錯誤時有效,如果ECC錯誤發(fā)生在關(guān)鍵代碼段或變量段中,這個處理是不適用的,因為這種ECC錯誤可能會造成程序崩潰。
| Offset | Register |
|---|---|
| 10h | Interrupt Status Register (INT_STATUS) |
| 14h | Interrupt Status Enable Register (INT_STAT_EN) |
| 18h | Interrupt Enable Register (INT_SIG_EN) |
| 30h | OCRAM multi-bit ECC Error Address Register (OCRAM_ECC_MULTI_ERROR_ADDR) |
| 50h | ITCM multi-bit ECC Error Address Register (ITCM_ECC_MULTI_ERROR_ADDR) |
| 6Ch | D0TCM multi-bit ECC Error Address Register (D0TCM_ECC_MULTI_ERROR_ADDR) |
| 84h | D1TCM multi-bit ECC Error Address Register (D1TCM_ECC_MULTI_ERROR_ADDR) |
二、開啟FlexRAM ECC的步驟
FlexRAM ECC需要按照標準步驟去開啟,需要特別注意的是開啟ECC操作的代碼不能放在待開啟ECC的FlexRAM空間里(比如TCM ECC要開啟,那么開啟ECC操作的代碼不能使用任何TCM空間),因此不管是XIP還是Non-XIP應(yīng)用程序,最好是用一個二級loader(這個loader可以鏈接在固定OCRAM1/2空間里,或者XIP)來完成ECC開啟操作然后再加載應(yīng)用程序執(zhí)行。痞子衡給了如下示例loader代碼工程,代碼里主要有四個步驟:
參考代碼:https://github.com/JayHeng/cortex-m-apps/blob/master/apps/coremark_imxrt1176/cm7_loader/loader.c
2.1 使能TCM的RMW(可選)
如果需要開啟TCM ECC,那么首先需要在CM7內(nèi)核寄存器里開啟TCM RMW(Read-Modify-Write)功能,這是ARM的規(guī)定,可在 Cortex-M7 Technical RM 手冊里找到相關(guān)信息如下。手冊里明確寫了RMW位同時也控制了外部邏輯(即MCU廠商的設(shè)計)來支持ECC功能。
操作函數(shù)代碼如下:
void enable_cm7_tcm_rmw(void)
{
SCB->ITCMCR |= SCB_ITCMCR_RMW_Msk;
SCB->DTCMCR |= SCB_DTCMCR_RMW_Msk;
}
2.2 使能FlexRAM的ECC
現(xiàn)在需要開啟FlexRAM ECC,在i.MXRT1170參考手冊里的FlexRAM章節(jié)可以找到FLEXRAM_CTRL寄存器定義,其中bit5和bit4就是用來分別控制TCM和OCRAM的ECC開關(guān)。
操作函數(shù)代碼如下:
void enable_flexram_tcm_ecc(void)
{
*(uint32_t *)(FLEXRAM_BASE + 0x108) |= (1u << 5);
}
void enable_flexram_ocram_ecc(void)
{
*(uint32_t *)(FLEXRAM_BASE + 0x108) |= (1u << 4);
}
2.3 初始化FlexRAM的ECC值
FlexRAM ECC開啟了之后,此時還不能隨機訪問FlexRAM,因為初始ECC校驗值還沒有填充,如果這時候去讀FlexRAM會產(chǎn)生錯誤。我們首先需要將會用到的FlexRAM空間全部初始化一遍(就是以ECC校驗數(shù)據(jù)塊大小對齊方式從頭到尾寫入一遍,寫入內(nèi)容不限,正常用全0)。
操作函數(shù)代碼如下:
#define ITCM_START 0x00000000
#define ITCM_SIZE (256*1024U) //只是示例長度,根據(jù)實際情況修改
#define DTCM_START 0x20000000
#define DTCM_SIZE (256*1024U) //只是示例長度,根據(jù)實際情況修改
#define OCRAM_START 0x20360000
#define OCRAM_SIZE (256*1024U) //只是示例長度,根據(jù)實際情況修改
void init_flexram_itcm_ecc(void)
{
for (uint32_t i = 0; i < ITCM_SIZE; i += sizeof(uint64_t))
{
*(uint64_t *)(ITCM_START + i) = 0;
}
}
void init_flexram_dtcm_ecc(void)
{
for (uint32_t i = 0; i < DTCM_SIZE; i += sizeof(uint32_t))
{
*(uint32_t *)(DTCM_START + i) = 0;
}
}
void init_flexram_ocram_ecc(void)
{
for (uint32_t i = 0; i < OCRAM_SIZE; i += sizeof(uint64_t))
{
*(uint64_t *)(OCRAM_START + i) = 0;
}
}
2.4 加載應(yīng)用程序執(zhí)行
當FlexRAM初始ECC校驗值已經(jīng)被填充之后,此時便可以正常隨機讀寫FlexRAM了。如果此時加載的是一個在ITCM里執(zhí)行并且data段在DTCM里的應(yīng)用程序,可以參考痞子衡前面給出的示例loader工程。
這是loader工程完整主函數(shù)代碼,其中memcpy那一句代碼里的cm7_app_code是應(yīng)用程序binary數(shù)組(用Python腳本將應(yīng)用程序工程生成的.bin文件轉(zhuǎn)換成C語言數(shù)組放到loader工程源文件里)。
#define APP_START 0U
uint32_t s_appStack = 0;
uint32_t s_appEntry = 0;
typedef void (*call_function_t)(void);
call_function_t s_callFunction = 0;
int main(void)
{
enable_cm7_tcm_ecc();
enable_flexram_tcm_ecc();
init_flexram_itcm_ecc();
init_flexram_dtcm_ecc();
// Copy image to RAM.
memcpy((void *)APP_START, cm7_app_code, APP_LEN);
s_appStack = *(uint32_t *)(APP_START);
s_appEntry = *(uint32_t *)(APP_START + 4);
// Turn off interrupts.
__disable_irq();
// Set the VTOR to default.
SCB->VTOR = APP_START;
// Memory barriers for good measure.
__ISB();
__DSB();
// Set main stack pointer and process stack pointer.
__set_MSP(s_appStack);
__set_PSP(s_appStack);
// Jump to app entry point, does not return.
s_callFunction = (call_function_t)s_appEntry;
s_callFunction();
while (1);
}
三、ECC對內(nèi)存訪問性能的影響
FlexRAM開了ECC后,訪問性能會有一定降低,畢竟數(shù)據(jù)訪問中插入了額外的ECC校驗工作,不過這個影響非常小,因為一次ECC校驗僅增加1-2個機器cycle。下面是FlexRAM分配出的不同存儲類型的基本情況,其中OCRAM可以被L1 Cache加速,所以從應(yīng)用程序角度開ECC對其訪問性能影響就更小了,我們主要討論ECC對TCM性能的影響。
| FlexRAM分配類型 | ECC校驗數(shù)據(jù)塊大小 | 總線類型 | 訪問速度 | L1 Cache加速 |
|---|---|---|---|---|
| ITCM | 8 bytes | ITCM_ITF 64-bits | 與CM7同頻 | 否 |
| DTCM | 4 bytes | DTCM_ITF 2x32-bit | 與CM7同頻 | 否 |
| OCRAM | 8 bytes | AXI64 | 與CM7頻率的1/4 | 是 |
為了簡化測試,痞子衡就用經(jīng)典的benchmark程序(Coremark和Dhrystone)來測試ECC對TCM的影響,測試工程如下:
Coremark工程:https://github.com/JayHeng/cortex-m-apps/tree/master/apps/coremark_imxrt1176/bsp/build7804_cm7_loader
Dhrystone工程:https://github.com/JayHeng/cortex-m-apps/tree/master/apps/dhrystone_imxrt1176/bsp/build8402_cm7_loader
需要特別提醒的是,我們知道i.MXRT1170 CM7內(nèi)核最高可以配置到1GHz,但是開了TCM ECC后,為了保證訪問可靠性,此時CM7內(nèi)核最好是工作在800MHz,下面的benchmark結(jié)果也是在800MHz主頻下得到的:
| Benchmark類型 | TCM ECC開關(guān) | Benchmark結(jié)果 |
|---|---|---|
| coremark | 關(guān)閉 | Total ticks : 2023600 Total time (secs): 20.236000 Iterations/Sec : 3953.350465 Iterations : 80000 CoreMark 1.0 : 3953.350465 |
| coremark | 開啟 | Total ticks : 2023657 Total time (secs): 20.236570 Iterations/Sec : 3953.239111 Iterations : 80000 CoreMark 1.0 : 3953.239111 |
| dhrystone | 關(guān)閉 | Dhrystones per Second: 3622138.51 DMIPS: 2061.5472 DMIPS/MHz: 2.0698 |
| dhrystone | 開啟 | Dhrystones per Second: 3621977.04 DMIPS: 2061.4553 DMIPS/MHz: 2.0697 |
從benchmark結(jié)果來看,ECC是否開啟對性能影響特別小,可以忽略,當然benchmark測試并不是特別精確地反映了性能影響,底下有空痞子衡會再專門用memcpy函數(shù)來測試性能影響。
至此,恩智浦i.MXRT1170上Cortex-M7內(nèi)核的FlexRAM ECC功能痞子衡便介紹完畢了,掌聲在哪里~~~
歡迎訂閱
文章會同時發(fā)布到我的 博客園主頁、CSDN主頁、知乎主頁、微信公眾號 平臺上。
微信搜索"痞子衡嵌入式"或者掃描下面二維碼,就可以在手機上第一時間看了哦。

最后歡迎關(guān)注痞子衡個人微信公眾號【痞子衡嵌入式】,一個專注嵌入式技術(shù)的公眾號,跟著痞子衡一起玩轉(zhuǎn)嵌入式。
衡杰(痞子衡),目前就職于恩智浦(NXP)半導(dǎo)體MCU系統(tǒng)應(yīng)用部門,擔任高級嵌入式系統(tǒng)應(yīng)用工程師。
專欄內(nèi)所有文章的轉(zhuǎn)載請注明出處:http://www.rzrgm.cn/henjay724/
與痞子衡進一步交流或咨詢業(yè)務(wù)合作請發(fā)郵件至 hengjie1989@foxmail.com
可以關(guān)注痞子衡的Github主頁 https://github.com/JayHeng,有很多好玩的嵌入式項目。
關(guān)于專欄文章有任何疑問請直接在博客下面留言,痞子衡會及時回復(fù)免費(劃重點)答疑。
痞子衡郵箱已被私信擠爆,技術(shù)問題不推薦私信,堅持私信請先掃碼付款(5元起步)再發(fā)。
浙公網(wǎng)安備 33010602011771號