【MM32F5270开发板试用】单片机也能玩神经网络-TinyMaix实测开源
本篇文章来自极术社区与灵动组织的MM32F5270开发板评测活动,更多开发板试用活动请关注极术社区网站。作者:甴尐
MM32F5270如何在单片机上跑通一个模型
(完整代码在末尾百度网盘)
问题点
基本上集中在怎么量化,还有就是单片机前段推理框架。最重要的就是资源问题。
先贴一下TinyMaix。
宝藏仓库
TinyMaix是面向单片机的超轻量级的神经网络推理库,即TinyML推理库,可以让你在任意单片机上运行轻量级深度学习模型~
我们的设计原则:易用性 > 移植性 > 速度 > 空间
话不多说,开干~~~~
keil版本
定时器
模型都需要统计时间
/* Setup the timer. */void app_tim_init(void){ /* Set the counter counting step. */ TIM_Init_Type tim_init; tim_init.ClockFreqHz = BOARD_TIM_FREQ; tim_init.StepFreqHz = APP_TIM_UPDATE_PERIOD; /* 1s. */ tim_init.Period = 1u; tim_init.EnablePreloadPeriod = false; tim_init.PeriodMode = TIM_PeriodMode_Continuous; tim_init.CountMode = TIM_CountMode_Increasing; TIM_Init(BOARD_TIM_PORT, &tim_init); /* Enable interrupt. */ NVIC_EnableIRQ(BOARD_TIM_IRQn); TIM_EnableInterrupts(BOARD_TIM_PORT, TIM_INT_UPDATE_PERIOD, true); /* Start the counter. */ TIM_Start(BOARD_TIM_PORT);}tim_init.StepFreqHz = 1000000 tim_init.Period = 1
一个1us的定时器。觉得浪费资源,也可以用系统滴答时间。
深度学习模型
显卡
conda tf pytorch 环境
数据集采用 mnist 训练20 epochs 准确率 96%
然后使用tflite中自带的量化策略,f32 转成int8.缩小模型。然后转成自定义的.h文件格式。
TinyMaix 移植
添加对应的文件
适配MM32
测试时间这边改成timer1 1us的tick
使用加速 使用ARM M系列加速
#define TM_ARCH TM_ARCH_ARM_SIMD
使用纯CPU
#define TM_ARCH TM_ARCH_CPU
主函数
void tinyMaix_test(void){ /* Begin TinyMaix */ TM_DBGT_INIT(); TM_PRINTF("mnist demo\n"); tm_mdl_t mdl; for (int i = 0; i < 28 * 28; i++) { TM_PRINTF("%3d,", pic[i]); if (i % 28 == 27) TM_PRINTF("\n"); } tm_mat_t in_uint8 = {3,IMG_L,IMG_L,IMG_CH, (mtype_t*)pic}; tm_mat_t in = {3,IMG_L,IMG_L,IMG_CH, NULL}; tm_mat_t outs[1]; tm_err_t res; tm_stat((tm_mdlbin_t*) mdl_data); TM_DBGT("tm_load"); res = tm_load(&mdl, mdl_data, mdl_buf, layer_cb, &in); if (res != TM_OK) { TM_PRINTF("tm model load err %d\n", res); return; } TM_DBGT("tm_preprocess"); #if (TM_MDL_TYPE == TM_MDL_INT8) || (TM_MDL_TYPE == TM_MDL_INT16) res = tm_preprocess(&mdl, TMPP_UINT2INT, &in_uint8, &in); #else res = tm_preprocess(&mdl, TMPP_UINT2FP01, &in_uint8, &in); #endif TM_DBGT("tm_run"); TM_DBGT_START(); res = tm_run(&mdl, &in, outs); TM_DBGT("tm_run"); if (res == TM_OK) { #ifndef TEST_MBNET parse_output(outs); #endif } else TM_PRINTF("tm run error: %d\n", res); tm_unload(&mdl);}int main(void){ BOARD_Init(); printf("\r\ntim_basic example.\r\n"); /* Setup the timer. */ app_tim_init(); tinyMaix_test(); while (1) { }}
效果测试
TM_ARCH_ARM_SIMD
===tm_run use 2.808 ms
===tm_run use 4.243 ms
准确识别,加速后,运行速度翻倍。
ps(mm32工程放百度网盘需要自取,也可以在下方附件下载)
链接:https://pan.baidu.com/s/1Y17nchrzb0_t2IaGEd1QQQ
提取码:fsno