联系我们

chucr@ahswan.com

热线电话

86-0556-2173435

【玩转端侧AI】低算力离线AI的物联网应用体验

  在上期内容中,我们详细测试了聆思CSK6的几个关键离线AI功能,比如英中翻译、拍照识图等,但这些离线AI因为模型实在太小,并不能够达到理想的效果,顶多只是一个功能展示性的存在。不过,这些复杂功能本来就不是低算力离线AI开发板的主打功能,作为低成本物联网AI方案,像姿态识别、人脸识别等功能才是它发挥能力的“主战场”,那么,从具体表现来看,聆思CSK6的物联网离线万像素画质一般

  对于大多数家庭、小企业来说,人脸识别门禁、考勤、自助终端都是常用设备,这些设备的人脸识别机制最简单,通过算法选取画面中分值最高的人脸,在图像中标定人脸边界框、头部姿态角度、人脸识别特征等数值,与此同时还可以保存人脸特征,支持将检测到的人脸特征值和本地存储的人脸特征值输入算法进行比对。

  对于聆思CSK6来说,它预装的离线人脸识别模型比较小,所以只支持至多保存20个人脸特征,在载入大模型之后,因为它只配备了30万像素(640×480)的摄像头,所以画质只能说是“惨不忍睹”,而且帧率也比较低,对环境光照的要求很高。

  通过观察屏幕上,可以在1米左右的距离实时标注出人脸,并通过黄色方框进行标注,此时通过按压K1键能注册当前人脸特征,按K2键即可进行人脸对比,对比通过,方框变成绿色,不通过则变成红色。通过将开发板连接至电脑并打开串口工具,可以直观查看到人脸识别输出结果,后续可以将此结果输出到门禁或打卡系统,就能完成离线人脸识别的工作。

  除此之外,聆思CSK6还可以换装红外活体摄像头,但需要在PC端使用专用工具,将开发板连接到PC后单独烧录固件,过程只需要操作几下鼠标而已,格外的简单。烧录完成后就可以和普通摄像头一样进行人脸识别了。从实际体验来看,聆思CSK6无论普通摄像头还是活体检测摄像头,人脸识别功能做得并不太好,对距离要求很高且灵敏度较低,时常会出现无法正确识别人脸和特征库比对错误的情况。引发问题的根源是算力不足,没办法使用较强的摄像头,也无法适配较强的模型,这也是当下离线人脸识别AI硬件成本依然不低的原因之一。

  聆思CSK6有两个独立的姿态识别功能,其一是坐姿检测,其二是头肩检测和手势识别,因为都依赖摄像头运行,而它的摄像头效果又相对较差,所以体验的结果可想而知,并不会比人脸识别强到哪里去。

  不过从可玩性上来说,姿态识别要比人脸识别更有趣一些,在光线条件较好的情况下,坐姿识别可以比较快速地识别出人物的关键骨骼点并进行标注,实时显示该人物的包含手、身体状态在内的坐姿检测结果,可用于教育平板、学习台灯等设备实现坐姿提醒功能。而头肩检测能结合监控摄像云台,实时追踪人置,并通过手势识别来实现拍摄、截图等额外功能。依照我们的实际体验来看,在3米左右,头肩跟踪和手势识别效率还不错,当然前提是光线条件较好,但坐姿识别则需要距离较近,大概在半米左右,所以这两个功能无法同时高效运转,这对于开发的最终产品来说是一个坏因,以聆思CSK6预装的“在线大模型语音+坐姿”功能为例,这项功能会连接到讯飞星火在线大模型,能够正常的使用关键词唤醒开发板进行在线的语音交互,同时检测用户坐姿,在坐姿异常时进行提醒,但无法同时开启头肩+手势识别功能,否则实用性可以更上一层楼。

  从下期开始,我们将会结合在线功能,更全面地体验聆思CSK6 AI开发板,事实上这块低算力开发板的定位本来就是一个“入口”,为了更方便、更直观地让用户随时接入在线模型当中,端侧算力对它来说只需要满足比如语音唤醒等最基本的功能即可。如果你特别在意隐私问题,那么未来我们还会考虑采购端侧算力更强的型号来来测试,敬请期待。

  壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者

  俞敏洪:我跟董宇辉到今天没有一点隔阂!任何一个时间里都不会参与到与辉同行的资本运作、投资发展中去

  与中坚力量共成长,2024建信信托艺术大奖评委会特别奖获奖艺术家凌海鹏

  三星已开始为 W25折叠手机测试 One UI 系统,有望 10 月国内发布

  谷歌 Pixel 9 系列 AI 功能曝光:手机版“回顾”、集体照合成等

和为贵 智为上 信为本 勤为力

Harmony is precious, wisdom is supreme, faith is the foundation, diligence is strength.