《学术论文》基于机器视觉的智能导光眼镜设计
本文提出了一种基于机器视觉的智能导盲眼镜系统的设计方案。系统测试结果表明,智能导盲眼镜系统不仅能够在测试环境中正确导航盲人出行,而且具有一定的目标识别能力,能够帮助盲人对简单物品进行分类。基于机器视觉的智能导光眼镜设计[J]. 电子技术应用,2017,43:58-61。与市场上导盲杖和昂贵的导盲犬等导盲效率不理想的情况相比,基于机器视觉的智能导盲眼镜系统更具竞争力。
概括
本文提出了一种基于机器视觉的智能导盲眼镜系统的设计方案。 采用三星Cortex-A8架构S5PV210作为中央处理器,搭载Linux系统,配备双目采集、GPS定位、语音播报、GSM短信、语音通话、无线传输六大核心功能模块,构建了智能导盲眼镜系统平台结合深度学习算法,在远程云服务器上完成对目标场景的智能识别,最终以语音的形式精准引导盲人行走。 系统测试结果表明,智能导盲眼镜系统不仅能够在测试环境中正确导航盲人出行,而且具有一定的目标识别能力,能够帮助盲人对简单物品进行分类。 系统还具有GPS定位、语音通话、GSM短信等多种辅助功能。
狭义家居装修:指室内装修; 从美化角度考虑,使室内空间更加美观;
广义的家居装修:包括室内空间的改造和装饰; 我们今天所说的家居装修大多是广义上的家居装修,是室内装修和装潢的结合。
中文引文格式:何腾鹏,张荣芬,刘超,等。 基于机器视觉的智能导光眼镜设计[J]. 电子技术应用,2017,43(4):58-61。
英文引文格式:何腾鹏,张荣芬,刘超,等。 基于机器视觉的智能视力眼镜设计[J]. 电子技术应用,2017, 43(4): 58-61。
0 前言
据世界卫生组织统计,目前全球约有7800万盲人,其中90%生活在发展中国家。 目前中国盲人数量占世界盲人总数的18%,多达1400万。 盲人作为社会的弱势群体,患有视力障碍和眼部疾病,给他们的生活带来诸多不便。 另一方面,随着近年来我国人口老龄化持续加剧,视障人群数量也急剧增加。 如何保证盲人和视障人士安全有效出行尤为重要。 为此,本文设计了一款基于机器视觉的智能导盲眼镜[1],旨在帮助盲人朋友在行走过程中安全有效地避开道路上的目标障碍物,尽可能保证其出行安全。 与市场上导盲杖和昂贵的导盲犬等导盲效率不理想的情况相比,基于机器视觉的智能导盲眼镜系统更具竞争力。
1 智能导光镜控制系统总体设计
本文的智能导光眼镜控制系统由前端嵌入式采集传输系统和远程云平台服务器两部分组成。 嵌入式采集传输系统采用三星Cortex-A8架构S5PV210处理器为载体,搭载Linux内核,配备双目采集、GPS定位、语音播报、GSM短信、语音通话等核心功能模块、无线传输打造智能导盲眼镜。 系统硬件平台主要完成信息采集传输和智能指令引导等功能。 云平台服务器作为智能导光眼镜的远程数据处理中心。 服务器配置方面,选择阿里云作为云服务器,然后结合深度学习、双目测距[2]等相关算法,实现智能导盲眼镜的前端场景。 图像识别、目标距离检测和方位判断。 此外,服务器还内置了GPS卫星数据匹配平台,结合智能导盲眼镜实体,可以有效实时定位眼镜用户。 本系统总体设计框图如图1所示。
2 智能导光镜控制系统硬件设计
2.1 双目采集模块设计
双目采集模块采用两个性能参数相同的CMOS高清摄像头采集智能导盲镜前方的场景信息,帮助盲人获取前方目标及对应的场景信息。
2.2 GPS定位模块设计
全球定位系统(GPS)可以为全球用户提供低成本、高精度的三维定位,可以在全球范围内进行全天候、全方位的实时定位。 该系统采用瑞士Ublox公司的NEO-6M模块作为GPS模块的核心单元,主要用于实时获取盲人地理位置的经纬度坐标。
2.3 无线通信传输模块设计
无线通信传输模块主要由3G芯片和相应的外围电路组成。 它采用3G无线技术,实现智能导盲镜与远程云平台服务器之间的双向通信。 一方面,双目摄像头模块采集的图片和GPS模块获取的地理位置坐标信息通过3G网络发送到远程云服务器平台。 另一方面,服务器的图像识别和地理位置匹配结果回传给智能导盲眼镜进行语音播报,实时告诉盲人结果。 同时,利用3G模块的GSM短信功能,智能导盲眼镜系统还将从云端服务器获取的结果以短信的形式及时通知盲人家属。 此外,在特殊情况下,盲人还可以利用3G电话功能直接与亲人进行语音通话。 图2是无线通信传输模块的应用电路图。
2.4 语音播报模块设计
智能导盲镜控制系统的语音播报功能主要用于通过语音模块播放导盲镜前方目标的图片识别结果、距离、方位信息和地理位置,以便及时告知盲人周围的环境条件。 该系统采用SYN6288中文语音合成芯片作为语音播报模块主体,实现文字到声音的转换。 其外围电路如图3所示。
3 智能导光镜控制系统软件设计
本系统的软件设计分为两部分:远程云平台服务器上的编程和智能导盲眼镜前端的编程。 远程云平台服务器上的软件设计主要采用C/C++等高级编程语言将图像识别、测距、方位检测等相关算法转换为计算机系统可以识别的程序指令,从而实现智能导盲眼镜的远程云服务器。 识别、测距、方位检测等功能。 另外,GPS经纬度分析也是通过云服务器上的软件编程实现的。 导光眼镜前端软件设计主要包括双目摄像头图像采集、GPS地理位置坐标获取、无线通信传输模块数据发送与接收、语音播报模块调度以及按键中断配置等功能模块子程序的编写。 主程序流程图如图4所示。
4 基于深度置信网络的自然场景识别
深度置信网络(DBN)[3]作为深度学习中应用最广泛的算法模型,多应用于手写识别和自然场景识别两个方向。 在智能导光镜控制系统中,深度置信网络主要用于自然场景中常见物体的识别。 这也是深度学习在机器视觉领域的一个应用。 图5是深度信念网络的典型网络结构模型。
从图5可以看出,深度信念网络是由多个受限玻尔兹曼机(RBM)组成的深度网络[4]。 在该网络中,DBN的训练过程采用逐层训练。 方法,每层RBM单独训练,参数单独调整[5]。 训练完一层后,将本层的训练结果作为下一层RBM的输入,直到训练完每一层RBM。 这个过程称为预训练。 深度置信网络中所有RBM训练完成后,根据样本的标签值,利用反向传播算法进行向后微调。
在智能导盲眼镜的图像训练过程中,采用改进的CIFAR-10自然场景库作为测试训练样本。 原始CIFAR-10数据集有60,000张32×32彩色图像,分为10类:飞机、汽车、猫、鸟、鹿、狗、青蛙、马、船和卡车。 为了增强智能导光眼镜的实用性,并考虑到盲人的特殊情况,本文在实际系统中添加了一些生活中常见的目标场景如餐桌、椅子、人、垃圾桶、树木等图像训练,并对改进后的原始CIFAR -10自然场景库进行测试,然后通过图6所示的深度置信网络模型,使用改进后的CIFAR-10自然场景库进行训练和识别。
上述训练模型中,改进后的CIFAR-10自然场景库中的每张图片都是32×32的彩色图片,因此输入层大小为3072个节点(3072=32×32×3),两个隐藏层节点数分别为 1000 和 200。 经过Softmax分类器[6]进行多元分类后,输出层为10个单元。 系统最终的模型结构为3072-1000-200-10。 在智能导镜系统的实际图像训练阶段,训练模型中两层RBM的训练迭代次数设置为200次,学习率设置为0.1。 训练完成后,系统学习到的权重用于初始化神经网络,微调网络参数,并使用Sigmoid函数激活神经网络[7]。 在系统训练过程中,由于样本数量较多、数据复杂,隐藏层需要相对较多的节点才能学习到更好的特征。 另外,图片本身信息量很大,需要更多的迭代。 整个培训过程平均持续10个小时。 与深度学习中的卷积神经网络[8]和自动编码模型[9]相比,训练时间大大缩短,并且也具有相对理想的识别率。 这就是为什么这个系统选择深度信念网络作为识别模型训练的主要原因。
5 系统测试结果及分析
利用上述深度置信网络训练模型,首先对改进后的CIFAR-10库中的10000张测试图片进行随机演示测试。 表1显示了各种样本的识别率和平均识别率。
从表1可以看出,改进后的CIFAR-10库中的10类测试样本经过导镜系统的深度置信网络训练后,平均识别率为82.9%,与训练时的情况相同基于支持向量机的识别模型[10]与识别率相比,其平均识别率超过支持向量机模型近10%,为进一步的智能导盲眼镜整体系统测试奠定了基础。 最后,针对盲人的生活需求,结合智能导盲镜的其他功能,在实际场景中联合调试智能导盲镜控制系统,其中双目摄像头的采集帧率设置为3帧/s,并将语音导航频率设置为每两秒引导盲人一次。 远程服务器上的测试结果如图7和图8所示。从图7可以看出,智能导盲眼镜的GPS功能可以实时准确地获取佩戴导盲眼镜的用户的经纬度,并发送给佩戴导盲眼镜的用户。它通过无线通信传输模块到远程服务器进行精确的地理位置匹配。 图8显示,在实际场景中,智能导盲眼镜不仅可以准确识别前方目标的类别,还可以测量目标物体与导盲眼镜之间的距离,正确表征障碍物的方位特征,将目标显示在眼镜一侧。 通过实时语音引导,帮助盲人及时有效避障,保障盲人安全出行。
六,结论
本系统采用S5PV210作为主控制器构建基于机器视觉的智能导光眼镜。 搭载Linux内核,配备双目采集、GPS定位、语音播报、GSM短信、语音通话、无线传输等六大核心功能模块。 完成了系统的硬件电路设计和软件设计。 通过系统测试,智能导盲眼镜不仅可以为盲人自主出行提供实时语音导航,而且在特殊情况下,盲人还可以使用导盲眼镜的GPS、GSM短信、语音通话等功能通过智能眼镜上的触发按钮。 及时获得朋友和家人的帮助。 此外,由于智能导盲眼镜还具有图像识别功能,可以帮助盲人对简单物品进行分类,在一定程度上也可以提高盲人的生活自理能力。 这对于盲人基数庞大的中国来说尤为重要。
参考
[1] Milan Sonka、Vaclav Hlavac、Roger Boyle 等。 图像处理、分析与机器视觉[M]. 北京:清华大学出版社,2016。
[2]岳荣刚,王少平,李凯,等。 基于相似原理的双目测距新方法[J]. 光电工程, 2008, 35(4): 64-68.
[3]陈翠萍. 基于深度置信网络的文本分类算法[J]. 计算机系统应用,2015,24(2):121-126。
[4]张春霞,纪楠楠,王冠伟。 受限玻尔兹曼机简介[J]. 工程数学学报,2013(2):159-173。
[5] HINTON GE、SRIVASTAVA N、KRIZHEVSKY A 等人。 通过防止特征检测器的共同适应来改进神经网络[J]。 计算机科学,2012,3(4):212-223。
[6] 王爽,马文平,谢惠明,等。 一种基于堆栈编码和softmax的极化SAR图像分类方法[P]. CN104156728A,2014。
[7]张学伟,王岩。 基于Sigmoid函数参数调整的双隐层BP神经网络板坯形状预测[J]. 化工自动化与仪表,2010,37(4):42-44。
[8] 陈贤昌. 基于卷积神经网络的深度学习算法及应用研究[D]. 杭州:浙江工商大学,2013。
[9]吴海燕. 基于自编码器的半监督表示学习和分类学习研究[D]. 重庆:重庆大学,2015。
[10]崔鹏宇. 基于支持向量机的分类器训练研究[J]. 数字技术与应用,2016(6):58-58。
作者信息:
何腾鹏、张荣芬、刘超、方乐男、刘玉红
(贵州大学大数据与信息工程学院, 贵州贵阳 550025)
Riley Testut 是一名 iOS 应用程序开发人员,多年来一直致力于移动视频游戏模拟,他刚刚发布了一个有潜力改变整个 iOS 生态系统的项目。 他将其称为 AltStore,它是 Apple App Store 的替代品,Testut 称 Apple App Store 分发的软件可以“推动 iOS 的发展”。 特别是,它支持 Testut 自己的任天堂模拟器 Delta,让任何拥有 iPhone 或 iPad 的人都可以玩超级马里奥和其他经典游戏。 此外,它不需要您越狱您的 iOS 设备。 任何人都可以立即下载 AltStore。
Testut 今天早些时候发布了 AltStore 的早期预览版。 完整的应用程序将于 9 月 28 日星期六发布,Testut 的完整 Delta 模拟器将成为商店中提供的应用程序之一。 它已经作为 GitHub 上的开源项目提供。
有关的
iOS 开发者如何为 iPhone 构建替代 App Store
目前,Delta 有一个名为 Delta Lite 的预览版,支持 NES 游戏。 Testut 表示,完整版将支持 SNES、Game Boy、Game Boy Advance 和 Nintendo 64 平台,未来还会推出更多版本。 而且,由于今年夏天早些时候在 WWDC 上宣布的 iOS 13 对 Sony DualShock 4 和 Xbox One 的支持,您可以使用标准控制台控制器或任何支持 MFi 的游戏手柄来玩这些游戏。
赖尔斯
✔
@rileytestut
非常高兴正式宣布 AltStore:iOS 的替代应用程序商店 - 无需越狱。 将于 9 月 28 日星期六推出,但您可以立即下载预览版
替代品商店
1,810
上午 5:04 - 2019 年 9 月 26 日
您可能有兴趣知道 Testut 不仅能够分发自己的模拟器应用程序,而且还能够分发自己的整个替代应用程序商店。 Testut 表示,这是一种简单但有弹性的方法,它建立在 iOS 开发人员和越狱社区多年来为绕过苹果的限制而炮制的漏洞和其他技巧的基础上。 事实上,Testut 早在 2014 年就因其中一个伎俩而被曝光,当时他使用了 Apple Developer Enterprise Program,该计划旨在允许公司在公司内部分发软件,以允许任何人安装他早期的任天堂模拟器 GBA4iOS。