基于Quanser信息物理系统(Cyber-Physical System)的机器学习Machine Learning with Quanser Cyber-physical Systems+ 查看更多
作者:Murtaza Bohra
无人系统工程师|Quanser公司
在过去的10年,嵌入式控制和机器学习技术有了长足的发展。在模块化和高效的范围内创建最先进的应用程序是前所未有的。这允许我们能够提出以前从未问过的问题。而这正是我们Quanser所关注的:提出相关的学术问题,然后为研究人员提供回答这些问题的工具。
用于现代应用的信息物理系统
在适当抽象的学术领域里,我们将“信息物理”系统定义为在智能和互联的世界里设计应用程序的关键组件。结合我们最基础的设备:QUBE-Servo 2。
执行,反馈,思考,通信
这个装置本身就是一个便携式机械系统。通过一个基础电机进行驱动,一个光学传感器测量基础旋转角度,另一个光学编码器测量倒立摆的角度。通过这些基础结构让系统具备执行和反馈的能力。QUBE-Servo 2除了能通过USB连接到计算机,也可以部署到嵌入式处理器,如树莓派3B+。这让我们能够创建一个在嵌入式目标上运行的物联网应用程序。
在这个扩展示例中,让现在的我们具备额外的思考能力(包含运行控制算法和所有逻辑)。还要注意的是,设备此时的通信(两个QUBE-Servo 2之间的TCP/IP通信)。在这方面,每个QUBE-Servo 2成为一个“信息物理”的设备能够具备执行,感应,思考,通信的能力。上述物联网演示的实际逻辑与整个信息物理主题无关,但你可以在这里找到更多相关物联网的信息。也可以看看下面的Quanser Aero物联网演示。
基于QUBE-Servo 2的机器学习和强化学习
研究人员将QUBE-Servo 2作为一个信息物理系统来开发机器学习和强化学习应用已经有一段时间了。如下是今年已经发布的最新的案例。
高丽技术教育大学(KOREATECH)电子与电信研究所(ETRI)的研究人员开发了一种基于深度q网络的控制算法,来控制不稳定的并且高度非线性的QUBE-Servo 2系统,并在远程定位学习平台(EdgeX平台)上进行监控和学习。
在韩国高级技术院(KAIST),研究人员将我们开箱即用的旋转倒立摆和一个复杂的通过使用一个称为熵搜索的贝叶斯优化来提高各种初始情况下的起摆性能的倒立摆进行了如下对比。
在另一项工作中,一个马克斯普朗克智能系统研究所的团队研究用于贝叶斯优化的元学习获取功能。乌普萨拉大学的研究小组致力于研究线性二次控制策略综合的凸界学习。他们还与KTH皇家理工学院合作,分析了线性二次强化学习中的稳定探索部分。