简介:研究基于深度强化学习技术的避障场景的算法模型设计,采用改进岛深度Q网络(DeepQ-lesrningNet-work,DQN)算法克服了Q-learning表名式算法在连续状态下导致内存不足的局限性。鉴于学习过程中奖励稀疏导致很艰难获得较好结果的情况,改进奖利机制,增知实时奖惩作为补充,解决学习耗时长和练不稳定的问题:采用相对角度、位置金和距离等信息,相比绝对坐标信息可以更有效的躲障碍物。不同于基于栅格法/可视图法等传统人为策略避障算法,深度强化学习算法DQN能够在缺乏先验知识的条件下具备自主决策能力,因此适用性更强。该技术可应用在仓储无人车、巡佥机器人、无人机等现实场景。
简介:本来以为2003年初的T界仍然会被严寒冻得失去活力.然而没有想到.正是在那经历了失望与遗憾的拉斯维加斯这地(见本刊今年第1期“荣兮?辱兮?——COMDEXFall2002展会记”一文),再闪举办了本年度第个重要的,也是北美洲最大的消费电子展览会——2003国际消费电子展(InternationalConsumerElectronicsShow,简称CES)。