部分观测马尔可夫决策过程(POMDP)中引入了初始状态成本(ISC-POMDPs),通过递归贝叶斯固定点平滑器估计未知初始状态,并将其转化为信念依赖成本问题,在机器人导航和主动感知等场景中验证了控制策略的有效性。 摘要: 我们提出了一类部分观测的马尔可 ...