公交化运营城际铁路日常运营中难免遭遇突发事件的影响而造成列车晚点,严重影响运行秩序与服务质量。为提升城际铁路公交化运营水平、减少突发事件对列车运行的干扰、提升乘客出行体验与乘车满意度,开展基于强化学习的公交化运营城际铁路列车运行调整研究。通过考虑公交化运营特点,综合高密度、乘客无需提前购票,随到随走、站台候车等关键因素,搭建强化学习模型并在竞争双深度Q网络(Dueling Double Deep Q-Network, DDDQN)算法的基础上进行改进,提出带有噪声的竞争双深度Q网络(Noisy Dueling Double Deep Q-Network, Noisy DDDQN)算法,以提升决策的稳定性和泛化能力。选取我国某公交化运营城际铁路为试验情景对算法进行验证,所选区段线路全长60.8 km,共设有9个车站,涉及7列车及其对应客流情况,通过设计不同晚点程度的算例,对算法有效性及可行性进行验证,并与深度Q网络(Deep Q-network, DQN)和DDDQN算法进行对比。结果表明,Noisy DDDQN算法能够充分考虑公交化运营的特点,并采用符合实际情况且合理的运行调整措施,有效缓解突发事件对列车运行秩序的干扰。相比DQN和DDDQN算法,该算法在求解效果上表现更优,分别减少了列车晚点时间8.33%和4.35%。研究结果可为调度人员在晚点情况下进行调度指挥提供科学依据和决策参考,为城际铁路公交化运营模式下的调度优化提供理论支持。