词语

策略迭代法

cè lüè dié dài fǎ · ㄘㄜˋ ㄌㄩㄝˋ ㄉㄧㄝˊ ㄉㄞˋ ㄈㄚˇ · 更新 2026-06-30 21:42:27

基本属性

  • 拼音字母ce lve die dai fa
  • 拼音首字母clddf
  • 注音符号ㄘㄜ ㄌㄩㄝ ㄉㄧㄝ ㄉㄞ ㄈㄚ
  • 注音首符号ㄘㄌㄉㄉㄈ

词语解释

策略迭代法(policy iteration method)是动态规划中求最优策略的基本方法之一。它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优策略的策略序列。

拆字组词