![]() |
登入帳戶
| 訂單查詢
| |
||
| 臺灣用戶 |
| 品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 | 服務:香港/台灣/澳門/海外 | 送貨:速遞/郵局/服務站 |
| 在 大書城
以“
全文
模式”搜“
[美]德梅萃·P 博赛卡斯[Dimitri P Berts
”共有
8
结果: |
同時支援繁體 / 正體 / 简体字輸入搜索 |
![]() ![]() |
强化学习与最优控制
『简体书』 作者:[美]德梅萃·P.,博赛卡斯[Dimitri P.,Bert 出版:清华大学出版社 日期:2020-06-01 本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和*控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于*控制和人工智能思想 ... |
詳情>> | |
![]() ![]() |
抽象动态规划(第2版)
『简体书』 作者:[美]德梅萃·P.博赛卡斯[Dimitri P. Berts 出版:清华大学出版社 日期:2022-04-01 第2版的主要目的是扩大第1版(2013)的第3章和第4章的半契约模型的内容,并以自第1版以来作者在期刊和报告中发表的研究成果作为补充。这本书的数学内容非常优雅且严格,依靠抽象的力量专注于基础知识。该书首次提供了该领域的全面综合知识,同时提出了许多新研究,其中一些研究与当前非常活跃的领域(如近似动态编 ... |
詳情>> | |
![]() ![]() |
策略前展、策略迭代与分布式强化学习
『简体书』 作者:[美]德梅萃·P. 博赛卡斯[Dimitri P. Bert 出版:清华大学出版社 日期:2022-04-01 本书目的是从作者近出版的《强化学习预控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散组合优化问题(例如路由,调度,分配和混合整数编程)中的应用,包括在这些情况下使用神经网络近似。 本书可作为计算机科学与技 ... |
詳情>> | |
![]() ![]() |
动态规划与最优控制——近似动态规划(第I卷)
『简体书』 作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert 出版:清华大学出版社 日期:2024-05-01 本书系统性介绍动态规划与最优控制,包括动态规划算法、确定性系统与随机最短路问题、确定性连续时间最优控制、状态信息完整的问题、状态信息缺失的问题、次优与适应控制、无穷阶段问题等。 ... |
詳情>> | |
![]() ![]() |
阿尔法零对最优模型预测自适应控制的启示
『简体书』 作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert 出版:清华大学出版社 日期:2024-06-01 大致内容:第一章,从阿尔法零的卓越性能出发,深入解读其背后着实不易的成长历程,揭示其数学模型。第二章,从确定性和随机动态规划问题入手,介绍决策问题的数学模型。第三章,从抽象视角回顾纷繁复杂的强化学习算法,揭示值函数近似与滚动改进的重要作用。第四章,从经典的线性二次型最优控制问题入手,分析从阿尔法零的 ... |
詳情>> | |
![]() ![]() |
阿尔法零对最优模型预测自适应控制的启示
『简体书』 作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert 出版:清华大学出版社 日期:2025-04-01 第一章,从阿尔法零的卓越性能出发,深入解读其背后着实不易的成长历程,揭示其数学模型。第二章,从确定性和随机动态规划问题入手,介绍决策问题的数学模型。第三章,从抽象视角回顾纷繁复杂的强化学习算法,揭示值函数近似与滚动改进的重要作用。第四章,从经典的线性二次型最优控制问题入手,分析从阿尔法零的成功中学到 ... |
詳情>> | |
![]() ![]() |
强化学习与最优控制
『简体书』 作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert 出版:清华大学出版社 日期:2024-04-01 本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和最优控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于最优控制和人工智能 ... |
詳情>> | |
![]() ![]() |
动态规划与最优控制——近似动态规划
『简体书』 作者:[美]德梅萃 P.,博塞克斯[Dimitri P.,Bert 出版:清华大学出版社 日期:2021-02-01 本书系统性介绍动态规划,特别是近似动态规划,包括折扣问题的理论与计算方法、随机*短路问题、无折扣问题、平均费用问题、折扣与无折扣问题的近似动态规划等。 ... |
詳情>> | |
| >>> (頁碼:1/1 行數:20/8) 1 |