登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站
大書城 以“ 全文 模式”搜“ [美]德梅萃·P 博赛卡斯[Dimitri P Berts ”共有 8 结果: 同時支援繁體 / 正體 / 简体字輸入搜索
强化学习与最优控制 强化学习与最优控制
『简体书』 作者:[美]德梅萃·P.,博赛卡斯[Dimitri P.,Bert  出版:清华大学出版社  日期:2020-06-01
本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和*控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于*控制和人工智能思想 ...
詳情>>
售價:HK$ 196.7

抽象动态规划(第2版) 抽象动态规划(第2版)
『简体书』 作者:[美]德梅萃·P.博赛卡斯[Dimitri P. Berts  出版:清华大学出版社  日期:2022-04-01
第2版的主要目的是扩大第1版(2013)的第3章和第4章的半契约模型的内容,并以自第1版以来作者在期刊和报告中发表的研究成果作为补充。这本书的数学内容非常优雅且严格,依靠抽象的力量专注于基础知识。该书首次提供了该领域的全面综合知识,同时提出了许多新研究,其中一些研究与当前非常活跃的领域(如近似动态编 ...
詳情>>
售價:HK$ 102.4

策略前展、策略迭代与分布式强化学习 策略前展、策略迭代与分布式强化学习
『简体书』 作者:[美]德梅萃·P. 博赛卡斯[Dimitri P. Bert  出版:清华大学出版社  日期:2022-04-01
本书目的是从作者近出版的《强化学习预控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散组合优化问题(例如路由,调度,分配和混合整数编程)中的应用,包括在这些情况下使用神经网络近似。 本书可作为计算机科学与技 ...
詳情>>
售價:HK$ 159.9

动态规划与最优控制——近似动态规划(第I卷) 动态规划与最优控制——近似动态规划(第I卷)
『简体书』 作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert  出版:清华大学出版社  日期:2024-05-01
本书系统性介绍动态规划与最优控制,包括动态规划算法、确定性系统与随机最短路问题、确定性连续时间最优控制、状态信息完整的问题、状态信息缺失的问题、次优与适应控制、无穷阶段问题等。 ...
詳情>>
售價:HK$ 113.9

阿尔法零对最优模型预测自适应控制的启示 阿尔法零对最优模型预测自适应控制的启示
『简体书』 作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert  出版:清华大学出版社  日期:2024-06-01
大致内容:第一章,从阿尔法零的卓越性能出发,深入解读其背后着实不易的成长历程,揭示其数学模型。第二章,从确定性和随机动态规划问题入手,介绍决策问题的数学模型。第三章,从抽象视角回顾纷繁复杂的强化学习算法,揭示值函数近似与滚动改进的重要作用。第四章,从经典的线性二次型最优控制问题入手,分析从阿尔法零的 ...
詳情>>
售價:HK$ 79.4

阿尔法零对最优模型预测自适应控制的启示 阿尔法零对最优模型预测自适应控制的启示
『简体书』 作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert  出版:清华大学出版社  日期:2025-04-01
第一章,从阿尔法零的卓越性能出发,深入解读其背后着实不易的成长历程,揭示其数学模型。第二章,从确定性和随机动态规划问题入手,介绍决策问题的数学模型。第三章,从抽象视角回顾纷繁复杂的强化学习算法,揭示值函数近似与滚动改进的重要作用。第四章,从经典的线性二次型最优控制问题入手,分析从阿尔法零的成功中学到 ...
詳情>>
售價:HK$ 86.9

强化学习与最优控制 强化学习与最优控制
『简体书』 作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert  出版:清华大学出版社  日期:2024-04-01
本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和最优控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于最优控制和人工智能 ...
詳情>>
售價:HK$ 159.9

动态规划与最优控制——近似动态规划 动态规划与最优控制——近似动态规划
『简体书』 作者:[美]德梅萃 P.,博塞克斯[Dimitri P.,Bert  出版:清华大学出版社  日期:2021-02-01
本书系统性介绍动态规划,特别是近似动态规划,包括折扣问题的理论与计算方法、随机*短路问题、无折扣问题、平均费用问题、折扣与无折扣问题的近似动态规划等。 ...
詳情>>
售價:HK$ 161.3

>>> (頁碼:1/1 行數:20/8) 1  

在這裡,你可以記下自己常用的搜索詞,快速查詢。