首页
强化学习中agent与actor的区别
返回

强化学习中agent与actor的区别

2023-03-18 综合百科 By:佚名
最佳答案Agent无处理逻辑,只收lambda,用lambda加工自己的状态。Actor有逻辑,收消息,消息可以是数据也可以lambda,Actor处理消息。关键区别是:Actor有个主动过滤消息的过程;而agent没有,是被动的,不论什么lambda都要执行。强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一...

Agent无处理逻辑,只收lambda,用lambda加工自己的状态。Actor有逻辑,收消息,消息可以是数据也可以lambda,Actor处理消息。关键区别是:Actor有个主动过滤消息的过程;而agent没有,是被动的,不论什么lambda都要执行。强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习的常见模型是标准的马尔可夫决策过程。

猜你喜欢
气体压强(关于气体压强的基本详情介绍)

气体压强(关于气体压强的基本详情介绍)

12-31 0 阅读
有你世界变得不一样(关于有你世界变得不一样的简介)

有你世界变得不一样(关于有你世界变得不一样的简介)

12-31 0 阅读
ok组合(关于ok组合的基本详情介绍)

ok组合(关于ok组合的基本详情介绍)

12-31 0 阅读
几号端午节(几号端午节)

几号端午节(几号端午节)

01-03 0 阅读
电磁阀铁壳线圈与塑封的区别

电磁阀铁壳线圈与塑封的区别

12-20 0 阅读
auto是什么意思车上的(dual是什么意思车上的)

auto是什么意思车上的(dual是什么意思车上的)

12-30 0 阅读
热门推荐
气体压强(关于气体压强的基本详情介绍)

气体压强(关于气体压强的基本详情介绍)

12-31 0 阅读
有你世界变得不一样(关于有你世界变得不一样的简介)

有你世界变得不一样(关于有你世界变得不一样的简介)

12-31 0 阅读
ok组合(关于ok组合的基本详情介绍)

ok组合(关于ok组合的基本详情介绍)

12-31 0 阅读
几号端午节(几号端午节)

几号端午节(几号端午节)

01-03 0 阅读
电磁阀铁壳线圈与塑封的区别

电磁阀铁壳线圈与塑封的区别

12-20 0 阅读
auto是什么意思车上的(dual是什么意思车上的)

auto是什么意思车上的(dual是什么意思车上的)

12-30 0 阅读
明清意象(关于明清意象的简介)

明清意象(关于明清意象的简介)

12-30 0 阅读
贾晨(关于贾晨的基本详情介绍)

贾晨(关于贾晨的基本详情介绍)

12-31 0 阅读
杨玉玲(关于杨玉玲的基本详情介绍)

杨玉玲(关于杨玉玲的基本详情介绍)

12-31 0 阅读
为什么有水的地方就有鱼

为什么有水的地方就有鱼

09-06 0 阅读