行为心理学的一个基本原则是通过后果来学习. 当一种行为被奖励之后,这种行为就会得到积极的强化,所以它会被重复. 当一种行为被惩罚时, 这个行为被负强化了, 因此, 这个动作不会再做了. 人类从小到大,在整个历史中都是这样学习的.
想象一下,如果机器或设备有这种能力,可以根据后果来决定是否重复行动. 想象一下,如果机器可以通过强化学习来学习. 但问题是, 没有必要想象,因为机器学习允许机器通过强化学习来学习.
强化学习(RL)现在可以在Microsoft Azure中使用, 托管和云服务领域的全球领导者. Azure将认知服务和人工智能带到每个开发人员和数据科学家都能触及的范围内,他们可以嵌入看到的能力, 听到, 说话, 搜索, 理解, 并将高级决策加速到任何应用程序中.
如上所述, 强化学习采用奖励和惩罚系统来迫使计算机自己解决问题. 而其他机器学习技术通过获取标记或未标记的数据来学习, 强化学习是一种通过与环境的交互进行学习的机器学习方法, 无论是真实的还是模拟的. 它从经验中学习最佳策略. 通过探索,代理可以适应变化,并且可以训练它们积极地做出决策并从结果中学习.
当计算机寻求最大的奖励时,它很容易找到意想不到的方法. 它可以学习如何最好地完成它的目标, 通常没有人工监督, 这使得它非常强大,非常灵活. 强化学习促使代理具有创造性,特别是在没有“适当方式”执行任务的情况下, 然而,代理人也意识到,要正确履行其职责是有规则可循的.
强化学习确实在机器人领域产生了巨大的影响, 自动驾驶汽车, 和游戏. 然而, 它已经并将彻底改变许多企业客户的世界,这些客户正在将RL应用于制造过程中不同类型的优化问题, 物流优化, 以及许多其他商业战略规划或人工决策.
许多工业采用机器人实现工业自动化. 机器人的操作效率更高,它们还可以执行对人类来说很危险的任务. 这些例子在飞机控制和机器人运动控制领域.
在NLP(自然语言处理), RL可以用于文本摘要, 问题回答, 还有机器翻译, 哪些可以用于对话生成. 深度强化学习可以用来模拟聊天机器人对话中的未来奖励. 机器可以在包含重要会话属性(如连贯性)的序列中获得奖励, informativity, 易于回答.
在医疗保健方面,患者可以根据从RL系统学习到的政策接受治疗. 强化学习可以利用以前的经验找到最优策略,而不需要以前关于生物系统数学模型的信息. 这使得这种方法在医疗保健中比其他基于控制的系统更适用.
RL在企业中最流行的应用是推荐系统. Netflix公开宣布,它正在使用RL向用户推荐节目和电影, 在其他机器学习算法中. Spotify也承认使用了多武装盗匪, 一种强化学习算法, 管理歌曲的开发和探索与艺术家的推荐之间的权衡.
基于强化学习的多智能体网络交通信号控制系统. 研究人员试图设计一种交通信号灯控制器来解决拥堵问题. 虽然只在模拟环境中测试过, 他们的方法显示出比传统方法更好的结果,并揭示了多智能体强化学习在设计交通系统中的潜在用途.
RL也可以应用于化学工业中优化化学反应. 一项利用深度强化学习优化化学反应的研究表明,他们的模型优于最先进的算法和广义不同的潜在机制. 这个应用程序很好地展示了强化学习如何在相对稳定的环境中减少耗时的试错工作.
机器学习中的强化学习应用可以用于商业战略规划, 金融, 和交易. 有许多股票交易机器学习算法的实现, 特别是, RL算法. RL代理人可以决定是否持有、买入或卖出. RL模型使用市场基准标准进行评估,以确保其性能最佳. 事实上,2019年4月,J.P. 摩根宣布开始使用深度神经网络算法执行(DNA)来增强其外汇交易算法.
强化学习在投标、营销和广告中的应用. 阿里巴巴集团的研究人员研究了“展示广告中基于多智能体强化学习的实时竞价”. 使用聚类方法处理大量广告客户,并为每个聚类分配一个战略招标代理. 平衡广告主之间的竞争与合作, 提出了一种分布式协调多agent竞价(DCMAB)算法.
强化学习是一项开创性的技术,有可能改变真人游戏厅的世界. 它是机器学习中最具创造性、创新性和创造性的领域之一. 因此, 强化学习有可能成为一项突破性的技术,也是人工智能发展的下一步. 凯基金泽, 微软首席程序经理, 相信Azure的价值对于那些正在进行大规模试错的客户来说是最有用的.
强化学习研究智能体如何学习如何在复杂系统中实现目标, 不确定环境. 强化学习是非常通用的,它包含了许多涉及做出一系列决策的问题. 强化学习甚至可以应用于具有顺序或结构化输出的监督学习问题. 强化学习算法已经开始在许多困难的环境中取得良好的效果,因此可以应用于许多不同的设置.
你公司的哪些流程和结构可以从强化学习中受益? 制造过程中的优化问题, 物流优化, 或者你公司的商业战略规划可以通过强化学习来解决?
如果你准备用强化学习探索机器学习和人工智能, 今天就伸出援手. 真人游戏厅是来帮你推进技术进步的.