扑克机器人的进化:从简单程序到高级人工智能

内容表

在线扑克彻底改变了这项游戏,使数百万从未踏入赌场、也可能永远不会踏入赌场的新玩家能够参与其中。无论是德州扑克、奥马哈,还是其他任何扑克变种,现在任何人都可以在家中随时享受游戏,或者借助移动应用程序,随时随地畅玩。

但自从1998年左右第一批数字扑克游戏推出以来,技术已经发生了巨大变化,如今的游戏与最初的版本几乎毫无相似之处。像所有涉及金钱的事物一样,玩家都希望最大化获胜机会,而扑克机器人正是在线扑克牌局中实现这一目标的方法之一。

就像扑克本身一样,扑克机器人这些年来迅速发展。但它们是如何起步的?它们是什么?扑克机器人未来又将如何演变?

免费试用 NZT AI

在 18 个受支持的场地进行比赛,使用桌面玩家水平检测器和 autoclicker 来扩展您的机器人农场

扑克机器人早期的简单人工智能时代 

事实上,扑克机器人出现在在线扑克之前,其中最早被知晓的机器人之一是 Orac,它在1981年被创建。经过数年的测试和训练软件开发,他使用该机器人与赌场老板 Bob Stupak 进行了一场比赛,并将其拍摄成电视节目。Orac 输了。

在那之后将近二十年的时间里,还没有在线扑克可玩,科学家们使用纸牌游戏作为训练人工智能的工具。利用历史牌局数据来识别当前游戏中的概率,并基于分析做出决策,使得机器学习和人工智能在扑克应用中变得非常理想。随着技术的进步,机器人也在进化。

虽然大多数早期机器人以二十一点为开发基础游戏,因为它依赖于特定牌在已知牌组中出现的简单概率,但更复杂的扑克游戏仍然是研究的重点。这一发展的推动者之一是美国教授 Darse Billings,他之所以选择扑克作为研究对象,是因为在扑克中任何玩家都无法获得完整信息——他们不知道其他玩家手里有哪些牌。

这些早期机器人完全是基于软件系统,依赖于庞大的牌局数据库来分析概率,并不像今天我们所理解的“智能”。也就是说,它们不会自我适应或学习,而是简单地按照机器人所编写的特定逻辑方法,在游戏的每个阶段做出决策。

技术进步对机器人扑克策略与世界扑克锦标赛的影响

随着在线扑克桌在1998年上线,Billings 所做的工作成为我们今天所知扑克机器人的基础,这些是用于在线扑克牌局的软件解决方案。第一款知名的在线扑克机器人是 Vexbot,它是一个相对较弱的玩家,任何对游戏有基本了解的人类对手都能轻松打败它。在那一阶段出现的其他机器人也表现类似,但包括 Billings 在内的科学家们继续进行研发。

2005年,世界上第一场扑克机器人锦标赛在拉斯维加斯举行,参赛者数量出人意料。这些机器人与早期版本设计相似,并不像我们今天所理解的那样具备学习能力。尽管算法和数据分析更复杂,但这些解决方案的核心仍然是基于对历史牌局数据库的理解。

赛事结束时,获胜机器人被一位人类玩家轻松击败,这表明虽然取得了进展,但机器人能够稳定地战胜人类玩家仍然还有很长的路要走。

从 Polaris 到 Libratus 的人工智能与扑克机器人突破

真正的突破发生在2007年,名为 Polaris 的机器人由阿尔伯塔大学的一个研究团队开发,该团队再次由 Billings 领导。与今天的扑克机器人相比,Polaris 的游戏玩法仍然相对基础,但它采用了新的实时逻辑进行决策。它能够对个别玩家行为建模,这是机器人技术的一大进步,也是人工智能实现实时学习的首次体现之一。

尽管后续的改进给后来的机器人带来了一些优势,但下一个真正的突破直到2015年才出现。Cepheus 成为第一个“解决”无上限德州扑克单挑的机器人。它使用200个处理器和大量内存,在两个月内计算出游戏中的所有可能性——共316千万亿种,并被编程为执行“平衡策略”。这个程序是不可战胜的,但如果目标是赢钱,它的打法其实并不理想。

Cepheus 之后在2015年出现了 Claudico,这是第一个真正的无上限扑克机器人,是 Cepheus 的升级版,但它未能击败任何职业选手。接下来的重大进展则是在2017年,机器人 Libratus 的问世。

Liberatus 是 Libratus 的进一步进化版本,依然需要大量资源运行,并使用先进的学习程序根据发展中的场景进行调整。它是第一个能稳定击败人类玩家的扑克机器人,在白天比赛、夜间分析每一个动作,从而在第二天改进其决策方式。

现代扑克机器人正是在 Libratus 的基础上构建的,首个出现于2019年的 Pluribus。这些机器人在许多方面都大不相同,拥有远远超越之前技术的惊人能力。

当代扑克机器人:Pluribus 及其他扑克AI的能力与策略

Pluribus 及其他现代扑克机器人使用先进复杂的AI算法实时学习和适应,因此不再需要早期机器人所依赖的大量资源。事实上,Pluribus 只需128 GB 内存和两个处理器就能运行,可以在云平台上部署运行。

它并不是在庞大的游戏数据库中进行训练的。相反,软件被教授了扑克规则,并被允许通过自我游戏逐步学习。这些机器人不仅了解游戏本身,还能即兴调整每一手牌的策略,以最大化获胜几率,同时实时分析对手的行为。

最终的结果就是一个可以同时与多个对手竞争的扑克机器人,也正是我们所设想的扑克机器人形象。Pluribus 是第一个能够同时击败多位职业扑克选手的机器人,它与五位职业玩家进行了一万手牌的比赛,并最终获胜。

扑克机器人与AI研究的未来

所以,Pluribus 已经证明现代先进AI系统可以学习扑克规则,并发展为能够同时击败多位职业选手的玩家,而且只需极少的资源支持,那么扑克机器人的下一步将会是哪里?

使用机器人进行在线扑克游戏已成为各大扑克平台长期以来的一个问题,过去这不算大问题,是因为早期的机器人并不聪明,很容易被打败。但现在若一个机器人能轻松战胜整桌职业选手,那就是另一回事了。特别是像 Pluribus 这样的机器人能在每月成本不到 100 美元的云平台上运行,几乎任何人都可以轻松搭建这样的系统。

扑克机器人不会感到疲惫,也不会因底池紧张,所以如果放任不管,它们可能会彻底压垮人类玩家。因此,在商业领域,扑克机器人的未来必然涉及更多检测和平台安全系统来限制其使用。那么技术本身又会如何呢?

人工智能在各个领域都在迅速发展,扑克也不会例外。先进的学习软件将在理解游戏和部署策略方面变得更加复杂。再过十年,我们的挑战可能不再是“机器人能否击败职业玩家”,而是“职业玩家能否击败机器人”。

结论

毫无疑问,扑克机器人已经取得了长足的进步,从几乎无法玩游戏的系统发展为能够实时学习并适应玩家的算法。对于在线扑克来说,机器人使用的快速增长可能带来灾难性的影响,毕竟,如果每张桌子都坐满了能轻松击败新手的机器人,那么谁还会留下来慢慢学习呢?

从技术角度来看,机器人令人着迷,它们的发展也揭示了人工智能在其他应用领域的发展水平。但我们必须意识到它们在在线扑克社区中的使用,以及这可能对全球扑克游戏产生的影响。

常见问题

早期扑克机器人的初始能力是什么?它们是如何演变的?

早期的扑克机器人基于逻辑系统,需要手动编写策略。因此它们的表现可预测且容易被击败。随着时间推移,AI 变得更加复杂,先是能够在游戏之间进行表现分析和策略调整,最终发展为能够实时分析与决策的系统。

AI 和机器学习的突破如何影响高级扑克机器人的发展?

早期系统不仅无法学习,也就是说它们无法超出预设策略进行适应,而且运行需要庞大的硬件资源。随着 AI 能力的提升,机器人不仅可以学习和适应,而且转向了对资源要求大幅减少的软件解决方案。

目前最先进的扑克机器人有哪些?它们的先进之处在哪里?

Pluribus 是目前最先进的扑克机器人,它能够在无上限德州扑克中同时与多位职业玩家对战并击败他们。Pluribus 是一个完全进化的学习系统,它最初被编程掌握了扑克规则,并在随后的游戏中根据经验不断演化其策略。

扑克机器人的未来在在线和现场扑克中将扮演怎样的角色?

随着人工智能软件的持续发展,能够在锦标赛中稳定表现的机器人变得既便宜又容易获取。它们显然将变得更强、更难以与普通玩家区分,最终世界上最强的扑克玩家很可能就是一个机器人。

份额

这篇文章有用吗?

留下您的问题

    填写此表即表示我已阅读并确认隐私政策,并同意 NZTPoker 可以通过上述电子邮件地址与我联系。