扑克机器人的演变: 从简单的程序到先进的人工智能

内容表

在线扑克彻底改变了扑克游戏,为数百万从未涉足赌场的新玩家带来了福音,他们可能永远也不会涉足赌场。无论是德州扑克、奥马哈还是其他任何扑克变体,现在任何人都可以在家里随时随地享受扑克游戏,而且由于有了移动应用程序,任何人都可以随时随地享受扑克游戏。

但是,自 1998 年左右推出早期的数字扑克游戏以来,技术不断进步,如今的游戏与早期的产品已不可同日而语。与任何以金钱为赌注的游戏一样,玩家们都希望最大限度地提高获胜的机会,而扑克机器人就是在线纸牌游戏中实现这一目标的方法之一。

就像扑克本身一样,扑克机器人多年来发展迅速,但它们是如何开始的,它们是什么,以及扑克机器人将如何继续发展?

扑克机器人中的早期简单人工智能 

扑克机器人实际上比在线扑克更早出现,Orac 是 1981 年创建的第一批已知机器人之一。在经过数年的软件测试和培训后,他用机器人与赌场老板鲍勃-斯图帕克(Bob Stupak)进行了比赛,并将比赛拍摄成视频在全国电视台播出。奥拉克输了。

在那之后的近二十年里,在网络扑克出现之前,科学家们利用纸牌游戏作为人工智能的训练工具。利用以前的游戏数据来识别当前游戏中的概率,并根据分析结果做出决策,这使得机器学习和人工智能成为扑克应用的完美选择。随着技术的发展,机器人也在不断进步。

虽然大多数早期的机器人使用二十一点作为开发游戏,因为它是由已知牌组中出现特定牌的简单概率驱动的,但更为复杂的扑克仍然是一个需要频繁研究的课题。美国教授达斯-比林斯(Darse Billings)推动了这一发展,他选择扑克作为研究对象,是因为任何玩家的信息都是不完整的,他们不知道其他玩家有什么牌。

这些早期的机器人完全使用基于软件的系统,根据大型游戏数据库分析概率,并不像我们今天所知的那样 “智能”。也就是说,它们不能适应或学习,而只是在游戏的每个阶段使用机器人特定的逻辑解题方法。

技术进步及其对机器人扑克策略和世界扑克锦标赛的影响

随着 1998 年在线扑克桌的推出,比林斯所做的工作为我们今天所熟知的第一批机器人奠定了基础,这些机器人是玩在线扑克游戏的软件解决方案。第一个在线扑克机器人被称为 Vexbot,它的实力相对较弱,很容易被大多数对扑克游戏有一定了解的人类对手击败。当时出现的其他机器人也有类似的表现,但包括比林斯在内的科学家们仍在继续开发它们。

2005 年,世界上首次扑克机器人锦标赛在拉斯维加斯举行,参赛者人数之多令人惊讶。这些机器人的设计与早期的产品类似,并不是我们今天所理解的人工智能学习系统。同样,算法和数据分析虽然更加复杂,但仍是这些解决方案的核心。

比赛结束时,获胜的机器人被人类玩家轻松击败,这表明虽然已经取得了进步,但机器人能够与人类定期对战并获胜的想法还有很长的路要走。

从北极星到 Libratus,人工智能和扑克机器人的突破

第一个真正的突破出现在 2007 年,即 Polaris 诞生之时。Polaris 由阿尔伯塔大学的一个研究小组创建,再次由比林斯领导。与今天的扑克机器人相比,Polaris 仍提供相对基本的游戏玩法,但它使用了全新的实时逻辑来在游戏中做出决策。它能够模拟玩家的个人行为,标志着机器人技术的重大进步,也是通过人工智能进行实时学习的首批范例之一。

虽然不断改进的技术确实为后来的机器人带来了优势,但下一个真正的突破直到 2015 年才出现。Cepheus 成为第一个 “解决 “德州扑克无限注的机器人。它使用 200 个处理器和大量内存,在 2 个月的时间里计算出了游戏中的每一种可能性,全部 316 万亿个可能性,并被编程为采取 “平衡策略”。结果,它成为了一个无与伦比的程序,但它的游戏方式意味着,如果赢钱是它的目标,那么它其实帮不上什么忙。

继 Cepheus 之后,Claudico 于 2015 年问世,它是第一个真正意义上的无上限扑克机器人,也是 Cepheus 的升级版,但却无法战胜任何职业玩家。

Liberatus 是 Libratus 的进化版,仍然需要大量资源才能运行,并使用了先进的学习程序,可以根据场景的发展进行调整。它是第一个定期击败人类对手的扑克机器人,白天玩游戏,然后通宵分析每一步棋,这样第二天就能改进决策。

在 Libratus 的基础上发展起来的是现代扑克机器人,第一个机器人 Pluribus 于 2019 年出现。这些机器人在很多方面都有很大的不同,它们所提供的令人印象深刻的功能远远超越了之前的任何产品。

现代扑克机器人的今天: Pluribus 和其他扑克人工智能的能力与策略

Pluribus 和其他现代扑克机器人使用先进、复杂的人工智能算法进行实时学习和适应,因此不再需要以前的机器人所使用的大量资源。事实上,Pluribus 只需 128 GB 内存和两个处理器即可运行,因此可以根据需要从云节点运行。

它也不是在游戏数据库中训练出来的。而是先教会软件扑克的规则,然后让它边玩边学。这些机器人不仅了解牌局,还能在分析其他玩家的牌局时,即时选择如何处理每一手牌,以最大限度地提高胜率。

因此,扑克机器人可以同时与多个对手愉快地对战,这正是我们对扑克机器人的想象。Pluribus 是有史以来第一个同时击败多名职业扑克玩家的机器人,它与五名职业玩家进行了一万手牌的较量,最终取得了胜利。

扑克机器人和人工智能研究的未来

那么,随着 Pluribus 显示现代先进的人工智能系统可以学习扑克规则,并发展成为可以同时击败多个职业玩家的玩家,而所有这一切都只需要极少的资源,扑克机器人还能走向何方?

人们使用机器人玩在线扑克已经是各种扑克平台一直在处理的问题,但在过去,这还不是一个大问题,因为机器人并不复杂,相对容易克服,但如果游戏被能轻松战胜一桌职业玩家的机器人所控制,那就另当别论了。尤其是像 Pluribus 这样可以在云平台上运行的系统,每月成本不到 100 美元,几乎任何人都可以轻松建立这样一个系统。

扑克机器人永远不会感到被束缚,它们永远不会因为彩池而紧张,因此如果任其发展,时间一长,它们就会压垮玩家。因此,机器人在商业领域的未来总是需要更多的检查和平台上的安全系统来阻止它们。但技术本身又如何呢?

人工智能在各个领域都在飞速发展,如果我们认为扑克也会如此,那就太愚蠢了。高级学习软件将继续变得更加复杂,无论是对游戏的理解还是制定的策略。

十年后,我们将不再挑战机器人能否击败职业玩家,而是挑战职业玩家能否击败机器人。

结论

毫无疑问,机器人已经取得了长足的进步,从几乎无法玩牌的系统到不仅能学习,还能实时适应玩家的学习算法。对于在线扑克而言,机器人使用的快速增长可能会带来灾难性后果,毕竟,如果每张牌桌上都是可以轻松击败新玩家的机器人,为什么还会有人坚持学习呢?

机器人的技术方面令人着迷,看到它的发展是人工智能在其他应用领域的一个很好的指标,但我们必须意识到它们在在线扑克社区中的使用,以及这将如何影响全世界的游戏。

FAQ:

早期扑克机器人的最初功能是什么?

早期的扑克机器人以逻辑系统为基础,需要将策略编程到其中。因此,它们是可预测的,很容易被击败。随着时间的推移,人工智能变得越来越复杂,先是可以在游戏之间进行性能分析和策略调整,最终发展到今天的实时分析和决策。

人工智能和机器学习的突破是如何影响高级扑克机器人的发展的?

早期的系统不仅不具备学习能力,即无法适应程序设计之外的策略,而且还需要庞大的硬件系统才能运行。随着人工智能能力的提高,机器人不仅能够适应和学习,还能转向基于软件的解决方案,运行所需的资源大大减少。

哪些是 目前最先进的扑克机器人有哪些?

Pluribus 是当今最先进的扑克机器人,它能同时与多名职业玩家进行无上限扑克游戏,并击败他们。Pluribus 是一个全面开发的学习解决方案,它的程序包含扑克规则,并根据游戏经验不断改进策略。

扑克机器人的未来及其在在线和现场扑克中的作用如何?

随着人工智能软件的不断进步,能够在锦标赛和更多比赛中独当一面的机器人正变得既经济实惠又容易获得。显然,它们将成为更好的玩家,更难被普通人类玩家发现,最终世界上最好的玩家很可能就是扑克机器人。

份额

这篇文章有用吗?

留下您的问题

    填写此表即表示我已阅读并确认隐私政策,并同意 NZTPoker 可以通过上述电子邮件地址与我联系。