【EV扑克(www.evp86.com)报道】
十月底,一位俄罗斯程序员计划让多个大语言模型在一场漫长的扑克对局中相互较量,以测试谁的牌技更胜一筹。然而,如果参考PokerScout对几款知名聊天机器人的测试结果,这场AI比赛的牌技水平可能还不如普通的1-2级别牌局。
这场名为PokerBattle.ai的赛事的发起人是Max Pavlov。他的设想是举办一场全AI模拟的常规桌对战,参赛者包括Grok、Gemini、Claude和OpenAI(ChatGPT)等知名模型。比赛将于10月27日至11月3日期间进行,规则如下:
10-20常规桌
无前注、 straddle注或盲注上涨机制
最多9人桌
起始记分牌量为100个大盲
记分牌低于50个大盲时可随时补充
最终记分牌量最高的语言模型将获胜。
Pavlov解释了举办这场实验的初衷:
“大语言模型天然像是能辅助学习的工具——通过解析手牌、解释决策,将游戏中不同环节整合成连贯整体。但扑克圈对其推理能力的可靠性仍无定论。为了更清晰地验证各模型在扑克情境中的推理能力,我们决定组织这场锦标赛。”
PokerScout使用求解器GTO Wizard的训练模式,对部分预计参赛的AI进行了测试。
语言模型的扑克决策逻辑
大语言模型与GTO Wizard等求解器有本质区别。后者会通过数十万次模拟计算期望值来优化决策,而大语言模型则是通过海量公开信息进行训练。因此它们的扑克策略基于训练时“阅读”的内容,其中可能包含错误信息。
此外,LLM基于词语在特定语境中的出现概率进行统计推测。与基于AI的扑克求解器不同,大语言模型底层并没有对扑克游戏进行数学模拟。
新版本模型采用多步推理,将问题拆解为子语境。例如ChatGPT会先评估筹码底池比、范围、胜率等因素,再综合这些信息生成最终输出。相比几年前,聊天机器人的输出至少听起来更像懂扑克的玩家了。但PokerScout发现,它们对扑克的实际理解仍然有限。
PokerScout通过GTO Wizard的练习牌局进行测试,观察LLMs在决策树中的表现。测试对象包括Gemini 2.5 Pro(侧重推理、数学和代码)和Grok Expert(深度思考模式)。本应参赛的ChatGPT最初未能理解查询,反而反问用户的思考过程,但在使用付费版本并优化提问结构后,得到了更合适的回应。
测试使用与PokerBattle AI相似的设定(双盲注常规桌,100个大盲,短人桌),以下案例展示了这些程序在扑克策略上的局限:
案例研究:语言模型实战扑克牌局
这手牌是单次加注底池,枪口位玩家加注至2.5个大盲。大盲位玩家用K♣7♣跟注。翻牌发出9♠8♥6♦,部分模型立即出现误判:两个建议过牌,一个建议下注,策略开始分化。
翻牌圈:9♠8♥6♦
Grok称:hero位是“K-high,带后门同花听牌和卡顺听牌”。它与Gemini都认为需要10才能成顺子,忽略了5也能组成顺子。建议过牌。
Gemini表示:hero位有“卡顺听牌”和“两张高牌”——尽管7显然不是高牌。建议全范围过牌,但求解器实际会混合下注与过牌策略。它还认为hero位应该准备对标准下注弃牌,而实际上求解器会用手牌中所有带7的组合继续游戏,且经常对下注 bluff加注。
ChatGPT建议:下注2个大盲,理由是翻牌“更击中大盲位范围”。但GTO Wizard显示大盲位实际有轻微权益劣势(49.48% vs 50.52%)。不过K7组合确实更多选择下注,虽然频率差异不大,这意味着ChatGPT给出了最精准的 nuanced回应。
GTO Wizard建议:小注或过牌
实战:hero位过牌,对手过牌
转牌圈:K♦
Grok建议:下注2.75个大盲(50%底池),错误地将50%下注称为“极化手牌的标准尺寸”,实际上极化下注尺寸更大。还错误认为超池下注“在深筹码时过于激进”。
Gemini建议:下注4.1个大盲(75%底池),正确识别顶对弱踢脚,但错误假设对手不可能有超对。
ChatGPT建议:过牌,正确指出K♦提升了枪口位玩家权益,但对后续行动的理解有误:认为只应跟注小/中等尺度下注(实际上求解器不会对任何尺度弃牌),还对5/10河牌提出警示(尽管这些牌会令Hero成顺)。
GTO Wizard建议:主要过牌,混合大小尺度下注
实战:hero位下注4.1个大盲,对手弃牌
语言模型无法提供有价值的扑克策略建议
这手未到河牌的简单牌局,清晰揭示了这些程序在提供扑克策略建议方面的局限性。虽然付费版ChatGPT给出的建议最为 nuanced,但仍对明显牌理存在误解。
对于担心线上作弊的扑克玩家而言,实时辅助(RTA)确实是隐患——已有职业牌手被发现在对局中使用GTO Wizard等求解器。但任何基于LLM的实时辅助,其危害性可能不亚于帮助。
PokerBattle.ai是个有趣的实验,但扑克玩家不必期待向获胜模型请教策略。扑克策略还是应该交给专业求解器和人类专家,让大语言模型专注回答基础查询等简单任务更为妥当。
国人盛宴 重磅来袭!《国庆中秋生肖狂欢赛》
节日氛围与扑克热情继续在十月交织,即日起至10月12日,《国庆中秋生肖狂欢赛》总保底88,000,000火热接力登场!
“中秋佳节月饼赏金赛”献上100万保底奖励;友善的中国时区赛事让你不必挑灯夜战;多场常规生肖赛奖励翻倍;百万排行榜前100名再加码WSOP、APT线上赛礼包和丰厚奖励。
重点推荐赛事:
▌10月12日21:00|喜迎中秋神秘赏金主赛
▌888报名,1,000万保底
都说是主赛事了,怎么少了点特别的?国人限定三重加码福利:
只要打进奖励圈,即获邀喜迎中秋10万抽奖赛!
冠军获得“虎首生肖纪念奖杯”,将生肖赛事最高荣誉抱回家
▌赛事特色:中国时区友好,不用挑灯夜战;常规生肖赛奖励翻倍升级;国庆中秋百万福利榜,前100名荣耀加码!
冠军获得“虎首生肖纪念奖杯”,将生肖赛事最高荣誉抱回家
淘汰任意特色昵称玩家,即得888T赛事基金,可重复获奖!包含Tony、茅人及在内的众多GG中国队大使、播客吧主播都将加入,一起享受这场国庆中秋盛宴~
首次来玩?门票我请!
无论是线下主赛事,还是线上征战,我们相信中国扑克人的故事才刚刚开始。
🎁 登记领取【新手迎新福利】🎁
WSOP,我们也精心准备了老朋友礼包,可以登录游戏查看噢~
全球选手现已可通过线上卫星赛,赢得梦寐以求的2025WSOP主赛事门票,向世界扑克最高殿堂发起进攻!
特别加码~每日免费席位赛
国人斩获10W大奖!赏金猎人赛火热开打中 丰厚50M刀奖励等你来战!
无论线上或线下赛场,最激励人心的就是见证国人于世界舞台斩获佳绩了。
立即百度搜索领取门票!
GGPoker作为全球线上平台龙头,与享誉世界的扑克盛会WSOP合作,提供选手一个最干净、有保障,且充满乐趣的竞技环境。
龙华富贵 激动人心的赛事福利来袭:
本周开始新朋友+老朋友都将有各种领到手软的福利大放送,要如何获得!?登入游戏中查看有没有收到惊喜啦。
逐梦参赛!百度 “丹牛也疯狂逆转胜” 了解更多活跃新朋友限量送
双旦嘉年华福利免费赛史上最大变革 ”免费体验场”来了!
现在开始可以随时随地可以享受真实的游戏体验!我们提供丰富多样的玩法,包括德州扑克、奥马哈、短牌等等,让您尽情挑战自我,提高技巧。不仅如此,可以从游戏中获得体验币,所有玩家每日可以领取20,000,新加入朋友还可额外获得20,000,助您迅速上手。
加入我们的免费扑克游戏,和全球的牌手们一起切磋技艺,感受扑克游戏的乐趣吧!EV扑克作为GGPoker在国内新开设的旗舰品牌,每月不断推出福利反馈活动,现在只要成为EV新用户,达成免费赛任务就可以获得——“EV专属大宝箱”启动码1组加入EV扑克战队:http://evpk7.com/96088再送4张免费门票!
想跟美女Sashimi一起玩,想知道最新资讯与赛程,敬请锁定EV扑克官网(www.evp99.com)。看牌手痒玩EV扑克,每日多场免费赛奖励高达20w,现在注册EV扑克(www.evpk89.com)额外加赠8张幸运赛门票最高奖励1500倍!