云顶进阶系列(二):大数据入门与深入
数据网站到底怎么用?澄清样本量、Delta / Rel. Delta、Ic 等基本概念与常见误区,再用蓝发妖姬、佐伊青龙刀、低费 EZ 等具体案例,把从基础到进阶的检索器用法讲清楚。

本文旨在解释数据网站的基本概念,澄清常见使用误区,阐述基础和进阶用法,推荐引申学习资料。
三大数据网站:
- tactics.tools:最早最经典的数据网站,适合连续长时间(比如半小时)使用。
- MetaTFT:收集 PBE 数据最好的网站,有独家城邦统计,海克斯梯度有很硬的后台支撑(不是指站台的人)。可以查询 2 阶段场面胜率(early)、弈子站位胜率(positioning)、猜胜负关系(boardle)。
- DataTFT:本土大数据网站,服务器就在国内、直连不卡,高级检索器免费,有最好的羁绊追踪者功能。
个人向杂谈
我如何看待数据。
正如内卷(网络用语)和内卷(社会学术语)内涵不同,大数据(云顶用语)和大数据(计科术语)也是两个不同的概念。本文提及的大数据指各种数据网站上的统计数据。
云顶的随机因素不计其数,大到肉眼可见的每轮牌库刷牌、海克斯选项、走位、异变(S13)刷新,小到死神千珏的一发弹体是否暴击、女巫剑姬的技能是否突到主 C、蓝发蜘蛛的控制是否和羁绊眩晕重叠,没有任何人能综合所有因素做出合理判断。如果不愿乘坐运气之舟在风雨飘摇的随机数海洋上漂流,或者不信任个人管中窥豹的一隅之见,又或单纯厌倦了旧有的云顶学习方式、想要另寻出路攀上新高,使用数据都是不二法门。数据来源于每位玩家的结算面板,当样本量足够大时,可以认为它综合了所有因素的平均值,相对可靠地衡量了 某件装备 / 某个海克斯 / …… 的真实强度;通过检索器增减各种条件,加上基于个人经验的分析判断,就能得出在特定情况下 规划散件 / 选择海克斯 / …… 的科学决策。
我对科学决策的追求完全基于兴趣,并不认为它是竞技云顶的最好方式,也不认为它对提升段位 / 取得成绩有必要作用。作为自走棋游戏的一种,云顶之弈多少脱胎于麻将(弈子升星-碰 / 成刻、组出羁绊-番型 / 成顺、备战席留牌-麻将留牌)。而竞技麻将的翘楚立直麻将早有 运势流 vs 科学 / 统计学 的碰撞,所以云顶圈出现类似的争论实属情理之中。据说,运势流产生的动机是“正因为我打的没什么问题、但是没赢,才去研究运气的”,可见日麻的运势流默认拥有技术的基础,是顶尖雀士早有扎实基本功之后数十年如一日积累的经验之谈,这些经验完全可以和现代统计学结论不谋而合。我们热爱的云顶之弈刚刚过完五岁生日不久,相比发展数百年的麻将宛如襁褓中的婴儿。在这个时间点,哪怕是最资深的云顶之弈玩家都很难克服婴儿似的自我中心看法,很难摆脱“鸽子的迷信”。在这个时间点,无论是网络论坛上时有的 运气-实力、或者 基本功-大数据 争论,还是顶尖选手对大数据的分析、解读和使用,都比较原始、初级(无贬义,我自己也是这样,无意引战)。因此,我认为竞技云顶还远没有发展到能研究运气的地步,而通过分析数据获得基本功(阵容选择、海克斯选择、散件规划、乘区论等等)上的提升是可行的。
当然,云顶从设计上似乎是鼓励“轻松游戏”的,例证之一是 抽牌 / 合装备 对游戏平均排名影响的数量级:四费 C 位 一星 / 两星 影响 2 左右的平均排名,而可合成装备之间的差距很难真正超过 0.2,有无体系五费的影响也在 2 附近——这个级别是任何人为操作无法逾越的天堑,尤其是在路线和构筑固定的版本(任何人的牌库利用率都极低,几乎只能抓体系牌,因为非体系牌二星甚至三星打不过他人体系牌一星)。正确研究数据对平均游戏排名的提升效率,未必比纯靠经验直觉高,甚至可能不如误读数据、歪打正着。我对这篇帖子的预期是石沉大海,正如人类有史以来产生过的思想浩如烟海,但它们中的绝大多数不被社会需要,只能失传或者长眠在古老的文献里。近年来,海外兴起了诸如 TFT Academy / TFT Coaching 等项目,他们的创作者有很好的大数据功底,提供的内容也三句不离大数据。他们能够存活或许有相当大的部分依赖于共识,我不认为国内云顶圈能凝聚出对大数据的需要。即便如此,出于朴素的民族情感,我也希望自己对大数据的理解不会输给外国人。
这篇文章在这样的心境下写就,它是我一年以来日夜思考的结果。
基本概念
完全没有大数据使用经验的人,建议移步下文“应用”区;本节适合对数据网站有基本使用的读者阅读。
0. 排名
统计数据来自于玩家的结算面板。云顶一共有 8 个名次,排名 1 最高、值最小,排名 8 最低、值最大。一般而言,数据中排名越小越好。
1. 样本量
省流:样本量低于 1000 的数据不要当真。
不同样本量大致有如下误差:
| 样本量 | 误差 |
|---|---|
| 100 场 | ±0.5 |
| 1000 场 | ±0.15 |
| 10000 场 | ±0.05 |
(这个部分引自 Aesah,我不理解如何把云顶名次分布看成正态,希望有人能教教我。暂时放个结论,应该不影响应用。)
2. Delta 和 Rel. Delta

如图:魔蕴的平均排名是 4.12,维克托的平均排名是 2.90,维克托带魔蕴的平均排名是 3.15。
- Delta 指有魔蕴的情况下,相比于给其他人,把魔蕴给维克托带来的影响:Delta = 3.15 - 4.12 = -0.97。装备界面的 Delta 通常没有使用意义,值为负、平均排名变高,只是代表游戏已经进行到后期(越后期 D 到维克托上场的可能性越大)。
- Rel. Delta 指有维克托的情况下,相比于其他装备,维克托带魔蕴的影响:Rel. Delta = 3.15 - 2.90 = +0.25。这个数据代表魔蕴对维克托的提升,值为正、平均排名变低,说明维克托带魔蕴很差,尽量不要这样做。它可以较好地衡量某装备是不是某弈子的神装。
3. Ic
是 Item count(装备数量)的缩写。比如说某张卡 Ic0,就是说他不带装备;Ic3,就是说他带了三件装备。
基础用法(不涉及检索器)
1. 寻找阵容构筑
以 tactics.tools 为例:进入主页后,点击相应入口,可以看到所需阵容的常见变阵(按等级 / 有无转职分类)。此项功能的缺陷是样本量较少,尤其在版本发布初期,LVL 8 中登场率最高的构筑也不足 1000 场,排名上容易失真。如果想参考排名,建议在“概述”栏查看对局数来判断是否准确;也可以不看排名,单纯用来增加自己的变阵储备。这个界面的“装备”栏也算有用,可以查看前后排神装及其组合,但有一些缺陷,后文进阶部分会讨论。
2. 作为开局选 神器 / 辅助装 / 光明装 的参考
以 tactics.tools 查询神器为例:

进入主页后,点击红框内容,可以看到神器排名。参考排名选到心仪的神器后,点击右侧箭头,查看神器的适配弈子。我们通常需要关注 Play rate、Delta(名次差)和 Rel. Delta(关于这两个 Delta 的区别详见上文「基本概念」)。
- Play rate:当前版本(S13)神器来源较少,玩家都会把神器给到该给的人,可以暂时忽略该值。
- Delta(名次差):点按名次差降序,通常会看到 六费卡 → 五费卡 → 四费卡 自上而下排序,这是游戏进度不同导致的。我们可以通过比较同费卡(通常是四费)的数据来决定本局的游戏方向,一般而言 Delta 越低越好。例如,魔蕴 Delta 最低的四费携带者是希尔科,所以拿到魔蕴后奔着希尔科玩是可行的。
- Rel. Delta:点按 Rel. Delta 降序,通常会看到不同费用弈子交错排序,这是神器对弈子的真实提升。我们可以挑选排名前列的弈子作为本局主 C。如果已经有了想玩的阵容、发现该阵容的 C 位在 Rel. Delta 榜上有名,请千万不要错过这个神器。例如,魔蕴 Rel. Delta 最低的携带者是炸弹人,所以想玩炸弹人的时候就拿魔蕴是很好的。
3. 快速捕捉版本变化
在 tactics.tools 的数据栏中点击趋势,可以看到新版本加强最多和削弱最多的弈子、羁绊、装备。
进阶用法
1. 深入寻找阵容构筑
以 tactics.tools 查询蓝发构筑为例——无转情况下,七蓝发的哪张五费外援最好?

如图 1,咋一看似乎是杰斯最好。其实不然,这张杰斯是十级才丢上去的(别问我为什么知道);如果把等级限制为 9(图 2),会发现只有妖姬是正提升。

这既符合给主 C 开羁绊的本手,也契合蓝发直切敌方后排的团战逻辑。在刀疤大嘴昌盛的版本,蓝发不带妖姬会遭到严重的惩罚,因为其余外援(如安蓓萨、杰斯)都是从前往后打的“平推系”,根本过不了刀疤盖伦;而妖姬可以早早给大嘴挂上锁链,配合佐伊弹射 + 金克丝火箭秒掉。当然,云顶有“D 到什么用什么”的原则,本文只关注大数据,暂不讨论。
2. 深入理解装备
以 tactics.tools 查询蓝发装备为例——佐伊的青龙刀很差?

如图 1,咋一看佐伊的青龙刀烂透了。其实不然:在团队只有一把青龙刀的情况下,这把青龙刀通常给到金克丝是更好的,而佐伊带着青龙刀涵盖了“没 D 到金克丝就淘汰”的情况,显得数据很差。如果把金克丝筛上启动装(图 2),会发现佐伊的青龙刀和羊刀一样是神装。

这既符合长蓝条法师做青龙刀的本手,也契合蓝发加攻速能和平 A 回蓝互动的乘区论。如果只看到了数据的第一层,在过渡阶段还没有金克丝的时候不给佐伊青龙刀,是匪夷所思的。当然,对于大数据新手出现这样的失误完全情有可原,没有责怪的意思——正是希望愿意使用大数据游戏的读者理解越来越深、越用越好,我才写下这篇攻略的。
3. 深入理解版本变化
以 tactics.tools 查询强势低费为例——伊泽瑞尔是版本低费新贵?

如图 1,在高级检索器弈子搜索框中输入想查的费用(比如三费),看起来 EZ 似乎是新贵低费 C 位。其实不然,将三星 EZ 筛入检索器(图 2),点击装备数量,我们有两个途径认定 EZ 是顺手追出来的:一是比较各弈子的 Ic3 率,此处 EZ 和俄洛伊 / 大头 Ic3 率相当,说明不是奔着 EZ 七 D 玩的;二是比较 Ic0 和 Ic3 的排名,发现 EZ 带不带装备数据没差,而通常奔着玩的低费阵容这项数据差别很大。

同理,可以发现阿卡丽的数据是蹭梦魇的,也可以发现船长虽然蹭了点征服,但大体是能玩的。
多年经验表明,能吃鸡的低费强势阵容三星数据至少要达到:
- 1 费 = 4.2
- 2 费 = 4.0
- 3 费 = 3.6
例如,S10 巅峰真伤亚索是 4.0,S13 巅峰海克斯梦魇是 3.8,S11 巅峰死神永恩是 3.4。
4. 深入理解装备分配
以 tactics.tools 为例——赌螃蟹的时候,多余输出装给一星飞机还是两星小炮?

如图,在检索器里筛入飞机控制游戏进度,对比小炮 Ic0 和 Ic3 的数据,发现基本无差异,所以他带不带装备是无所谓的,把装备给到不用叠层、即时发力的飞机更好。
注:这个解读不够严谨,跨费用跨星级对比不能真正消除游戏进度的影响,只是当前版本我只能找到这个例子。更有代表性的是 S12 换型辛德拉的肉装分配:对比 (妮蔻 × 乌鸦) - (Ic3 × Ic0) 的数据会发现妮蔻 Ic3 更好 0.1 左右,因此在同质量的情况下肉装给妮蔻。
5. 深入理解城邦
以 MetaTFT 为例:

进入主页后,点击相应入口,就能看到对应阵容的城邦数据。由于误差的存在,通常我们只需关注 0.1 甚至 0.2 以上级别的数据,用作参考。这个数据在理解阵容所需 经济量 / 装备量 上极有价值,尤其是在缺少海克斯数据的当下,以后有空开坑来讲。
6. 窥探海克斯数据
所有英雄羁绊类强化(S13):如在 tactics.tools 检索器里输入“天才”,可以看到该海克斯对应的排名,以及数据上最优的构筑。在排除条件里排除几乎所有羁绊(可以保留外交官),得到卓尔不群的数据。
英雄强化:如在检索器里输入 3 星辛吉德,其中带有 大天使 / 鬼书 的数据可以认为是“炼金术士”的数据。DataTFT 提供了更高级的功能——检索器里的高级模式,可以查询辛吉德带有 大天使 or 鬼书 的数据。
装备类强化:纹章可以在 装备 → 纹章转职 处查看。加冕礼-金铲铲冠冕,锅铲厨房-金锅铲冠冕,最大规模-金锅锅冠冕;金铲铲冠冕的数据受 金蛋 / 城邦 的影响大,其余二者相对准确。另一方面,通过对比两个版本的变化幅度,可以配合平衡改动判断强度。“不是今天”这类可以通过查看 青钢影+史密奇 的双夜刃 Delta 判断,因为通常情况不会这样出装——横向对比,青钢影+史密奇的双血手很差,以此判断“不是今天” vs “释放野兽”的强度。同理还有螃蟹的 血手+血手 Delta。
写在最后
祝各位有所收获。