玩游戏，要看评分吗？

图片来源@视觉中国

互联网时代的前夜，南加州大学的三名校友在1999年创办了网站Metacritic（后文简称M站）——一个尽可能覆盖所有娱乐产品的综合性评分网站。创始人多伊尔总结过它的宗旨：“让消费者们知道怎么才能最好地使用他们的时间和金钱。”

汇聚多家媒体得出均分，比单一媒体评分更具说服力，在相当长一段时间里，M站评分扮演着游戏口碑风向标的角色，以至某些发行商给游戏的奖金也会和M站评分挂钩。黑曜石工作室制作人克里斯·阿维隆就曾透露，由于比预期目标低了1分，他的团队错过了100万美元奖金。

M站的一项特性是取“加权平均分”，多伊尔对此表示：“我们的系统里权重是不透明因素，这是我们的独家秘方。”它选择媒体的标准同样不透明，像IGN、Eurogamer这样规模较大的媒体，总部和某国分站可能会被同时收录到一款游戏的评分列表里。

M站的长期竞争对手GameRankings在收录媒体上更加严格，且会计算绝对平均值，不过这家网站已经在2019年年底宣布关闭，原域名直接重定向至M站，原团队表示只会“带来更多经典的游戏评论”，不再提供评分服务。

改变原有评价体系的也不止一家，知名媒体Eurogamer早在2015年就放弃了1-10分的评分机制（分站仍保留），采用“推荐”、“精品”等区间评级。

老牌网站或媒体寻求变化的原因不难理解，移动互联网的到来、直播和视频平台的兴起都改变了原有媒介生态。“自媒体”的门槛降低后，一来玩家的发声渠道变多、发声成本减少，都能对一款游戏各抒己见，而媒体评测人员本质上也只是“更专业的玩家”，给出的评分本就无法避免主观色彩。二来通过观看直播和视频，玩家们也能在初步了解游戏后决定是否购买，不再依赖“评分”和“口碑”。

大环境变化是旧有评测体系必然面临的困境，但要将一款游戏的“评分权”完全交给玩家，现阶段似乎也行不通。

有关“差评轰炸”的案例不胜枚举，前段时间赛车游戏《GT7》就因为微交易、维护时间长等问题，在M站上的用户评分被刷到了1.5/10，成为该站史上分数最低的PlayStation游戏。

Steam上规模较大的刷差评事件则有缺中文的《足球经理》、突然涨价的《尼尔：机械纪元》等。有开发人员对披萨君回忆，自家游戏因为添加了一段角色可能死亡的隐藏剧情，Steam、WeGame等几个平台的好评率都在短短几天内从90％跌到了50％。

除了“故意差评”，还有“故意好评”，即以说反话、玩梗的形式拉高游戏评分，2018年时TapTap 上的《贪玩蓝月》就曾“中招”，官方不得不发了一则“关于恶意评价5星的的情况处理”声明，去掉冗余评分后游戏评分从8.3分降到了1.8分。

在很多时候，“玩家评分”只是表达情绪的一种方式，无法代表游戏内容质量的优劣好坏。

游戏评分为何难统一

理想状况下，具体的“分数”背后都应该有某种稳定的评价体系作为支撑，而探讨应该如何评价一款游戏，就避不开游戏带有的“商业”和“艺术”双重属性。

据Newzoo统计，2021年全球游戏市场规模已达1803亿美元，一个客观、庞大的市场支撑着“游戏首先是商品”的说法。“游戏归根结底是一种商品，商品能满足消费群体的需求就是合格、成功的。”一位旗下买断制作品销量达200万份的公司高层告诉披萨君，“只要玩家愿意持续不断地投入时间，真心愿意付费，那就可以说这是款好游戏。游戏毕竟不是衣食住行那样的必需品，而是消遣品。游戏制作者也得找准足够的玩家群体才能生存，不然容易曲高和寡。”

在消费逻辑里，情绪化评分也具有一定合理性。游戏的优化问题、网络问题乃至提供的语种不全，都可以解释为消费者因为使用体验不佳，进而行使了自己的评价权。

更极端的情况是，一些游戏相较其他内容产品，还提供着“内容消遣”之外的功能。某大厂员工向披萨君坦言：“大部分人看电影还是想看到好内容，但大家玩游戏的目的是有区别的，有些人可能想玩好游戏，有些人玩游戏就不是为了玩游戏的，可能是想花钱享受‘虐人’的快感，可能是想找个地方发泄负面情绪……”

如果不用区分游戏内容品质的“好”与“坏”，评分就没有存在的意义了。此外，但凡涉及充值，不同玩家的消费力度就会有差距，“游戏的ARPU（平均活跃用户收入）很高，一些网游私服可能就靠几个玩家养整个服务器，其他都是机器人，这时评分也没有意义。”上述大厂员工表示。

但商品属性并非游戏的全部。国内去年试行的《游戏审查评分细则》，就提出过从观念导向、原创设计、制作品质、文化内涵和开发程度5个维度对送审游戏进行打分。从行业及玩家认知的角度，“第九艺术”的名号也已经伴随游戏多年。

一旦进入艺术范畴，基于欣赏或鉴赏的评分就需要一定的评判依据。

“首先明确并非所有游戏都叫艺术，就好像绘画是艺术，我画的就不是。”制作人亚恒向披萨君分享了他给游戏划分的6个评判维度：商业成绩；玩家影响力；制作水平；游戏艺术价值（指与交互、系统、玩法相关的设计）；一般艺术价值（人文、社会、美学等普适审美体验）；作者性。

“其实普通玩家没有义务做鉴赏。”他表示，而奖项则是另一个极端，代表着一定要依循鉴赏目的来做评选，“不同奖项的侧重点也不一样，比如TGA会比较看重制作水平、一般艺术价值和商业成绩，IGF会看重游戏艺术价值和作者性。”

受访者供图

奖项的评选标准固然和普通玩家关系不大，但游戏也没有一套被资深爱好者们普遍认同的评判标准。媒体评测一般会有画面、系统、叙事等大致维度，再根据各个维度的表现打出综合分，是否精准暂且不论，这套话语体系在普通玩家中的普及度也不算高。

而类似豆瓣、IMDB这类第三方影视社区，聚集起一批爱好者群体（电影领域即“影迷式观众”）是它们能影响行业的先决条件。对“好游戏”的认知太过分散和个人化，导致目前国内游戏社区的“众评”版块很难具备影响力。

专注手游的TapTap是个例外，创立初期，TapTap曾以“发言前答题”的形式向用户传达社区文化，建站理念比较接近打造硬核玩家社区。不过由于手游自身轻量化的特性，迄今还是很难看到基于某些标准的完整评测，更为常见仍是感性打分。

深究下去，这是因为游戏在学术研究和基础教育这两个重要领域的失语。

从事游戏研究的学者刘梦霏曾在采访中表示：“参照兄弟行业影视，学界和业界的关系很健康，研究和评论影视有门槛是一种共识，至少得有阅片量才能输出靠谱的意见。”

但在现在的社会共识里，玩家要评论一款游戏不要求“玩过很多游戏”，也极少有院校会开展涉及游戏理论及游戏评论的研究。

另一方面，鉴赏需要后天培养，每个人小时候都会在学校或家庭里被推荐书单、影单，接受一些“优秀作品”的熏陶。哪怕一辈子不迈进专业领域，抱有兴趣的人多年积累下来也会形成大致的判断框架，有自己关于作品好坏的模糊认知，但游戏并没有这种待遇。

大部分玩家从未有意训练过自己的“游戏素养”，游戏这种文娱载体在任何第三方平台也就没法形成稳定的受众评分。

如果从1962年的《Space War》算起，电子游戏到现在的历史只有整整60年，本身技术迭代速度飞快，目前更多作为消费品存在、不被赋予更多文化意义也非常正常。“评分”只是露出海面的一角冰山，下方如果要形成稳固的、被广泛认知的欣赏、鉴赏体系，恐怕还需要给游戏以岁月。

关键词：