怀念知轩
文盲 / 2025-07-27
2022年春节假期期间,一时兴起,爬取了知轩藏书的书籍评价数据,最近又给当时文件翻了出来,早知道知轩会倒就给书也爬下来了(误。又整理了整理,准备从自己还未读过的评分高的中看看有没有感兴趣的。知轩中书籍共分为这七类:都市娱乐、二次元、竞技游戏、科幻灵异、历史军事、奇幻玄幻、武侠仙侠,下面分别放下每个分类里评分前100的书目。
原本是按照5分制,直接计算平均分的,但是如此算法,历史军事中排名第一的书为腊月青梅子的《大楚怀王》,七人评分,均为仙草,感觉评分人数太少,均分失真,于是问了下chatGPT,其提供了贝叶斯平均的算法,说明如下:
公式:
Bayesian Rating = (v / (v + m)) * R + (m / (v + m)) * C
参数说明:
R
:该书的平均评分v
:该书的评价人数C
:全体书籍的平均评分m
:最小评价人数门槛(经验值,如 50)解释:
- 当评价人数很多时,权重偏向
R
(该书真实评分);- 当评价人数很少时,权重偏向
C
(全局均值);- 有效避免了少数评价主导评分的问题。
我最终采取了这个方式计算均分,并重新进行了排序,因为没有经验,所以m值也干脆也定为了50人,好计算方式如上,最终结果如下。