文盲

读书无多,识字不广

怀念知轩

文盲 / 2025-07-27


2022年春节假期期间,一时兴起,爬取了知轩藏书的书籍评价数据,最近又给当时文件翻了出来,早知道知轩会倒就给书也爬下来了(误。又整理了整理,准备从自己还未读过的评分高的中看看有没有感兴趣的。知轩中书籍共分为这七类:都市娱乐、二次元、竞技游戏、科幻灵异、历史军事、奇幻玄幻、武侠仙侠,下面分别放下每个分类里评分前100的书目。

原本是按照5分制,直接计算平均分的,但是如此算法,历史军事中排名第一的书为腊月青梅子的《大楚怀王》,七人评分,均为仙草,感觉评分人数太少,均分失真,于是问了下chatGPT,其提供了贝叶斯平均的算法,说明如下:

公式:

Bayesian Rating = (v / (v + m)) * R + (m / (v + m)) * C

参数说明:

  • R:该书的平均评分
  • v:该书的评价人数
  • C:全体书籍的平均评分
  • m:最小评价人数门槛(经验值,如 50)

解释:

  • 当评价人数很多时,权重偏向 R(该书真实评分);
  • 当评价人数很少时,权重偏向 C(全局均值);
  • 有效避免了少数评价主导评分的问题。

我最终采取了这个方式计算均分,并重新进行了排序,因为没有经验,所以m值也干脆也定为了50人,好计算方式如上,最终结果如下。

都市娱乐

都市娱乐

二次元

二次元

竞技游戏

竞技游戏

科幻灵异

科幻灵异

历史军事

历史军事

奇幻玄幻

奇幻玄幻

武侠仙侠

武侠仙侠

附录

全部书籍