電影評分演算法多,想刷分其實沒那麼簡單

2022-09-23 06:18:24 字數 2399 閱讀 4113

想讓**評分高一點,只有拍好電影這一個能確定的方法。

這兩天豆瓣、貓眼的"評分事件"鬧得有點兒大,作為一家“科技**”的小編,自然是不摻和這些站隊之類的麻煩事兒

所以蹭熱點的方式非常淳樸——科普,因為電影評分這事兒當然不可能像體操那樣“去掉一個最高分、丟掉一個最低分,然後總分除人數”那麼簡單粗暴,還得談到“大資料”。

豆瓣的評分是把所有使用者給出的 1~5 星換算成 1~10 分,然後將總分除以打分人數,就得到了豆瓣評分。這個評分不經稽核,由程式定時生成。不過豆瓣也對“非正常評分”做了處理,不管是刷高分還是刷低分,都會遮蔽掉、不算在評分內

國內的另一家電影**時光網也採用的平均演算法:

時光網官方給出的演算法說明

早些年時光網的 slogan 是做“中國版的 imdb”,但根據後來時光網在去社群化上做出的一系列改版,這個願望大抵跟廁紙一起衝到馬桶裡,現在好像沒誰再提了。時光網的評分最有意思的是最低可以打到 0.1 分,不過這需要特別的技巧:在分項裡只給聲音和畫面各一顆星(最少要給兩項打分才能提交)。

而國外最知名的imdb的則不同,它使用的加權平均值。對於 top 250 的評分,它採用了貝葉斯統計演算法

wr, 加權得分(weighted rating)。

r,該電影的使用者投票的平均得分(rating)。

v,該電影的投票人數(votes)。

m,排名前250名的電影的最低投票數。

c, 所有電影的平均得分

通過現有資料統計設定基準平均評分、人數,在這個基準之上加入真實的使用者評分,合起來得出 imdb 的 top 250 最終得分。

imdb 的這種貝葉斯統計演算法更像是平衡模型、而不是一個評分模型。這種平衡模型能為冷門影片提供一個補償值,即便評分數少也能得到一個相對可靠的評分,而每一次新的投票都會使評分不斷向該影片的真實投票結果靠近。

top 250 之外的排名演算法 imdb 目前並未公開,但我們可以通過現有的具體評分來了解一下:

《國家寶藏》、《肖申克的救贖》、《長城》的評分詳情

除了演算法之外,對於電影評分來說,把握好宣傳的力度也很重要,過度宣傳可能會拉低評分

一般來說,不依靠宣傳吸引來看電影的人傾向於打高分,但人數較少;而被大規模的宣傳吸引的人傾向於打低分,這類人數較多。這也是獨立電影為什麼有時候評分很高(只有少數粉絲來打分),而票房冠軍有時候評分很低(把不會喜歡的人也宣傳來了)的原因。

所以高分和高票房的確會有一些衝突,只有真正廣受歡迎的電影能化解這個衝突

《盜夢空間》和《星際穿越》是近幾年高票房、高評分的典型

豆瓣 ceo 阿北之前對評分演算法表示“豆瓣在盡力還原普通觀影大眾對一部電影的平均看法,這個主旨過去十年沒變過,將來也不想變”,他雖然也認為彙總專家意見也是件很有價值的服務,但這並不是豆瓣評分的宗旨(所以做賣票起家的貓眼做了基於電影業內人士的專業評分,雖然現在由於不可描述的原因已經取消了)

。也許就像阿北說的那樣,想讓**評分高一點,只有拍好電影這一個能確定的方法。

【****網路】