議題當紅度分析

有一個方法可以快速辨別熱門程度的指標,就是把它輸入到Google搜尋趨勢(Google Trends)。例如輸入「進擊的巨人」後它會呈現近年的搜尋熱門趨勢(最高數值會被設為100)。可以看到它剛開始有一個急遽竄紅的時期,過了高峰後就會開始衰減,於是現在我們可以問:1. 能不能透過搜尋趨勢的曲線,來認定它是不是過氣的作品? 2.我們要怎麼量化一個作品的過氣程度呢?

一般我們對過氣的定義是,當初全盛期的熱潮,現今已不復存在。所以最「理想」的過氣情況,就是當初急遽竄紅,然後人氣又快速衰減最好到最後大家都如同失憶一般,紛紛吐出「OO…是誰?」這樣的情況。那有甚麼適合的曲線方程式可以描述這樣的趨勢呢?

有的,我們有 Maxwell–Boltzmann 分佈,其pdf為

f(v)=2π(mkT)3v2exp(mv22kT) f(v) = \sqrt{ \frac{2}{\pi} \left( \frac{m}{kT} \right)^3 } v^2 \exp{ \left( \frac{-m v^2}{2kT} \right) }

,其中vv為分子的速度,mm為分子的質量,kk為Boltzmann常數, TT為絕對溫度。

Maxwell-Boltzmann 分佈

Boltzmann分布是用來描述理想氣體(ideal gas)的速率分佈的曲線,其描述某個溫度下,一個盒子內的氣體在各種速度下所佔有的粒子數量。此分佈成功地解釋了許多基本的氣體性質。撇去推導過程不說,這邊先只對它的公式做一些定性上的說明大家可以看到,每條曲線從原點開始,粒子數目會隨著速率增加。這表示當速率越大,分子可以做出的動作越多(有更多方向的選擇),所以橫軸上的速率越高,這個速率所"提到"的粒子數也就越多。

但接著,後面是個快速衰減的曲線,原因是在統計學上,粒子被分配到高能量的機率很低,根據分析,它是一個指數衰減─沒有人能抵得過指數衰減的壓制,因此圖形畫起來就像是偏向左邊集中的鐘形曲線了。

值得一提的是,根據方程式的結果,當溫度提高時,整體分佈會向右平移而壓扁(紅曲線),溫度變低時,分佈會向左集中而變得尖銳(青曲線),看起來有點像熱門程度變化的趨勢曲線。作為比較,如果把橫軸(xx-axis)換成時間軸,縱軸(yy-axis)換成熱門指數,那麼氣體分子因速度增加而提升了運動的可能性,就類比於作品熱度經一段時間散播名氣而竄紅,而氣體分子因能量分佈而造成高能量粒子數有明顯的指數衰減現象,類比於長時間下,作品熱潮的退去,考驗著一個作品能不能夠久存於人心的實力,這樣看來,Boltzmann分布的確是個非常適合描述熱門趨勢的曲線模型。

需要特別注意的是,Google Trends顯示的是關鍵字搜尋熱度,並非直接顯示粉絲的比例,或到達多"鐵粉"的程度。但紛絲在一定程度上都有推廣的作用,間接引發搜尋熱度,這同時也和”有沒有常常提到或聽到這個作品”的「過氣程度」有意義上的直接關係。

根據這樣的啟發,我們可以設計一個方程式來做data fitting,也就是模仿Boltzmann分布的公式: f(t)=Atαexpbt2+c f(t) = A \cdot t^{\alpha} \exp{-bt^2} + c

,其中aa為竄紅指數,bb就是過氣指數,AA僅是作為幅度的調整(時間統一以月為單位)。而關於調整offset的cc值,可以取未竄紅前的關鍵字平均熱門程度或者是參考作品發售的時間點取值,也可以取最靠近高峰值的前一個極值三種取法的$$c$4值通常都會很接近,但也有例外例如動畫化後才大紅的作品,就不適合拿輕小說的發售時間作為參考點(data fitting也容易出現錯誤)。

以「神魔之塔」作為關鍵字來測試。經data fitting後得到「神魔之塔」竄紅指數為0.95853676,過氣指數為0.00411,以其他同類型的資料來說,算是比較不過氣的遊戲。

「神魔之塔」關鍵字熱門度以Boltzmann分佈配適結果。藍線為原始資料,綠線為fitting曲線。

第二個實驗品是「開心農場」,竄紅指數2.25962323,過氣指數0.0333251,幾乎是「神魔之塔」過氣指數10倍。

「開心農場」關鍵字熱門度以Boltzmann分佈配適結果。藍線為原始資料,綠線為fitting曲線。

以下是多個作品的配置結果。

多個動漫作品與遊戲關鍵字熱門度以Boltzmann分佈配適結果。藍線為原始資料,綠線為fitting曲線。
對象 使用關鍵字 地區 過氣指數
夏娜 夏娜 台灣 0.000216
minecraft minecraft 全球 0.000232
K-ON K-ON 台灣 0.000241
LoveLive LoveLive 台灣 0.000986
神魔之塔 神魔之塔 台灣 0.00411
pokemon pokemon 全球 0.0296
開心農場 開心農場 台灣 0.0333
海老名 海老名 菜々 全球 0.061
雷姆(re0) 雷姆 台灣 0.067
乳繩 乳繩 台灣 0.0771
鬥陣特攻 Overwatch 全球 0.0932
小埋 小埋+土間埋 台灣 0.107
鬥陣特攻 鬥陣特攻 台灣 0.162
pokemon pokemon+寶可夢 台灣 0.193
無名(甲鐵城) 無名 甲鐵城 台灣 0.203
淡定紅茶 淡定紅茶 台灣 0.211
poi poi 台灣 0.5
跨年(2015) 跨年 台灣 1.452

附記

藝人或者偶像等似乎不適合套用在這個模型,藝人的熱門趨勢通常是後面一連好幾個peak,增減不一,不過同時也產生了一個新的疑問:當一個疑似過氣的藝人因後來某些事件而增加搜尋量時他還算是過氣嗎? 這個就很難說清了。而同樣生為偶像且常被質疑是否過氣的初音未來,其趨勢圖如下,由於可以延伸的領域範圍很廣所以沒有明顯衰減的曲線也不適合套入該模型使用,至少可以確定還沒到達過氣的程度。

「初音未來」關鍵字熱門程度。無明顯衰減。

其他無法套用公式的例子:Elsa (階段式的走紅),PPAP (現正當紅)。

「Elsa」關鍵字熱門程度。階段式走紅。
「ppap」關鍵字熱門程度。現在走紅中。

參考資料

results matching ""

    No results matching ""