-
大數(shù)據(jù)扒一扒蔡徐坤的真假流量粉:動(dòng)輒轉(zhuǎn)發(fā)百萬有多少是套路?
關(guān)鍵字: 蔡徐坤流量蔡徐坤本文經(jīng)授權(quán)轉(zhuǎn)載自微信公眾號(hào)“Alfred數(shù)據(jù)室”(Alfred_Lab), 作者AlfredWu。
前段時(shí)間央視新聞公開披露流量明星數(shù)據(jù)造假。作為一名數(shù)據(jù)猿,我們秉著好奇心點(diǎn)開了NBA新春賀歲形象大使蔡徐坤的微博,發(fā)現(xiàn)他的微博轉(zhuǎn)發(fā)量除了最新一條之外,其它的基本每條都是轉(zhuǎn)發(fā)100萬+。
在我們的印象中,轉(zhuǎn)發(fā)100萬+可是某些明星官宣結(jié)婚、或者某些明星吸毒出軌被爆等能讓微博服務(wù)器奔潰的流量呀。蔡徐坤真的那么火嗎?他的100萬+轉(zhuǎn)發(fā)里到底是否存在假流量?假流量所占比重有多少呢?
為了解答這個(gè)問題,我們通過微博移動(dòng)端隨機(jī)抓取了蔡徐坤的一條微博《再見,“任性的”千千…》的10萬條轉(zhuǎn)發(fā)數(shù)據(jù)(時(shí)間節(jié)點(diǎn)2019年3月11日10時(shí))。這條講訴蔡徐坤關(guān)愛小動(dòng)物的短視頻微博,于2019年3月9日01:23發(fā)布,到2019年3月10日18:00的時(shí)候已經(jīng)被轉(zhuǎn)發(fā)100萬+。
數(shù)據(jù)的維度包括轉(zhuǎn)發(fā)者的相關(guān)信息(昵稱、性別、關(guān)注者數(shù)量和被關(guān)注者數(shù)量等)以及轉(zhuǎn)發(fā)時(shí)的評(píng)論等。
一、蔡徐坤的微博轉(zhuǎn)發(fā)是否存在假流量?
解答這個(gè)問題之前,我們其實(shí)對(duì)于蔡徐坤的粉絲性別比例更加感興趣。按理來說應(yīng)該他的女粉絲所占比例應(yīng)該更大,但是我們統(tǒng)計(jì)了102313條轉(zhuǎn)發(fā)數(shù)據(jù)中,有93618條是男粉絲轉(zhuǎn)發(fā)的,只有8695條是女粉絲轉(zhuǎn)發(fā)的。
這不對(duì)呀,難道更多的男生喜歡蔡徐坤嗎?而且這比例也太懸殊了一點(diǎn)吧?于是我們隨機(jī)抽取了男生轉(zhuǎn)發(fā)的數(shù)據(jù),發(fā)現(xiàn)這些轉(zhuǎn)發(fā)的男粉絲基本上都是關(guān)注0,粉絲1的用戶。
我們合理地推測:這些流量就是所謂的假流量。
那假流量所占的比例有多少呢?在這隨機(jī)抓取的10萬條轉(zhuǎn)發(fā)數(shù)據(jù)中,有多少是假的流量呢?
二、真假流量所占的比例各有多少?
通過一番探索分析,我們把轉(zhuǎn)發(fā)數(shù)據(jù)中轉(zhuǎn)發(fā)者的關(guān)注或者粉絲數(shù)少于等于5、沒有簡介、轉(zhuǎn)發(fā)之后被點(diǎn)贊數(shù)評(píng)論數(shù)再轉(zhuǎn)發(fā)數(shù)都為0、微博會(huì)員等級(jí)為0級(jí)的數(shù)據(jù),以及轉(zhuǎn)發(fā)者的關(guān)注或者粉絲數(shù)大于等于5但昵稱長“用戶XXXXXXXX”這樣的數(shù)據(jù)抽取了出來。
這部分?jǐn)?shù)據(jù),便是我們所說的假流量。
可見,102313條轉(zhuǎn)發(fā)數(shù)據(jù)中,有95397條是由假粉絲轉(zhuǎn)發(fā)的,占了總轉(zhuǎn)發(fā)的93.24%,只有6916條是由真粉絲轉(zhuǎn)發(fā)的,占6.76%。原來假流量占的比重那么高啊!
那么6919條真粉絲轉(zhuǎn)發(fā)的數(shù)據(jù)中,除去重復(fù)轉(zhuǎn)發(fā)刷榜的數(shù)量,里面一共有多少個(gè)真粉絲在轉(zhuǎn)發(fā)呢?我們把這部分?jǐn)?shù)據(jù)按照粉絲微博ID進(jìn)行去重。發(fā)現(xiàn)這里面只有3926個(gè)真粉絲在轉(zhuǎn)發(fā),也就是說,真實(shí)轉(zhuǎn)發(fā)的粉絲數(shù)量,占總轉(zhuǎn)發(fā)量的3.84%。
按照這個(gè)比例,可以推算出100萬的轉(zhuǎn)發(fā)中,真實(shí)轉(zhuǎn)發(fā)的粉絲數(shù)為3.84萬,說明蔡徐坤的粉絲群和影響力還是很大的,但遠(yuǎn)沒有微博顯示的全是100萬+轉(zhuǎn)發(fā)量那么大。
- 原標(biāo)題:大數(shù)據(jù)扒一扒蔡徐坤的真假流量粉:動(dòng)輒轉(zhuǎn)發(fā)百萬有多少是套路?
- 責(zé)任編輯:陸雨聆
- 最后更新: 2019-04-04 15:55:54
-
蔡英文母校標(biāo)臺(tái)灣為中國一部分,臺(tái)當(dāng)局崩潰
2019-04-04 15:52 臺(tái)灣 -
頻繁跳槽影響個(gè)人信用?浙江人社廳:只針對(duì)惡意跳槽
2019-04-04 15:19 -
頻繁跳槽影響個(gè)人信用?浙江人社廳澄清
2019-04-04 15:04 最難就業(yè)季 -
持續(xù)真香!是什么魔力讓新版《倚天屠龍記》持續(xù)漲分?
2019-04-04 14:15 中國電視劇 -
中學(xué)生因未“告密”被罰后自殺?鄭州教育局回應(yīng)
2019-04-04 13:55 -
又有用火災(zāi)烈士打廣告的?!
2019-04-04 13:50 捍衛(wèi)英雄 -
“太赫茲能量鞋”治腦梗?專家:可能是騙局
2019-04-04 13:46 -
致敬英烈,唱響吾輩當(dāng)自強(qiáng)的時(shí)代最強(qiáng)音
2019-04-04 13:32 -
平均薪酬1.1萬,打游戲也成“正經(jīng)職業(yè)“了
2019-04-04 13:10 -
“舍命產(chǎn)子”重病妻子離世 丈夫回應(yīng)爭議:醫(yī)生所說并不屬實(shí)
2019-04-04 13:10 -
李志否認(rèn)因行為不端被取消巡演 可經(jīng)紀(jì)人好像不是這個(gè)意思...
2019-04-04 12:11 明星那點(diǎn)事兒 -
被綁留學(xué)生是鹽城紀(jì)委書記“闊綽兒子”?假的!
2019-04-04 11:50 網(wǎng)絡(luò)謠言 -
00后的社交黑話 也太讓人上頭了吧…
2019-04-04 11:12 趣讀 -
英雄永在!30名犧牲人員被批準(zhǔn)為烈士
2019-04-04 11:05 捍衛(wèi)英雄 -
黃牛代買喜茶月入過萬:一天三四十杯不愁賣不出去
2019-04-04 11:04 -
李志因身體抱恙取消演唱會(huì) 官方:行為不端被叫停
2019-04-04 10:57 明星那點(diǎn)事兒 -
在德國學(xué)術(shù)成果被掠奪,當(dāng)事人:回國后進(jìn)展更順利
2019-04-04 10:51 -
曾偉雄任國家公職,香港各界盼有更多港人參與
2019-04-04 10:36 香港 -
這個(gè)iG冠軍皮膚,王思聰很眼熟
2019-04-04 10:20 趣讀 -
習(xí)近平這些話,致敬民族最閃亮的坐標(biāo)
2019-04-04 10:18 新時(shí)代新氣象新作為
相關(guān)推薦 -
特朗普要求“大搞特搞”,美團(tuán)體急了:沒中國不行 評(píng)論 14“美國人,真正該擔(dān)心的時(shí)候到了” 評(píng)論 90直播:算法向善——共話AI與人類命運(yùn)共同體未來 評(píng)論 8“美國政府像青少年,拿信用卡揮霍,直到…” 評(píng)論 140“聽到東方驚雷了嗎?那是14億中國人在笑話美國” 評(píng)論 241最新聞 Hot
-
特朗普要求“大搞特搞”,美團(tuán)體急了:沒中國不行
-
“美國人,真正該擔(dān)心的時(shí)候到了”
-
涉及中國,韓企與美國“一拍即合”
-
歐洲學(xué)者:現(xiàn)在,中國能不能反過來幫幫我們?
-
印度“硬剛”:將報(bào)復(fù)美國
-
“歐洲同行都覺得,未來十年誰將主導(dǎo)已無懸念,不會(huì)是美國”
-
普京:全世界都想進(jìn)入中國市場
-
馬斯克:對(duì)!全面公布所有文件
-
美方恢復(fù)出口,“不是恩賜也不是讓步,是我們斗爭來的”
-
想得真美!“美越協(xié)議這一條,旨在孤立中國…”
-
“美國政府像青少年,拿信用卡揮霍,直到…”
-
“聽到東方驚雷了嗎?那是14億中國人在笑話美國”
-
“以色列和俄羅斯正進(jìn)行秘密會(huì)談”
-
佩通坦基本盤還穩(wěn)嗎?泰國權(quán)力天平傾向何方
-
“不同于西方,中國正建設(shè)由技術(shù)驅(qū)動(dòng)的福利模式”
-
中國駐泰國大使館:被騙至緬甸的男模特已獲救
-