【思享會】楊玥:在數字的映象里研究人

>>>  名人論史——近當代作家的史學觀點  >>> 簡體     傳統


編者按

通過大數據的分析,可以做成“油價早知道”這樣的小應用為開車族提供方便,也可以為出版社分析出00后男生和女生好不相同的閱讀偏好。8月14日,2014夏季騰訊思享會“中國說”在北京正院公館舉辦。數托邦創始人楊玥在“大數據與社會變革”論壇板塊,從實踐者的角度展示了三個鮮活的案例,指出:“大數據時代,人類的行為、人類的思想、人類的關系在虛擬世界里有一個映象,在這個虛擬世界研究人、以更寬廣的技術和手段,這會產生更多的技術上的革新,也可能會有更多的發現。”以下為楊玥發言實錄:


楊玥(數托邦創意分析工作室創始人):我也是《大數據時代》這本書的忠實讀者,我們對自己的定位我們是大數據時代的踐行者,我們考察數據究竟能給我們個人,給這個社會,給我們企業、政府、組織帶來什么實實在在的幫助,我們也提供了幾個案例分享。


第一個是美國的案例,美國西北大學和哈佛做的全美情緒測量的案例,Pulse of the nation。我傾向于叫國人幸福的調查,統計了三億多條Twitter上的信息,按照情緒指數分成八個維度,最右邊最綠色的代表最高興,最左邊的代表情緒最低落,他把一天24小時和美國的地理位置聯系在一起,做了一個可視化的視頻。(視頻略)


這是一張美國地圖,從東部時間零點開始,一天24小時美國發Twitter人的變化,深夜是紅色的,說明深夜發Twitter的人都比較郁悶。到了早晨,加州人起來跑步,比較開心,變成了綠色。九點上班以后,美國東北部的律師投行進入了上班時間,整個人開始郁悶,顏色變紅,隨著時序推移,西部也開始郁悶起來。到下午三四點鐘工作的壓力下全美幾乎都非常郁悶。這里,隨著下班時間的臨近,佛羅里達的人群又開始綠了,加州的下班了也開始綠了,東北部還是一片紅,他們很晚下班,還是很郁悶。


這張圖很直觀的描述了一個全美的情緒變化,是心臟呼吸的形狀,根據每個州的大小,Twitter的量做了一個可視化的地圖。我從這張圖里可以明顯的感覺到美國人的幸福指數跟地域、時間、狀況是什么關系。相對來說,生活在美國邁阿密州和加州的也許幸福指數更高一些。這個對社會現象的觀察會帶給我們很多不一樣的視角和洞察。


下一個例子,回到PPT,這是我們自己團隊的一個小例子,油價早知道。這也是我們團隊的科學家做的一個小的應用。下周一很有可能我們政府會降油價,幅度在200元/噸,這是我們今天微信賬號發出的預測,這個概率應該是超80%的,所以,大家可以下周二再去加油。


解說一下這個例子,用的是微博上的意見領袖的意見,我們實際上是海搜了大量的提及油價的人,找到其中的700位的專家意見團的人物,這些人物不知道我們在采集他的信息,我們從中間找出來影響力最高的700人組成了一個專家團,這個專家團在自己的微博上經常談對油價的估計、看法,油價的趨勢,我們用一個算法對這700個專家團建立一個投票的機制,每個人投票下一次油價什么時候漲,上來時候跌,漲跌多少錢,我們把這700人的智慧綜合起來做加權,用社會化媒體的關系來加權,他在網絡越有影響力我們認為他票數越高,代表意見領袖的價值越大。用這個模型做出來我們發現這700個人的意見在真實油價下跌和上調之前的三天左右時間,這個專家團的意見,他們有汽車行業、能源、財經、媒體行業的,還有可能我們不知道,但是接觸到油價信息披露的。但不知道會不會我們講了以后就不調了。


我們用這樣的方法找到這700個這個領域的專家意見,并且把它匯總成一個結果,大家加油可以節省一點時間或者節省一點錢,累計起來經濟價值還是很可觀的。這是一個典型的通過數據的挖掘對個人有幫助的小應用。我們團隊希望開拓這樣的應用服務社會。


我們還做了其他有趣的例子,比如這個給中國聯盟出版社做的例子。00后的孩子在想什么,尤其針對10—16歲青少年的書,他們已經有自主的選擇書的權利了,社長委托我們調查00后的男生和女生都在想什么。


我們數據來源于網絡,來自于這些年輕的孩子們所留下痕跡的地方,比如微博、微信,他們上的論壇,來找到這樣的一些孩子們,然后我們發現他們非常活躍,在大人不了解的一些領域里他們形成了一個個的群組,形成了一個個團體討論自己感興趣的事情。


這張圖是對00后女生的描述,楊冪這個詞非常大,他們愛看“快樂大本營”,也愛看成人相親節目“非誠勿擾”,還有一些明星大家都不太知道,平澤,楊小曦,我看到都不知道意味著什么,還有“傲嬌”這些詞,這是00后女生的。


00后男生是另外一張圖,最大的字眼是“海賊王”、植物大戰僵尸、萬圣節,可見這個年齡段的男生還活在愛動畫冒險里,男女生的興趣點是不一樣的,給他們的內容也是不一樣的,從他們自己選擇的書來看,女生可能更喜歡探索成人的情愛世界,更時尚,愛表達。男生還是活在動漫游戲中。那么,如果給這個年齡段的孩子出書,男生和女生可能要分開出。這也是常識的一個補充,當我們真正探索這個的時候,每個詞的大小我們不是簡單的統計,而是對信息商的一個計算,代表這個信息在這群人的發言里是很有信息含量的。


另外,我們還長期對一些熱播的節目進行跟蹤,現在越來越多的人會在網絡上表達自己對事物的看法,包括對公眾人物、娛樂人物的看法,比如3·15晚會當天,那個周末有好幾個電視節目都在播,我們人群結構已經凸顯出了不同的內容對什么人群有影響。“我是歌手”這樣的娛樂節目典型的我們叫L型,青春派,更多的00后、90后在關注;3·15晚會是主流范兒,更多的50后、60后、70后看;最強大腦是合家歡,是爺爺奶奶帶著年輕的父母以及更年輕的孩子都在看的勵志類的節目,不同的內容和不同的年齡結構的人群一些不可分的特點。


最后一個例子是12306的例子,講這個例子是為了說明一個問題,為什么當時大家感覺票特別難買,用數據來解釋就是2014年年1月9號當天是最高峰的一天,有879萬張票定了,但是其中43%是沒有被支付的,有將近一半兒的的票回到了票室,58%以上的票是在4分鐘以后就支付成功的。我們給大家的建議,第一如果沒有票,三分鐘拿不到的話就再等45分鐘,可能還是有票。這是從數據角度給個人提供建議。


回到我們的結論,現在大數據時代,人類的行為、人類的思想、人類的關系在虛擬世界里有一個映象,這是過去幾百年、幾千年、幾萬年都沒有過的,人類社會的現實在一個虛擬世界里有了更豐富的意象,給我們提供的角度,我們在這個虛擬世界研究人、以更寬廣的技術和手段,這些都是重新去研究人類與社會學,研究人類的行為、心理、組織形式,這會產生更多的技術上的一些創新和革新,也可能會有更多的發現。


王俊秀(嘉賓主持,信息社會研究所所長):楊玥從他們的實踐角度,從商業方面做了一些探索,下面請于建嶸從社會學的角度講講他對這個問題的理解。




騰訊思享會 2015-08-23 08:39:42

[新一篇] 你到底想做什么?——《神探》

[舊一篇] 我在浮光掠影里等你
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表