WiDS Taipei 2020 |《天下》2020總統大選:一個選舉資料庫 ...
文章推薦指數: 80 %
講者介紹-李郁欣(Sylvia) 現任《天下雜誌》資深策展編輯。
近期作品「決戰2020!得票地圖、即時解析、機器人開票,總統立委選情一次掌握」(天下 ...
GetunlimitedaccessOpeninappHomeNotificationsListsStoriesWritePublishedinTaiwaneseinDataScienceWiDSTaipei2020|《天下》2020總統大選:一個選舉資料庫,如何在一天內創造數百萬流量?—李郁欣SylviaLee講者介紹-李郁欣(Sylvia)📍現任《天下雜誌》資深策展編輯。
近期作品「決戰2020!得票地圖、即時解析、機器人開票,總統立委選情一次掌握」(天下雜誌)、「請回答1978:重返美台斷交那一夜,測測你會是什麼人?」(中央社)。
曾當過1年電視台記者,以及5年的雜誌編輯。
畢業於政治大學新聞系。
2015年偶然接觸資料新聞後,才漸漸轉型至數位策展、數位敘事領域,過去曾與記者合作「失控的高科技廢棄物」、「2027電力戰役:全台電廠荒謬記事大解密」等專題,拿下吳舜文新聞獎、亞洲卓越新聞獎及金鼎獎。
📍講者影片介紹:https://www.facebook.com/watch/?v=952251008582938郁欣分享團隊如何規劃總統大選專題。
在選情資料庫將『社會經濟數據』跟『開票結果』做交叉分析,自動產出一段分析文。
並推測讀者要的不只是開票結果,而是能「分享」,因此與UXLab討論flowchart規劃分享機制。
最後建議大家在位子上想梗想破頭,更要走出去感受世界的脈動。
▍請大家玩玩2020總統大選開票地圖圖片來源:李郁欣簡報不斷更新》決戰2020!得票地圖、即時解析、機器人開票,總統立委選情一次掌握|天下雜誌從歷史來看,台灣選情總是「贏了縣市長選舉,總統大選就勝券在握」,2020年依然如此嗎?從原本藍綠對決的態勢,演變成蔡英文、韓國瑜、宋楚瑜三角鼎立的局勢,誰能拿下總統大位?國民黨不分區立委名單充滿爭議、民進黨選情堪憂,台灣民眾黨、時代力量、台…web.cw.com.tw▍一、策展編輯(ContentCurator)的工作?媒體產業裡,這樣的職位很難不斜槓,職務內容也會不停的變化、成長。
目前同業大多也都是半路出家。
策展編輯=專案經理(ProjectManager)+文稿編輯(CopyEditor)+數據研究員(偶爾兼職一下)▍二、2020總統大選專題—我們是如何創造破紀錄的流量大潮?1.團隊&網頁架構介紹:-10人團隊策展編輯×1(me)、數據記者×1、後端×1、前端×1、前端設計×1、數位設計×2、工程師PM×1、UXLab成員×2-五大頁面以技術難易度與內容含金量來看,是三個專案加起來的工作量。
整體來說,我們一共做了8159個頁面。
其中紅匡這三個頁面完全是數據驅動的專題。
(代表記者角色佔比最低的頁面)圖片來源:李郁欣簡報2.你的鄰居都投給誰?『這世界有一種髒,叫做台灣開放資料的髒。
』(政府資料都常用PDF形式,因此很難被用來作數據分析,也代表政府單位有時不太懂民間企業要的是什麼數據)◆開票地圖資料來源:(1)中選會選舉資料庫:歷年投開票結果(村里)(2)主計總處村里代碼(3)戶政司村里代碼-困難點:(1)台灣這幾年的行政區經過激烈的整併與改名,村里代碼變得非常重要。
我們所使用的統計資料附上的村里代碼有兩個版本:一個是主計總處的、一個是戶政司的。
中選會之前用的是主計總處的代碼,但主計總處村里代碼並沒有更新到最新,於是我們必須轉用最新的戶政司村里代碼…(紀錄:感覺就是個大工程)(2)如果不用代碼,就要面對可怕的錯字和異體字。
鹽vs.塩、峰vs.峯、台vs.臺、部vs.廍…-作法:(1)預先處理好一份得票資料,以及代碼的比對清整。
(讓工程師進來做事很方便)(2)所有的數據清整全靠spreadsheet的函式以及規則運算式,剩下的視覺化交給工程師繼續做下去。
(3)spreadsheet很萬能,尤其對一個數據麻瓜來說,好好學函式、樞紐分析表、規則運算式,處理萬筆資料不會有問題(4)不知道要用哪個函式來幫助你清整資料?Google吧!這種教學資源真的非常多圖片來源:李郁欣簡報(*好好學習spreadsheet,然後學函式,慢慢撈資料。
)◆全台選情資料庫:大部分的資料跟開票地圖一樣,但多了社會經濟資料庫的性別、年齡、所得等數據來做交叉分析。
圖片來源:李郁欣簡報-作法:我們大選當天,將這些『社會經濟數據』跟『開票結果』交叉分析,自動產出一段分析文。
圖片來源:李郁欣簡報-這段文字具備幾個鉤子(事前觀察社群的討論):誰輸誰贏?天氣與投票率的關係?區域特性(學歷高不高、年紀大不大、所得高不高)?最重要的是,我們不去做判斷,不去說高齡地區就是會投韓、高學歷就投蔡。
我們把詮釋資料的權力還給讀者。
▍三、2020立委關鍵制策、財產、輿情全解析最後這一個是我們跟ikala旗下的KOLRadar合作的數據專題。
-作法:我們合作撈出所有立委候選人的從九合一大選後的社群發言資料,試圖去歸納出他們對一些議題的論述與立場。
-對選民的用處:當選民不知投誰時?在這個網站可以先了解競選人的熱衷的主題(光譜)。
這份資料一共有7.8萬筆,我依然使用spreadsheet去清整這包資料。
圖片來源:李郁欣簡報◆立委選舉指南資料來源:(1)KOLRadar獨家資料(2)公督盟的立委評鑑資料▍四、我們是怎麼抓主軸的?說了這麼多,但我為什麼會選這些數據及角度切入呢?想教大家如何「科學」觀落陰。
Step1.首先,我們樂觀預期:無論蔡、韓、宋誰當選,都會有一半的人會崩潰,上站查詢得票分布。
當時選舉的詭譎程度,以及韓粉與英粉的撕裂程度,都讓我們足以相信「開票地圖」有它的市場性。
但這時候有風聲傳出,好像同業都打算做「開票」,那我們要如何從紅海中殺出重圍呢?-觀察過去現象:這時候我就調出了九合一大選時的流量表現,當時天下也做了開票地圖。
其實很多人都以為做開票是為了開票當下的讀者需求,但如果你從流量變化來看,其實流量的高峰集中在開票後的48小時。
Step2.所以,我們大膽猜測讀者要的不只是開票結果,而是能夠「分享」開票結果。
-網頁的策略規劃:(1)立委專輯:選前暖身,我自己最有興趣的題目(2)開票地圖:即時開票視覺化,也是天下前年累積下來的基本盤(3)最後的CTA(Calltoaction)-數據分析:賦予這一頁很重的「分享」任務,包含在UI的設計上可以做到8000多個網頁都有自己的og:img圖片來源:李郁欣簡報-網頁的flowchart:圖片來源:李郁欣簡報每次做網頁的時候,總很想要每個頁面都可以有很多入口,可以導去其他頁面,以為這樣就可以提供給讀者很多資訊服務。
但事實上並非如此,你給他愈多條路徑走,他就愈迷惑;最後簡化flow反而讓降低漏斗效應的發生,讓機器人開票的分享功能大爆發。
-規劃CTA-觸發分享:機器人開票文字,最終任務是要觸發分享。
最開始我想做的是很醜的長輩圖,後來修改成og:img的分享樣式(同時帶引用文字)。
Step3.讀者買單嗎?分享的威力超乎預期,比2018年還多吸納了6倍流量。
其中,數據分析頁的流量,是地圖頁的兩倍。
圖片來源:李郁欣簡報-其他發現—圖像化VS.文字化:開票地圖:圖像化數據分析:文字化『數據分析』頁面最後取得得流量是『開票地圖』的兩倍。
思考:(1)圖像化之餘,讓資訊清楚傳遞會更重要。
(2)在某些領域,文字是優於圖像。
Step4.獲得更多使用者行為透過GA、GTM、Crazyegg、Crowdtangle,偷窺更多使用者行為。
-發現:(1)打破讀者的同溫層—年輕選民:原來家鄉的長輩不是投韓啊(2)打破《天下》同溫層—流量來源出現了:Plurk!(3)分享地圖搜尋排行榜:請參考下圖圖片來源:李郁欣簡報▍五、先有好切角vs.先有好資料在位子上想梗想破頭,不如出去感受世界的脈動。
我為什麼會挑選這些資料、如何選擇切角,都是跟記者、工程師聊天來的。
交叉分析是去跟記者聊出來的機器人裡頭的天氣資料,是因為工程師想要串API後來網路上很多人在催票,提到投票率的問題,就想有沒有可能去做天氣與投票率的交叉呢?「創意真的很平凡,一直講話、一直講話就出來了。
」—韓國綜藝節目《一日三餐》、《花漾爺爺》系列製作人羅暎錫如果你願意聆聽、接納,身邊的隊友總會帶來一些驚奇。
比如說我接下來要安利的這個彩蛋。
▍六、彩蛋工程師為了爭取更多睡眠時間,竟然(瞞著我)做了一個彩蛋。
→總統大選地圖頁面,使用桌機版輸入:上上下下左右左右BA,即可下載svg。
▍QA:1.請問數據記者、工程師PM的職責各別是什麼呢?差在哪裡呢?A:策展編輯(講者本身角色):PM原本是要協調專案的進行,但在前期大部分都是講者一個人做完。
數據記者:中選會新進資料處理,前期數據探勘,聯絡對接中選會工程師PM:頁面優化,把數據跟地圖對接2.聽說最近天下雜誌也開始做新冠肺炎的專欄,可不可以也分享你做這個專欄的心路歷程呢?資料視覺化是以什麼靈感設計的?A:以下分享幾個感想(1)我們的角度是給讀者數據,但不造成恐慌。
(2)數據從哪來?我們是否該信任?(比如研究vlookup在百度上被搜尋的程度=中國復工程度)(3)預告下週一天下會有新的新冠肺炎專題:全境感染30天台北淪陷時,哪種封城手段最有效?數據模擬》全境感染30天--當台北淪陷時,哪一種封城手段最有效?|天下雜誌我們離大型社區感染階段還有多遠?台灣近半數確診案例集中於雙北。
人口高度密集、頻繁流動,會不會正推高雙北地區的風險?如果終將走到封城這一步,有沒有更好的手段阻隔疫情?web.cw.com.tw3.最後進來的流量有多少之後成為天下的讀者?A:因為這次專案沒有去綁會員,所以無法得知。
但政治類的題目較少轉換,因為大家都是過路客比較多。
4.請問什麼是UXLab?實際在做什麼工作呢?A.是公司內部自行成立的,跨BU跨部門的組織,裡面是一群對UX有興趣的人,成為一個顧問,來審核這個案子(是一群很厲害的人)。
想更深入了解WiDSTaipeiConference2020的活動內容嗎?歡迎到此連結索取當天活動的12份完整簡報檔!(這次講者的簡報都超級精彩,強烈推薦大家多多索取喔!)▍更多WiDSTaipei2020精彩演說紀錄,請查看下面索引文:WiDSTaipei2020資料科學x行銷科技應用研討會-官方筆記手12篇筆記精華彙總!2020年WiDSTaipeiConference邀請12位來自業界擁有豐富實務經驗且深耕多年的女性專家,分享資料科學與行銷科技(Martech)碰撞的實務經驗與重要思維。
籌辦團隊官方筆記手在此將12…medium.com💖💖💖💖💖💖💖💖💖💖💖💖如果喜歡這篇文章,可以送我們拍手👏👏👏50下,支持我們繼續努力!(找找左側或左下角“拍手符號👏”,長按可以連拍50下喔)💖💖💖💖💖💖💖💖💖💖💖💖MorefromTaiwaneseinDataScienceWeaimtoinspireandeducatedatascientistsworldwide,regardlessofgender,andsupporteveryoneinthefield.ReadmorefromTaiwaneseinDataScienceAboutHelpTermsPrivacyGettheMediumappGetstartedI’mFaye|聊聊UX策略與商業2.2KFollowers資深用戶體驗設計師|主修行銷,自學設計,10年資歷。
經歷美商、日商與新創,熟悉電商、汽車互聯網、行動支付、用戶數據分析。
歡迎企業內訓或講座邀約[email protected],也可IG搜尋ux.designer.sharing👉https://reurl.cc/z8y8MyFollowMorefromMediumHowToGrowRichOnlineBelieveAndPrepareToGetTheJobDone…ArunKumarAnticipationofendingsMatildeMagroUntamed — Healingourfeminineconnectiontowomanhood.SiddhantDeshpandeSupercomputersHelpStatusWritersBlogCareersPrivacyTermsAboutKnowable
延伸文章資訊
- 1國立政治大學選舉研究中心-首頁
選研中心執行我國大學生政治社會化面訪 · More. 最新消息. 2022-07-12 中心公告. 【NEW】更新選研中心「重要政治態度分佈趨勢圖」(1992-2022/06). 置頂熱門.
- 2數據分析》全台7761村里所即時分析,機器人怎麼說? - 天下雜誌
年齡結構、所得高低會不會影響單一區域的選情?動手查一查,讓機器人告訴你這個縣市、鄉鎮市區或村里發生了什麼事。
- 3山水民調-專業的民調公司-Focus Survey Research-線上調查-
- 4選舉資料庫
選情資料庫,提供歷年選舉的快速搜尋及資料視覺化。
- 5鄰居都投給了誰?《天下雜誌》製作「全台選情資料庫」 各地 ...