用統計幫電影算個命

文章推薦指數: 80 %
投票人數:10人

這些電影資訊其實已經變成一個小小的資料庫了,於是筆者突發奇想,想利用. 這些資料做一些簡單的統計分析,看看可不可以獲得一些有趣的新資訊。

晨晰統計部落格新站(統計、SPSS、BIGDATA討論園地) 跳到主文 一個討論統計的好地方 部落格全站分類:圖文創作 相簿 部落格 留言 名片 公告版位 晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:[email protected]\網址:http://www.rai-stat.com.tw Feb12Thu200910:52 用統計幫電影算個命~     電影院相信是大家擁有美好回憶的地方,在黑漆漆的大廳裡躺在超舒服的沙發 上,享受一兩個小時的「神遊」。

在這小段時間裡,讓人彷彿可以忘卻現實 中一切的壓力與不愉快,跟隨電影主角一起冒險、搞笑或悲傷,看電影好像變 成21世紀的一種心理治療方法,讓人不斷想要複製這樣美好的經驗。

  一定很多人跟筆者一樣是愛看電影一族,筆者一年大約要看30部電影,由於常 常看電影,所以也越來越「關心」電影。

有一個不錯的網站介紹給大家(相信 很多人也知道),就是開眼電影網~http://www.atmovies.com.tw/home/,我 常上這一個網站主要的原因是:該網站對於「哪家電影院幾點幾分播放哪些電 影」的訊息記錄非常清楚可靠。

所以要出發去看電影之前,必定會先上去瀏覽 一下。

  常常上去「開眼」瀏覽,筆者發現這個網站裡還有許多關於電影的其他資訊, 例如台北票房狀況、該電影的推薦人數、該電影的評價分數、電影背景資料 (演員、導演、出品公司…等)、以及BBS電影討論區。

由於經年累月下來, 這些電影資訊其實已經變成一個小小的資料庫了,於是筆者突發奇想,想利用 這些資料做一些簡單的統計分析,看看可不可以獲得一些有趣的新資訊。

  註:「台灣票房」就是開眼網站裡面有記錄的台灣票房數字;「美國票房」是YAHOO電影 英文版網站上記錄的美國票房數字;「推薦人數」是指開眼網站上推薦這部電影的人數; 「開眼電影評價」是開眼網站上根據網友給分的電影評價平均分數;「YAHOO電影評價」 是台灣YAHOO電影網站上面,網友評價的平均分數;「外國YAHOO評價」是YAHOO電影英文 版網站上,網友評價的分數;「主角的熱門程度」是把主角的姓名用GOOGLE工具,計算出 來的搜尋數量,用這個指標當做是主角的熱門程度;「電影種類」是依據電影內容分類成 動作片、劇情片、喜劇片。

        『資料蒐集』 筆者首先進行收集資料的工作(這邊的資料蒐集是以可及性為主,網路上立刻 可以查到的資料優先使用),並且把資料整理成可以分析的型態(如上圖)。

當把所有想要分析與了解的變數做成這樣一行一行的資料,就算是初步準備好 了,可以開始進行後續的分析工作。

所有的變項裡面除了「電影種類」是類別 變項以外,其他的都是連續變項,如果在表格中有空白的部份,表示是遺漏 值,分析時會自動去除。

  『假想問題與回答問題』   假想問題1.『在美國賣座的電影,在台灣也會賣座嗎?』 筆者一直以來都很好奇,一部電影在美國上映後若票房反應熱烈,是否在台灣 上映也會是如此呢?這個問題應該很多台灣電影代理商會關心,到底要代理哪 一部電影才會大賺錢?是否選擇美國票房好的電影來代理就是「穩賺」的呢?     回答問題1 筆者把這兩個變項做一個相關分析(CorrelationAnalysis),結果發現相關程 度為高正相關r=0.75,並且統計上有達顯著水準。

這個意思就是說:如果依照 美國票房來推測台灣票房是有高度的準確性的,注意!並非百分之百準確喔, 還是有例外的狀況,但是已經是一個不錯的指標了!   假想問題2.『各種不同的評價是否一致?』 很多網站上都會有網友投票的評價分數,但是這些評價分數之間到底關係為何 呢?會不會同樣一部電影在不同網站上的評價差異很大?根本沒有一致性可 言,若是這樣,那想要參考網友評價的消費者可就得大傷腦筋囉!   回答問題2. 筆者把這三個變項(開眼、YAHOO電影台灣、YAHOO電影英文版)都一起做相關 分析,結果發現三個評價的網站彼此之間的相關在0.43-0.73之間,算是中程 度的相關,並且統計上都有達顯著水準。

由於這三個指標是測量一樣的東西, 邏輯上應該要有非常高的正相關才對(至少要0.8以上),這樣的結果表示一 部電影在不同網站評價分數上可能會有差異,所以精明的消費者還是多參考幾 個網站的評價再決定要不要掏出荷包裡的錢吧!       假想問題3.『哪一種指標最能預測台灣電影的票房?』 這個問題是「超」重要的,我們手上找到許多指標,但是哪一種對票房預測最 有幫助呢?在這裡篩選三種跟台灣票房比較有關連的指標,分別是:開眼網站 的推薦人數、開眼電影的評價、與主角熱門程度,看看統計分析結果可以發現 些什麼?   回答問題3. 由於筆者一開始是想針對開眼電影網站裡的數據做應用,因此這邊選取的變項 以開眼電影網站上有的為主。

這邊把「台灣票房」當做是依變項,「推薦人 數」、「開眼電影的評價」、與「主角熱門程度」三個當做是自變項,進行多 元迴歸分析(MultipleRegressionAnalysis)。

結果發現只有「推薦人數」這 個變項對台灣票房有高度的預測力,其他兩個變項似乎都無法預測「台灣票 房」的表現。

綜合問題二與問題三的結果,筆者推論:開眼網站的電影評價不 太具有參考意義(可能是該網站評價人數不夠多,所以評價的結果有待商榷)。

其次電影主角火紅不火紅,無法預測台灣電影票房的好壞,故電影代理商若想 要選大牌演的電影來代理,也不見得就會大賣。

至於「推薦人數」對台灣票房 有高度預測性,這一點是可以確定,但是要特別注意:在這裡只是做應用統計 的示範,並非嚴謹的研究(如果正式的研究應該在蒐集變數的時候就先去除可 能有問題的變項)。

嚴謹的來說,推薦人數多未必是台灣票房好的「因」,而 且更可能是「果」。

畢竟票房好,看過的人更多,自然推薦人數多,所以這樣 的結果不要太開心!參考參考就好了~     假想問題4.『不同類型的電影在台灣和美國的票房是否有差異?』 電影類型在這邊分作三種(當然細分的話應該更多),這三種類型的電影是否 在票房上有差異呢?還有在台灣票房與美國票房的差異是否一樣呢?(說不定 台灣人愛看動作片,美國然偏愛看劇情片)   回答問題4. 在這裡以電影種類為自變項,台灣與美國票房為依變項,做兩個單因子變異數 分析(One-WayANOVA),結果發現在美國票房上,不同類型的電影票房差異不 顯著,但是在台灣的票房上,動作類的電影顯著的比劇情類的電影票房好,所 以台灣的觀眾偏好看動作類的電影,大家可要加強進攻囉!!   『結語』 以上的討論是純興趣的討論,若要做更嚴謹的研究可能樣本數要更多,指標選 擇上要更精確才行。

生活周遭其實有許多有趣的資料,鼓勵大家可以隨手整理 整理做些統計分析,說不定可以發現你從來沒發現到的『新世界』!統計真的 好有趣,跟抽象畫一樣,看懂了就愛不釋手~   分享 Facebook Plurk YAHOO! 分享在我的Facebook 分享在我的Plurk 分享在我的即時通 全站熱搜 創作者介紹 晨晰部落格新站 晨晰統計部落格新站(統計、SPSS、BIGDATA討論園地) 晨晰部落格新站發表在痞客邦留言(0)人氣() E-mail轉寄 全站分類:不設分類個人分類:統計應用專題此分類上一篇:線上遊戲好好玩 此分類下一篇:哇塞!!統計圖ㄝ---(上) 上一篇:超好笑的短片,祝大家牛年行大運!! 下一篇:哇塞!!統計圖ㄝ---(上) 歷史上的今天 2018:三階層(threelevels)HLM_mixedmodel之SPSS操作~~(下篇) ▲top 留言列表 發表留言 熱門文章 文章分類 powerBI(36)生物醫學統計(125)迴歸與SEM(55)研究方法(66)SAS教學(54)Excel與統計軟體(44)統計應用專題(78)其他類統計知識(113)問卷知識(26)論文寫作(15)統計分析新趨勢(14)晨晰的宣傳與服務專案(54)數據話視頻(15)會員心得分享(10)新聞類(65)我們的故事(78)未分類文章(6) 最新文章 最新留言 文章精選 文章精選 2021十二月(1) 2021十一月(5) 2021十月(3) 2021九月(3) 2021八月(3) 2021七月(3) 2021六月(3) 2021五月(5) 2021四月(4) 2021三月(5) 2021二月(2) 2021一月(4) 2020十二月(4) 2020十一月(5) 2020十月(4) 2020九月(3) 2020八月(5) 2020七月(3) 2020六月(4) 2020五月(3) 2020四月(4) 2020三月(4) 2020二月(4) 2020一月(3) 2019十二月(4) 2019十一月(4) 2019十月(4) 2019九月(3) 2019八月(3) 2019七月(3) 2019六月(4) 2019五月(4) 2019四月(5) 2019三月(4) 2019二月(3) 2019一月(4) 2018十二月(4) 2018十一月(4) 2018十月(5) 2018九月(3) 2018八月(3) 2018七月(5) 2018六月(4) 2018五月(4) 2018四月(5) 2018三月(3) 2018二月(3) 2018一月(5) 2017十二月(4) 2017十一月(4) 2017十月(4) 2017九月(4) 2017八月(4) 2017七月(4) 2017六月(4) 2017五月(3) 2017四月(3) 2017三月(5) 2017二月(3) 2017一月(4) 2016十二月(4) 2016十一月(5) 2016十月(4) 2016九月(4) 2016八月(5) 2016七月(4) 2016六月(4) 2016五月(4) 2016四月(5) 2016三月(5) 2016二月(4) 2016一月(5) 2015十二月(4) 2015十一月(5) 2015十月(4) 2015九月(4) 2015八月(4) 2015七月(4) 2015六月(5) 2015五月(4) 2015四月(3) 2015三月(5) 2015二月(3) 2015一月(4) 2014十二月(5) 2014十一月(4) 2014十月(4) 2014九月(5) 2014八月(4) 2014七月(4) 2014六月(5) 2014五月(4) 2014四月(4) 2014三月(5) 2014二月(3) 2014一月(4) 2013十二月(6) 2013十一月(4) 2013十月(5) 2013九月(5) 2013八月(4) 2013七月(5) 2013六月(4) 2013五月(4) 2013四月(6) 2013三月(4) 2013二月(4) 2013一月(6) 2012十二月(4) 2012十一月(4) 2012十月(6) 2012九月(4) 2012八月(4) 2012七月(9) 2012六月(4) 2012五月(5) 2012四月(4) 2012三月(3) 2012二月(4) 2012一月(4) 2011十二月(4) 2011十一月(6) 2011十月(4) 2011九月(5) 2011八月(5) 2011七月(4) 2011六月(4) 2011五月(5) 2011四月(4) 2011三月(5) 2011二月(3) 2011一月(4) 2010十二月(5) 2010十一月(5) 2010十月(4) 2010九月(5) 2010八月(5) 2010七月(5) 2010六月(5) 2010五月(4) 2010四月(5) 2010三月(6) 2010二月(5) 2010一月(6) 2009十二月(5) 2009十一月(5) 2009十月(7) 2009九月(5) 2009八月(8) 2009七月(7) 2009六月(6) 2009五月(4) 2009四月(4) 2009三月(4) 2009二月(5) 2009一月(4) 2008十二月(8) 2008十一月(9) 2008十月(8) 2008九月(9) 2008八月(10) 2008七月(10) 2008六月(13) 2008五月(13) 2008四月(10) 2008三月(9) 2008二月(9) 2008一月(10) 2007十二月(10) 2007十一月(12) 2007十月(13) 2007九月(10) 2007八月(9) 2007七月(6) 2007六月(7) 所有文章列表 文章搜尋 新聞交換(RSS) 誰來我家 參觀人氣 本日人氣: 累積人氣: QRCode POWEREDBY (登入) {{article.user_name}} {{article.timestamp*1000|date:'MMM.dd.y.hh.mm'}} {{article.title}} {{article.content}} 我要留言 回到頁首 回到主文 免費註冊 客服中心 痞客邦首頁 ©2003-2021PIXNET 關閉視窗 PIXNET Facebook Yahoo! Google MSN {{guestName}} (登出) 您尚未登入,將以訪客身份留言。

亦可以上方服務帳號登入留言 請輸入暱稱(最多顯示6個中文字元) 請輸入標題(最多顯示9個中文字元) 請輸入內容(最多140個中文字元) 請輸入左方認證碼: 看不懂,換張圖 請輸入驗證碼 送出留言



請為這篇文章評分?