2014年5月15日 星期四

[R]R的學習資源推薦

        R是統計分析或DATA MINING中目前使用者比例最高的軟體。但是國內相關的資源相對來說卻不如其他統計軟體(特別是SPSS),剛開始學R的時候花了很多時間和金錢報名課程和摸索。在這邊列出一些我常在使用或曾經使用過的線上資源供各位朋友參考。

2014年5月8日 星期四

[R]用R轉換資料結構-將矩陣型資料轉為一般資料格式

        之前抓了氣溫資料,但是因為解釋力不強,所以又開始到處找變數,這次看上的是雨量資料。這次雨量資料本國氣象局的網站就有提供了!
(中央氣象局  http://www.cwb.gov.tw/V7/climate/dailyPrecipitation/dP.htm)。
   
        這次的雨量資料非常詳細,不但有年份,月份,還有每日的資料,相當符合需求。但是天下沒有白吃的午餐,雨量資料的格式是沒有辦法直接與之前的資料結合並且進行分析的。雨量資料是採用類似九九乘法表、矩陣資料的形式,月份和日期各站一邊,兩者的交叉點就是當天的雨量資料。但是一般要進行統計分析,需要的資料格式是CASE和欄位。

2014年5月7日 星期三

[職涯] 如何進入市場調查/行銷研究業!搶佔2013全球最HOT工作!

        去年有篇文章"搶佔2013全球最HOT工作"( http://www.cheers.com.tw/article/article.action?id=5047051)中, 市場調查業在幾個雜誌的評比中都佔據了前十名的位置。其實這個結果也不難解釋,當傳統的大眾(喜好相對單一)轉為分眾時,消費者需求逐漸分化、多元、細緻,一般大眾化的產品已經無法滿足所有消費者的需求,商業環境由製造者本位轉為消費者本位,商業活動越來越重視消費者的需求和回饋,自然也需要有一批專業人士來作為消費者與製造商之間的橋樑,協助產品提供者了解消費者。


        這群專家橫跨生產與消費的兩端,自然也會比較需要跨領域的能力,無法被概括在任何一個單一的研究領域。一般的市場分析研究員的工作內容流程大致如下:

2014年5月6日 星期二

[R]用R抓網頁資料

        幾個月以前老闆丟了個問題"氣象跟業績會不會有關係啊?",老闆請人當然就是為了解決問題,所以當下我馬上點頭如搗蒜答應了(殊不知才是痛苦的開始)。我當下想法很簡單,中央氣象局有OPEN DATA,從上面抓氣象資料就可以了。但是事實總比想像殘酷。第一,中央氣象局的OPEN DATA格式是XML格式,當時的我只會處理傳統結構化資料,對於網頁資料完全沒轍。第二,中央氣象局提供的氣溫資料只有月份資料!!!太粗糙啦!!根本不符合需求。所以當時就以沒有資料為藉口推掉了這個工作。