2014年6月19日 星期四

Big Data 書摘

以下是從左新借的 "Big Data-看見真實慾望" 讀書筆記, 本周要還了, 不記不行.

作者 : 宋吉永 悅知文化出版
  1. 何謂趨勢 ? (1) 持續不斷累積 (2) 擁有特定方向 (3) 多數人分享的流行方向
  2. 對東方人來說, 幸福的時態是未來式, 因為對未來感到不安, 所以當下無法感到幸福.
  3. 社會氛圍隱藏人民對未來的展望與洞察. 當一個國家的社會氛圍不好, 便是政黨輪替的時候.
  4. 由於統計學的發達, 預測未來不再是一種迷信, 而是科學.
  5. 凱文貝肯 (Kevin Bacon) 的六度分隔理論, 因為臉書的出現, 原本的六度已經下降到四度, 即在人際網絡中, 要認識一位陌生的朋友, 中間需要通過的朋友數, 已經從原本的六人降為四人.
  6. 社群網路讓我們看到群體, 而非少數樣本.
  7. 巨量資料分析的技術核心在自然語言處理技術, 網路上的資料有 90% 都是文字, 照片, 影片等非結構化資料, 透過自然語言處理就可以從中擷取出可量化 (scalble) 與結構化的資料.
  8. 發現趨勢的方法 : 計算社群網站中關鍵字出現次數的增減量, 以及與其他關鍵字的相關性.
  9. 社群網站能讓我們看到客戶內心真正的慾望, 而且讓我們立刻看到結果, 其分析速度非常驚人. 社群網路分析之所以存在, 無非是其速度的優勢. 
  10. 將社群網站的主觀客觀化是巨量資料分析的特點, 可以讓我們透過現在看到未來.
  11. Oreilly Media 對 data scientist 的定義 :
    想要成為資料科學家,就需學習 Python 語言, 並設立可通過 R 的迴歸統計分析的假說, 再用簡單易懂的語言與全體成員溝通. 
  12. 比起技術能力, 更重要的是擁有看到整體的洞察力, 也必須知道如何創造並傳播故事. 
  13. 想要讓自動化成為可能, 必須先定義什麼是可以重複的工作.
  14. 巨量資料的特性可以用 3P+1P 說明 : Problem+People+Platform=Productivity, 其中問題才是本質, 因為它無法自動化.
  15. 巨量資料分析步驟 : 觀察 - 量化 - 演繹 - 推論.
  16. 分析人類產生的資料, 須結合語言學家, IT 專家, 甚至人類學家. 
  17. 巨量分析的特點是它是面對一般人進行分析, 而非特定一群人.
  18. IT 技術最重要的不是方法, 而是成效.
  19. 資料分析的重點不是什麼, 而是為什麼.
  20. 若只是不斷強調商品的好處, 那就是無用的廣告. 行銷要做的工作是刺激消費者的欲望.
  21. 餐飲業創業成功率僅 8%, 創業前必須深入了解大部分人的飲食偏好.
  22. 巨量資料分析可以用來掌握社會動向. 目前網路資料已經巨大到足以讓我們透過觀察過去與現在, 成功預測未來的方向. 例如分析手錶屬性關鍵字 (品牌, 禮物, 價格, 代言人等) 在主要部落格出現的頻率變化 (每月, 每季, 每年), 可以看出
  23. 要成為巨量資料分析專家, 首先必須瞭解如何發問, 並分析該問題能透過何種資料來分析與解決.
  24. 知識均等讓專業職業 (醫生, 會計師等) 的重要性開始下降, 資訊平均化也使得要在這個時代謀生店得越來越困難.



沒有留言 :