2014年9月21日 星期日

精準預測



前言:
預測真是個充滿魅力的活動,來看看作者到底用了什麼方法讓他就是猜的比別人準。

隨記:
[速讀]

P.20 只要我們對資訊的理解程度比不上資訊的成長速度,我們就會臨危險。
P.22 數字沒辦法為自己講話。是我們在為它們說話,我們賦予它們意義。
P.25 巨量資料一定會造成進步。→但其中會不會退化就要看大家,舉最易懂的PTT八卦板,那裡充滿著資訊與雜訊,而雜訊總是渲染的比資訊快,結果一件事原本是進步的,常常經一連串的雜訊,結果是退步的。當然事情最終不管對或錯,最終結果將會導向正確的方向,只是所費不貲。
P.26 人類大腦相當卓越,可以儲存三TB的資訊。然而據IBM所說,這只是現在全世界每天所產生資訊量的百萬分之一。→這也告訴你,現在的知識不能用背的,背不完。最多只記的下索引,或找資料的方法,大腦只用來組裝創意,而不是存放所有資料。從此推論,未來記憶力高的人種會沒落,而思考型的會占相對優勢。當然前提是沒被現行教育所毒害而走偏。想想入黑幫的應該有不少人,因教育失敗而造成的…。
P.27 資訊量每天都增加兩百五十萬兆位元組,有用的資訊量卻幾乎沒有增加。→看來新聞不用理會外,連網路資訊都要避免,幾乎都是雜訊。
P.24 未知而不自知(unknown unknown)→這概念很重要,其實你看到資訊,但你因為根本不知道那是什麼而錯過。簡單的像小時常常誤闖紅燈,為啥?因為小時壓根子無法理解紅燈代表的是什麼。
P.37 沒有人想到事情會發生。當你沒辦法表述自己是無辜的時候,就宣告你的無知吧!→我想到的是百年老店,用了黑心豬油。我看到的是連豬油本味都分不出來,那還有「能力」做出美食。不管有意或無心,結果只有不再去買才是合理的決定。同理阿基師舌尖也讓人起疑,畢竟他專長項目中包括味蕾。
P.51 如果你在市場裡,有人賣你一些你不懂的東西,你就應該認定他們賣給你的東西有問題。
P.74 強烈、大膽、刺蝟般的預測,比較可能讓你上電視。→名嘴追求的不是正確,而是能否上電視。
P.80 預測模型三原則:
  • 原則一:用機率思考
  • 原則二:今天的預測就是你餘生的第一個預測
  • 原則三:尋求共識
P.115 只要牽涉到人為判斷,也就引進偏見的可能。
P.124 盡可能多收集資訊,但分析的時候要盡可能嚴格而有紀律。→資訊要量化才有意義,也就是先用量化篩選然後才是用感覺和經驗作第二輪確認。反過來是錯誤順序,因為你的感覺可能直接封殺掉最有潛力的選項。
P.144 混沌理論可以運用到這兩個特性的系統
  • 系統是動態的,這表示系統某個時間點的行為表現會影響其未來的行為表現。
  • 系統是非線性的,這表示它們遵守的是等比級數的關係,而非等差的關系。
P.233 如果你想找經濟預測,最好找平均的或集體的預測,而不是單一經濟學家做的預測。→本書的核心概念之一,預測要用行家間的平均值。而不是只相信某一個偶像說的話。這概念是,統計學的信賴區間,要的是95%的準度,而不是捨本逐末,去抓5%的極端結果。
P.284 貝氏定理:這個定理會告訴我們如果某些事發生之後,某個理論或假設為真的機率有多少。→公式:XY/[XY+Z(1-X)]

P.290 貝氏定理處理的是認識論上(epistemological)的不確定-我們知識的限制。
P.293 我們連著手實驗都沒有,就必須先講明我們覺得某件事有多可能發生。→貝氏定理的先天盲點。先驗機率常常是感覺而評量出的機率。
P.300 我們的信念永遠得不到完美的客觀、理性或準確。但我們可以努力不要那麼主觀,不要那麼不理性、不要那麼錯。
P.330 我們思考的盲點通常是我們自己造成的,而隨著我們年齡增長還會增加。→當一個盲點刻印在大腦時,該盲點就會與其他判斷融合出偏差論點,然後一直擴散,直到失敗的那一刻才會回頭檢視,問題的根源。或許一輩子都沒發現真正錯在那,因為根源太核心了。
P.330 電腦(深藍)讓(棋王)卡斯帕洛夫震驚了,但原因只是因為一個設計上的瑕疵。→這推翻電腦絕不會錯的定理(對非資訊相關科系的而言),因為程式是人寫的,但卡斯帕洛假設電腦不會出錯,導致他對電腦行為感到困惑,無法理解。這動搖了棋王的心智。這似乎無解…,人性的盲點,當原本深信的事,突然起疑,大腦會呈現當機狀態,因為沒根基無從作決策,直到理解並確認後才能重新思考,而這段時間思考力和意志力是最脆弱的。看來最佳的做法是,撒退,直到大腦理解後才能繼續。該比賽是五天,而這不足以讓大腦沉澱,而且人在局中是看不清真相的。運用到股市就是立即出場,然後至少一星期不進場操作。
P.357 預測的帕雷多原理→如果想做預測,不該花100%時間,因為20%的時間就有80%的準度,也就超越專家了,也就是說為了剩下20%你將投入近乎無限的資源(時間、金錢),尤其是預接近100%時呈現的是直線上升的資源投入。也造成,報酬遞減的狀況。我在專職操作股市時對此很有感覺,也因此對80/20法則深感共嗚,越專注看盤賺的錢越少。這扯出一個眾人的盲點,在沒意義時段花費精力,而當關鍵時刻,精力早已耗盡。因為你是人,但不自知。

P.360 競爭環境中的帕雷多原理→水平線。這就套在投資學就是損益兩平點。所以努力投入在此邏輯下,在40~60%程度時的投報率最高,超過80%後效益明顯遞減嚴重,不如最後20%的時間拿去吃喝玩樂睡都還比較有意義。
P.370 根據一項對線上撲克玩家的研究顯示,百分之五十二的玩家有學土的學位,這是美國整體人口比例的兩倍,跟買樂透的人比起來則是四倍。大多數的撲克玩家都夠聰明。→股市也是,其實你的對手大部分學歷、才智、經驗都比你高,賺到錢別自嗚得意,常常太高興了,接下來一個閃神錢就噴回去,還倒貼。
P.372 我現在明白是什麼引發我亂打。最大的起因是志得意滿的感覺。→的確我有時也會莫名的亂打(無意義的進出股市),我也真的不知為什麼,在經過多次亂打後我有養成一個習慣,不是克制亂打,反而是放任那種感覺(經作者說才知道那叫志得意滿),但我會用最小的單位去亂打,反正就是給那感覺一個出口。就目前亂打交易記錄來看,今年已累積賠了二萬元了。說好的第六感操作,跟渣一樣弱。
P.374 正在進行的事,我們很常沒辦法正確看清。有時退出來比堅持到底更有智慧,尤其關於錢的賺賠。歷史故事只記載奇蹟事件(特別值得一提的事件),但墓園裡躺著無數運氣普通的人。一個人無法創造奇蹟,一萬個人倒是可以創造萬中選一的奇蹟。
P.443 任何預測模型的目標都在於捕捉到的訊號要盡量的多,雜訊要盡量的少。→如果無法辨識,寧可忽略該筆資料,因為雜訊會如混純效應在資訊中產生反饋加乘效應。這也就是簡單模型常常勝過複雜模型的原因,只抓重點。而複雜模組常因小變數在經混純效應而變成錯誤資訊,導致比簡單模組還差的結果。
P.475 在事情過後再從不相關的訊號中整理出相關的訊號,就簡單多了。事情過後,訊號當然總是極其清晰,但事情之前,訊號卻很模糊,充滿各種相互衝突的意義。→事前像夜晚,看過去一片模糊不清。事後像戴上熱感應器,所有訊號都呈現有跡可尋,並都指向會發生事情。換句話說別事後諸葛,也別太為過去事太過懊惱,錯誤一定會發生,然後才能知道。
P.477 某種可能性對我們來說不熟悉的時候,我們甚至連思考都不會。→作者舉珍珠港事前,根本不會預測任何可能性。沒人想過,事後才從以前的訊號記錄解出資訊,來證明早就該知道。這是不合理的。
P.486 事實上,只要時間夠久,就必然出現。→只要機率大於零,剩下次數(時間)的問題。像台灣會不會被海水淹沒?這不是會不會,這是一定會,只是要多少次災難衝擊的問題。


心得感想:
酒後不開車(P.61),我突然覺得這是邏輯陷阱,酒後一定會開車才是合理。喝酒後就會喪失判斷力,那在喪失判斷力,怎麼還能做選擇?開車與坐計程車可是個選擇!所以解決的方法是根本不能開車去喝酒的地方。
最近留意到一件事,就是名詞定義,每個人對名詞的定義落差不小,例:宗教、科學、神、素食…等。每個人定義都不完全相同。以神為例,一般來說是具有外在的神祕力量,但也有人解釋為內在心靈…,這真的是很困擾,原來大家彼此都在雞同鴨講。語言文字具有精確性但又充滿多義性。看來要等能用心靈感應,這個困擾才能徹底根除。這應該是個夢想吧。也是終極翻譯工具,直接讓大腦作交流不必透過聲帶作媒介。現在想想那個世界才是人腦大數據時代,現在資訊吸收假如是電話撥接(56k),那心電感應應該就是光纖(100M)。大學教育可能只要四天就完成了。
品書品久了,讀幾頁大概就能知道該書是否有閱讀價值,一本好書很容易引人入勝,會有驚奇或有系統的感覺,而不好的書通常是寫了一堆字,但就是抓不到感覺,像作者說的雜訊,而本書讀了200多頁,我還是只看到雜訊。作者是屬於有能力,但表達不出來的人。
看完第9章發現電腦不是用來對抗,而是與人最完美的搭配工具,人擁有電腦沒有的創意和思考力,而電腦擁有完美的運算和記憶力。人與電腦的組合根本是超完美互補。
用作者提出的貝氏定理預測美國被攻擊的機率,從珍珠港事件前的近乎0,到珍珠港事件後的38%,到雙子星大樓後99.99%的後驗機率(套用P.289邏輯),可想而知,美國一定會在將來再被攻擊。
本書在第13章論述蠻有趣的,如何預防恐怖分子的攻擊,結果跟一般人想的不同(加強查察),而反過來想唯有極端傷害才會動搖國本,也就是核彈。其他自殺炸彈最多200條人命,跟核彈20萬起跳來說,不足為懼。判斷恐怖分子何時何地在大賣場放自殺炸彈,是事倍功半,而是該花大部分心力去解除核彈被盜的可能性,關鍵就在什麼事發生可彌補,什麼事發生是毀滅。



書籍資料:
書名:精準預測:如何從巨量雜訊中,看出重要的訊息?
The Signal and the Noise: Why So Many Predictions Fail—but Some Don’t
作者: 奈特.席佛
原文作者:Nate Silver
譯者:蘇子堯
出版社:三采
出版日期:2013/09/06
閱讀價值:中
ISBN:9789862299609
目錄:
前言
1. 慘烈的預測失誤
2. 你比電視名嘴還聰明嗎?
3. 我在乎的只有輸贏
4. 多年來你一直告訴我們雨是綠的
5. 拚命找訊號
6. 要怎麼淹死在一公尺深的水裡
7. 模型的角色
8. 錯誤越來、越來越少
9. 對機器大發脾氣
10. 撲克泡沫
11. 要是你贏不了他們
12. 有著健康懷疑態度的氣氛
13. 你不知道的東西可能會傷害你結論

沒有留言: