如今,機器算法能夠在很多方面對事情的走向及發展做出預測。這些預測結果能夠在各行各業對人類起到助力,這種前景廣闊的算法也得到了政府和資本的注意。然而,僅憑機器算法對一些事情做出預測的做法涉及到隱私問題和公平問題,也招來了許多質疑。
一、人工智能判斷犯罪可能,機器算法可對多領域進行預測
從古到今,關于預測未來的傳言不在少數。如諸葛亮可以預測天氣借東風,袁天罡能夠預測出武則天未來成為皇帝等。這些真假難辨的傳言聽起來都非常玄,但也從某種程度上反映出了人們對預測未來的渴望。
University of Pennsylvania的統計學教授Richard Berk是預測犯罪算法的主要研發者。他的這種算法是參照Google的Alpha Go研發的。在與李世石對戰之前,Google向Alpha Go中灌輸了上萬的棋局數據,用以訓練Alpha Go找到最優的下棋策略,再配合Alpha Go自身的訓練,達到提升能力的目的。
Berk研制算法的過程與以上過程類似。Berk和University of Pennsylvania的心理學家Susan Sorenson共同收集了從2009年至2013年10萬件家庭暴力案件,將這些數據灌輸給電腦程序。數據中包括年齡、性別、第一次犯罪時間、犯罪種類等。這些成果都發表在了《實證法律研究》雜志上。
預測犯罪,聽起來那么不可思議。更令人吃驚的是,機器算法的預測功能不僅僅局限于犯罪方面。
去年9月,印第安納大學伯明頓校區的Jaehyuk Park帶領團隊利用機器算法預測模特未來事業的成功率。他們下載了Fashion Model Directory(時裝模特指南)中431位模特的姓名、年齡、三圍、體重等相關信息,結合模特在社交網絡上的受歡迎程度以及登上T臺的次數等其他數據,預測出模特未來的事業發展情況。
在理科方面,機器算法的預測同樣能夠發揮作用。賓夕法尼亞Haverford College(哈弗福德學院)的研究團隊創造了一種能預測制備晶體方法的機器算法,其預測效果比人工預測更好。
研究人員采用標準的機器算法,用4000次不同的反應下制備晶體的實驗數據來對機器算法進行訓練。研究團隊將存檔在實驗記錄中的暗黑反應和失敗信息轉換為能夠輸入機器的格式,讓計算機分析試驗成功與失敗的因素,從而對制備晶體成功的化學條件進行預測。研究員Alex Norquist表示:“失敗的反應包含大量未報告和未提取的信息,失敗的實驗比成功的多得多,但通常只有成功的那些才得以發表。”
機器算法幫助人類實現了預測未來的夢想,隨著機器算法在各領域的逐漸拓寬,對生活和社會可以起到許多推動作用。
二、機器算法預測未來,提高生活質量推動社會發展
在研發預測犯罪的算法之前,Berk教授在這方面的研究已經有相當長的一段時間了。他的算法能夠幫助監獄決定要把哪些犯人關到高度警戒區,假釋部門也用這種算法判斷應該對哪類假釋人員采取更為嚴厲的監視手段,警官則可以通過算法預測被捕罪犯是否會再次犯罪。
此外,Berk還編寫過一個可以預測哪些工作場所會違反安全規定的算法,能夠為Occupational Safety and Health Administration(美國職業安全與衛生管理局)所用。
其實在這種算法出現之前,美國已有用計算機來處理司法案件的先例。上世紀90年代,紐約市曾使用數據信息預測哪些地鐵站犯罪率高。
預測犯罪的機器算法可以使警方鎖定目標變得更加容易。比如目前涉嫌家暴的罪犯釋放率達到了50%,為警方和政府的監控帶來了極高的成本。有了預測犯罪的算法,能夠為警方的工作帶來許多便利,同時也能使社會治安狀況良好。
除了治安方面,機器算法預測功能可以提高人們的生活質量。比如MIT(麻省理工學院)計算機科學與人工智能實驗室開發了一種預測算法,他們用600個小時讓計算機“觀看”不同的電視節目,觀察其能否預測如接吻、擊掌、擁抱等一系列互動行為。
這種算法利用深度學習人工智能來構建其對人類互動的理解。研究者為程序輸入原始數據,讓算法自己對內容進行區分。
這種算法的目的是讓未來的機器人更好地服務于人類。MIT的博士候選人Carl Vondrick表示:“如果你想在家中有一個能夠互動的機器人,那么它需要有一些預測未來的基本能力。舉個例子來說,在你正要坐在椅子上時,你不會希望機器人恰好在這時候把椅子抽走。”
除了上述領域之外,機器算法還能在好多方面做出預測。比如購物網站能夠通過算法知道顧客可能會購買的商品,視頻網站能夠根據算法預測用戶接下去想要看什么視頻,氣象部門能夠根據算法預測出未來一周的天氣等等。這些預測能夠提高生活質量,推動社會發展。
然而,新技術的發展通常都不夠完善,機器算法也是如此。預測未來的功能雖然能為人類提供一些便利,但是這種算法還是存在不少缺陷。
三、機器算法預測未來不太靠譜,準確性值得商榷
機器算法的預測功能對社會和人們的生活起到了一定的推助作用,但細究之下,依然會發現存在許多不完善的地方。
首先,機器算法進行預測時會涉及到隱私侵犯問題。機器在學習的過程中需要大量的數據來進行分析,像是預測犯罪的算法就更需要一些高度隱私的數據。雖然Berk曾表示自己對算法進行訓練時用的是公開數據,但是其新算法的功能是判斷嬰兒是否會在年滿18周歲時犯罪,這些數據則是相當私密的。
隨著預測算法的發展,未來極有可能會涉及到更多領域。算法在深度學習的過程中,難免會涉及到一些高度隱私的數據。這就牽涉到科技的發展和倫理問題,在預測算法走向成熟之前,需要將這類問題先妥善解決。
其次,這類預測算法的準確性也有待商榷。這是預測算法中最重要的問題,也是被人質疑最多的一點。比如預測犯罪的算法,這種算法的基礎都是來源于以往的犯罪統計數據,因此極可能導致把以往的執法模式和認為如窮人和黑人等人群更有犯罪可能的傾向帶入算法之中。
根據國外網站ProPublica發布的調查報告顯示,佛羅里達州一家法院在風險評分的過程中,發現黑人再次犯罪的幾率較高,但實際上白人再次犯罪的情況卻比黑人常見。
再如上文提到的預測模特事業成功率的算法,這種算法的預測功效僅限于15名模特,數據并不夠全面。此外,這種算法以模特走T臺的次數來衡量其成功率并不科學,因為這不足以顯示模特真正的價值。
最后,預測算法的技術是否應該公開也是個問題。不只是因為一些數據涉及隱私和人身權利,更涉及到一些商業利益。由于預測算法的技術日益成熟,許多商業公司紛紛入局。密歇根一家商業公司Northpointe開發了一款預測軟件,卻并未將其公開,這讓很多人認為其中存在不可告人的部分,也有人對該公司的做法進行攻擊。從商業機密角度來說,商業公司對技術保密也無可厚非,但是對預測算法保密確實會阻礙這方面科技的發展速度。
由此可見,機器算法預測技術給人們帶來了一些改變,推動了許多領域的發展。然而這一技術剛剛興起,許多算法和系統并未經過科學的認證和事實的檢驗,存在諸多缺陷。因此,盡管機器能夠通過學習對一些事情進行預測,但要完全依賴預測的結果,還不是非常靠譜的選擇。