數據商用中的模糊化處理

2018/04/20 15:54

最近由Facebook數據濫用引發的風波，成為了整個矽穀監管環境升級的導火索。
而一直以來，關於大數據時代數據隱私話題的討論從來沒有停止過。
不過，時談時新。
萬眾期待既紅米 Note 4X 高配版依加係SmarTone online shop已經買到啦,同小米官方定價相同之餘仲保證有齊咁多款顏色! 另外只要係SmarTone Online shop購買此機,即送12個月爆芒換新保養優惠及加送 Mon 貼,其他熱門手機都有優惠!

在初期，當用戶在互聯網上留下的種種痕跡並沒有顯現出任何商業價值的時候，我們所享受到的互聯網所帶來的便利，更多的是以一種單向的、像是慈善事業或是社會福利的形態呈現
也就是在這個過程中，我們曾經不太重視的上網軌跡，隨著網絡技術的增強，被廣泛應用於商業活動。用戶主動或是被動提供的信息，在經歷了密集的數據挖掘之後，帶來了更有效率的篩選結果和更為優質便捷的服務內容，實實在在地改變了我們的生活。
從這個角度看，用戶和平臺雙方的角色早已經發生了變化，但是從這一係列的數據隱私危機的爆發還有公眾對個人信息泄露由來已久的擔憂來看，雙方對於數據隱私和自身角色變遷的理解，存在了巨大的缺口和分歧。
近日，《華爾街日報》科技專欄作家克裏斯托弗·米姆斯(ChristopherMims)撰文稱，在用戶隱私保護上，美國科技巨頭過去幾乎處於自由放任的監管環境中，自律意識淡薄，但是一切即將改變。

也就是說，雖然現在被“人贓並獲”曝光的隻有Facebook一家，但是穀歌、蘋果、亞馬遜等各大科技公司對數據的需求程度並不比Facebook低，並不是誰比誰用得高尚的原因，很可能隻是自家的問題還未到達全麵爆發的缺口而已。
在數據驅動的經濟中維持信任（更準確的說應該是重建信任）的方式，目前看來並沒有發揮應有的作用，甚至在一定情況下起了反作用的效果。
這是由於我們在建設平臺角色的時候，更傾向於保持一種中立的非營利組織的形象，至少在對數據使用這方麵，這些科技公司在有意弱化其商業模式對於數據變現的依賴程度。
SmarTone iPhone筍plan有幾筍？上台出機月費激抵不在話下，客戶合約期內仲可享有「真．無限」4.5G 全速數據計劃，仲有額外月費回贈，轉台客戶更加享有每月$18行政費回贈，仲諗？即刻嚟SmarTone出最新iphone上台Plan，萬勿錯過震撼優惠！

正如Facebook此次的數據濫用，能夠引起如此大的用戶反應，與其此前一直保持的無辜中立的平臺形象不無關係。
盡管如此，在越來越難以掌控的危機爆發之前，但凡存在一點僥幸心理，比起在廣告盈利模式的質疑中披露平臺的信息被如何使用的，保持數據使用中立的形象，哪怕隻是一個假麵，也顯得更為體麵。
也由此，像是本能一般，數據在廣告商業模式中的使用，呈現出更加隱秘的復雜化趨勢。
基於穀歌等公司對於其用戶認知資本的收益依賴，此次被Facebook所波及在所難免，相似的是，穀歌搜索引擎的“關鍵詞自動完成功能”（autocomplete），也曾卷入到操縱美國大選的“陰謀論”風波之中。

兩年過去了，針對這種數據或者算法呈現的帶有相似的偏見信息，卻依舊不斷地在引發追問和反思。
在很早之前，穀歌發言人就此已經回應過：“我們的自動填充文本算法在設計時就避免了與人名同時出現時推薦帶有攻擊或者侮辱性的詞匯。這項過濾操作不是針對某一個人的，對所有人都是如此。’犯罪’屬於具有攻擊性的詞匯。穀歌的自動完成功能不會因任何一種原因偏向任何一位總統候選人。”
關鍵詞自動完成功能的設計初衷是為了避免用戶輸入錯誤的搜索詞，以提升用戶的搜索體驗和輸入效率。而真正實現這一工具功能，將用戶引導到他們最希望得到的相應關鍵詞上的，卻依賴於背後大量使用搜索引擎的用戶自己。也就是說在用戶輸入的關鍵詞中，被輸入的次數越多，它對應的查詢就越熱門，出現在關鍵詞排序靠前的幾率也就越高。
也因此，在當時揭示出一種導致“算法偏見”的結果：很可能是用戶自身更傾向於關註負麵的而非積極正麵的關鍵詞搜索建議，所以才導致了這種選舉的“陰謀論”。

這種類似於算法惡作劇的惡性循環，在Facebook也曾出現過，某些無益的惡搞內容，卻因為不斷地被不喜歡的用戶怒而評論，這種帶有誤導性的標記，卻最終被當作熱門內容不斷轉載傳播。
《算法時代》的作者盧克·多梅兒在書中談到：“從嚴格意義上講，搜索算法無法提交不受意識形態影響的搜索結果，而且這些搜索結果為了取悅我們的個人主義觀念，往往會進一步加強我們對某些問題的’既有看法’，同時，對於與我們現有觀點格格不入的那些問題，則會降低其重要程度。”
工具將使用者某種無意識的行為，在相對無束縛的網絡檢索環境中被放大和量化了。甚至是與初衷完全相反的意願，僅僅是基於好奇心或者批判心理而產生點擊的動作，卻也由此也留下了不可磨滅的數據痕跡。
ETG致力提供專業的防盜方案，包括掛勾、智能櫃鎖等

因此綜合了的算法本身的隱秘性和用戶某種無意識行為，共同促成了這場陰謀：穀歌呈現出的帶有偏見的檢索關鍵詞可能真的隱藏著傷害某個特定對象的潛在能力。或許其他潛在勢力真的存在，但是它的偏向性及其產生的後果，至少是在這種惡性循環之中被放大了。
這隻是數據使用中造成分歧的其中一個方麵。我們本質上更習慣於去放大數據使用的結果，卻對造成結果的數據使用過程知之甚少。
也就是說我們能夠理解，為什麽網頁上的廣告在我們幾個星期之前搜過一塊手表並且已經購買完成以後，還在不斷推送相關的廣告信息的時候，意識到我們的搜索數據和隱私被利用了。
但是我們並不能理解為什麽係統會在推送其他廣告或者呈現信息的時候，出現一些看起來與我們並不太相關或者與我們觀點不同的東西，及其在實際中到底會給我們帶來什麽影響。

百度早前就曾因為基於關鍵詞檢索而對用戶進行定向廣告投放，被控告侵犯隱私。法院一審判決認為，網絡活動蹤跡屬於個人隱私，且百度公司的相關提示非常不顯著，無法起到規範的說明和提醒作用，故判定其侵犯了用戶的隱私權。
但上訴審判過程中，法院以“百度公司在《必讀》中已經明確告知網絡用戶技術使用情況和退出機製”、“網絡活動軌跡及上網偏好一旦與網絡用戶身份相分離，便無法確定具體的信息歸屬主體，不再屬於個人信息範疇”等為由，最終判定百度的這種個性化推薦行為不構成侵犯該網友的隱私權，撤銷原審判決。

雖然這個事件已經過去很久了，但是它最核心的矛盾並沒有改變。
一方麵，平臺愈加依賴於這種復雜而模糊的服務條款的原因在於，他們不需要過多的去解釋它們是如何做決策的，以此來爭奪利益空間和進行自我保護。
用戶們為了享受服務，往往對條款表示同意，且他們更傾向於更輕鬆的選擇，即過濾信息，勾選默認選項，絕大多數用戶根本不會認真看條款內容。所謂的用戶知情同意，可能隻是一種過於理想的幻覺。
而這些由商家製定的服務協議中必然會存在更加偏向於商家利益的內容。且要在數據采集環節針對不同的使用範圍進行權限界定，既模糊又困難，實現起來並不現實。

但另一方麵，用戶越來越在意被使用的那些數據隱私。
有越來越多的人傾向於認為，平臺獲得個人信息已經非常方便，個人信息泄露問題既廣泛又難以避免，所以有必要對個人信息的使用實施更為嚴格的管製。
最近集中爆發的越來越多的數據問題分歧，正在打破以往數據商用中的這種隱秘和復雜化帶來的平衡。用戶有必要對他們的數據到底發生了什麽有更多的了解。
數據的隱私保護和商用需要尋找新的平衡。在監管之外，至少科技公司不應僅限於滿足持續的模糊化和復雜化的數據使用，不至於為了避免保護數據隱私而麵臨一禁了之的被動局麵。返回搜狐，查看更多