Dropbox一類的網絡存儲工具如何知道你分享了侵權的文件?難道它們在不停窺探著用戶的隱私嗎?不不,其實它們并沒有做任何壞事。
如果你知道“文件哈希值匹配黑名單”是什么意思,可以跳過本文剩余部分。Dropbox檢查共享文件的哈希值是否匹配到禁止清單,如果匹配,那就阻止文件的分享。
如果這些詞讓你聽起來迷糊,請繼續往下了解。
運作原理:
在計算機科學中,有一個非常受歡迎的概念,叫“哈希值”(hashing)。
其使用非常普遍——從允許網絡服務去查看但不儲存你的密碼,到確定某個文件在用戶傳輸過程中沒有發生變化。
在這種情況里,哈希函數是一種算法,這種算法會根據你輸入的內容提出一個唯一識別符。
哈希值通常只是一串數字和字符。A文件的哈希值可能是4f2900f2fdfaf,而B文件的哈希值可能是dba7b12a19fe9。Dropbox的哈希值可能比這個例子長很多(從而允許更多哈希值),不過大家都能明白其中意義了吧。
如果正確執行哈希函數,對同一個文件執行該算法2次,將獲得相同的識別符——不過即使略微改變該文件都會完全使哈希值改變。
這種識別符可以用于告訴你這個文件是否和另一個文件完全相同——不過這是一條單行通道。哈希值不過告訴你原文件是什么,除非你已經知道或者拷貝文件進行對比。
這可能讓你想到哈希值就像指紋。每個人的指紋都是獨一無二的,不過它不能用于識別某個人,除非你擁有這個人的指紋來進行比對。同樣,基于哈希值的DMCA合規系統不能說這個文件是什么,除非它與已經收到撤銷請求的文件是一模一樣的。
當你把文件上傳到Dropbox,會進行兩樣事情:哈希值將被生成,之后該文件被加密從而使任何未經授權的用戶(黑客或Dropbox員工)不能通過Dropbox的服務器打開該文件。
(有關加密:Dropbox掌握加密的密鑰,因此如果收到合法的要求,他們可以打開你的文件。他們的系統制定了監察機制,從而使員工不能偷看你的文件。)
在Dropbox法律團隊核實了DMCA申訴后,Dropbox將該文件的哈希值加入到一個大的黑名單,這份黑名單包含所有已知的不能合法分享的文件的哈希值。如果你分享一條指向該文件的鏈接,Dropbox將檢查發現該文件的哈希值屬于該黑名單范圍。
如果你分享的文件正是版權持有者申訴的文件,該文件將被禁止與他人分享。如果這是其他文件——新文件或者甚至是同一文件的修改版本,基于哈希值的反侵權系統將不會知道該文件是什么內容。
換言之,至少基于Dropbox的公開表述,該公司并沒有積極掃描用戶的文件以搜尋受版權保護的材料。不存在人工(或者機器人)偷聽你的MP3或者嘗試查找你的文件,或者閱讀你的哈利波特小說收藏集。他們只是有一個很大的禁止分享文件清單,他們只是以一種特意不去了解任何非黑名單文件具體是什么內容的方式來識別這些文件。
現在,上述內容并不是要說基于哈希值的系統是沒有安全隱憂的。例如,在政府要求的情況下,理論上Dropbox會識別將特定文件儲存在賬戶上的任何用戶。不過對于任何基于云端的儲存系統,道理是一樣的,在這些系統里并不是由用戶處理全部的加密程序。
以下是Dropbox對Twitter消息的正式評論:
“一直以來對于我們如何處理版權通知,總有一些疑問。我們有時候收到DMCA通知,要求根據版權原因移除部分鏈接。收到這些通知后,我們根據法律處理這些要求,并禁用被識別出來的鏈接。我們有一個自動系統,能夠避免用戶使用Dropbox鏈接分享完全相同的材料。這是通過對比文件哈希值來完成的。我們并不會查看用戶私人文件夾的文件,我們承諾保持用戶文件的安全。”
|
新聞熱點
疑難解答