專業者言｜數據確權：確定產權還是確定規則？

黃少卿上海交通大學安泰經濟與管理學院教授

2023-07-12 15:24

來源：澎湃新聞

一

經濟學關于產權一直有兩種觀點：一是“產權產生交易”，主張明晰的產權會帶來交易的便利化并促進交易發生，由此進一步促進商品或要素的流動，因之，產權確定非常重要；另一種觀點主張“交易產生產權”，強調的是交易結構已包含確權的規則，既然交易規則里有確權規則，那么，交易過程同時就是確權過程，因為交易要運用到確權規則。后一個觀點似乎有點不好理解，且通常容易被忽視。

數據作為生產要素，明晰產權很重要。因為這有利于數據的交易和流動。但是，更加重要的是，如何界定數據產權。當前，數據產權立法的工作非常必要，核心問題在于要明確立法的基本取向。我認為，與其試圖給數據事先確定一個絕對產權，更合適的做法應該是設置確定產權的游戲規則和程序架構。從這個視角出發，很多問題就能有一個包容性答案，不同觀點不會顯得相互矛盾。有人所感到的困惑也可以化解，即如何協調確定權益和促進數據流動兩大目標，二者可以不是對立關系。

數據流動是否產生價值？從經濟學角度講，價值的產生和創造通常是企業家的工作，只要確保數據流向企業家，由他們來處理和使用，就會產生價值。問題在于，如何確保數據向企業家流動？非常重要的一個條件，就是要有競爭性交易。只要有競爭性交易，越具有企業家才能的人，就可以報出越高的價格，自然有利于數據通過交易向企業家流動。但交易不就要確權嗎？不是只有事先確定產權的數據才能產生交易嘛？這正是前述第一種觀點的看法。

在海量數據時代，如果政府要對每一個數據的產權在交易前進行確權，不但確權成本巨大，甚至會出現難以確權的情形；另外，大量確權后的數據可能無人問津，而使事先確權的工作失去意義。正如有專家所言，數據不會在使用中被損耗，只會在不被使用中不斷失去價值。既然一直沒有得到利用的數據不會自己產生價值，因為數據要在使用中產生價值，那么，更恰當的應該是在使用中確權。不被利用的數據沒有價值，也就沒有交易前確權的必要。

設想一種情形：有人要購買你掌握的數據。為什么？一定是你的數據有其獨特價值，從其他人手里買不到。為什么你的數據比別人的數據蘊含更大的獨特價值？一定是因為數據已由你做過創造性加工，賦予其獨特的價值屬性。因此，如果遵循無瑕疵原則，只要加工之前是通過合法交易取得的數據，即數據獲得的前位程序沒有瑕疵，那么，經你加工處理后的數據就可以合法繼續交易。而新的交易實質就產生了產權——讓數據處理工作所創造的價值確權給創造者本人，即，交易過程對你的加工工作所創造的額外價值權屬給予認定，從法律上把這部分增加價值的產權界定給你了。

中國古代的房屋交易，很多時候并不要求賣的房子要有產權證書。事實上，中國古代政府通常不提供產權登記證明。但是，只要有一個東西——契書，就是和上家做交易的契書——蓋了政府的章，由此證明獲得土地和房子的前位程序無瑕疵，只要有購買房屋契書，后面就可以賣。

數據也一樣。不過，前置無瑕疵規則的運用可能比土地房屋更復雜，不是簡單一份契書就可以解決。這就涉及確權規則問題，包括用益物權問題。用益物權的確有排他性，如果完全沒有排他性就沒有收益權，不排他就沒有辦法說這個東西一定是我的，也無法用來產生收益。關鍵在于，這是事先的排他還是事后的排他？

事先排他意味著事先要確定產權；只在交易過程中確定排他屬性也沒有問題。事后確定本質上還是要有確權規則。有了確權規則就能夠促進交易，促進交易就有收益發生，有收益發生，就會促進各種對數據的價值創造性加工和深度開發。有了數據加工和深度開發，自然帶來了對整體經濟的更大價值。

那么，確權最終是什么問題？怎么確權？這是一個認知問題，說得玄乎點，是腦科學問題，是如何對世界本質進行認知的思維方式問題。《決策的大腦》一書說，我們對世界的認知框架是與生俱來的。非常小的孩子就有財產權觀念，這種財產權觀念是一些預設的思維方式，比方說，認為付出了勞動的對象就應該擁有產權，而不僅是因為誰占有這個對象。書中特別講到盧梭在《愛彌兒》這本教育學名著里的一個例子。

基于羅馬法及后來發展出的民法，是強調基于占有來確定產權。這個規則很簡單，簡單且有效。在農業時代、工業時代，確定產權的規則一直就這么用下來了。

事實上，除了這樣一個認知框架和確定規則的框架之外，現實世界還有一種規則，和《決策的大腦》給出的認知框架類似，是洛克在《政府論》里強調的，只有勞動才能產生產權。馬克思的勞動價值論即源于此，這是另一個重要的確權淵源。因為，根本意義上，人生下來唯一擁有產權的就是自己的身體，所以，后續衍生的產權都基于身體而來，即基于身體的勞動而來。

基于身體勞動的產權是自己身體產權的衍生品。終極意義上，每個人只能占有自己的身體，占有不了別的東西——那是上帝創造的。基于這個占有的意義，那么，源自個人的原始數據的產權就像個人身體一樣，天然由個人所擁有。以此為基礎，才能談衍生的產權和權利。如果我們同意勞動產生產權，這就意味著，如何確定數據產權要有更基準的游戲規則，即占有數據者是否在這些數據上付出了額外勞動。在數據不斷流通或使用過程中，不管公司或個人，如果對其進行加工、開發，賦予勞動，那么這些環節所創造的價值，其產權就要界定給付出勞動者。

在我看來，基于勞動投入而占有相應權利，這種確權程序安排，將有利于數據的開發與加工。用這個規則取代過去純粹意義上的占有規則，可能更有助于實現合理的數據產權確定。

總之，人類有兩類確權規則，這兩類規則是純粹意義上的。到今天為止，不同國家不同民族現實運用的財產權利規則，都混合了這兩個規則的因素。只不過有時這個規則因素多一點，有時另一個規則因素多一點，并不一定是純粹意義的某一種類型的產權規則在絕對性地起作用。

二

由此，如其他學者所說，數據產權的產生過程分兩個步驟。首先是從個人到平臺，即從主體1到主體2，其次是主體2到主體N。我同意這個兩階段分類。當然，我更愿意把它看成是兩類重要關系，第一類從個人開始，個人包括自然人、也包括法人——法人也有它的人格。也就是說，這個人格權不僅是自然人意義上的隱私權，名譽權等其他人格權也要考慮到。從個人到平臺公司，或者到所謂主體2，即著手數據收集加工的主體，這是第一階段的關系。第二階段是從主體2到主體N，即數據收集加工以后在不同主體之間的流轉關系。

這兩類關系差別很大。第一階段數據從個人——不管自然人還是法人——那里，通過收集整理后流轉到作為平臺的主體那里，這是數據形成價值的關鍵一步。原因在于，數據的經濟價值可幫助掌握它的經濟主體更好地理解市場結構，從而做出正確的經營決策。即，數據的價值來自海量個人信息匯總后得到的對市場整體結構的認知，而個人信息數據本身無法產生這一價值。所以，有效的數據產權規則應最大程度降低個人信息匯總為整體信息這一階段的交易成本。

如果個人基于數據權利不同意有關自己的數據被收集，完成這個過程就會發生巨大的交易成本。但如果法律上不明確個人對自己的數據權利，導致平臺對個人數據隨意收集和使用，又必然帶來隱私權或人格權的侵犯現象。因此，個人天然擁有與自身相關數據的權利這個基點并不能動搖。

那前述問題如何解決？為降低交易成本，第一階段數據的收集匯總應遵循兩個原則。第一個原則叫依默許而取得。針對個人數據的收集整理，只要個體不反對就應被視為同意。默許就是“可以”。“可以”的說法比較抽象，但默許在行動上是具體的，即沒有反對的表態。譬如，個人登錄某個網絡平臺，可能涉及被收集個人數據，只要個人點擊進入后愿意注冊并使用這個APP（當然，個人如果覺得不愿默許，也可以放棄）——這個行為就被理解為默許。

第二個原則是什么？數據收集過程中，“默許+收集”本身要生成新的法律關系，即信托法律關系。當個人默許后，并不表示平臺拿到個體數據就沒有責任了，因為這些數據轉移到平臺手上，數據收集不僅會產生財產屬性，而且，它們內涵著另一個屬性，即前面講到的附加屬性，就是很多隱私信息也在里面。財產屬性和隱私屬性兩者不可剝離。有人認為通過脫敏可以剝離，但脫敏處理還是難以剝離干凈，真要把所有敏感信息剝離掉，可能這個數據的價值就不大了。如果不知個人在哪里生活、每天買什么東西，也就失去了數據的財產屬性和經濟含義。如果知道這些信息，僅僅把名字隱掉，要把具體個人找出來可能也并非難事。總之，脫敏處理很難實現100%的隱私剝離。

個人數據被平臺公司等主體所收集時，相當于其隱私也被獲取了。由此，數據收集馬上會產生不對稱關系，導致平臺對個體的信義義務，即，數據收集者負有保護對被收集數據個人的隱私權的義務，這個責任從收集數據的瞬間就確立起來了。而且，未來通過交易而獲得這些數據的其他主體，將同樣負有該義務。

也許人們會問，法律上當然可以如此界定，問題在于，怎么確定這一義務是否得到履行？我的建議是，一旦信義義務被確定下來，被收集數據的個人如果產生隱私已被侵犯的疑慮，就可提出起訴，起訴后，舉證責任落在收集數據一方。因為信息嚴重不對稱，個人不了解平臺算法，不知平臺在如何使用數據。因此，個人在保障自己數據不被濫用上缺乏必要的手段和信息，除非平臺舉證自己無過失。如果是個人，反駁不了這一舉證就應該接受；如果平臺無法舉證，就要冒被認定為違背信義義務、侵犯個人隱私的法律風險，違背信義義務將受到法律制裁。

總之，第一環節的數據轉移為從個人——不管自然人還是法人——到收集數據的平臺，必須建立這兩個原則：默許原則和基于“默許+收集”所產生的信義原則。否則，第一個數據轉移的環節將因巨大交易成本而難以完成。倘若這兩個原則得以確立，扯皮情況將大大減少，由此可以進入第二階段，即拿到個人數據的主體，如平臺公司，可以通過數據加工或開發等數據增值工作，進而進行數據交易，讓增值后的數據進一步流動起來。

這個階段的數據處理和使用有兩種方式：要么出售給其他主體作為中間投入品再加工，即到主體N那里去；要么直接出售給終端用戶。不管以什么方式獲取收益，都要把數據服務和產品進行出售，一定會有出售過程。

那么，在出售過程里，怎么確定數據產權？這時，像前面的分析那樣，需要建立基于勞動的產權確認規則。經濟生活中存在很多無形資產，像知識產權，它的確立正是基于勞動。權利人首先要有一個想法產生，再把它變成可申請專利的具體知識，包括把著作寫出來。寫成著作的那些文字類似原始數據。通過不同文字的組合寫出一本新書，看上去是在我們學到的五千個漢字中反復重組，但形成了新知識和新著作。音樂也是這樣，幾個音符，哆來咪發唆拉西是既有的，通過音樂創作者重新組合，形成了擁有版權的新作品。數據的加工開發處理也是如此，加工主體在原始數據基礎上所做的新開發，也會帶來新的數據權利。

這個過程中，因為上面附加了勞動，才能給數據加工處理的主體以確定的數據產權，正如給作家或作曲家以確定的書的著作權或音樂作品著作權一樣。數據產權同樣如此，因為確權原則沒有發生變化。拿到原始數據的主體對這些數據加工處理，讓它以一種新的形式體現出來，而加工處理給后續使用者創造了價值，導致后來者愿意購買。自然而然，基于勞動就能把數據處理工作創造的價值的產權確定起來。

當然，基于所謂勞動產生財產權的原則和基于占有產生財產權的原則，在數據產權的確定上可以結合。用益物權，就是針對已存在物品進行加工等增值努力，再使用它并獲得收益。這種用益物權跟基于勞動獲得財產權利不必然存在矛盾。

三

第三個問題，數據流通過程中，怎么知道交易主體的數據從上游取得的過程符合無瑕疵原則。即如前面所說，交易時需要確保沒有人對所交易數據的產權進行質疑或索取，說出售數據的主體不具有產權，而指控是從自己這里通過爬蟲手段等非授權方式得到的。當然，法律上如何界定爬蟲行為的性質，是否應認為其合法？目前可能存在爭議。在我看來，即便是公開信息，哪怕是前臺信息，且不論后臺信息，這些信息經過加工后把它公布出來，也不表示他人可以直接復制使用。相當于我的音樂作品，既然讓大家都唱了，并不表明有人可以截取其中一段，在不付費的前提下放到自己的作品里，顯然這是屬于侵犯版權的行為。因為，基于付出勞動就要獲得產權這樣的游戲規則，和付出勞動以后的數據存在形式是公開還是隱蔽的無關。所以，對爬蟲行為，將來法律上要有所界定，不同意恐怕就不能爬。換句話講，要爬蟲可能也要基于交易或許可，就是上一端數據獲取方的許可，才能讓爬蟲者得到合法權屬。

怎么確保手上的數據在前端已得到許可，符合無瑕疵原則？這是一個很難的問題。因為數據不斷流動，A手上有的可能B手上也有，C手上也有。如果A要去索取權利，就會說從B那里得到，如果B要去索取就會說從C那里得到的。

這個問題怎么解決？我主張，借助當今日臻成熟的區塊鏈技術。區塊鏈技術可以幫助清晰界定各種數據的流動軌跡——數據從哪里得到的，得到過程是不是已獲得前置許可，或有什么法律憑證確保不是非法取得。哪怕是爬蟲，不得到許可也是非法取得。

如果前置程序沒有獲得許可，后面即便做了數據加工，創造了價值，也要把前置程序補全，通過賠償等方式補上前置許可，才能進行后續數據交易獲益，否則，這個交易就是有程序瑕疵的交易。區塊鏈技術幫助我們準確把握數據流動的軌跡和痕跡，這個問題就不難解決。我相信，區塊鏈技術在數據市場要素確權和交易過程中必將發揮重大作用。如果這個作用不發揮出來，那么，數據確權和數據交易流通，乃至數據市場的形成，以及，最終幫助我們實現數據收益的分配——分配也是交易過程，交易過程實現了收益也就實現了分配——恐怕這些都難以實現。區塊鏈技術未來怎么進一步完善開發，國內也要有相應立法跟上，我認為這是重要的配套制度。

最后說一下政府相關立法。我一直主張，政府不要行天道，而要行人道。不要老想替天行道，認為自己手上掌握絕對真理——掌握絕對的確定性。今天講立法一直在強調確權，似乎政府認為自己可以確定性地給出一個合理的產權安排。恐怕這個立法思維要調整。數據確權立法中的“行人道”是什么？是不需要確定權利，但要確定確權的規則，在這個規則下，讓每個市場主體去博弈——人們基于利益和成本考慮、對倫理和法律的尊重，當然還包括對效率的追求、對公平的考慮，這些都會在博弈過程中體現，從而最終形成博弈的均衡。這個均衡是“人道”的體現。如果政府的數據確權立法，不是要確定一個確定性的權利——像過去羅馬法、民法的傳統那樣，而是建立有利于數據產生、開發利用，并且可以創造收益、創造價值的游戲規則，這比什么都來得更重要。

（本文是作者2021年7月10日在上海社會科學院“面向數據要素市場的企業數據權益配置研究”專家研討會上發言速記稿的修訂稿，修訂稿完成于2023年6月28日）

責任編輯：王昀

校對：欒夢

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

我要舉報