大公三十四年年底,朱迪钚再次來到朱靖垣的住處,送上了一套最新的計算機和軟件系統。
“機器智能學習創造系統”。
類似于朱靖垣前世的人工智能,不過是一個相對完整的軟件體系。
由于朱靖垣在最開始的時候的提示和引導,朱迪钚開發模拟世界和各種遊戲的過程中,一直都在孜孜不倦的研發更加真實的機器智能。
不過早期基本上隻應用在遊戲中,最近十來年才逐步有了其他的現實應用。
比如說人臉識别、物品分揀、駕駛輔助、智能語音等等。
最近這幾年,這些重要的基礎能力,一直都在不斷地升級換代。
同時在功能範圍上也有了新的突破。
已經可以與用戶智能聊天,可以使用語音控制設備。
可以根據标題和框架生産文章,根據關鍵點和元素生成圖像。
根據語音段落生成智能語音庫,根據遊戲台詞直接生成語音。
還可以修繕和改造現有圖片、視頻、遊戲畫面和聲音。
正在提供越來越多的豐富多彩的智能化應用。
在大公三十四年底,借着新一代小型計算機量産完成,朱迪钚對這些功能做了一個歸納整理。
朱迪钚将這些功能統稱爲“機器智能學習創造系統”。
朱靖垣看了之後頗爲滿意,但是擺弄了一會兒卻輕輕的歎了口氣。
大明的科技水平,開始在越來越多的方面超過前世了,但是自己也已經真的老了。
今年自己已經六十四歲了。
雖然相比兩個世界的同齡人而言,自己現在的身體狀态其實是很不錯的。
但與自己年輕時候對比,差距就越來越明顯了。
頭上的白發也越來越多了,身體也越來越不靈活了,腦子也越來越遲鈍了。
朱迪钚不知道父親爲什麽歎氣。
正想要問問的時候,朱靖垣已經開口吩咐仆人了:
“叫迪镧過來……”
然後朱靖垣開始問朱迪钚,他這些智能系統的訓練邏輯。
等到朱迪镧過來之後,朱靖垣就讓朱迪钚給他簡單說了這些程序的情況。
然後朱靖垣直接問了一個問題:
“迪镧,你是大宗伯和刑律院院長,主管文化與法律。
“覺得應該如何處理機器學習的使用的素材的所有權問題。”
朱迪镧聽了之後随口就說:
“兒臣覺得很簡單啊,直接付費授權就是了。”
朱靖垣馬上追問:
“機器學習收費的邏輯和理由是什麽?立法是要有說的過去令人信服的道理的。
“如果機器學習需要收費的話,那普通人學習已經公開的書畫作品,是否也需要收費呢?”
朱迪镧理所當然的說:
“學習本來就要付費的。
“不談學習者自己學習過程中的消耗,例如筆墨紙硯和計算機等等設備。
“也不談上學和聘請老師的費用。
“單純的自行購買學習資料,學習用的原材料和學習内容,本來就是要花錢的。”
朱靖垣伸手指着屏幕上的書畫生成軟件:
“那創作者已經免費在現實中或者互聯網公開的書畫作品,他人學習的時候顯然是不需要付費的。
“這個以别人的書畫作爲學習材料的程序,也需要對所有用到的書畫作品付費嗎?
“我記得很多書畫家都在互聯網上免費公開過自己的作品。
“隻要不用于盈利行爲,通常都會允許别人臨摹學習,甚至還有人會主動指點。”
朱迪镧稍微整理了一下語言:
“父皇,按照大明現有的法律,創作者主動免費公開的作品,他人不得用于任何以盈利爲目的行爲。
“這個盈利包括直接和間接的盈利,也包括現在不盈利但未來盈利的行爲。
“那些熱心的大師們,通常也不介意他人先模仿自己的作品,再去創作風格類似的不同作品。
“隻要對方不照搬他們的設計,另外用于盈利行爲也無所謂。
“也覺得是理所當然的做法。
“站在律法的角度看,沒有矛盾的根本原因,還是因爲沒有利益沖突。
“免費公開作品的創作者,其實有一種理所當然的,在過去也是基本正确的心态和認知。
“首先是别人除非直接抄襲,否沒辦法簡單利用自己的作品獲利。
“就算是他人學習自己的風格去再創作,也需要需要花費大量精力去完成創作。
“對方要親自動手,一個字一個字的寫,一根線條一根線條的畫。
“對方的創作速度與自己不會有明顯區别。
“絕大部分情況下,學習者的知名度和收益水平,也都不會比原創者更高。
“學習者通常還會尊敬原創者,将對方視爲老師。
“這有可能爲原創者帶來聲望加成,甚至有可能會帶來能夠直接提供金錢的客戶。
“這種情況下學習者和原創者之間當然沒有矛盾。
“一旦學習者與原創者使用高度相同的風格,但是學習者的作品熱度超過了原創者。
“那雙方的關系就可能會迅速下滑。
“學習者與原創者的風格類似,完成度比原創者自己更高,知名度也會超過原創者。
“就算是能夠提供收益的客戶,也會變成學習者的客戶。
“而不再是自己的潛在客戶了。
“這時候學習者就會變成發揚光大者,原創者就變成了一個點子提供者或者風格創始者。
“就算是在這樣的基礎上,隻要學習者仍然尊重原創者,雙方的關系通常也不會變得太差。
“因爲發揚光大者會爲落寞的原創者提供額外的知名度。
“同時,發揚光大者也是一個人,創作的速度受限于人體的極限。
“在訂單增加的情況下,風格相似的原創者有機會獲得額外的實際利益。
“雙方的利益沖突仍然不明顯,利益仍然是趨同的。
“如果學習者發明了一個機器,可以将原創者的稿件投入進去,瞬間生成無數類似的高質量作品。
“并且用這些大機器生産出來的‘廉價工業品’賺大錢。
“那原創者絕對會暴怒。
“所以我們不需要什麽複雜的具有說服力的理由。
“隻要規定機器學習需要收費,現有的原創者絕大部分都會直接支持這種規定。
“因爲機器很可能會讓他們得不到收益了,自己會被對方的機器迅速取代,失去絕大部分生存空間。
“就像傳統的手工織布工人與機械化紡織機一樣。
“不過,手工紡織工人與機械化紡織機的關系,與書畫創作者和機器學習智能繪圖的關系并不相同。
“手工紡織技術的發明者無法确定,手工紡織工人隻是掌握技術的工人。
“工人的紡織過程本身不存在創造性。
“其他人發明和購買機械化紡織機器,與工人并無直接的沖突和侵權行爲。
“但是,如果工人自己設計了一種紡織圖案和花紋,而不是傳承多代人的常見圖案和花紋。
“那使用機械化紡織的工廠,在未經工人許可的情況下使用相同圖案,就是法律所禁止的侵權行爲。
“而機器學習的對象,恰好都是有創造性的産品,絕大部分都是有版權的産品。
“所以機器學習應該取得學習目标的版權所有人的授權。”
朱靖垣聽完之後看向朱迪钚:
“老二你認可這個理由嗎?”
朱迪钚直接說:
“镧弟……你這樣的說法是沒有道理的,機器學習與紡織工人設計圖案的比喻也是在狡辯。
“機器學習的過程,以及後續再創作的過程,都是與人的學習沒有本質區别的。
“人學習别人的作品,本質上也是将作品元素完全打碎,變成分子乃至原子狀态存進腦子裏面。
“然後再自行組合這些原子狀态的素材,組合出與原作看上去截然不同的作品。
“隻是這些原子太小了,根本無法鑒别出于原作的直接雷同點。
“其實隻是人類鑒定抄襲的規則基礎上,繼續向下無限細分到人類無法認知爲止。
“相同的設計圖案和段落是不是抄襲?相同的人物結構和大綱算不算抄襲?
“相同的抄設計元素和詩句算不算抄襲?相同的線條風格和詞組算不算抄襲?
“相同的顔色範圍搭配和詞庫範圍算不算抄襲呢?
“這樣繼續細分下去,人類學習到最後使用可能是類似的顔色範圍和詞庫。
“機器學習的深度可能比這個更加深入和細化。
“伱用人類法律鑒定抄襲的标準,去鑒定機器學習創造出來的作品,是絕對鑒定不出抄襲來的。
“類比手工織布工匠和機械化紡織機的相同,隻能算是使用了類似的棉花和顔色。
“所以爲什麽人類學習不算抄襲,機器幹同樣的事情就是抄襲?
朱迪镧笑着說:
“二哥你你可能理解錯了我的意思。
“我沒說機器學習和創造是抄襲,而人類的學習和創造不是抄襲。
“其實按照我自己的觀點,兩者都應該算是抄襲。
“就像二哥你說的,隻要鑒定抄襲的标準無限深入,所有的學習都能夠判定爲抄襲。
“在這樣的基礎上,任何免費學習過别人的藝術作品的人,都不應該創作任何以盈利爲目的的作品。
“想要創造以盈利爲目的的作品,本人的所有的學習資料都應該是取得了盈利授權的材料。
“因爲隻要學習過,顯然就會受到或多或少影響,不然也就不能稱之爲學習了。
“是否爲抄襲的判斷标準,更加準确的說法是允許抄襲到什麽級别。
“二哥可以參考微積分和相對論的邏輯來理解這個說法。
“在這樣的基礎上,現實中的人類社會和人類創作者,已經經過實際上的社會實踐和法律,默認授權了其他人類擁有特定級别以下的抄襲盈利許可。
“但是,人類還沒有授權機器使用任何級别的抄襲盈利标準。
“比如說,我畫了一幅畫,默認允許二哥你學習畫法。
“我允許你把我的畫的原子結構甚至分子存在自己的腦子裏随時使用。
“但沒有允許你把他們存在機器裏面供機器使用。
“機器要學習就要另外要授權。
“因爲你說了,機器學習的邏輯,與人是相同的,但機器恰好又不是人類。
“機器學習相關又沒有任何現行法律。
“機器學習還沒有大規模出現,我并沒有直接給過它授權,更加沒有給過事實授權。
“甚至沒有給過你使用機器學習的授權。
“現在,我們要拟定相關法律,決定默認授權機器學習到什麽程度。
“我的建議是全部非默認,任何用于機器學習的資料,都必須得到創作者的直接授權。
“這樣做的目的不是爲了阻止機器學習繼續進化。
“恰恰是要規範機器學習行業。
“未來是大數據的時代,機器學習的規模必然會越來越大。
“如果不限制機器學習的範圍和規則,必然導緻這個産業的混亂發展。
“必然導緻機器學習開發者互相抄襲且不可控。
“抄襲數據原子當然不是抄襲,那抄襲數據庫肯定就是抄襲了吧?
“就像照搬一個字庫的範圍不算抄襲,但照搬一本大詞典那就絕對是抄襲了。
“在大數據和機器學習的新時代,數據資料應該是有新的權屬規範。
“任何數據和資料,都應該是有權屬的,都是有價值的。
“我認爲這應該是下個時代的時代邏輯。
“有了這樣的基礎規則,有了規範的收費和授權的基本規則。
“相應的數據模型開發者,才有機會将通過有授權的數據,開發出同樣有授權的數據模型。
“進而可以不受額外限制的使用機器生産的産品去盈利。
“否則,任何機器學習最終産生的作品,其著作權歸屬都是模糊和敏感的。
“機器不是人類,所以人類可以不保護機器的著作權,完全不認可機器創作的作品的著作權。
“隻有将機器視爲人類的機器,創作的作品的著作權屬于其主人所有。
“才能以人類著作權的邏輯獲得保護并盈利。
“但人類想要利用别人的素材盈利,就必須獲得對方的授權了,這樣也就形成了清晰的著作權歸屬。
“透過現象看本質的話,用機械智能完成以前隻有人能夠完成的工作,并且講産量和速度提升幾十幾百倍,是又一次的産業革命。
“生産力會再次跨越式的提升,技術能夠覆蓋的産品的生産成本會大幅度下降,由此産生的效益大幅度提升。
“爲智能機器成功運行起來提供原料的人,有分享這種生産力提升所帶來的利益的權利。
“不能将個人欣賞學習的授權許可,用于研發和制造任何生産工具。
“這樣數據資料有價論的邏輯也就清晰了。”
朱靖垣聽完之後看向朱迪钚:
“老二你怎麽看?”
朱迪钚沉默思考了幾秒鍾,最終慢慢的點着頭說:
“我覺得迪镧的話有道理……
“用微積分的邏輯來評判和區分學習、模仿、抄襲的界限是個很不錯的理念。
“未來的公共網絡平台上,創作者上傳自己的作品的時候。
“應該有一個是否允許機器學習的選項。
“同時也應該有一個是否使用大數據篩選和推薦信息的選項。”
朱迪镧聽了馬上附和說:
“我贊成二哥的意見。”
朱靖垣笑着說:
“既然你們哥倆都覺得可行,那這些事情就這麽定了吧。
“不過問題是,你們怎麽判斷一個數據模型,是否用了未經授權的材料來訓練呢?
“在數據分析層面你們有辦法區分嗎?”
朱迪钚想了想說:
“可以在未經授權的素材中添加一些驗證數據,規避未經許可的機器學習的使用甚至污染數據模型。
“不過……單純依靠技術手段是不行的,無法完全規避違規者的破解和甄别以及反破壞技術。
“所以還是要用社會和制度層面的限制以及事後處置方法……”
朱迪钚說到這裏看向了弟弟。
朱迪镧想了想說:
“制度上有兩個方向,一個是默認全部授權,同時默認全部收費。
“目前互聯網上的大規模藝術作品平台,都是朝廷和四大産業集團的官方平台。
“民間廠商和用戶想要自行建立數據模型,隻能從這些平台上采集數據。
“所以可以規定,沒有向現有平台之一付費取得授權資格的廠商,都直接按照違規處罰。
“另一個方向,是就由四大産業集團出面,各自設計一套基礎軟件框架。
“相當于一個帶有強制過濾和篩選功能的裝置。
“民間廠商做任何的數據訓練,必須在這個基礎軟件框架之上開發。
“也就是放在這個過濾裝置之内。
“這個過濾程序自動甄别未經授權的材料标記,直接不将未經授權的材料投入訓練過程。
“同時互聯網上應該在授權和未授權的材料上加入專門标記。
“供過這些濾裝置直接識别。
“這些方案可以與二哥的技術方案同步實行。”
朱迪钚聽了不由得點頭:
“好,識别和反訓練技術是必須開發的。”
朱靖垣也沒有評價兩人的設想,就讓朱迪钚和朱迪镧哥倆商量着辦了。
(本章完)