1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

谷歌之后,OpenAI也要給新聞網(wǎng)站付費(fèi)了?

 2024-07-13 09:57  來源:A5專欄  我來投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

文丨師天浩

出品丨師天浩觀察(shitianhao01)

近兩年,大模型噴涌,它們?cè)谖淖?、圖片、音視頻等內(nèi)容形態(tài)的生成上大放異彩。內(nèi)容創(chuàng)作一直認(rèn)為是人“獨(dú)屬”的技能,自O(shè)penAI于2022年發(fā)布ChatGPT之后,眾多大模型開始挑戰(zhàn)一直被人類把持的這一獨(dú)特技能。從初期驚艷心態(tài)“祛魅”后,大眾逐步了解了這個(gè)新生事物的“創(chuàng)作原理”。

它需要先“吞食”海量的文字內(nèi)容、圖片內(nèi)容、音視頻內(nèi)容,這些大數(shù)據(jù)先被高速分析和處理,在深度學(xué)習(xí)技術(shù)的推動(dòng)下,大模型愈發(fā)像人一樣可以創(chuàng)作文字、圖片、音視頻等多模態(tài)內(nèi)容。包含社交娛樂到工作學(xué)習(xí)等場(chǎng)景的內(nèi)容生成,能力越來越強(qiáng)的大模型,將深刻改變未來世界。

快速發(fā)展背后,大模型侵權(quán)問題頻繁爆發(fā)。

1

今年4月末,包括《紐約每日新聞》和《芝加哥論壇報(bào)》在內(nèi)的多家新聞機(jī)構(gòu)在紐約的聯(lián)邦法庭對(duì)OpenAI及Microsoft提起了法律訴訟,控告二者在未獲授權(quán)下,利用其新聞稿件來教導(dǎo)生成型人工智能(AI)技術(shù)。隨后,美國(guó)調(diào)查新聞中心(CIR)指控OpenAI和Microsoft使用版權(quán)材料來訓(xùn)練其人工智能模型。一份在紐約聯(lián)邦法院提交的投訴聲稱,OpenAI未經(jīng)許可或付款就利用了CIR的內(nèi)容。

這讓人不得不聯(lián)想到十年前,美國(guó)眾多新聞機(jī)構(gòu)對(duì)谷歌搜索引擎的法律訴訟。其實(shí),大模型自誕生就被看做搜索引擎之后,網(wǎng)民的全新信息獲取工具,相比于后者,大模型除了提供精準(zhǔn)信息,還可以直接“原創(chuàng)”文字、圖片、音視頻內(nèi)容供用戶使用。

如今,谷歌已經(jīng)對(duì)非常多新聞機(jī)構(gòu)“付費(fèi)”,大模型或許也難逃這個(gè)結(jié)局,雖然OpenAI對(duì)此強(qiáng)調(diào)使用公開材料訓(xùn)練AI模型屬于合理使用。

新聞機(jī)構(gòu)和互聯(lián)網(wǎng)巨頭的較量,最早可追溯到2009年。

2009年,美國(guó)新聞集團(tuán)旗下的《華爾街日?qǐng)?bào)》新聞網(wǎng)站采取收費(fèi)制,網(wǎng)友打開該網(wǎng)站部分新聞可瀏覽第一段,若想閱讀全文就須付費(fèi)。彼時(shí)這類收費(fèi)新聞若由谷歌搜尋鏈接,卻可閱覽全文。

在“2009年有線電視展會(huì)”上默多克譴責(zé)谷歌,稱搜索巨人正在竊取不屬于自己的內(nèi)容,因此呼吁內(nèi)容所有者進(jìn)行反擊。默多克控訴:“我們還要讓谷歌繼續(xù)竊取我們的版權(quán)內(nèi)容嗎?不能再這樣下去了。”

即使到了今天,新聞網(wǎng)站的優(yōu)質(zhì)內(nèi)容,仍是谷歌等搜索引擎向用戶提供優(yōu)質(zhì)服務(wù)的必要組成部分。搜索引擎在賺取大量財(cái)富的同時(shí),新聞網(wǎng)站卻成了谷歌們的“陪嫁品”。圍繞搜索引擎是否應(yīng)該向新聞網(wǎng)站付費(fèi)的討論,從美國(guó)蔓延到全球,從十幾年前爭(zhēng)議持續(xù)到今天。

漫長(zhǎng)時(shí)間的較量下,現(xiàn)在谷歌向新聞機(jī)構(gòu)付費(fèi)已是一種常態(tài)化現(xiàn)象。

早在2020年,谷歌公司就對(duì)外宣布,當(dāng)時(shí)已與全球約200家報(bào)道機(jī)構(gòu)建立了合作關(guān)系,將開始一項(xiàng)推送新聞的新服務(wù),未來3年,谷歌將支付10億美元的新聞稿件等的使用費(fèi)。

2

相比于,搜索引擎的索引“侵權(quán)”和廣告壟斷等拷問。大模型與新聞機(jī)構(gòu)的較量更為全面,雙方的矛盾也更為激烈。

要知道,全球新聞網(wǎng)站依靠谷歌帶去的源源不斷流量,尚能夠通過廣告服務(wù)、付費(fèi)閱讀等業(yè)務(wù)盈利。而大模型的服務(wù)機(jī)制中,超鏈跳轉(zhuǎn)所占比例并不高,也就說服務(wù)大多在大模型產(chǎn)品內(nèi)就結(jié)束,新聞網(wǎng)站從中更難獲取利益。

這一次,率先對(duì)大模型開戰(zhàn)的為《紐約時(shí)報(bào)》,2023年底該報(bào)對(duì)OpenAI以及Microsoft提起訴訟,指控后者未經(jīng)授權(quán)使用該報(bào)版權(quán)內(nèi)容訓(xùn)練AI模型,并在ChatGPT產(chǎn)品中呈現(xiàn)給用戶。截至今年6月底,已至少有13家新聞媒體機(jī)構(gòu)對(duì)OpenAI和Microsoft提起了侵權(quán)訴訟。

據(jù)新聞集團(tuán)首席執(zhí)行官羅伯特湯姆森所說“媒體的集體知識(shí)產(chǎn)權(quán)正受到威脅,我們應(yīng)該大聲要求賠償。”新聞行業(yè)律師Steven Lieberman更是直言,OpenAI的巨大成功也要?dú)w功于其他人的工作,它在未經(jīng)許可或付款的情況下獲取了大量?jī)?yōu)質(zhì)內(nèi)容。

這類起訴并非只是存在新聞行業(yè),大模型多模態(tài)發(fā)展,也引起其他行業(yè)企業(yè)和機(jī)構(gòu)展開反擊。

美時(shí)間6月24日,全球三大唱片公司索尼音樂集團(tuán)、環(huán)球音樂集團(tuán)和華納音樂聯(lián)合多家唱片公司,向AI音樂生成公司Suno和Udio開發(fā)商Uncharted Labs發(fā)起訴訟,指控后者非法使用版權(quán)音樂來訓(xùn)練模型并提供服務(wù)。

唱片公司指控Suno抄襲了662首歌曲,Udio抄襲了1670首歌曲,正在嘗試索取每件音樂作品最高15萬美元的賠償費(fèi)用。

國(guó)內(nèi)也發(fā)生了類似事件,今年6月6日360 AI發(fā)布會(huì)上,360集團(tuán)創(chuàng)始人、董事長(zhǎng)周鴻祎在演示360AI瀏覽器的創(chuàng)新功能“局部重繪”時(shí),選用了一張女性古裝寫真圖片進(jìn)行演示。兩天后,ID為DynamicWangs的創(chuàng)作者在社交平臺(tái)上發(fā)難,認(rèn)為該圖片是他利用AI繪圖模型精心創(chuàng)作,并指責(zé)360公司未得到自己的授權(quán)。

內(nèi)容創(chuàng)作行業(yè),追“新”是一個(gè)特點(diǎn),最新的思想、最新的事件、最新的言論、最新的圖畫風(fēng)格或最新的視頻模式。對(duì)大模型而言,如果缺了最及時(shí)信息的提供,必然會(huì)被用戶吐槽提供的內(nèi)容過時(shí)、傳統(tǒng),而想要追“新”,就難免和各種內(nèi)容行業(yè)機(jī)構(gòu)產(chǎn)生在“版權(quán)”方面的糾紛。

在去年《紐約時(shí)報(bào)》起訴書中就有這樣一段內(nèi)容,ChatGPT幾乎逐字復(fù)制了其新聞報(bào)道。該報(bào)舉例稱,2019年,《紐約時(shí)報(bào)》發(fā)表了一篇榮獲普利策獎(jiǎng)的關(guān)于紐約市出租車行業(yè)掠奪性貸款的系列文章。該報(bào)稱,只要稍加提示,ChatGPT就會(huì)一字不差地背誦其中的大部分內(nèi)容。

來源:《紐約時(shí)報(bào)》起訴書

顯然,一部分ChatGPT用戶已把大模型當(dāng)做了搜索引擎來使用。這種形式究竟算不算侵權(quán)呢?法律定義上尚有討論空間,可隨著大模型的大踏步商業(yè)化,類似拷問會(huì)層出不窮。就算當(dāng)下版權(quán)法體系下算不得“大事”,可隨著版權(quán)方的積極維權(quán),也難免會(huì)有新的立法來杜絕這種現(xiàn)象。畢竟,新聞網(wǎng)站主要是靠流量和伴生的廣告盈利,ChatGPT這種直接杜絕用戶和新聞網(wǎng)站“鏈接”的方式,侵犯了后者的利益。

其實(shí),現(xiàn)在包括美國(guó)和中國(guó)兩個(gè)AI大國(guó),版權(quán)法方面和AI相關(guān)的法律內(nèi)容尚在探索中,但考慮到大量?jī)?nèi)容創(chuàng)作者依靠版權(quán)吃飯的現(xiàn)實(shí)中,大模型和內(nèi)容版權(quán)的較量將是個(gè)長(zhǎng)期問題,從新聞網(wǎng)站與搜索引擎的十幾年較量歷史中總結(jié),大模型公司向內(nèi)容方付“版權(quán)費(fèi)”或是一個(gè)必然的結(jié)果。

3

內(nèi)容版權(quán)方未來向大模型“發(fā)難”主要在兩個(gè)層面,第一是訓(xùn)練AI模型時(shí)有沒有用到我的版權(quán)內(nèi)容;第二是輸出的文字、圖片、音視頻內(nèi)容有沒有涉及侵權(quán)的地方。

大模型商業(yè)化必然要面臨“版權(quán)”問題,以O(shè)penAI最新發(fā)布的GPT-4o為例,該大模型能夠處理50種不同的語言,相比過去版本提升了速度和質(zhì)量,并擁有了可讀取人情緒的能力。它接受文本、音頻和圖像三者組合作為輸入,并能生成文本、音頻和圖像的任意組合輸出,“與現(xiàn)有模型相比,GPT-4o在圖像和音頻理解方面尤其出色。”

它的應(yīng)用場(chǎng)景非常豐富,包括實(shí)時(shí)翻譯、會(huì)議報(bào)告生成、法律咨詢、創(chuàng)意寫作、虛擬客服等場(chǎng)景,包括實(shí)時(shí)語音和視頻分析功能。且用戶還可以和它聊天,通過提問獲取最新知識(shí),甚至一些人開發(fā)了和大模型戀愛的“賽道”。

除了生活場(chǎng)景,大模型會(huì)在越來越多商業(yè)場(chǎng)景中應(yīng)用。這就意味著,雖然OpenAI宣布GPT-4o目前可免費(fèi)使用(限次數(shù)),但用戶只有付費(fèi)才可無限使用。況且,商業(yè)化權(quán)限一直在OpenAI手中。

由于國(guó)內(nèi)無法使用GPT-4o,小編就用騰訊元寶大模型、文心一言大模型提問“張藝謀三體電影怎么樣”這個(gè)熱點(diǎn)。從騰訊元寶的答案中,每一個(gè)答案段落都有其引用超鏈出處。文心一言上的答案雖然未提供超鏈,但下方也有相關(guān)話題的超鏈接。

其實(shí),大模型只是工具,輸入某方面的內(nèi)容,才具備輸出相關(guān)方面“答案”的能力。要知道,內(nèi)容創(chuàng)作的進(jìn)化非??欤诖竽P蜕顖?chǎng)景、商用場(chǎng)景中,想要能夠隨時(shí)提供最佳體驗(yàn)予以用戶,必須要“喂食”最新的數(shù)據(jù)。而且,在用戶需求下,輸出的答案難免會(huì)“復(fù)制”新聞網(wǎng)站或其他版權(quán)方的內(nèi)容。在大模型目前剛起步時(shí)期,這類矛盾還只是限于部分大的新聞機(jī)構(gòu)和大模型公司之間,一旦大模型在日常生活中應(yīng)用普遍化,這種矛盾將會(huì)進(jìn)一步激化。

未來,這種圍繞版權(quán)的糾紛會(huì)以什么樣的方式解決?現(xiàn)在,已經(jīng)很多案例發(fā)生,未來類似問題解決方式跳不出這些圈子。

圍繞人工智能的法案正在出臺(tái),2023年12月8日,歐盟委員會(huì)、歐洲議會(huì)和歐盟成員國(guó)代表達(dá)成的《人工智能法案》(AIAct)。該法案明確提出,對(duì)于類似ChatGPT的通用AI系統(tǒng)(GPAI)以及相關(guān)的GPAI模型,提供方需要制作技術(shù)文件、遵守歐盟版權(quán)法、披露訓(xùn)練系統(tǒng)時(shí)使用的數(shù)據(jù)內(nèi)容匯總。如果各企業(yè)和機(jī)構(gòu)違反歐盟的AI法將面臨罰款。

今年8月15日,由國(guó)家互聯(lián)網(wǎng)信息辦公室等七部門聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》正式施行,這是我國(guó)首個(gè)針對(duì)生成式人工智能產(chǎn)業(yè)的規(guī)范性政策,也是全球第一部人工智能生成內(nèi)容管理辦法。

監(jiān)管機(jī)構(gòu)將對(duì)違規(guī)行為進(jìn)行相應(yīng)處罰,今年3月,法國(guó)市場(chǎng)監(jiān)管機(jī)構(gòu)宣布,已向美國(guó)谷歌公司開出一張2.5億歐元(約合人民幣19.7億元)的罰單,原因是谷歌未經(jīng)同意使用法國(guó)出版商和新聞機(jī)構(gòu)的內(nèi)容訓(xùn)練旗下的聊天機(jī)器人“巴德”(其升級(jí)版名為“雙子座”),違反了歐盟知識(shí)產(chǎn)權(quán)的相關(guān)法規(guī)。

谷歌因此成為第一個(gè)因?yàn)橛?xùn)練數(shù)據(jù)“侵權(quán)”被罰款的公司。有了這個(gè)前車之鑒,未來或有更多大模型企業(yè)會(huì)因?yàn)橛?xùn)練數(shù)據(jù)問題,遭受相關(guān)的管制。

對(duì)于大模型公司而言,如何和擁有版權(quán)的內(nèi)容公司獲得合作,將是未來重要的戰(zhàn)略。今年6月份,《時(shí)代》雜志與OpenAI宣布,兩家公司達(dá)成了一項(xiàng)多年內(nèi)容授權(quán)協(xié)議和戰(zhàn)略合作伙伴關(guān)系。該協(xié)議允許OpenAI將這家出版商的內(nèi)容引入ChatGPT,并幫助訓(xùn)練其最先進(jìn)的AI模型。

據(jù)悉,雙方合作內(nèi)容非常深入,OpenAI甚至能夠訪問《時(shí)代》過去100多年的檔案和文章,以訓(xùn)練其AI模型,并在其面向消費(fèi)者的產(chǎn)品(如ChatGPT)中用于回復(fù)用戶的詢問。

作為回報(bào)的是,OpenAI使用《時(shí)代》雜志的內(nèi)容時(shí)會(huì)注明引用并鏈接原始來源?!稌r(shí)代》雜志將可以使用OpenAI的技術(shù),以便為其受眾“開發(fā)新產(chǎn)品”。

無論怎么說,原創(chuàng)內(nèi)容是互聯(lián)網(wǎng)高速發(fā)展重要的支柱之一。過去,新聞網(wǎng)站、音樂公司、版權(quán)商和谷歌搜索引擎展開的十幾年“版權(quán)戰(zhàn)爭(zhēng)”,將會(huì)在大模型領(lǐng)域重現(xiàn),且斗爭(zhēng)程度要遠(yuǎn)超過前者。

任何一種技術(shù)的繁榮,都不應(yīng)該建立在“巧取豪奪”之上。大模型企業(yè)或可以用提高與新聞網(wǎng)站等內(nèi)容機(jī)構(gòu)的合作門檻,增加自身的競(jìng)爭(zhēng)護(hù)城河。

目前來看,大模型沒有辦法由0變100。作為大模型“養(yǎng)料”供給方,內(nèi)容原創(chuàng)者或機(jī)構(gòu),也完全有理由,從大模型蓬勃發(fā)展中獲取合理的利益。

引用文章:

財(cái)聯(lián)社《巨大壓力之下谷歌放棄“吃獨(dú)食” 承諾未來三年向出版商支付10億美元》

每日經(jīng)濟(jì)新聞《13家媒體怒告OpenAl等AI巨頭背后:內(nèi)容創(chuàng)作為何成了大模型的“免費(fèi)午餐”?》

觀察者網(wǎng)《歐盟內(nèi)部市場(chǎng)專員:歐盟達(dá)成“歷史性AI立法”,成首個(gè)制定AI明確使用規(guī)則的大陸》

四川觀察《谷歌被罰2.5億歐元,AI訓(xùn)練數(shù)據(jù)版權(quán)問題再引爭(zhēng)議》

財(cái)聯(lián)社《OpenAI與《時(shí)代》雜志達(dá)成合作協(xié)議,將用其內(nèi)容訓(xùn)練ChatGPT》

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 全球AI巨頭正在賭:誰搞定MCP,誰就是未來老大

    我不是危言聳聽,現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態(tài)控制權(quán),誰就是AI圈的老大。你們有沒有發(fā)現(xiàn),MCP在2025年初開始特別火爆,互聯(lián)網(wǎng)技術(shù)大廠都在強(qiáng)推MCP。(1)阿里云百煉搞了個(gè)MCP平臺(tái),提供50+預(yù)置MCP服務(wù)。不過大都只面向阿里系產(chǎn)品。(2)騰

    標(biāo)簽:
    ai智能
  • 對(duì)話李軍:人工智能是“第五范式革命”

    2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為主辦方之一,歐美同學(xué)基金會(huì)理事長(zhǎng)李軍接受了大賽主持人艾誠(chéng)采訪。在采訪中,李軍認(rèn)為IAEPC不僅是一場(chǎng)“冠軍中的冠軍”對(duì)決,更是一次全球AI人才的線下交流盛會(huì)。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動(dòng)和普

  • 對(duì)話施韓原與杜瑜皓:與參賽選手一起改變世界

    2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為大賽發(fā)起人方之一及裁判委員會(huì)負(fù)責(zé)人,施韓原與杜瑜皓接受了大賽主持人艾誠(chéng)采訪。裁判委員會(huì)主席施韓原分享了此次大賽的亮點(diǎn),IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進(jìn)行答題。裁判委員會(huì)副主席杜瑜皓認(rèn)為,選手最終目標(biāo)并

  • 吳林林專訪IAEPC冠軍:與全球參賽者交流是最重要的一課

    2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認(rèn)為與來自全球的參賽者交流是自己學(xué)到的最重要的一課。在科技與AI之前,選手們可以平等、開放、友好的交流。以下是采訪實(shí)錄(有刪節(jié)):吳林林

  • 吳林林專訪黃錦輝:年輕人要像懂中文一樣懂A

    2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大會(huì)嘉賓:全國(guó)政協(xié)委員、香港特別行政區(qū)立法會(huì)議員、香港中文大學(xué)工程學(xué)院副院長(zhǎng)、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵(lì)年輕人要像懂中文和英語一樣懂AI,

  • 本以為DeepSeek天下無敵了,沒想到Manus更猛

    昨天新出了一個(gè)AI,據(jù)說比DeepSeek還牛,而截止到今早,已經(jīng)有10萬人在排隊(duì)申請(qǐng)Manus邀請(qǐng)碼了,而且它邀請(qǐng)碼已經(jīng)炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學(xué)的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了,名叫Manus

    標(biāo)簽:
    ai智能