您現在的位置是:產(chǎn)品中心 >>正文

超17萬(wàn)個(gè)視頻!英偉達蘋(píng)果等巨頭被曝違規用數據訓練AI

產(chǎn)品中心56人已圍觀(guān)

簡(jiǎn)介7月17日消息,據媒體報道,包括NVIDIA、蘋(píng)果、Salesforce和Anthropic在內的多家科技巨頭,被曝光涉嫌違規使用數據,用于訓練其AI模型。這些公司被發(fā)現使用了超過(guò)173536個(gè)You ...

7月17日消息,超萬(wàn)據媒體報道,個(gè)視規用包括NVIDIA、頻英蘋(píng)果曝違蘋(píng)果、偉達Salesforce和Anthropic在內的等巨多家科技巨頭,被曝光涉嫌違規使用數據,頭被用于訓練其AI模型。數據

這些公司被發(fā)現使用了超過(guò)173536個(gè)YouTube視頻的訓練字幕數據,而這些數據的超萬(wàn)獲取并未得到視頻創(chuàng )作者的許可。

這些公司所使用的個(gè)視規用數據集名為“YouTube Subtitles”,由非營(yíng)利組織EleutherAI創(chuàng )建,頻英蘋(píng)果曝違該數據集包含了來(lái)自超過(guò)48000個(gè)頻道的偉達視頻文本。

其中不乏知名教育機構和媒體公司的等巨內容,例如可汗學(xué)院、頭被麻省理工學(xué)院、數據哈佛大學(xué)等,此外,一些廣受歡迎的YouTube創(chuàng )作者,如MrBeast等的視頻也被包括在內。

此前,EleutherAI發(fā)布了名為“Pile”的數據匯編,其中的大部分數據集都是對公眾開(kāi)放的,包括YouTube Subtitles。

不過(guò)值得注意的是,蘋(píng)果在使用Pile數據集訓練OpenELM模型時(shí),并未直接下載數據,因此在技術(shù)層面上,是EleutherAI違反了YouTube的使用條款。

YouTube明確禁止未經(jīng)授權從平臺獲取素材,同時(shí)這些數據不僅用于訓練AI,還可能涉及到版權和隱私問(wèn)題。

創(chuàng )作者們也對此表示震驚和不滿(mǎn),因為他們并未被告知自己的作品被用于商業(yè)目的,更遑論從中獲得任何補償。

超17萬(wàn)個(gè)視頻!英偉達蘋(píng)果等巨頭被曝違規用數據訓練AI

Tags:

相關(guān)文章

?
日本国产激情视频_中国av片永久免费_A级毛片免费中文字幕无码_亚洲污污无码网站在线观看