图片来源@视觉中国
文|元宇宙日爆,作者|凯蒂,编辑|文刀
“现在是诉讼时间。”4月20日,推特被踢出其数字营销平台后,新掌门人马斯克立马发推回击称,用推特的数据做“非法训练”。这一怼,直接揭开了AI大模型开发商与数据源的利益之争。
(相关资料图)
此前,在线社区论坛Reddit与程序员社区Stack Overflow先后宣布,将向使用平台API训练数据的公司收费;环球音乐集团直接表示,将阻止AI从其版权歌曲中抓取歌手的声音。
在此之前,AI大模型开发商都在低成本地使用互联网公开的内容数据训练自家的大模型,如今,各种科技巨头们加持的大模型纷纷开始商业化,互联网内容平台们突然反应过来,不能让这些巨头们薅羊毛“白嫖”数据了。
当推特将API收费门槛摆在面前时,AI大模型训练要给付的成本就不止芯片算力和研发算法的人才了,现在还要加上“为数据付费”。
马斯克直怼微软“非法训练”
“他们非法使用推特的数据进行训练。现在是诉讼时间。” 4月20日,“宇宙顶流”马斯克直接在推特上明示要告。他以推特CEO的身份亲自下场,以此直怼把推特踢出Microsoft Digital Marketing Center(数字营销中心)的做法。
这个“中心”是干嘛的呢?它其实是利用大数据和AI技术开发的一个广告和营销的管理平台,聚合了包括推特、脸书、Ins等海外所有主流的社交平台,方便企业主们在一个平台上完成广告和营销活动的推送,还能管理各种账号、分析推流数据。你刷微博、微信朋友圈时突然冒出的广告,就有类似这种工具的贡献。
这个数字营销中心能实现这些功能,很重要的一环是接入了这些社交平台的API,这是企业主推送广告、分析数据的基础。
结果,马斯克收购推特后,直接把推特API的企业套餐初始订阅费用定为4.2万美元/月,折合人民币28.9万元,以这个价格能获得2500万条推文,一条差不多1块多钱了。如果每月支付12.5万美元,能获得 1 亿条推文,后续还会按照使用量加钱。
推特API的新收费标准直接劝退了不少小公司,连财大气粗的数字营销中心都直言“要价太高”,于是,直接把推特踢出了管理库。这意味着,借助这个平台执行广告和营销计划的广告主们,没法在推特上搞投放了。
原本这是企业主、分发平台、渠道商之间的广告业内事,马斯克跳出来了,直指用推特的数据搞非法训练。
马斯克称用推特数据“非法训练”
谁都知道,爆火的ChatGPT背后有的资本加持。而马斯克和GPT大模型的开发方OpenAI不仅渊源颇深,还积怨许久。
2015年,马斯克与Sam Altman等6人共同创立OpenAI人工智能实验室,致力于建设开源的、研发人工智能的非营利机构,来抗衡当时在人工智能领域大有一家独大之势的谷歌。为此,马斯克捐了1亿美元,承诺未来继续捐9亿。结果不到2年,马斯克就退出了OpenAI董事会,这里既有烧钱开发大模型短期没烧出成果的问题,也有马斯克和Altman对OpenAI的管理权之争。
马斯克退出1年后,即2019年3月,OpenAI成立子公司OpenLP,将其定位为“有限营利机构”,重组后的OpenAI很快拿到了来自微软的10亿美元投资。谁也没想到又一个3年过去后, OpenAI站上了全球科技舞台的最前沿。
ChatGPT爆火后,当初为OpenAI掏过钱、站过台的马斯克频频表达怨念。
2月17日,马斯克发推指称OpenAI从开源、非营利变成了微软控制的“闭源、追求利益最大化”的公司;后来还多次在公开场合强调人工智能对人类社会的潜在危害,甚至认为“风险比飞机、汽车、毒品更大”;3月29日,那封科技大佬联署签名“暂停AI巨型实验”的公开信上,他也第一时间签名表态。
马斯克为人工智能的健康发展操碎了心,看上去,这位将巨型载人飞船送入太空的现实版“钢铁侠”似乎不打算跟风人工智能了。
然而,4月17日,马斯克在媒体采访中披露,将推出一款生成式AI大模型TruthGPT。很快就有媒体爆料,马斯克买了1万个英伟达A100芯片。这是AI大模型训练的重要硬件。
撕微软非法训练数据,怼OpenAI变成逐利公司,无论马斯克如何批评这两家公司,这下也难掩他对人工智能的兴趣了。左手拦下推特数据低成本外流,右手高价囤芯片,在AI大模型赛道上,马斯克开始跑马圈地。
多平台API拟收费,AI训练成本被推高
不过,最近要向AI大模型开发商们收取API费用的平台不止推特。
4月18日,海外最大的社区论坛Reddit宣布,将向使用其API做数据训练的公司收取数据使用费。Reddit暂未公布具体收费标准,业内推测,Reddit很可能会按数据数量分等级收费,这也是业内的常规做法。此外,程序员问答网站Stack Overflow也计划向AI巨头收取训练数据费用。
Reddit更新数据API条款防大公司薅羊毛
要知道,研发AI大模型,算法、算力和算据这“三算”缺一不可。以OpenAI训练GPT-3.5为例,这个模型容纳了多达45TB的文本语料,这些语料既包括书籍期刊等出版物的内容,也包括社交平台、问答网站、论坛小组等在线数据中的用户生成内容。而从OpenAI的公开信息看,该公司并没有提及获取线上数据是否支付过费用。用“爬虫”爬、和第三方合作、以及购买都有可能是OpenAI 获得数据的方式。
此前,各个生成式大模型似乎都在没啥限制地使用互联网上的公开内容,影响大模型性能的要素就集中在算法和算力差异上。从推特、Reddit等平台明确为API收费后,大模型开发商自在地使用数据的好日子到头了。
2019年之前,OpenAI是非营利机构,如今,ChatGPT都有Plus收费版了,更别提该公司还开通了API的付费渠道。当前,OpenAI的估值接近300亿美元,研究机构PitchBook预测,该公司今年的收入将达到2亿美元,明年会翻五番。
社交平台们明确API收费,剑指大模型开发商,双方也正式变成了“商业对商业”的关系,收费与付费实属正常。这也意味着,AI大模型成为科技巨头们狂卷的赛道后,像Reddit这样的海量内容平台将增加商业来源,数据将成为重要要素。
以成立于2008年的Reddit为例,它是全球互联网中最有活力的社区之一,目前日活达到3.3亿,大量的用户创建了超过14万个活跃社区,帖子总量超3.6亿。尤其在很多小众领域,Reddit论坛贡献了很多有价值的讨论内容。换句话说,Reddit提供了英语互联网中最重要的语料库。
OpenAI的CEO Sam Altman也表示,公司在积极与内容公司进行合作,并愿意“为高质量数据支付高价”。
尽管Altman宣称“目前没在训练GPT-5”,但OpenAI应该不会停下数据训练的脚步,因为GPT-4仍有很多需要打磨的地方,比如通识知识的准确性、对人类语言的理解进化等等,这些仍然需要语料数据的持续投入。
放眼全球,研究AI大模型的公司还不止OpenAI一家,海外有谷歌,国内有百度、华为、阿里。可以预见,切入大模型赛道的公司,都将面对数据所有者的收费关卡,训练成本将水涨船高。另一个值得深思的问题是,Twitter也好,Reddit也罢,他们手握数据向大模型开发公司收取价格不菲的费用,那么,为这些平台贡献了海量内容和数据的用户又得到了什么?
-
马斯克要告微软,拒绝AI训练“白嫖”数据_天天报道当推特将API收费门槛摆在面前时,AI大模型训练要给付的成本就不止芯片算力和研发算法的人 -
郑州航空港经济综合实验区税务局第一税务分局:“税惠春风”助力项目建设顺畅河南经济报记者史新旗通讯员秦婧怡随着航空港区2023年第一批重大项目的集中开工启动,全区项目建设吹响了冲 -
欧美同学会将在泉州举办第三届中德科技论坛中国青年报客户端北京4月25日电(中青报·中青网记者秦珍子)欧美同学会(中国留学人员联谊会)第三届中德 -
巴拉圭总统候选人:如当选,将支持与中国建交!|微头条据西班牙埃菲通讯社报道,巴拉圭总统选举候选人库巴斯当地时间23日表示,支持巴拉圭同中国正式建立外交关系 -
青海油田首批风力资源测试塔顺利建成投用据中国石油天然气集团公司青海油田分公司(以下称“青海油田”)25日消息,近日,青海油田首批风力资源测试塔 -
唐僧是如来佛祖的弟子什么转世投胎作状元什么之子_西游记唐僧是如来佛祖的弟子1、师徒关系金禅子转世十个轮回而成为唐僧前九世未成年之前就被吃掉了。本文到此分享完毕,希望对你有所帮 -
矿泉水瓶盖什么材质(矿泉水瓶盖)|全球播报1、百利盖集团是世界上三大塑料瓶盖生产商之一,这个家族企业于1926年在德国法兰克福创建,90多年的历史从 -
精测电子:子公司武汉精鸿CP/FT产品线相关产品已取得相应订单并完成交付_全球今热点精测电子近期接受投资者调研时称,公司子公司武汉精鸿主要聚焦自动测试设备(ATE)领域(主要产品是存储芯 -
视讯!结婚当天前女友来求复合,双膝跪地求新郎给个机会,新娘脸都绿了结婚当天前女友来求复合,双膝跪地求新郎给个机会,新娘脸都绿了,单身,爱情,新郎,新娘,复合,前女友,婚礼现场 -
火影:盘点剧中出现的六大结界之术它是火影中首次登场的结界忍术,需要四个人发动,是一个透明的长方形结界,附有紫色的火焰,无法让外界人员 -
海面漂浮式光伏“跑路”?解答来了基于该项目的技术方案,失散的光伏组件和薄膜大概率不是“飘走了”,而是“沉底了”,因此对航行安全的影响 -
被强制执行超10亿!万达地产集团成“老赖” 环球看热讯近日,万达地产集团竟成“老赖”,备受市场关注。中国执行信息公开网显示,4月20日,万达地产集团被上海市 -
环球新资讯:霸州经济开发区项目审批再提速近日,霸州经济开发区行政审批局首例产业项目“拿地即开工”审批顺利完成,河北科信半导体有限公司新建年产 -
算命网红3年非法盈利200多万元,他算到了自己“被抓”的命吗?极目新闻评论员吴双建日前,安徽省阜阳市公安局颍州分局网安大队民警网上巡查时发现,辖区网民“宜和宽哥” -
世界观点:将访美的菲总统表态:将与拜登讨论如何“缓和或减少地区针锋相对”【环球网报道】综合路透社、《菲律宾星报》25日报道,菲律宾总统马科斯下周将访美与美国总统拜登会晤,马科 -
东方日升·升阳光以"中国速度"沐光而行,驶向乡村振兴!迎着二十大、2023年全国两会的政策东风,光伏行业尤其是分布式光伏迎来了新的春天。立足新征程,东方日升*升 -
天天即时:4月24日伦敦金属交易所(LME)锡库存1535吨2023年4月24日伦敦金属交易所(LME)锡库存1535吨持平(单位:吨)地点前日库存入库出库今日库存变动注册仓 -
【环球新视野】持续到9月底!重庆交通执法部门开展轨道交通防汛检查目前,重庆正式进入汛期,重庆市气象台已发布今年首个暴雨黄色预警,强降雨天气,极易导致轨道交通车站站厅 -
晨会纪要|环球通讯晨会纪要 -
现实版的“女孙悟空”,除掉体毛后,容貌惊艳四方-全球热文现实版的“女孙悟空”,除掉体毛后,容貌惊艳四方,返祖现象是一种生物的退化现象,少数且偶然,主要表现为 -
关注:小米14锁定直屏+骁龙8Gen3小米13Ultra的话题热度还没有降下来,小米14已经开始抢占大家的关注了。据数码博主@数码闲聊站爆料称,小米 -
天天速看:智能化时代,如何让老年人出行不掉队?日前,北京市交管局再次明确,自2024年1月1日起,违规电动三、四轮车不得上路行驶,不得在道路、广场、停车 -
今日热闻!信达证券发布药明康德研报,业绩符合预期,多业务协同稳健发展信达证券04月25日发布研报称,给予药明康德(603259 SH,最新价:71 25元)评级。评级理由主要包括:1)事 -
全球消息!叶非夜全部小说你的来电(叶非夜的全部小说)叶非夜全部小说你的来电,叶非夜的全部小说这个很多人还不知道,现在让我们一起来看看吧!1、叶非夜作品已发 -
中国驻悉尼总领馆举办新州中文教师联谊活动据中国驻悉尼总领馆网站消息,4月23日,中国驻悉尼总领馆举办澳大利亚新南威尔士州中文教师联谊活动。4位老 -
4月25日国内BDO部分厂家公布竞拍成交价格-世界新要闻陕西陕化3万吨、10万吨BDO装置负荷降至七成,暂停散单销售,合约为主。陕西融和6万吨 年BDO装置3月1日初检 -
焦点!外媒公布今夏五大重磅转会,姆巴佩告别法甲,曼联太子离队鉴于各俱乐部财政实力,目前只有皇马、曼城、曼联存在签下姆巴佩的可能性,根据外媒《Mirror》报道,曼联十 -
万名大学生看淮安,出发!为助力淮安高校毕业生“留凤”工程,让更多人才看好淮安、扎根淮安、服务淮安,4月23日下午,淮安市委人才 -
绝经后手部骨关节炎女性激素替代治疗的可行性评估最近一项针对患有手部骨关节炎的绝经后妇女进行激素替代疗法(HRT)随机对照试验的可行性测试研究取得了积极 -
当前滚动:儿童疫苗预防接种20问儿童疫苗预防接种关系到下一代的健康成长,涉及千家万户。一类疫苗与二类疫苗有何区别?二类疫苗可打可不打



