{dede:global.cfg_webname/}

当前位置: 首页 > 科技 > 软件 > 正文

字节跳动狂扫全球网络数据 速度超越OpenAI 25倍

来源:IT商业科技网    时间:2024-10-09 15:59:43

  热门短影音平台TikTok母公司、中国企业「字节跳动」,为训练其生成式AI模型,正积极搜集网络数据,其自行研发的网络爬虫程序「Bytespider」,搜集数据速度之快,已超越业界龙头。

  据报导,根据网络资安公司Kasada(专精于线上数据的机器人管理)和Dark Visitors(监控网络爬虫程序)的研究,字节跳动于4月推出Bytespider网络爬虫程序的数据搜集速度,远胜过Google、Meta、Amazon、OpenAI和Anthropic等主要科技公司所使用的网络爬虫程序。

  Kasada首席执行官克劳瑟指出,Bytespider的数据搜集速度,约为OpenAI用于训练ChatGPT的GPTbot的25倍,更是Anthropic公司Claude平台的ClaudeBot的3000倍。 而且,Bytespider近6周的数据搜集活动,呈现大幅增加的趋势,显示其搜集数据的积极程度与日俱增。

  字节跳动积极搜集数据的行为,正值TikTok可能在未来几个月内遭美国禁用之际。 美国总统拜登已签署法案,基于国家安全考量,要求字节跳动出售TikTok或关闭其在美国的营运。

  研究显示,Bytespider与OpenAI和Anthropic的网络爬虫程序一样,无视robots.txt的设定。 robots.txt是网站发布者设定的代码,虽然不具法律约束力,但本应告知网络爬虫程序,不得搜集该网站的数据。

  网络数据搜集已行之有年,搜索引擎长期以来即运用此技术搜集网页链接。 然而,生成式AI的兴起,使数据搜集的议题更加复杂,也引发更多版权争议。 所有生成式AI工具的模型,都是以大量的线上数据为基础训练而成,这些数据几乎涵盖网络上的所有信息,尤其以文字信息为主。 科技公司利用网络爬虫程序免费复制这些数据,再将其纳入自己的资料集中。

  克劳瑟认为,Bytespider积极搜集数据的行为,显示字节跳动正急于在生成式AI领域追赶其他公司。 据报道,字节跳动去年在生成式AI领域落后许多,甚至还曾违反OpenAI服务条款,使用OpenAI来协助开发自身的LLM(大型语言模型)。 字节跳动今年稍早推出名为「豆包」的聊天式LLM,但该模型的开发应早于Bytespider搜集最新数据的时间点。

  知情人士透露,字节跳动正积极研发新型LLM,目标之一是提升TikTok的搜寻功能。 TikTok上月底更新搜索功能,让广告主能实时搜寻TikTok上的热门关键词,以便设计更有效的广告。 知情人士表示,搭载新AI模型,并整合最新的网络趋势和主题数据,将可提升TikTok的搜寻体验,让TikTok的搜寻环境更具竞争力,甚至能瓜分Google的广告市场。

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
字节跳动狂扫全球网络数据 速度超越OpenAI 25倍

字节跳动狂扫全球网络数据 速度超越OpenAI 25倍

  热门短影音平台TikTok母公司、中国企业「字节跳动」,为训练其生成式AI模型,正积极搜集网络数据,其自行研发的网络爬虫程序「Bytespid
2024-10-09
研调:蓝芽耳机市场平价产品崛起 苹果、三星力推AI功能突围

研调:蓝芽耳机市场平价产品崛起 苹果、三星力推AI功能突围

  研调中心Counterpoint Research指出,全球真无线蓝牙耳机市场正面临重大转折,根据最新数据,2024年第二季全球TWS销量年增7%,主要由
2024-10-09
OpenAI与Hearst达成协议 将新闻内容引入ChatGPT

OpenAI与Hearst达成协议 将新闻内容引入ChatGPT

  根据周二报导,OpenAI和美国跨国大众媒体和商业讯息集团Hearst Communications Inc 达成协议,将把该出版商的杂志和报纸中的内容引入
2024-10-09
Q3全球PC出货量陷萎缩、苹果减幅居冠

Q3全球PC出货量陷萎缩、苹果减幅居冠

  Q3全球PC出货量陷入萎缩,其中苹果出货量大减2成、减幅居前6大厂之冠。  根据国际数据信息有限公司8日公布的初步统计显示,2024年第3
2024-10-09
智慧戒指成下一战场! 研调:苹果2026推智能戒与三星一较高下

智慧戒指成下一战场! 研调:苹果2026推智能戒与三星一较高下

  苹果与三星健康产品即将从智能手表进入到智慧戒指,据CCS Insight称,苹果可能会在2026年推出1款智能戒指与三星竞争,分析师表示,戒
2024-10-09
Uber对客户推出电动车选择功能

Uber对客户推出电动车选择功能

  Uber 首席执行官柯斯洛沙西周二宣布,该公司正在更新其平台,推出新的永续发展功能,其中包括「电动车偏好」,让客户在乘车时默认选择
2024-10-09
全球2030年6G实现商业化 台湾团队获欧盟认证为境外第一座6G实验网

全球2030年6G实现商业化 台湾团队获欧盟认证为境外第一座6G实验网

  经济部产业技术司今日与欧盟执委会资通讯网路暨科技总署于台北共同举办「2024台欧盟6G SNS联合研讨会」,邀请多位欧盟6G计划主持人及
2024-10-09
印尼是TikTok用户最多的国家超越美国

印尼是TikTok用户最多的国家超越美国

  数据显示,印尼拥有全球最多的 TikTok 用户,超过实际人口更多的美国。  根据 Statista 揭露的数据,印尼拥有 1 576 亿 TikTo
2024-10-09
电动车与能源转型带动 全球铜需求增长预期加速

电动车与能源转型带动 全球铜需求增长预期加速

  据报道,根据全球最大矿商必和必拓的一份新报告,全球铜需求预计将以每年增加100万公吨的速度增长,这一增幅是过去15年平均需求增长的
2024-10-09
OpenAI亏损严重 微软遭降评、今年涨幅远输那指

OpenAI亏损严重 微软遭降评、今年涨幅远输那指

  微软藉由投资ChatGPT开发商OpenAI、接触最顶尖的人工智慧科技,看似明智之举。 然而,华尔街一名分析师却决定调降微软投资评等,警告O
2024-10-09

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com