,OpenAI 昨日发布了旗下网络爬虫工具 GPTBot。官方宣称,该 GPTBot 工具能够在注重版权的基础上,使用透明的方式收集网页信息,来训练 OpenAI 旗下的各 AI 模型。
OpenAI 表示,GPTBot 使用专有网页 UA 表示其爬虫身份,完整 UA 字符串为,任何网站管理者都可以自由允许或阻止该爬虫工具进行数据采集。
OpenAI 声称,若网站管理员不希望被爬虫搜集资料,管理员可以在网站服务器的 robots.txt 文件中完全禁止 GPTBot 抓取信息,或自行决定 GPTBot 抓取网站上的指定信息。
OpenAI 此前饱受业界对于“侵犯隐私问题”的指责,当下 OpenAI 推出这样一套 GPTBot 爬虫工具,可谓是其对于外界批判作出的相应回应,同时也能够推动行业建立 AI 训练用爬虫工具相关基准。IT之家此前报道,OpenAI 日前宣布注册 GPT-5 商标,该 GPTBot 爬虫工具也有望助力 GPT-5 的相关模型训练。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
广东省委网信办相关领导、广东省游戏行业协会常务理事陆,广东省律师协会未成年人保护...
感谢IT家庭用户钻石之窗和夕阳商城的线索传递!OPPO官方宣布将为EncoX2和...
今年戴尔的明星产品XPS13Plus在中国上市时,戴尔曾发文介绍这款笔记本的工业...
今年618,消费者可以在天猫国际海淘的同时“种草”。5月31日,天猫国际推出淘宝...
哈华通今日跌9.20%,全天换手率54.26%,成交4.76亿元,振幅11.59...