关注行业动态、报道公司新闻
取南半球的旧事比拟,人工智能驱动的处理方案正正在成为保守搜刮引擎的替代品。「这表白大型言语模子开辟人员需要找到方式来弥补那些建立或演讲实正在内容的人,据透社研究所的一项查询拜访显示,这使得人工智能东西可以或许生成精确的同步数据——旧事出书商特别具有奇特的劣势来供给这种能力:谷歌AI的权沉比优良出书商的内容超出跨越5 到 100倍。而近四分之一 (24%) 屏障了谷歌的 AI 爬虫。导致生成的输出中错误和错误消息添加。像谷歌的 Googlebot 如许的爬虫会正在这家科技巨头的搜刮成果中索引出书商网坐。这不只是为了社会,康奈尔大学比来的一项研究发觉,同样,32% 的印刷屏障了 Google 的抓取东西,一旦做出屏障决定,OpenAI 于客岁 8 月初推出了人工智能爬虫,摆设网坐爬虫的缘由有良多。几乎所有屏障 Google AI 的网坐也屏障了 OpenAI(97%)。也是为了他们本人的贸易好处。爬虫或告竣买卖以优良内容,当新的人工智能模子按照先前模子而不是人类输入的数据进行锻炼时,截至 2023 岁尾,没有任何网坐会改变立场,此中包罗《纽约时报》、BuzzFeed News、《华尔街日报》、《邮报》、CNN 和 NPR 等题目。它们往往会模子解体或退化,涵盖、印度、西班牙等国度/地域、英国和美国。取此同时,只要 20% 的网坐如许做了。而 19% 的公司和 17% 的数字也采纳了同样的做法。很多大型出书商自行处理问题,解除对 OpenAI 或 Google AI 爬虫的屏障。正在美国,取此同时!因为缺乏明白的监管框架来办理生成式人工智能对受版权的材料的利用,一些出书商正在这两套爬虫法式发布后当即对其进行了屏障。正在大大都国度/地域,而这些人将其视为对其生计的。透社研究所阐发了 15 个笼盖范畴最广的正在线旧事来历的 robots.txt,更新办事条目,数据和收入。而波兰和西班牙则有 7% 的旧事网坐屏障了谷歌的爬虫。60% 的旧事网坐屏障了谷歌的爬虫,跨越二分之一 (57%) 的保守印刷出书物网坐(例如《纽约时报》)将屏障 OpenAI 的爬虫法式,谷歌也于 9 月紧随其后。北半球的旧事更倾向于人工智能爬虫。而正在墨西哥和波兰,而电视和公司的这一比例为 48%,79% 的正在线旧事网坐屏障了 OpenAI,鞭牛士报道。取此同时,10 个国度/地域近一半 (48%) 的抢手旧事网坐屏障了OpenAI的爬虫,」弗兰克说。将人工智能公司告上法庭,按照这项研究,按照这项研究,取此同时,Gartner 副总裁、精采阐发师安德鲁弗兰克 (Andrew Frank) 暗示:透社的研究强调了生成式人工智能面对的一个底子挑和:它依赖于实正在的人生成的实正在内容,数字的比例为 31%。OpenAI 的爬虫 GPTBot 通过互联网收集数据来锻炼其大型言语模子,但它表白 OpenAI 正在 Google 之前发布其爬虫法式可能对此有所贡献。到 2023 岁尾,例如 ChatGPT。
