人工智能公司(例如谷歌、OpenAI)主要使用新闻出版商创建的高质量内容来训练生成式人工智能系统,然后直接与这些出版商竞争。
这是新闻媒体联盟(News Media Alliance)在新报告中提出的核心论点,该行业协会声称其代表了美国和加拿大约 2,000 家出版商。
- 该报告(PDF)已与美国版权局人工智能研究的评论(PDF)一起提交。
我们为什么关心。自从 Bing Chat、Google Bard 和 Google 的搜索生成体验问世以来,各种规模的出版商都担心生成式 AI 会取代搜索,这可能会对自然流量、收入甚至品牌形象造成毁灭性的影响(例如,通过幻觉,例如 Bing Chat 讨论《纽约时报》支持唐纳德·特朗普成为 2024 年共和党总统候选人)。
新闻媒体联盟在说什么。根据新闻媒体联盟总裁兼首席执行官丹尼尔·科菲向纽约时报发表的评论,该报告证明该行业协会在法庭上有充分的理由。
- “它确实替代了我们的工作。你可以看到我们的文章只是被逐字逐句地抄袭和复述,”科菲说。
谷歌和 OpenAI 都说了什么。目前还没有。但我们知道谷歌认为,除非出版商选择退出,否则所有在线内容都应该用于人工智能训练。《纽约时报》是第一批“选择退出”的媒体之一,它在其服务条款中增加了一条禁止人工智能系统开发人员使用其内容进行训练的规定。
对新闻出版商进行一些控制。除非您完全阻止了 GoogleBot 或 CCbot(Common Crawl)等机器人,否则 AI 公司将继续有办法访问内容以进行培训(例如,通过许可交易或抓取)。但是:
- 在 Google 上,SGE 概览不会显示任何被阻止的内容,
nosnippet
您可以使用Google-Extended(适用于 Bard、Vertex 和未来型号)。 - 您可以阻止 GPTBot(许多流行网站都有)。
- 您可以使用 NOCACHE 和 NOARCHIVE禁止在 Bing Chat 中显示内容。
深入挖掘。什么是生成式人工智能?它是如何工作的?