在 2023 年至 2025 年间,多个美国作家、记者、出版机构发现他们的原创内容,比如小说、新闻报道、专栏等被用于训练大型语言模型,而他们没有被通知或获得报酬。而这类大型语言模型直接指向这类的OpenAI 的 ChatGPT 以及由微软集成的 AI 产品,如Office 的 Copilot。
他们分别提起了多起诉讼,截至目前共有 12 起相关诉讼,已于 2025年4月初由纽约南区法院合并,以更高效地处理相似事实和法律问题。
这起合并案为何受到重视?那么这些指控内容具体是什么呢?
1.未经授权使用受版权保护作品
OpenAI 和微软擅自使用了他们的作品如新闻文章、文学作品、书籍等,用来训练 ChatGPT 和其他 AI 模型,这构成侵权行为。
2.内容被二次创作甚至多次创作,侵犯原作表达方式
ChatGPT 可生成与原作极为相似的文本,虽然不是复制或者粘贴,但构成了对其独创性表达的“派生作品”侵权。
3.对付费内容获取数据
一些新闻机构指出,他们的文章设有付费墙,但训练数据中仍然包含了这些内容,涉嫌绕过数字访问控制。
4.商业利益被窃取带来的不公平性
OpenAI 和微软通过训练数据创造了强大的模型并盈利,而原始内容创作者却没有从中分得利益,这被认为是不正当得利。
更多关于AI的好文章,请关注:https://iaiseek.com/news