ChatGPT是对新闻业的威胁还是机遇

自从OpenAI的人工智能聊天机器人 聊天GPT该网站于11月推出,记者们一直在讨论其对新闻业的潜在影响。

An AI-generated image of robots working on laptops in a modern-looking office.

生成性人工智能的兴起将取代多少记者?这个过程将以多快的速度进行?哪些记者最容易受到这种干扰?我们应该将ChatGPT视为解决新闻行业面临的一些问题的挑战还是机遇?

随着所有这些问题以及更多问题的激烈辩论,我与三位专家和两位创业公司创始人进行了交谈,以更清楚地了解生成性人工智能和大型语言模型在短期和中期可能如何影响新闻业。

弗朗西斯科·马可尼是一名计算记者,也是实时信息公司的联合创始人 已应用XL之前,他是《华尔街日报》人工智能和新闻自动化在美联社共同领导。马可尼是《新闻制作人:人工智能与新闻业的未来”,一本关于人工智能和新闻的书,于2020年出版。

马杜米塔·穆尔吉亚是《金融时报》新任命的人工智能编辑,是该报的新职位。在此之前,她曾在英国《金融时报》担任欧洲技术记者。

Charlie Beckett教授是的负责人新闻Mai这是伦敦经济学院(LSE)新闻智囊团Polis的一个项目。以及进行研究和出版一份报告在新闻和人工智能方面,该倡议研究金方案对于记者和技术人员来说培训计划针对小型新闻编辑室,以及策划示例人工智能在新闻领域的应用,供其他人学习。

许多门店已经在有限程度上使用人工智能来协助其运营。其他人正在设想基于该技术的全新模型。后者包括 珍妮·罗曼诺和 佩德罗·恩里克斯,的联合创始人新闻编辑室这是一款为读者提供每日简报的应用程序,其中包含AI生成的主要新闻故事摘要:关键事实、背景和主要内容。

不是全新的
使用人工智能来支持和制作新闻报道是一些媒体已经尝试了一段时间的事情。弗朗西斯科·马可尼(Francesco Marconi)将过去十年的人工智能创新分为三次浪潮:自动化、增强和生成。

他说,在第一阶段,“重点是使用自然语言生成技术自动化数据驱动的新闻故事,如财务报告、体育成绩和经济指标。”。新闻出版商自动化某些内容的例子很多,包括路透社、法新社和美联社等全球机构,以及较小的媒体。

根据马可尼的说法,第二波浪潮到来时,“重点转移到通过机器学习和自然语言处理增强报告,以分析大型数据集并揭示趋势。”阿根廷报纸上有一个这样的例子民族,其中开始2019年使用人工智能支持其数据团队,然后与数据分析师和开发人员合作建立人工智能实验室。

第三个也是当前的浪潮是生成性人工智能。马可尼说,它“由能够大规模生成叙事文本的大型语言模型驱动”。这一新的发展为新闻业提供了超越简单的自动报告和数据分析的应用程序。现在,我们可以让聊天机器人就某个主题或某个观点写一篇更长、更平衡的文章。我们甚至可以要求它以著名作家或出版物的风格这样做。

自去年11月以来,记者们对这项技术可能的用途的想法成倍增加经常测试聊天机器人的编写和编辑功能。

ChatGPT和其他工具之所以如此令人兴奋,部分原因可能是因为它们对用户非常友好,可以用自然语言进行交流,英国《金融时报》的Madhumta Murgia说,“虽然它实际上仍然只是一种非常强大的预测技术,但感觉那里有情报,”她说。

这些工具所使用的语言模型意味着,它们在生成新内容时响应我们的提示,而不是自己提出想法。该模型根据一组内容和数据进行训练,并根据训练内容生成新的输出。

这意味着,虽然它可能有助于综合信息、进行编辑和为报道提供信息,但Murgia认为,我们今天看到的生成性人工智能缺少一些关键技能,这些技能将阻止它在新闻业中发挥更重要的作用。Murgia说:“从现在的情况来看,它不是原创的。它没有打破任何新的东西。它基于现有的信息。而且它没有那种分析能力或声音。”。

她解释道,正因为如此,生成性人工智能无法满足读者在阅读《金融时报》等媒体时对某一主题进行更多分析或更深入理解的需求。ChatGPT本身似乎也同意。

A screenshot of a chat exchange with ChatGPT. The question is: "Will you replace journalists in publishing breaking news?" The answer is that, while tools like ChatGPT can assist journalists in their work, they cannot completely replace them.

Murgia说:“这并不是说,随着底层技术的发展,[生成性人工智能]不会变得更强大或更先进。”。“我想对原始的人类声音感到非常乐观,没有任何东西可以取代我们。我确信,在当今的语言模型中,它们没有创造性、原创性,也没有以任何方式产生任何新的东西。但我认为它们模仿得很好。”

生成性人工智能在新闻业发挥更大作用的另一个挑战是ChatGPT经常犯下的事实错误,有时甚至在公开演示中,这两种情况似乎都发生过谷歌的和Microsoft的新的AI驱动工具。ChatGPT可能有给读者指出了一个不存在的参考 .

马可尼说:“这些模型通常难以生成有关当前事件或实时数据的准确和真实信息。”。这表明目前可用的人工智能工具不适合突发新闻报道,这是一项复杂而昂贵的操作,需要仔细核对事实和交叉引用信息。

生成性人工智能模型也在与数字作斗争。马可尼说:“新一代生成性人工智能在计算精确计算方面并不准确。未经检查的算法创建带来了重大风险,因为它关系到健康的信息生态系统。”。这并不意味着生成性人工智能在新闻业中没有作用,但我们不能完全依赖它。

Charlie Beckett教授,Polis/LSE新闻AI研究项目负责人,他还建议谨慎行事,并劝阻记者在没有人类监督的情况下使用新工具:“人工智能并不是内容制作从头到尾的完全自动化:它是为了增强专业人员和创意人员的工具,让他们更快地工作,让他们有更多的时间从事人类最擅长的工作,”他说。“人类新闻也充满了缺陷,我们通过编辑来降低风险。人工智能也是如此。确保你了解你正在使用的工具和风险。不要对技术期望过高。”

马可尼还认为,媒体应该以承认和克服其当前陷阱的方式利用这项技术。“大型语言模型(如GPT信号)的局限性是新闻创新应该关注的重点,它有助于开发能够捕获和计算实时信息的事件检测系统。将这些事件检测系统与大型语言模型相结合,将为全新的新闻方法铺平道路,”他说。

事件检测系统的一个例子是在马可尼自己的公司AppliedXL中发现的,他将该公司描述为“一家事件检测公司,在这里,有新闻头脑的人共同预测新闻。”通过机器学习和调查性新闻的原则,他的团队旨在预测与临床试验有关的新闻,例如标记早期不规则信号在公司公开问题之前很早就有了数据。

生成性人工智能在行动
几家知名媒体已经宣布计划使用生成人工智能,或者已经将其纳入其内容。BuzzFeed宣布将使用人工智能来增强其著名的个性测验、和《纽约时报》使用ChatGPT创建情人节信息带有提示组合的生成器。

更多人正在探索可能的用途,包括德国出版巨头 斯普林格集团和英国出版商Reach最近出版的AI在当地新闻网站上发表的第一篇文章。意大利报纸 工作表宣布了一个挑战对读者而言:从3月第二周开始的30天内,它将在每日版中发布人工智能编写的简短文本,能够在一周内正确识别每一篇文本的读者有资格获得免费订阅和一瓶香槟。

对于佩德罗·恩里克斯(Pedro Henriques)和珍妮·罗曼诺(Jenny Romano)来说,人工智能在新闻业中的应用是他们于2021年成立的新闻编辑室(the Newsroom)业务的核心。他们开发了一个应用程序,提供AI生成的主要新闻故事的每日摘要。这些不是突发事件,而是已经被各种媒体广泛报道的新闻。该应用程序的创始人告诉我,其目的不一定是给用户带来全新的信息,而是描绘出所有销售点都同意的事实,然后强调不同的观点。

Henriques解释道,这个过程的第一步是从各种出版商那里收集数据,以了解正在讨论的新闻事件以及由谁讨论。下一步是通过创始人与记者合作建立的模型来运行这些文章。该模型基于事实的存在和偏差因素等标准来评估作品的质量。

亨利克斯说:“一旦我们有了关于相同事件的一组文章和我们这边的某个质量条,我们就有了另外两种模式,基本上将这些文章分割开来。”。“我们确定了围绕报道内容达成共识的要素。那么,所有报纸都同意的主要内容是什么?每个人都在报道哪些基本事实?另一方面,散度的要素是什么?那么,对于正在出现的同一主题,有哪些不同的观点?基于此,我们写了一篇新的文章,基本上将其打包,因此您可以从共识元素开始,了解正在发生的事情的基本事实,然后您可以探索我们所称的多重视角。”

在“多视角”选项卡下,还有一个发布者列表,这些发布者报告了正在总结的主题,并带有指向其报道范围的链接。

新闻室的文章由人工智能撰写,并由人类手动审查。罗马诺说,虽然人类将始终是监督过程的一部分,但他们正在寻求进一步简化这一过程。

Henriques说:“我们计划根据主题的不同,在人工审查的数量上有不同的层次。”。“例如,目前我们做的大多数主题都是关于地缘政治、气候等全球主题。一旦我们开始发展到其他风险较低的主题,例如体育,我们计划对这些主题进行不同程度的审查。”

目前,他们只使用英语源代码并用英语发布摘要,但他们计划在模型中包含其他语言的文章,以改善其输出的地理多样性。这反映在整个行业中:尽管ChatGPT可能使用多种语言,但其输出的质量各方面都不一样 .

当被问及是否经历过其他模特遇到的一些问题时,亨里克和罗曼诺表示他们没有经历过。他们的模型没有产生任何“幻觉”,当AI生成数据不支持的语句时并且他们对文本的手动审查可以消除任何事实上的错误。

亨利克斯说:“我们不处理突发新闻这样的事情。当新闻发生时,仍然没有足够的信息让我们能够正确地验证它。因此,《新闻编辑室》上的信息总是有目的地有点延迟。”。

该应用程序目前正处于最低可行产品阶段,因此仍在开发中。创始人表示,该公司在各国拥有约1000名用户,其中大部分在欧洲,绝大多数在35岁以下。据罗马诺介绍,《新闻室》目前的用户可以分为两大类:已经从其他渠道阅读大量新闻的人和以前的新闻回避者,他们通过接触和与一些用户交谈在观众中找到了这一群体。

然而,Henriques强调,该应用程序并不是为用户设计的唯一新闻来源。他说:“我们将自己视为一种帮助用户浏览新闻的方式。我们不认为它是一个完全独立的平台,是唯一一个阅读新闻的地方。它是一种接入点,所以你可以去那里导航,但它不会到此为止。然后你去找其他玩家,继续深入你真正感兴趣的东西。”说。

展望未来
Murgia和Marconi都提到了记者在综合信息、将信息背景化和识别故事方面的作用。对马可尼来说,这将变得更加困难。

他说:“来自网络、传感器、移动设备和卫星等来源的数据爆炸式增长,创造了一个信息过多的世界。我们现在产生的信息比历史上任何时候都多,这使得过滤不需要的信息变得更具挑战性。”。

马可尼认为,这是新闻业的一个方面,人工智能可以在减轻人类工作量方面发挥关键作用。他说:“人工智能不仅应该被视为生成更多内容的工具,还应该帮助我们过滤内容。”。“一些专家预测,到2026年,90%的在线内容可能是机器生成的。这标志着一个转折点,我们现在必须专注于制造能够过滤噪音、区分事实与虚构并突出重要内容的机器。”

马可尼认为,记者应该在开发新的人工智能工具中发挥作用。例如,通过编写编辑算法并将新闻原则应用于新技术。他说:“新闻业必须积极参与人工智能革命。”。“事实上,媒体公司有机会成为该领域的主要参与者——它们拥有人工智能开发的一些最宝贵资产:用于培训模型的文本数据和用于创建可靠可靠系统的道德原则。”

本文内容由用户注册发布,仅代表作者或来源网站个人观点,不代表本网站的观点和立场,与本网站无关。本网系信息发布平台,仅提供信息存储空间服务,其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如因作品内容侵权需删除与其他问题需要同本网联系的,请尽快通过本网的邮箱或电话联系。 
THE END
分享
二维码
< <上一篇
下一篇>>