披露与否：对新闻网站文章透明度的综合分析

原文标题： To Disclose or Not to Disclose: A Comprehensive Analysis Into the Article Transparency of News Websites

一、研究对象与核心研究问题

本文的研究对象是荷兰六个主流在线新闻网站（包括数字原生媒体、公共媒体、优质媒体和大众媒体）所发布的新闻文章。其核心研究问题是：在线新闻媒体在多大程度上实施了透明度常规？该问题进一步被细化为媒体间（between-outlet）和媒体内（within-outlet）两个层面的比较：一方面，探讨不同类型的新闻媒体（基于其起源、资金来源和媒体定位）在透明度实施上是否存在系统性差异；另一方面，探究同一媒体内部，硬新闻与软新闻板块在透明度实践上是否也有显著不同。

二、研究背景

本研究的现实背景是当前新闻业面临的公众信任危机。越来越多公众认为新闻质量下滑，导致不信任感上升，进而转向替代性新闻源或减少新闻消费，这可能导致社会信息环境的恶化。在这一背景下，新闻透明度被广泛提倡为重建公众信任的一种潜在手段。其内在逻辑是，通过更公开地展示新闻的生产过程和决策依据，可以缩小传受双方的知识鸿沟，使公众有能力判断新闻品质。同时，新闻的数字化在带来透明度实施需求（如在线新闻可发布后修改的“流动性”）的同时，也提供了技术上的可能性（如超链接和不受限的页面空间）。然而，透明度实践中也面临资源（时间、人力、财力）紧张、以及对过度透明可能带来负面效果（如暴露错误损害公信力）的担忧。因此，新闻媒体如何在利弊权衡中常规化地实施透明度，成为一个亟需实证研究回答的问题。此前的研究多为单一媒体的个案分析，缺乏对日常报道中透明度常规的广泛、系统的量化描述，本研究旨在填补这一空白。

三、理论背景

本文的理论框架建立在“透明度”作为新闻规范向“透明度常规”转化的过程之上。

透明度概念与价值：新闻透明度被定义为通过提供更多关于新闻产品及其内部生产过程的信息，来实现一系列价值，包括增强公众对新闻的理解力、增强媒体的可问责性、促进传受对话、赋权公众参与，并最终提升媒体的公信力与信任。然而，文献也指出了透明度在效果（部分实验显示效果微弱甚至负面）、实施成本（时间压力）和目标的合意性（可能导致“去问责化”或信息过载）等方面存在的争议。
透明度常规的分类：本文聚焦于“披露型透明度”，即单向地向受众沟通新闻的选择和生产过程。基于Karlsson (2010)的分类，将其细化为四个维度的常规：
- 作者透明度： 披露作者姓名、联系方式和生平背景。
- 更新透明度： 通过时间戳和文本说明披露文章的修改情况。
- 来源透明度： 通过超链接、原始文件和在文本中明确指出来源，使信息源可追溯。
- 生产透明度： 公开新闻的策划、采访、编辑标准等生产过程信息。
影响透明度实施的差异因素：研究从媒体层面和文章层面提出了解释透明度实施差异的假设：
- 媒体起源（H1）： 数字原生媒体相比传统媒体，其工作流程不受模拟时代惯例束缚，更具创新性，因此预期透明度更高。
- 资金来源（H2）： 公共媒体因其资金不依赖于商业收入且有法定高标准的义务，预期比商业媒体在透明度上投入更多。
- 媒体定位（H3）： 以理性、信息性报道为目标的优质媒体，预期比追求娱乐化和轰动效应的大众媒体实施更多透明度。
- 稿件类型（H4）： 硬新闻板块由于其事实性和公共性，预期比软新闻板块遵循更高的新闻标准，因此透明度更高。

四、研究设计

本研究采用大规模量化内容分析方法。

样本选择：研究选取了六家荷兰阅读量最高的新闻网站，以代表不同媒体类型：1家数字原生媒体（NU.nl），1家公共媒体（NOS），2家优质媒体（NRC, Volkskrant），以及2家大众媒体（AD, Telegraaf）。
数据收集：采用两步法。首先，从各网站站点地图或通过遍历文章ID的方式，抓取了2023年发布的文章链接。在排除直播、播客等非标准内容后，从每家媒体各随机抽取5000篇文章，最终在清洗（排除过长或超链接过多的文章）和随机下采样后，得到包含27,096篇文章的平衡数据集。
关键变量测量：研究综合运用了多种计算方法来自动化检测各类透明度常规。
- 作者特征：通过正则表达式检测署名中的明确作者名、联系信息（邮箱/社交媒体）和传记信息（作者页链接）。
- 更新特征：利用HTML元数据（dateModified标签）并结合互联网档案馆的数据进行验证，判断文章是否修改及是否通过时间戳或文本说明披露了修改。
- 来源特征：统计内链、外链、集团内部链接和文件链接的数量；同时，利用经人工标注数据微调的大语言模型和转换器模型，对文章中每句话的来源进行识别，并将其分为匿名、含糊和明确三个层级。
- 生产特征：先通过规则提取自我指涉的句子，再通过人工标注和微调转换器模型，判断句子是否包含关于新闻生产“时机、原因、方式或标准”的信息，并计算其在全文句子中的比例。
分析指标与策略：为综合衡量各透明度维度，研究构建了加权透明度指数，即通过对常规检测指标赋予与其实施普遍性成反比的权重（越罕见的常规权重越高），并将同一维度下的加权指标加总后标准化。分析使用独立样本t检验比较不同媒体间的指数均值，并使用多层线性模型（文章嵌套于媒体）检验硬新闻与软新闻的效应。

五、主要发现

研究发现，各新闻媒体在透明度的实施程度上和侧重维度上存在显著差异，且与原先的理论假设不完全吻合：

数字原生媒体与传统媒体对比（H1）：数字原生媒体NU.nl在更新透明度上表现突出，但在来源透明度和作者透明度上并非最高。其透明度优势更多体现在频繁使用更新标签，而非深度挖掘数字功能（如超链接）。
公共媒体与商业媒体对比（H2）：公共媒体NOS在更新和来源透明度上较高，但倾向于使用较浅层的路线（如时间戳、内部/集团链接）。然而，它在作者透明度和生产透明度上得分最低，作者署名多为机构名而非个人。
优质媒体与大众媒体对比（H3）：关于透明度的系统性差异并未得到一致支持。优质媒体在作者透明度上显著领先（提供明确姓名和传记），但在更新透明度上得分最低。在来源和生产透明度上，两家优质媒体NRC和Volkskrant表现出相反的格局（NRC高，Volkskrant低），表明简单二分法已不足以概括。
硬新闻与软新闻对比（H4）：在所有透明度维度中，仅在来源透明度上发现硬新闻系统性高于软新闻。在其他三个维度上均未发现显著差异，这反映出新闻“小报化”趋势可能正在模糊硬新闻和软新闻板块之间的标准界限。

六、研究结论与讨论

本研究的核心结论是，尽管所有新闻媒体都在一定程度上实施了透明度，但如何实施、在哪些方面实施呈现出复杂的混合模式，不同媒体在各透明度维度上各有领先，并未出现一家媒体在所有方面都绝对透明的“理想类型”。

学术贡献：

方法创新：作为少数对多类型新闻媒体进行大规模、多维度透明度自动量化内容分析的研究之一，本研究开发了一套结合规则、机器学习和网络档案验证的综合测量框架，为未来透明度研究提供了可借鉴的方法论。
理论修正：研究发现挑战了“数字原生即更透明”、“公共媒体即更负责”等简单因果假设。透明度实践模式揭示了新闻机构在新闻标准、效率、商业利益、安全考量（如作者遭网络骚扰）等多重压力下的复杂权衡。例如，公共媒体NOS的低作者透明度可能出于保护员工安全，而商业媒体在透明度上的竞争性投入可能源于对长期信任回报的期待。
揭示新趋势：研究为新闻“小报化”趋势提供了新的证据，即不仅发生在媒体间，也发生在媒体内部，表现为硬新闻与软新闻板块的透明度标准趋于同化。

政策与实践意涵：不同媒体的透明度实施与其受众期望可能并不匹配，这种错位可能导致进一步的不信任。研究建议新闻机构需有意识地管理透明度策略，使其与自身定位和受众期待保持一致。

研究局限与未来方向：本研究局限于荷兰这一媒体信任度相对较高的国家，其结论的外部效度有待在不同媒体系统（如信任度低、竞争格局不同的国家）中进行检验。未来研究可采用“关联分析”法，将内容分析数据与受众调查数据相结合，直接探究媒体的透明度实践在多大程度上满足了其特定受众群体的期望，进而对媒体信任产生实质影响。

订阅论文速递

已取消订阅

一、研究对象与核心研究问题#

二、研究背景#

三、理论背景#

四、研究设计#

五、主要发现#

六、研究结论与讨论#