当前位置: 首页 > news >正文

【杂谈】-被引用即被看见:生成式AI如何改写内容规则

被引用即被看见:生成式AI如何改写内容规则

文章目录

  • 被引用即被看见:生成式AI如何改写内容规则
      • 1. 引用功能:重塑 AI 行为的关键环节
      • 2. 媒体格局:免费媒体占据绝对优势
      • 3. 近因偏差:新鲜度成为关键要素
      • 4. 提示差异:引导不同来源的选择偏好
      • 5. 权威性与领域特性:多元并存而非单一主导
      • 6. 行业洞察:各领域 AI 引用特征解析
      • 7. 对传播与 SEO 团队的战略启示
      • 8. 结论:AI 引用的双重效应——放大与边缘化

在生成式人工智能蓬勃兴起、深度重塑数字生态格局的当下,一个至关重要且极具前瞻性的问题已然跃升为内容创作与探索领域的核心议题:人工智能究竟在读取怎样的信息?Muck Rack 发起了一项具有开创性意义的研究项目,其报告 《人工智能在阅读什么》(源自 Generative Pulse),通过深入剖析主流人工智能系统超百万条引文数据,涵盖了 OpenAI 旗下 ChatGPT(含 4o 及 4o - mini)、谷歌的 Gemini(包括 Flash 与 Pro)、Anthropic 开发的 Claude(Sonnet 和 Haiku)等,旨在揭开这些模型生成回复时所依托链接背后的深层逻辑与动态机制。

此项研究成果不仅极具启发价值,更对新闻从业者、企业传播专家、搜索引擎优化(SEO)专员以及品牌战略规划者等群体产生了颠覆性的变革影响。

1. 引用功能:重塑 AI 行为的关键环节

身处 AI 领域的人士皆知,简单切换引用功能的开启或关闭状态,便会显著改变答案呈现效果。当引用功能处于关闭状态时,AI 主要依赖静态的训练数据集;而一旦启用引用功能,模型输出将焕然一新,其内容直接受实时数据源的深刻影响。

典型例证如下:针对“美国职棒大联盟中表现最差的球队”这一问题,未启用引用功能的 AI 给出了 1962 年的大都会队作为答案;但在开启引用功能后,依据 CBS 体育频道的数据,答案更新为 2024 年的芝加哥白袜队,该队本赛季战绩惨淡,仅取得 41 胜 121 负的成绩。

2. 媒体格局:免费媒体占据绝对优势

研究数据显示,超过 95%的引用来源集中于非付费媒体范畴,具体构成如下:

  • 新闻类占比 27%,如路透社、美联社、金融时报等权威媒体;
  • 政府/非政府组织网站占 18%;
  • 学术或研究资源占 13%;
  • 聚合器/百科全书平台(如维基百科、Visual Capitalist)占 10%。
    相较之下,付费或软文内容的引用比例不足 5%,这清晰表明人工智能模型对营销导向型内容存在系统性偏见。

3. 近因偏差:新鲜度成为关键要素

对于 OpenAI 的模型而言,内容的新鲜度尤为关键。在新闻领域,ChatGPT 高达 56%的引用源自过去 12 个月内发布的资讯,而 Claude 的这一比例仅为 36%。这种倾向被称为“近因偏差”,即即便旧有资料依然准确且相关,人们仍倾向于优先采信最新发布的信息。

在生成式 AI 的语境下,近因偏差意味着语言模型(特别是与实时数据紧密相连的 ChatGPT)更倾向于引用并信赖新近发布的材料,尤其在回应涉及时事热点、新兴技术或政策变动等问题时。例如,面对“门诊治疗的最新进展”或“最近的录音创新”等时效性强的提问,模型会高度关注过去数月内发布的内容,假定其中蕴含着更具相关性和前沿性的见解。

这对内容创作者与品牌策略师而言是重要启示:若内容陈旧过时,即便仅相差一年,其在 AI 生成答案中的曝光概率也会大幅降低。因此,保持内容的时效性不仅是提升 SEO 效果的手段,更是在 AI 时代获取高曝光度的关键所在。

4. 提示差异:引导不同来源的选择偏好

AI 模型并非随机选取引用来源,而是根据问题的特定类型进行精准匹配。不同的提示风格会触发对不同类型来源的引用:

  • 事实核查与百科全书式查询通常从维基百科、大英百科全书等静态参考网站获取信息,这些站点虽资料成熟但相对老旧;
  • 近期事件相关问题多会引用美联社、路透社或 Axios 等主流新闻机构的报道,因其以速度和时效性见长;
  • 寻求建议或意见的提示则促使模型转向更具互动性和讨论氛围的平台,如博客、论坛、Reddit 或 Medium;
  • 学术或研究导向的任务推动 AI 从期刊、arXiv 预印本服务器或 PubMed、NCBI 等政府支持的知识库中引用文献;
  • 创意需求或分步指导类请求常展示来自 Quora 等平台上的用户原创内容、非正式操作指南或社区讨论帖。

这意味着问题的表述方式将直接影响哪些域名获得推荐,哪些则被忽视。例如,Claude 引用路透社等主流媒体的频率仅为 ChatGPT 的 1/50。

5. 权威性与领域特性:多元并存而非单一主导

尽管高权威性媒体占据主导地位,但并非唯一选择。多个行业的数据显示,仅有 15%的最常被引用来源进入前十名榜单,这表明特定领域的专业内容同样受到青睐。具体表现为:

  • 金融领域:Bankrate 和 NerdWallet 等平台更受推崇;
  • 医疗保健领域:CDC.gov 和 NIH.gov 等政府官网占据主导地位;
  • 科技领域:Udemy、Coursera 和 Medium 等学习平台名列前茅。
    可视化热图(第 15 页)揭示,Claude 展现出最为丰富的行业多样性,频繁选用各行业独有的优质来源;而 ChatGPT 和 Gemini 则更倾向于依赖综合性媒体资源。

6. 行业洞察:各领域 AI 引用特征解析

  • 金融与保险业:新闻类引用占比达 37%,高于其他所有行业;Claude 的前十大来源中有 90%为独特细分资源,体现其对细分市场的深度挖掘能力。
  • 医疗保健业:政府和非政府组织网站的引用率高达 18%,是跨行业平均水平的两倍有余;Gemini 在该行业的来源多样性方面表现突出。
  • 旅游/航空业:学术引用几乎可以忽略不计(仅 0.7%);FAA.gov 和 IATA.org 等官方机构网站占据主导地位,对新闻媒体依赖度较低。
  • 零售与电子商务业:维基百科等聚合器的引用率低于其他行业(36% vs. 28%);Claude 引用了大量细分市场相关内容。
  • 媒体/娱乐业:新闻业再次以 37%的引用率领跑;Claude 经常引用 TVTechnology、Radioking 等细分平台。
  • 技术行业:几乎不使用百科全书或学术资源;Medium、Coursera 和 SproutSocial 等实践导向型平台占据显著位置,反映出对该领域实操知识的重视。

7. 对传播与 SEO 团队的战略启示

本研究报告表明,生成式引擎优化(GEO)已与传统 SEO 同等重要。人工智能不再局限于汇总静态数据库,而是能够实时主动链接至相关源头。这些链接受以下因素制约:

  • 时效性:持续更新内容以确保新鲜度;
  • 域名权重:积极构建反向链接以增强信任度;
  • 利基相关性:创作契合行业需求的专业化内容,避免泛泛而谈;
  • 内容性质:侧重于赢得媒体认可和信息密集型内容,减少纯营销页面的比例。

这一转变迫使内容营销人员、公关专业人士及出版商重新审视策略。若目标是出现在 AI 生成的搜索结果中,就必须打造符合 AI 价值评判标准的内容,而非仅仅满足用户或谷歌的需求。

8. 结论:AI 引用的双重效应——放大与边缘化

本报告深刻揭示了信息在线呈现方式的根本变革:AI 模型不仅是内容的检索工具,更是选择性整理者。这种整理机制正在重塑数字时代的可见性规则。

对于出版商、研究者和品牌而言,被 AI 引用意味着融入下一代搜索体系,将内容展示给那些原本可能不会访问您网站却信任该模型的用户群体。被引用的来源将获得显著的流量加持。相反,未被引用的来源——无论质量高低——都可能完全脱离公众视野,失去参与讨论的机会。

这场变革催生了新的赢家与输家。高权威性媒体和及时更新的免费媒体成为宠儿;而付费内容、更新滞后的博客以及知名度较低的小众声音则面临被边缘化的风险——不仅被人类忽视,更被塑造公众认知的系统所遗忘。

随着生成式人工智能在知识传播中的核心地位日益巩固,关键问题已不再是如何在传统搜索中排名靠前,而是如何成为值得 AI 引用的优质内容的一部分?

http://www.dtcms.com/a/301301.html

相关文章:

  • vscode找不到python解释器的解决方案
  • 8. 若依框架的AjaxResult
  • Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现PCB上二维码检测识别(C#代码UI界面版)
  • 欢乐的周末 - 华为OD统一考试(JavaScript 题解)
  • RAG(检索增强生成)
  • Vue 四个map的使用方法
  • MySQL读写分离部署
  • 【YOLO系列】YOLOv1详解:模型结构、损失函数、训练方法及代码实现
  • 前端面试专栏-前沿技术:31.Serverless与云原生开发
  • Spring AI 项目实战(二十一):Spring Boot + AI +DeepSeek驱动的智能题库系统(附完整源码)
  • Linux-文件与文本管理
  • 【语义分割】记录2:yolo系列
  • Java面试实战:安全框架与大数据技术深度解析
  • 代码随想录算法训练营二十八天|动态规划part01
  • C语言自定义数据类型详解(四)——联合体
  • 欧拉图与欧拉回路
  • Windows---动态链接库Dynamic Link Library(.dll)
  • 裴蜀定理应用
  • Ubuntu Linux 如何配置虚拟内存 —— 一步一步配置 Ubuntu Server 的 NodeJS 服务器详细实录8
  • GRPO强化学习缓解多模态大模型OCR任务的幻觉思路及数据生成思路
  • 【Oracle】Oracle分区表“排雷“指南:当ORA-14400错误找上门时如何优雅应对
  • 【数据结构与算法】数据结构初阶:详解排序(二)——交换排序中的快速排序
  • 【Web安全】深入浅出理解“SQL注入-伪静态注入”及空格限制绕过技巧
  • linux 板卡实现vxi11服务
  • Qwen3安装使用教程:引领推理型大模型新时代
  • 【硬件-笔试面试题】硬件/电子工程师,笔试面试题-35,(知识点:三极管知识点,电路电压计算题,三极管电压计算,PNP三极管)
  • linux 部署 flink 1.15.1 并提交作业
  • 数据上新|最新省、地级市农业新质生产力2002-2025
  • Linux vimgrep 详解
  • 深度学习篇---优化器