学术出版中AIGC使用边界指南-中文版.pdf
学术出版中 使用边界指南 Guideline on the Boundaries of AIGC Usage in Academic Publishing 中国科学技术信息研究所 爱思唯尔、施普林格•自然、约翰威立国际出版集团(排名不分先后) 我很高兴看到中信所联合爱思唯尔、约翰威立、施普林格·自然等国际出版机构制定本指 南。这份指南为论文作者、研究机构、学术期刊出版单位等如何负责任地使用AIGC提出了建 议,包括如何对AIGC使用情况进行充分、正确的披露和声明。因为AIGC的使用是一个非常动态 的领域,STM也希望各方献计献策以适应未来。在现阶段本指南是务实且有作用的。 ——颜帅(国际科学、技术与医学出版商协会中国顾问) 随着生成式人工智能在关注度和使用上的加速发展,施普林格·自然很高兴参与制定关于这 一重要课题的指南。由于该技术功能强大,我们需要去理解预期和非预期的后果,并因此谨慎 小心地行事。同样需要注意的是,鉴于该技术的迭代特性,这份指南也是迭代的,将随着该技 术本身的发展,包括与之相关的挑战和益处,而持续发展。 ——Steven Inchcoombe(施普林格·自然科研总裁) 生成式人工智能(Generative AI)为未来科学研究和学术出版带来了广阔的前景和机遇。然而, 鉴于其迅猛的发展速度,我们需要展开深入的探讨和对话,以解决从科研到出版过程中各个利 益相关方应如何在确保诚信和透明原则下运用这项技术的问题。在这个背景下,这份指南对于 提高人们对使用这项新技术所涉及问题的认识非常重要,同时也强调了人工智能技术在实际应 用中问责制的重要性。 ——Michael Streeter(约翰威立国际出版集团科研诚信政策与战略总监) 爱思唯尔非常欢迎由中国科学技术信息研究所(ISTIC)牵头的这一重要倡议,即制定在学 术出版中AIGC技术的使用指南。我们很高兴有机会为该技术使用指南做出贡献,并分享我们自 己的经验。 正如指南中所指出的,人工智能在学术和学术出版领域的影响与日俱增,同时也带来了机 遇和挑战。爱思唯尔的政策侧重于负责任地使用人工智能,以及在作者使用人工智能协助其文 章写作过程时披露相关信息的必要性,同时我们的政策强调在审稿人和编辑使用人工智能时保 护作者和数据的保密性和隐私权。在所有情况下,我们都需要为作者、读者、审稿人、编辑和 投稿人提供透明度和指导。ISTIC的这份指南是非常关键的,它将有助于学界以负责任的、透明 的和可问责的方式来使用人工智能。 ——Sarah Jenkins(爱思唯尔研究诚信与出版伦理部总监) 目录 1 背景 ………………………………………………………………………………………………………… 01 2 目标 ………………………………………………………………………………………………………… 02 2.1 防范学术不端,加强诚信治理 ………………………………………………………………………… 02 2.2 引导相关利益主体就AIGC使用达成共识 …………………………………………………………… 02 3 原则 ………………………………………………………………………………………………………… 02 3.1 透明度和问责制 ………………………………………………………………………………………… 02 3.2 质量和诚信 ……………………………………………………………………………………………… 02 3.3 隐私和安全 ……………………………………………………………………………………………… 02 3.4 公平 ……………………………………………………………………………………………………… 03 3.5 可持续发展 ……………………………………………………………………………………………… 03 4 行为框架/实践指导 …………………………………………………………………………………… 03 4.1 研究开展和论文撰写阶段 ……………………………………………………………………………… 03 4.1.1 资料收集 ………………………………………………………………………………………… 03 4.1.2 统计分析 ………………………………………………………………………………………… 04 4.1.3 图表制作 ………………………………………………………………………………………… 04 4.1.4 文字撰写 ………………………………………………………………………………………… 04 4.1.5 语言和润色 ……………………………………………………………………………………… 05 4.1.6 引文整理 ………………………………………………………………………………………… 05 4.2 投稿阶段 ………………………………………………………………………………………………… 05 4.2.1 作者署名 ………………………………………………………………………………………… 05 4.2.2 规范引用 ………………………………………………………………………………………… 05 4.2.3 披露和声明 ……………………………………………………………………………………… 05 4.2.4 同行评审 ………………………………………………………………………………………… 06 4.3 论文发表/出版后 ……………………………………………………………………………………… 06 4.3.1 数据仓储和共享 ………………………………………………………………………………… 06 4.3.2 AIGC相关材料提交、存档 ……………………………………………………………………… 06 4.3.3 AIGC产生内容的检测和发现 …………………………………………………………………… 06 5 总结 ………………………………………………………………………………………………………… 07 6 致谢 ………………………………………………………………………………………………………… 08 背景 学术出版中AIGC使用边界指南 1 背景 近年来,随着人工智能技术的迅速发展,特 生态环境。同时,使用AIGC还可能增加学术不端 别是2022年11月人工智能聊天机器人ChatGPT的 检测的难度(例如抄袭和图像操纵检测)。因 发布,人工智能内容生成(Artificial Intelligence 此,如何使用AIGC,设定界限并提供可参考的指 Generated Content,简称AIGC)已经走进公众 南至关重要。 视野,并被广泛利用。人们清楚地认识到人工智 目前,一些国家科技管理机构、出版领域、 能(AI)正在获得产生流利语言的能力,产生的 期刊等针对AI技术在学术论文中的使用进行了研 大量语句越来越难与人写的文本区分开来。一些 讨,并提供了一些相关的准则、指南等,例如国 科学家已经在使用聊天机器人作为研究助手,帮 际出版伦理道德委员会(COPE),国际医学期刊 助其组织思维,对他们的工作产生反馈,协助其 编辑委员会(ICMJE),国际科学、技术和医学出 编写代码并总结研究文献。AI在研究论文写作、 版商协会(STM),Taylor & Francis,Wiley, 创作等方面的影响不断增强,但是对学术研究的 Springer 透明性、完整性产生重要影响,引起学术界的广 不同 机 构 在 不 同 时 期 发 布 的 A I 相 关 指 南 和 规 范 泛关注。 性文件,有着不同的表述和要求。为此,在广 Nature,Elsevier等。值得注意的是, 学术界最担忧的是科学家、研究人员、学生 泛调研和梳理现有业内相关研究和探索工作的 等可能会欺骗性地将AIGC生成的文本作为自己的 基础上,我们致力于为AI技术在学术出版中的 文本,或者简单使用AIGC并产生不可靠的研究成 最佳行为实践提供一个基本原则的框架和指 果。LLMs(Large Language Models)通过学习 南,希望能够引导出版界、科学界和科技管理 大量在线文本数据库中的语言统计模式来工作, 部门就AI技术使用规范进一步形成共识。因为 很容易产生错误和误导性信息,且无法显示其信 AI是一项新兴技术,技术的性质及如何使用将 息的来源。如果没有输出控制,AIGC很容易被用 不可避免地发生变化,我们将根据情况变化, 来产生不当言论或不可靠的研究结果,影响科研 持续、及时更新这份指南。 01 目标|原则 2 学术出版中AIGC使用边界指南 目标 2.1 防范学术不端,加强诚信治理 以防范AIGC不当使用作为切入点,加强科研 诚信意识教育,推进学术诚信治理,推进科研活动 有序开展。 2.2 引导相关利益主体就AIGC使用 达成共识 明晰相关利益主体在学术期刊论文准备、写 作、投稿、评审、出版、传播各环节应该履行的最 佳行为实践,提供详尽、规范的AIGC使用指导。 3 原则 3.1 透明度和问责制 3.2 质量和诚信 透明度和问责制是学术出版中AIGC使用最基 确保质量和诚信是在学术研究中AIGC应用建 本的原则。在学术研究到出版发行的过程中,所 立信任的基础。从算法的设计和构建,到用于训 有参与者(包括研究人员、作者、同行评议人和 练AIGC的输入,再到实际应用中使用的输入,应 读者)都应该了解并明确披露AIGC的使用情 坚持问责和透明原则,并通过标识符或反馈等手 况,透明度应该包括数据透明度(包括底层数据 段表明AIGC的使用,保证学术研究的质量和诚信 集、数据来源和数据处理方法),以及知识产权 不受AIGC技术使用的影响。 和版权材料的使用情况。问责制则是关键利益相 关者应共同承担的责任,包括研究人员、资助 者、政策制定者和出版商,应建立问责标准和相 关信息。 3.3 隐私和安全 隐私和安全是AIGC使用的基本法律原则。 02 原则|行为框架/实践指导 在使用AIGC时应尊重隐私和数据保护,包括数 学术出版中AIGC使用边界指南 3.5 可持续发展 据、隐私和安全影响评估,并通过适当的数据匿 名来保护隐私、数据保护和安全措施来确保数据 AI系统的多学科性质使其非常适合解决全球 关注的领域,如联合国可持续发展目标、碳中和 安全。 等。它还为公共和私营组织提供了提高效率的机 会,以实现更大的生态可持续性和责任。AI系统 3.4 公平 承载着造福全人类,包括子孙后代的承诺。为高 使用AIGC时应秉持公平原则,避免偏见。由 质量输入数据的供应商提供资金和其他奖励措 于人工智能具有复制和放大偏差的风险,因此在 施,如出版商创建的出版物和数据库,有助于提 训练数据选择、算法设计、模型生成和优化、使 取重要的可采取行动的知识。 用过程中,应仔细评估和审查潜在的偏差来源, 可持续发展应是AIGC本身的核心原则。为减 并建立反馈机制,监测和审查可能的不公平现 少重复和浪费,使用AIGC应避免过度依赖可能暂 象,及时纠偏。同时,AIGC能够帮助提供诸如语 时或永久不可用的数据,同时工具的功能模块应 言润色等服务,减少此类文化或语言上的不公平 基于公认标准和指南,以确保数据可查找、可访 现象。 问、可互操作和可重复使用。 4 行为框架/实践指导 AIGC可在研究开展及学术出版的各个阶段提 供辅助作用(服务)。为了营造良好的科研氛 稿前的研究开展和论文撰写阶段使用AIGC提出 建议。 围,防患于未然,避免/减少不当使用AIGC行为 的发生,本部分提供一个符合道德行为的框架, 以帮助作者、研究机构、学术期刊出版单位等就 如何合规合理地使用AIGC做出指导。 4.1 研究开展和论文撰写阶段 本部分以指导性建议为主,对研究人员投 03 4.1.1 资料收集 AIGC所提供的资料是基于大数据和语言模型 生成和抽取的,其准确性和真实性缺乏考量和验 证,需要研究人员确认内容的可靠性。 文献调研:可以借助AIGC收集关键词或主题 相关参考文献,并进行分类和梳理,总结参考文 行为框架/实践指导 学术出版中AIGC使用边界指南 献结论,为研究人员提供参考;帮助研究人员发 统计方法的建议和指导:AIGC可以根据问题 现新的信息来源,并跟踪研究领域最新进展。需 和领域知识,为研究人员提供统计分析建议和指 要注意的是,由于AIGC提供的参考文献可能是虚 导,但只是基于其所学习的语言模型和知识库, 构或过时的,使用AIGC支持其文献综述的研究人 可能存在缺失和不准确。因此,研究人员需甄别 员必须阅读并验证AIGC提供的每项建议和参考文 AIGC所提供的统计分析建议的可行性,结合其他 献的真实性。 可靠统计分析和数据挖掘工具进行判断,或向专 概念解答:AIGC可以回答一些简单的概念问 题,为研究人员在构建章节内容时提供帮助。但 业的领域专家寻求指导和帮助,最终判断是否采 纳AIGC提供的建议。 要注意,AIGC是基于已有研究提供的概念解答, 研究人员在使用时要注意概念的适用性。 观点类资料调研:AIGC可以采集文本中公众 或专家对某些主题的观点、情感及情感倾向的相 关数据资料。研究人员必须监督和控制AIGC提供 的观点资料,必要时对AIGC提供的资料进行清洗 处理,以确保研究人员使用的资料是有效、无偏 的,防止传播不正确、有偏见或歧视性的信息。 4.1.2 统计分析 4.1.3 图表制作 辅助生成图表:根据数据特点和作图目的, AIGC可以依据不同的运用场景,推荐合适的统计 图表类型,直观呈现数据结论,有效地传递信 息,从而节省研究人员制作图表的时间,提高写 作效率。但蛋白质印迹实验图、细胞技术分析、 组织细胞染色图等实验生成类图像必须由真实开 展的实验研究获得,不可通过AIGC直接生成。 图表格式处理和优化:根据数据量和图表需 某些情况下,研究人员已经收集了数据,但 求,研究人员可以使用AIGC辅助调整图表样式, 不确定用何种最佳的统计分析来验证其假设。研 对图表进行格式化处理,例如调整字体大小、数 究人员可使用AIGC来选择最合适的分析方法或 据标注、添加图例、更改颜色等,使图表更清 进行统计分析,但所用的数据必须是研究人员进 晰、美观,更易于理解。 行实验并收集的,并且研究人员需要对AIGC所 提供的统计分析结果进行验证,确保统计结果可 靠性。 数据分析和解释:研究人员可以借助AIGC解 释数据,计算统计学指标,进行一些简单的数据 分析和统计结果的描述,但不能取代他们自己对 数据的解释。 4.1.4 文字撰写 在论文撰写过程中,AIGC可用于提高文本可 读性、启发内容逻辑性、提供句式等,以供研究 人员参考撰写,但不应该用来产生研究假设、直 接撰写整篇论文文本或解释数据、得出科学结论 等。所有属于科学或智力贡献范围的任务都应该 04 行为框架/实践指导 学术出版中AIGC使用边界指南 由研究人员自己来完成,特别是论文重要部分的 对,在学术写作中帮助作者完成规范引用的相关 撰写。使用AIGC的目的只是如何以最佳可读的方 任务,减少人工操作的繁琐,提高论文的质量和 式传达作者生成的科学知识。 研究人员的效率。 4.1.5 语言和润色 4.2 投稿阶段 学术语言服务:语言不应该成为学术交流与 科学传播的障碍。AIGC可以作为高标准语言检查 AIGC可以在投稿阶段提供帮助,但这需要研 究人员的专业判断,并承担最终的责任。 器,提高稿件可读性和写作质量,以消除研究传 播中的语言障碍。目前,AIGC的学术语言服务可 以帮助非英语母语的研究人员润色稿件使其符合 国际期刊的投稿要求。但研究人员也需注意,当 手稿(全部或部分)输入到公共AIGC中时,有可 能成为大型语言模型训练语料库的一部分。 4.1.6 引文整理 当涉及AIGC推荐的任何内容时,“引用相关 4.2.1 作者署名 在没有人类研究人员指导的情况下,AIGC不 能独立发起一项原创性研究,也不能对已发表的作 品或研究设计负责。同样,它在绝大多数国家也没 有法律地位或持有或转让版权的能力,而这些责任 和能力是对作者身份的基本要求。因此,根据 COPE对人工智能工具的立场声明,AIGC不能履 行文章作者的角色,也不能被列为文章作者。 性”至关重要。研究人员需确保引用的内容与论文 切实相关,包括引文和被引内容的真实性。 引文格式检查:AIGC可以检查引用的文献是 否符合学术论文的引文格式,并指出可能存在的 错误或缺陷。 自动引用生成:AIGC可以帮助研究人员确定 引用来源,并根据作者提供的文献信息,自动生 成符合学术论文引文格式要求的引用。但AIGC仅 应作为一种辅助工具,作者仍需仔细核对引用文 献的格式和内容,以确保引用符合学术论文的规 范要求。 4.2.2 规范引用 所有来自其他来源的内容必须经过仔细确认、 恰当引用标注。研究人员对于AIGC所提供的资料 需要验证其真实性和准确性,并对其底层数据来 源、工具、获取方式、处理等进行引用标注。 4.2.3 披露和声明 对AIGC使用情况进行充分、正确的披露和 声明。 参考文献自动排序:AIGC可以按照指定的引 应明确以下内容:使用者;人工智能技术或 文格式自动对参考文献列表进行排序和顺序校 系统(需注明版本号);使用的时间和日期;用 05 行为框架/实践指导 学术出版中AIGC使用边界指南 于生成文本的提示和问题;文本中由AIGC编写或 保数据的来源准确、完整且真实可靠。数据检查 共同编写的部分;论文中因使用AIGC而产生的想 的侧重点包括数据的收集和处理方法、实验、测 法。若作者使用此类工具撰写了稿件的任何部 量精度和准确性,以及数据存储方法等。 分,则必须在方法或致谢部分中公开、透明、详 细地进行描述。 对于有实验过程的研究性论文,研究人员应 及时、准确、详细地记录实验和数据收集过程, 避免记录错误或遗漏等问题,并将实验数据和过 【模板】 程记录一并提交。 声明:在本作品的准备过程中,作者使用 了[AIGC具体工具/服务名称]来[使用目的:如 文献调研/数据分析/图表制作等]。使用此工 具/服务后,作者根据需要对内容进行了审查 和编辑,并对出版物的内容承担全部责任。 4.2.4 同行评审 4.3.2 AIGC相关材料提交、存档 鼓励研究人员(在某些情况下)分享他们的 研究数据,包括但不限于:原始数据、处理后的 数据、软件、算法、协议、方法、材料等。特别 是由AIGC生成的文本、图片、程序等内容应作为 补充材料提交、存档。 在同行评审过程中,作者可使用AIGC帮助回 复评审意见,但作者需对同行评审意见的回复负 责,如果回复受到质疑,也应由作者证明其回复 是合理的。在同行评审过程中,AIGC可以将评审 意见进行汇总和分类标注,帮助作者快速理解评 审意见,并为作者推荐合适的回复内容,从而高 效地回应评审意见。 4.3 论文发表/出版后 4.3.1 数据仓储和共享 在符合相关要求的前提下,鼓励作者公开原 始数据,以审查防范数据污染、造假的问题。 4.3.3 AIGC产生内容的检测和发现 鼓励期刊和编辑使用新的工具来检测、识别 由AIGC产生的内容。建立针对AIGC工具的审查程 序,开发相应技术,进行人工审查和自动化检 测。检测结果作为辅助判断依据,根据论文的使 用范围、期刊的要求、论文整体水平等综合研判 处理。 研究人员使用AIGC直接生成的稿件文字等资 料必须提供明确的披露和声明,否则将构成学术 不端行为。例如,从AIGC中提取新生成的文本作 为稿件内容而未注明的,将被视为抄袭。 作者应该对论文中的数据进行严格检查,确 06 总结 学术出版中AIGC使用边界指南 5 总结 AIGC属新兴事物,涉及多元主体,其在学术 涉及学术出版链条中如作者、期刊、编辑、审稿 出版中的使用场景具有多样性,AIGC使用的边界 人、传播者、受众及科研管理者等各责任主体, 也存在大量模糊地带尚待厘清。中国科学技术信 如何厘清各方关系,明确主体责任和制约关系, 息研究所联合爱思唯尔、施普林格·自然、约翰威 清晰划定责任对于促进各方明确自身职责有着重 立等国际出版集团,在征求有关各方建议的基础 要意义。同时,由于对不当使用AIGC技术的处理 上,从原则与行为框架/实践指导等方面对AIGC 尚未达成共识,对涉及的各种不当使用情况提出 技术使用提出建议,以达到防范学术不端、加强 适当的处理建议对推动责任落实也有着至关重要 诚信治理和引导相关利益主体就AIGC使用达成共 的作用。 识的目的。 AIGC技术与工具仍在不断革新和发展中,本 值得注意的是,制定本指南的目的是为AIGC 指南的适用范围、行为框架也需要定期调整以应 技术使用提供一个启发式的框架,还有一些更为 对这一持续变化带来的新挑战与新问题。积极呼 具体、实践性的问题有待进一步研究。比如, 吁各方对本指南提出建议和反馈,帮助我们不断 AIGC技术在学术出版应用中涉及的主体众多,既 完善AIGC技术使用指南,给相关主体提供更为具 包括AIGC技术开发、应用的所有者和使用者,也 体、详实的实践框架,以防止学术不端的发生。 07 致谢 学术出版中AIGC使用边界指南 6 致谢 本指南在中国科学技术部科技监督与诚信建 A lic e H e n c hley女 士、 胡泽 英 女 士、 Ste ve n 设司支持和指导下,由中国科学技术信息研究所 Inchcoombe先生、Imogen Rose博士、Henning 牵头,联合爱思唯尔、施普林格·自然、约翰威立 Schoenenberger先生、Katrin 国际出版集团(排名不分先后)的团队协作完 士、Niels Peter Thomas博士、张立先生;约翰 成。主要贡献人为:中国科学技术信息研究所的 威立国际出版集团的Michael Streeter先生、 郑雯雯博士、杨代庆研究员、高继平研究员、王 Joyce 美玲博士;爱思唯尔的Peter Lee先生、康晓伶女 自国内外科技出版领域和科技管理领域的专家学 士、李季萌女士、研究诚信和出版伦理专家中心 者和资深人士对本指南的内容给予了宝贵建议和 的研究团队;施普林格·自然的Nick Campbell博 指导,在此表示由衷感谢。 Stienemeier女 Griffin女士、王宇女士。同时还有多位来 士、Chris Graf先生、Arjan Grootenboer先生、 08 中国科学技术信息研究所 科学计量与评价研究中心 北京市海淀区复兴路15号 邮编:100038 电话:+86-10 58882604 联系人:郑雯雯 邮箱:zhengww@istic.ac.cn