学术出版中AIGC使用边界指南-中文版.pdf

学术出版中使用边界指南 Guideline on the Boundaries of AIGC Usage in Academic Publishing 中国科学技术信息研究所爱思唯尔、施普林格•自然、约翰威立国际出版集团（排名不分先后）我很高兴看到中信所联合爱思唯尔、约翰威立、施普林格·自然等国际出版机构制定本指南。这份指南为论文作者、研究机构、学术期刊出版单位等如何负责任地使用AIGC提出了建议，包括如何对AIGC使用情况进行充分、正确的披露和声明。因为AIGC的使用是一个非常动态的领域，STM也希望各方献计献策以适应未来。在现阶段本指南是务实且有作用的。 ——颜帅（国际科学、技术与医学出版商协会中国顾问）随着生成式人工智能在关注度和使用上的加速发展，施普林格·自然很高兴参与制定关于这一重要课题的指南。由于该技术功能强大，我们需要去理解预期和非预期的后果，并因此谨慎小心地行事。同样需要注意的是，鉴于该技术的迭代特性，这份指南也是迭代的，将随着该技术本身的发展，包括与之相关的挑战和益处，而持续发展。 ——Steven Inchcoombe（施普林格·自然科研总裁）生成式人工智能（Generative AI）为未来科学研究和学术出版带来了广阔的前景和机遇。然而，鉴于其迅猛的发展速度，我们需要展开深入的探讨和对话，以解决从科研到出版过程中各个利益相关方应如何在确保诚信和透明原则下运用这项技术的问题。在这个背景下，这份指南对于提高人们对使用这项新技术所涉及问题的认识非常重要，同时也强调了人工智能技术在实际应用中问责制的重要性。 ——Michael Streeter（约翰威立国际出版集团科研诚信政策与战略总监）爱思唯尔非常欢迎由中国科学技术信息研究所（ISTIC）牵头的这一重要倡议，即制定在学术出版中AIGC技术的使用指南。我们很高兴有机会为该技术使用指南做出贡献，并分享我们自己的经验。正如指南中所指出的，人工智能在学术和学术出版领域的影响与日俱增，同时也带来了机遇和挑战。爱思唯尔的政策侧重于负责任地使用人工智能，以及在作者使用人工智能协助其文章写作过程时披露相关信息的必要性，同时我们的政策强调在审稿人和编辑使用人工智能时保护作者和数据的保密性和隐私权。在所有情况下，我们都需要为作者、读者、审稿人、编辑和投稿人提供透明度和指导。ISTIC的这份指南是非常关键的，它将有助于学界以负责任的、透明的和可问责的方式来使用人工智能。 ——Sarah Jenkins（爱思唯尔研究诚信与出版伦理部总监）目录 1 背景 ………………………………………………………………………………………………………… 01 2 目标 ………………………………………………………………………………………………………… 02 2.1 防范学术不端，加强诚信治理 ………………………………………………………………………… 02 2.2 引导相关利益主体就AIGC使用达成共识 …………………………………………………………… 02 3 原则 ………………………………………………………………………………………………………… 02 3.1 透明度和问责制 ………………………………………………………………………………………… 02 3.2 质量和诚信 ……………………………………………………………………………………………… 02 3.3 隐私和安全 ……………………………………………………………………………………………… 02 3.4 公平 ……………………………………………………………………………………………………… 03 3.5 可持续发展 ……………………………………………………………………………………………… 03 4 行为框架/实践指导 …………………………………………………………………………………… 03 4.1 研究开展和论文撰写阶段 ……………………………………………………………………………… 03 4.1.1 资料收集 ………………………………………………………………………………………… 03 4.1.2 统计分析 ………………………………………………………………………………………… 04 4.1.3 图表制作 ………………………………………………………………………………………… 04 4.1.4 文字撰写 ………………………………………………………………………………………… 04 4.1.5 语言和润色 ……………………………………………………………………………………… 05 4.1.6 引文整理 ………………………………………………………………………………………… 05 4.2 投稿阶段 ………………………………………………………………………………………………… 05 4.2.1 作者署名 ………………………………………………………………………………………… 05 4.2.2 规范引用 ………………………………………………………………………………………… 05 4.2.3 披露和声明 ……………………………………………………………………………………… 05 4.2.4 同行评审 ………………………………………………………………………………………… 06 4.3 论文发表/出版后 ……………………………………………………………………………………… 06 4.3.1 数据仓储和共享 ………………………………………………………………………………… 06 4.3.2 AIGC相关材料提交、存档 ……………………………………………………………………… 06 4.3.3 AIGC产生内容的检测和发现 …………………………………………………………………… 06 5 总结 ………………………………………………………………………………………………………… 07 6 致谢 ………………………………………………………………………………………………………… 08 背景学术出版中AIGC使用边界指南 1 背景近年来，随着人工智能技术的迅速发展，特生态环境。同时，使用AIGC还可能增加学术不端别是2022年11月人工智能聊天机器人ChatGPT的检测的难度（例如抄袭和图像操纵检测）。因发布，人工智能内容生成（Artiﬁcial Intelligence 此，如何使用AIGC，设定界限并提供可参考的指 Generated Content，简称AIGC）已经走进公众南至关重要。视野，并被广泛利用。人们清楚地认识到人工智目前，一些国家科技管理机构、出版领域、能（AI）正在获得产生流利语言的能力，产生的期刊等针对AI技术在学术论文中的使用进行了研大量语句越来越难与人写的文本区分开来。一些讨，并提供了一些相关的准则、指南等，例如国科学家已经在使用聊天机器人作为研究助手，帮际出版伦理道德委员会（COPE），国际医学期刊助其组织思维，对他们的工作产生反馈，协助其编辑委员会（ICMJE），国际科学、技术和医学出编写代码并总结研究文献。AI在研究论文写作、版商协会（STM），Taylor & Francis，Wiley，创作等方面的影响不断增强，但是对学术研究的 Springer 透明性、完整性产生重要影响，引起学术界的广不同机构在不同时期发布的 A I 相关指南和规范泛关注。性文件，有着不同的表述和要求。为此，在广 Nature，Elsevier等。值得注意的是，学术界最担忧的是科学家、研究人员、学生泛调研和梳理现有业内相关研究和探索工作的等可能会欺骗性地将AIGC生成的文本作为自己的基础上，我们致力于为AI技术在学术出版中的文本，或者简单使用AIGC并产生不可靠的研究成最佳行为实践提供一个基本原则的框架和指果。LLMs（Large Language Models）通过学习南，希望能够引导出版界、科学界和科技管理大量在线文本数据库中的语言统计模式来工作，部门就AI技术使用规范进一步形成共识。因为很容易产生错误和误导性信息，且无法显示其信 AI是一项新兴技术，技术的性质及如何使用将息的来源。如果没有输出控制，AIGC很容易被用不可避免地发生变化，我们将根据情况变化，来产生不当言论或不可靠的研究结果，影响科研持续、及时更新这份指南。 01 目标｜原则 2 学术出版中AIGC使用边界指南目标 2.1 防范学术不端，加强诚信治理以防范AIGC不当使用作为切入点，加强科研诚信意识教育，推进学术诚信治理，推进科研活动有序开展。 2.2 引导相关利益主体就AIGC使用达成共识明晰相关利益主体在学术期刊论文准备、写作、投稿、评审、出版、传播各环节应该履行的最佳行为实践，提供详尽、规范的AIGC使用指导。 3 原则 3.1 透明度和问责制 3.2 质量和诚信透明度和问责制是学术出版中AIGC使用最基确保质量和诚信是在学术研究中AIGC应用建本的原则。在学术研究到出版发行的过程中，所立信任的基础。从算法的设计和构建，到用于训有参与者（包括研究人员、作者、同行评议人和练AIGC的输入，再到实际应用中使用的输入，应读者）都应该了解并明确披露AIGC的使用情坚持问责和透明原则，并通过标识符或反馈等手况，透明度应该包括数据透明度（包括底层数据段表明AIGC的使用，保证学术研究的质量和诚信集、数据来源和数据处理方法），以及知识产权不受AIGC技术使用的影响。和版权材料的使用情况。问责制则是关键利益相关者应共同承担的责任，包括研究人员、资助者、政策制定者和出版商，应建立问责标准和相关信息。 3.3 隐私和安全隐私和安全是AIGC使用的基本法律原则。 02 原则｜行为框架/实践指导在使用AIGC时应尊重隐私和数据保护，包括数学术出版中AIGC使用边界指南 3.5 可持续发展据、隐私和安全影响评估，并通过适当的数据匿名来保护隐私、数据保护和安全措施来确保数据 AI系统的多学科性质使其非常适合解决全球关注的领域，如联合国可持续发展目标、碳中和安全。等。它还为公共和私营组织提供了提高效率的机会，以实现更大的生态可持续性和责任。AI系统 3.4 公平承载着造福全人类，包括子孙后代的承诺。为高使用AIGC时应秉持公平原则，避免偏见。由质量输入数据的供应商提供资金和其他奖励措于人工智能具有复制和放大偏差的风险，因此在施，如出版商创建的出版物和数据库，有助于提训练数据选择、算法设计、模型生成和优化、使取重要的可采取行动的知识。用过程中，应仔细评估和审查潜在的偏差来源，可持续发展应是AIGC本身的核心原则。为减并建立反馈机制，监测和审查可能的不公平现少重复和浪费，使用AIGC应避免过度依赖可能暂象，及时纠偏。同时，AIGC能够帮助提供诸如语时或永久不可用的数据，同时工具的功能模块应言润色等服务，减少此类文化或语言上的不公平基于公认标准和指南，以确保数据可查找、可访现象。问、可互操作和可重复使用。 4 行为框架/实践指导 AIGC可在研究开展及学术出版的各个阶段提供辅助作用（服务）。为了营造良好的科研氛稿前的研究开展和论文撰写阶段使用AIGC提出建议。围，防患于未然，避免/减少不当使用AIGC行为的发生，本部分提供一个符合道德行为的框架，以帮助作者、研究机构、学术期刊出版单位等就如何合规合理地使用AIGC做出指导。 4.1 研究开展和论文撰写阶段本部分以指导性建议为主，对研究人员投 03 4.1.1 资料收集 AIGC所提供的资料是基于大数据和语言模型生成和抽取的，其准确性和真实性缺乏考量和验证，需要研究人员确认内容的可靠性。文献调研：可以借助AIGC收集关键词或主题相关参考文献，并进行分类和梳理，总结参考文行为框架/实践指导学术出版中AIGC使用边界指南献结论，为研究人员提供参考；帮助研究人员发统计方法的建议和指导：AIGC可以根据问题现新的信息来源，并跟踪研究领域最新进展。需和领域知识，为研究人员提供统计分析建议和指要注意的是，由于AIGC提供的参考文献可能是虚导，但只是基于其所学习的语言模型和知识库，构或过时的，使用AIGC支持其文献综述的研究人可能存在缺失和不准确。因此，研究人员需甄别员必须阅读并验证AIGC提供的每项建议和参考文 AIGC所提供的统计分析建议的可行性，结合其他献的真实性。可靠统计分析和数据挖掘工具进行判断，或向专概念解答：AIGC可以回答一些简单的概念问题，为研究人员在构建章节内容时提供帮助。但业的领域专家寻求指导和帮助，最终判断是否采纳AIGC提供的建议。要注意，AIGC是基于已有研究提供的概念解答，研究人员在使用时要注意概念的适用性。观点类资料调研：AIGC可以采集文本中公众或专家对某些主题的观点、情感及情感倾向的相关数据资料。研究人员必须监督和控制AIGC提供的观点资料，必要时对AIGC提供的资料进行清洗处理，以确保研究人员使用的资料是有效、无偏的，防止传播不正确、有偏见或歧视性的信息。 4.1.2 统计分析 4.1.3 图表制作辅助生成图表：根据数据特点和作图目的， AIGC可以依据不同的运用场景，推荐合适的统计图表类型，直观呈现数据结论，有效地传递信息，从而节省研究人员制作图表的时间，提高写作效率。但蛋白质印迹实验图、细胞技术分析、组织细胞染色图等实验生成类图像必须由真实开展的实验研究获得，不可通过AIGC直接生成。图表格式处理和优化：根据数据量和图表需某些情况下，研究人员已经收集了数据，但求，研究人员可以使用AIGC辅助调整图表样式，不确定用何种最佳的统计分析来验证其假设。研对图表进行格式化处理，例如调整字体大小、数究人员可使用AIGC来选择最合适的分析方法或据标注、添加图例、更改颜色等，使图表更清进行统计分析，但所用的数据必须是研究人员进晰、美观，更易于理解。行实验并收集的，并且研究人员需要对AIGC所提供的统计分析结果进行验证，确保统计结果可靠性。数据分析和解释：研究人员可以借助AIGC解释数据，计算统计学指标，进行一些简单的数据分析和统计结果的描述，但不能取代他们自己对数据的解释。 4.1.4 文字撰写在论文撰写过程中，AIGC可用于提高文本可读性、启发内容逻辑性、提供句式等，以供研究人员参考撰写，但不应该用来产生研究假设、直接撰写整篇论文文本或解释数据、得出科学结论等。所有属于科学或智力贡献范围的任务都应该 04 行为框架/实践指导学术出版中AIGC使用边界指南由研究人员自己来完成，特别是论文重要部分的对，在学术写作中帮助作者完成规范引用的相关撰写。使用AIGC的目的只是如何以最佳可读的方任务，减少人工操作的繁琐，提高论文的质量和式传达作者生成的科学知识。研究人员的效率。 4.1.5 语言和润色 4.2 投稿阶段学术语言服务：语言不应该成为学术交流与科学传播的障碍。AIGC可以作为高标准语言检查 AIGC可以在投稿阶段提供帮助，但这需要研究人员的专业判断，并承担最终的责任。器，提高稿件可读性和写作质量，以消除研究传播中的语言障碍。目前，AIGC的学术语言服务可以帮助非英语母语的研究人员润色稿件使其符合国际期刊的投稿要求。但研究人员也需注意，当手稿（全部或部分）输入到公共AIGC中时，有可能成为大型语言模型训练语料库的一部分。 4.1.6 引文整理当涉及AIGC推荐的任何内容时，“引用相关 4.2.1 作者署名在没有人类研究人员指导的情况下，AIGC不能独立发起一项原创性研究，也不能对已发表的作品或研究设计负责。同样，它在绝大多数国家也没有法律地位或持有或转让版权的能力，而这些责任和能力是对作者身份的基本要求。因此，根据 COPE对人工智能工具的立场声明，AIGC不能履行文章作者的角色，也不能被列为文章作者。性”至关重要。研究人员需确保引用的内容与论文切实相关，包括引文和被引内容的真实性。引文格式检查：AIGC可以检查引用的文献是否符合学术论文的引文格式，并指出可能存在的错误或缺陷。自动引用生成：AIGC可以帮助研究人员确定引用来源，并根据作者提供的文献信息，自动生成符合学术论文引文格式要求的引用。但AIGC仅应作为一种辅助工具，作者仍需仔细核对引用文献的格式和内容，以确保引用符合学术论文的规范要求。 4.2.2 规范引用所有来自其他来源的内容必须经过仔细确认、恰当引用标注。研究人员对于AIGC所提供的资料需要验证其真实性和准确性，并对其底层数据来源、工具、获取方式、处理等进行引用标注。 4.2.3 披露和声明对AIGC使用情况进行充分、正确的披露和声明。参考文献自动排序：AIGC可以按照指定的引应明确以下内容：使用者；人工智能技术或文格式自动对参考文献列表进行排序和顺序校系统（需注明版本号）；使用的时间和日期；用 05 行为框架/实践指导学术出版中AIGC使用边界指南于生成文本的提示和问题；文本中由AIGC编写或保数据的来源准确、完整且真实可靠。数据检查共同编写的部分；论文中因使用AIGC而产生的想的侧重点包括数据的收集和处理方法、实验、测法。若作者使用此类工具撰写了稿件的任何部量精度和准确性，以及数据存储方法等。分，则必须在方法或致谢部分中公开、透明、详细地进行描述。对于有实验过程的研究性论文，研究人员应及时、准确、详细地记录实验和数据收集过程，避免记录错误或遗漏等问题，并将实验数据和过【模板】程记录一并提交。声明：在本作品的准备过程中，作者使用了[AIGC具体工具/服务名称]来[使用目的：如文献调研/数据分析/图表制作等]。使用此工具/服务后，作者根据需要对内容进行了审查和编辑，并对出版物的内容承担全部责任。 4.2.4 同行评审 4.3.2 AIGC相关材料提交、存档鼓励研究人员（在某些情况下）分享他们的研究数据，包括但不限于：原始数据、处理后的数据、软件、算法、协议、方法、材料等。特别是由AIGC生成的文本、图片、程序等内容应作为补充材料提交、存档。在同行评审过程中，作者可使用AIGC帮助回复评审意见，但作者需对同行评审意见的回复负责，如果回复受到质疑，也应由作者证明其回复是合理的。在同行评审过程中，AIGC可以将评审意见进行汇总和分类标注，帮助作者快速理解评审意见，并为作者推荐合适的回复内容，从而高效地回应评审意见。 4.3 论文发表/出版后 4.3.1 数据仓储和共享在符合相关要求的前提下，鼓励作者公开原始数据，以审查防范数据污染、造假的问题。 4.3.3 AIGC产生内容的检测和发现鼓励期刊和编辑使用新的工具来检测、识别由AIGC产生的内容。建立针对AIGC工具的审查程序，开发相应技术，进行人工审查和自动化检测。检测结果作为辅助判断依据，根据论文的使用范围、期刊的要求、论文整体水平等综合研判处理。研究人员使用AIGC直接生成的稿件文字等资料必须提供明确的披露和声明，否则将构成学术不端行为。例如，从AIGC中提取新生成的文本作为稿件内容而未注明的，将被视为抄袭。作者应该对论文中的数据进行严格检查，确 06 总结学术出版中AIGC使用边界指南 5 总结 AIGC属新兴事物，涉及多元主体，其在学术涉及学术出版链条中如作者、期刊、编辑、审稿出版中的使用场景具有多样性，AIGC使用的边界人、传播者、受众及科研管理者等各责任主体，也存在大量模糊地带尚待厘清。中国科学技术信如何厘清各方关系，明确主体责任和制约关系，息研究所联合爱思唯尔、施普林格·自然、约翰威清晰划定责任对于促进各方明确自身职责有着重立等国际出版集团，在征求有关各方建议的基础要意义。同时，由于对不当使用AIGC技术的处理上，从原则与行为框架/实践指导等方面对AIGC 尚未达成共识，对涉及的各种不当使用情况提出技术使用提出建议，以达到防范学术不端、加强适当的处理建议对推动责任落实也有着至关重要诚信治理和引导相关利益主体就AIGC使用达成共的作用。识的目的。 AIGC技术与工具仍在不断革新和发展中，本值得注意的是，制定本指南的目的是为AIGC 指南的适用范围、行为框架也需要定期调整以应技术使用提供一个启发式的框架，还有一些更为对这一持续变化带来的新挑战与新问题。积极呼具体、实践性的问题有待进一步研究。比如，吁各方对本指南提出建议和反馈，帮助我们不断 AIGC技术在学术出版应用中涉及的主体众多，既完善AIGC技术使用指南，给相关主体提供更为具包括AIGC技术开发、应用的所有者和使用者，也体、详实的实践框架，以防止学术不端的发生。 07 致谢学术出版中AIGC使用边界指南 6 致谢本指南在中国科学技术部科技监督与诚信建 A lic e H e n c hley女士、胡泽英女士、 Ste ve n 设司支持和指导下，由中国科学技术信息研究所 Inchcoombe先生、Imogen Rose博士、Henning 牵头，联合爱思唯尔、施普林格·自然、约翰威立 Schoenenberger先生、Katrin 国际出版集团（排名不分先后）的团队协作完士、Niels Peter Thomas博士、张立先生；约翰成。主要贡献人为：中国科学技术信息研究所的威立国际出版集团的Michael Streeter先生、郑雯雯博士、杨代庆研究员、高继平研究员、王 Joyce 美玲博士；爱思唯尔的Peter Lee先生、康晓伶女自国内外科技出版领域和科技管理领域的专家学士、李季萌女士、研究诚信和出版伦理专家中心者和资深人士对本指南的内容给予了宝贵建议和的研究团队；施普林格·自然的Nick Campbell博指导，在此表示由衷感谢。 Stienemeier女 Griﬃn女士、王宇女士。同时还有多位来士、Chris Graf先生、Arjan Grootenboer先生、 08 中国科学技术信息研究所科学计量与评价研究中心北京市海淀区复兴路15号邮编：100038 电话：+86-10 58882604 联系人：郑雯雯邮箱：zhengww@istic.ac.cn