《研究生通讯》2021年第二期(vol70).pdf
P值的相关思考 刘 / 鲁静 刘婷 吕璐成 ……2 眼见不一定为实 李 / 婕 柴苗岭 涂志芳 ……4 第四范式:智能情报发展现状与趋势 李 / 子星、徐曾旭林、 ……23 人类与病毒亲密接触的那些事 ……18 刻在芯片上的电路图案,记录着工程师的研发人生 】 ……26 虚妄的爱与世界里的美梦 妖怪 生 【活栏目 ……1 以美日为分析 —— ……11 邢思思等 ……7 面向数据密集型科学的信息资源建设 】 对象 方 / 思越 胡雅敏 李明菲等 学术栏目 【 】 辛丑牛年 2021• 中国科学院文献情报中心新春致辞 李 / 猛力 刘细文 【卷首语 ……20 录 简讯栏目 【 】 情深意重 再度启程 ……16 ……17 拳拳爱国情 声声入我心 相遇国科 期盼同行线下联谊活动 目 ……15 求 【职讲堂 CATALOG 】 干货满满的第二讲,你听了吗 ……27 教研岗位求职怎么做,优秀师兄告诉你 ……28 主编:刘鲁静 责任编辑:赵亚娟 执行主编:任娇菡 副主编:严格 美编:贾毓洁,梁静,黄珂敏 卷首语:新春致辞 中科院文献情报中心新春致辞 ——2021•辛丑牛年 “江汉春风起,冰霜昨夜除”。值此2021 年新春之际,我们谨代表中科院文献情报中心党 政领导班子向中心全体职工、离退休同志、博士 后、研究生和关心支持文献中心发展的社会各界 朋友致以新春的祝福和诚挚的谢意! 2020年是深刻影响我国社会发展的极不平 凡的一年,我们每个人的命运是如此紧密地与国 家命运生死相连。这一年,新冠肺炎席卷全球, 我们目睹了疫情对世界各国人民造成的灾难和国 际政治经济格局的重大变化,我们更见证了中华 儿女在党中央的坚强领导下,用“生命至上、举 国同心、舍生忘死、尊重科学、命运与共”的伟 大抗疫精神,夺取了全国疫情防控的决定性胜利 。“一节复一节,千枝攒万叶”,我们文献人作 为中华儿女的一份子,和全国人民一道积极投入 抗疫斗争,为疫情防控科研攻关提供文献情报支 撑,以保障我院抗击新冠肺炎科研活动顺利开展 。在战略决策支撑方面,我们启动了关于突发公 共卫生事件应对的情报研究工作,积极建言献策 ,充分发挥智库的重要作用;在科研攻关组织方 面,我们在全球视野下梳理分析我院在冠状病毒 诊断技术及疫苗、抗体、药物研发方面的相关科 研力量和科研成果;在科研攻关支撑方面,我们 为兄弟院所联合开展的病毒分析仪研发提供关键 技术情报服务;在科技信息方面,我们主动向科 研一线提供文献保障服务,推出多种可支持远程 获取数字学术资源方式,有效解决疫情期间数万 研究人员居家办公访问文献数据库受限问题;在 专题信息平台方面,我们建设并开通了新冠病毒 知识服务与科研攻关交流平台,提供科技大数据 专题服务,支撑我院新冠病毒科研攻关组信息共 享与交流。与此同时,我们积极落实各项发展任 务,不断提升服务能力:全院文献资源保障稳定 有序,开放资源保障规模与服务效果稳步提升; 基于科技大数据计算基础支撑平台与慧系列的知 识服务成效显著;情报研究专业化能力迈上新台 阶;持续发挥服务科研创新的前沿阵地作用,推 1 /page 进所级文献情报服务能力进一步提升;作为核心力量参 与国家科技资源战略保障与服务,发挥引领示范作用, 推动国家科技信息服务发展;在科研诚信与伦理治理方 面的研究与服务支撑我院相关管理工作;图书馆围绕资 源、空间、服务核心“三要素”全面展开阵地服务;期 刊完成全年出版任务,总体学术质量达到历史新高;科 学文化传播工作取得长足进展。 2021年是中国共产党百年华诞,是我国实施“十四 五”规划和实现2035年远景目标的开局之年,也是我院开 启全面实现“四个率先”新征程的关键之年。党的十九 届五中全会把科技自立自强作为国家发展的战略支撑, 并在“十四五”规划建议中明确提出“构建国家科研论 文和科技信息高端交流平台”,中央经济工作会议也将 强化国家战略科技力量列为2021年经济工作的首要重点 任务。作为中科院的一员,我们将承担更艰巨的任务, 也将面临前所未有的发展机遇。2021年开年伊始中心作 为院四个试点单位之一,启动实行党委领导下主任负责 制的新体制。这一转变是院党组赋予我们的一项政治任 务,我们必须统一思想,统筹谋划,积极推进,积极探 索新的治理结构,不负院党组的信任和嘱托。 心有大愿,不计风雨。新的一年我们将继续坚持以 习近平新时代中国特色社会主义思想为指导,坚定不移 贯彻落实党的十九大和十九届二中、三中、四中、五中 全会精神,增强“四个意识”,坚定“四个自信”,做 到“两个维护”,坚持“四个面向”,按照“两加快一 努力”要求,认真执行院党组的重大决策和战略部署, 为院“十四五”规划和“率先行动”计划第二阶段的顺 利实施做好强有力的支撑保障。我们将致力于建设国家 科技知识服务中心建设,打造国家级高端学术交流平台 ,成为支撑院科技决策和管理的可信赖的情报研究与服 务力量,成为国家科技文献保障平台建设的主力军,不 断续写中心的新篇章,以优异的成绩庆祝建党100周年! 李猛力 刘细文 2021年02月 P值的相关思考 刘鲁静1,2 刘婷1,2 吕璐成1,2 (1. 中国科学院文献情报中心,北京 100190;2. 中国科学院大学 经济与管理学院图书情报与档案管理系,北京 100190) 【摘要】P值是“显著性检验”理论体系的一个重要概念,被广泛应用于心理学、自然科学、 临床医学、教育学、社会学、经济学等领域。近年来,由于P值的局限性、P值的误解、P值的 滥用等问题,导致学者和部分杂志的主编对P值是否仍具有统计学及学术价值提出质疑。本文 通过对P值的剖析,对P值替代方案的可行性进行分析,并通过阐述P值在图情领域中的应用现 状,以期全方位解析P值的现实价值。结果表明,无论是否采用P值进行假设检验或采用何种补 救措施,都无法从根本上解决统计数据存在的问题,只有维护良好的学术氛围,才是解决统计 数据问题的长久之计。 【关键词】 P值;假设检验;局限性;图情领域 统计学是应用数学的一个分支,主要通过利用概率论建 立的数学模型,收集所观察系统的数据进行量化分析、总结 ,做出判断和预测。统计学除了描述统计外,还可以描述推 断统计,推断统计是统计学的精华和使命。在实际研究场景 中,统计学知识被广泛应用在物理、社会科学和人文科学各 门学科中。 1.P值是什么? P值是当原假设为真时,所得到的样本观察结果或更极端 结果出现的概率。美国统计学会的声明中给出了P值的非正 式定义:P值是基于某个特定统计模型,对数据的某个统计 量(如两个对照组的样本平均值之差)与观测值相等或比观 测值更极端的概率。某种意义上说,P值体现了原假设成立 时研究者看到样本的奇怪程度,P值越小所获得的样本在原 假设成立的前提下出现的可能性越小;当P值小到一定程度 时,可认定其假设是错误的。 P值是统计推断中普遍依据的一个指标,是“显著性检 验”理论体系的一个重要概念。费雪 (R.A. Fisher)[1]在 1925年最早明确给出P值的含义,他指出当原假设为真时,得 到的样本观察结果或更极端结果的概率即为P值。费雪的显 著性检验是通过反证逻辑来实现,通常根据P值来做出判断 ,如果P值小于显著性水平α,则拒绝原假设。费雪提出P值 8年后,奈曼和埃根·皮尔逊提出假设检验理论(简称N-P假 设检验)[2],认为考虑一个原假设的前提是先构想至少一个 合理的备择假设(alternative hypothesis),往往把希望拒绝的 假设作为原假设。他们引入两种错误(第一类错误和第二类 错误)完善了假设检验理论,其中第一类错误是指拒绝的假 设作为原假设(α),第二类错误是指接受了一个错误的原 假设(β)。统计效力是在研究假设为真的情况下, 某研究产 生统计显著性结果的概率, 即拒绝错误的零假设的概率。统计 效力与犯第二类错误概率之间的关系是:效力 =1-β。效力 越大,犯第二类错误的概率就越小;效力越小,犯第二类错 误的概率就越大。 N-P假设检验与费雪的显著性检验存在较大的不同,彼 此的观点完全不相容。1940年,林奎斯特 (Lindquist) 首次 尝试横跨互不相容的费雪体系和奈曼-皮尔逊体系,对两者进 行糅合,经过很多学者的努力逐步衍生出一种新的假设检验 模式,即零假设显著性检验(Null Hypothesis Significance Test ,NHST)[3]。20世纪50年代至70年代,零假设显著性检验 逐渐成为各类教科书中的标准化内容和实证研究的普遍应用 模式。该理论的基本思想是,实现制定显著性水平(通常为 0.05),然后计算P值,若P值小于事先制定的显著性水平, 则拒绝原假设(零假设)。值得一提的是,NHST既不完全 是费雪式的显著性检验(NHST使用备择假设),也不完全是 奈曼-皮尔逊式的假设检验(NHST未要求计算功效大小,不 完全要求使用拒绝域法,可采用费雪的P值法拒绝原假设), 而是一种杂合体。自此,建立原假设与备择假设、选定检验统 计量、选择显著性水平、确定拒绝域或计算P值、做出统计决 策,逐步成为标准化的假设检验步骤[4]。 通常零假设表示为“无效应”或“无差别”,此外,一般 情况下零假设是想推翻的,备择假设是想证实的,两者形成鲜 明对照。在假设检验中,常把一个被检验的假设称为原假设或 者零假设,用 H0表示。通常将不应轻易加以否定的假设作为 原假设,当 H0被拒绝时而接受的假设称为备择假设,用 H1表 示,它们常常成对出现。例如,H1信息意识与受教育程度成 正比,H0信息意识与受教育程度无关。根据总体分布情况及 方差是否已知,选择合适的统计量。当总体方差σ2已知时, 选用Z统计量;当总体方差σ2未知时,则选用t检验统计量。 显著性水平α表示假设H0为真时拒绝原假设的概率,即拒绝 原假设所面临的风险。检验假设的步骤是[5]:(1)确定研究 问题。零假设(H0)和备选假设(H1);(2)证据是什么,在 零假设成立的前提下选取合适的统计量,并计算样本发生的可 能性(即P值);(3)选择判断标准,假设检验常用的显著性 水平(α)判断标准是5%;(5)得出结论,P值 < α 则小概 率事件发生,拒绝原假设(H0)。 2.“喷香”的P值 P值是假设检验重要的工具,通常作为检验决策的依据, 被视为检验统计假设的“黄金准则”,被广泛应用于心理学、 自然科学、临床医学、教育学、社会学、经济学等领域,很多 领的应用利用实验设计思想开展因果效应的检验。检验中实验 组与对照组的差异可能代表真实的因果关系,其差异也可能是 采样误差引起的随机波动。通过直接比较P值与给定的显著性 水平大小而做出是否拒绝假设的判定,相对于比较检验统计量 与临界值大小的方法更为方便,并且随着统计软件普及,如 SAS、SPSS等的分析结果中均会给出P值,其逐渐取代传统临界 值法,获得了学界的广泛应用。 3.“不香”的P值 Cohen(1994)在《地球是圆的(P<0.05)》一文中首次 公开批评P值并引起了广泛关注,其观点成为讽刺滥用P值进行 统计推断的经典文献[6]。2016年,美国统计协会在《美国统计 学家》上发表《关于统计显著性与P值》的声明,警告人们不 要滥用统计显著性和P值。2016年3月,谭坤编译了《美国统计 学会权威发布:P值应该这么用,学界有错须改正》的有关内 容,并发表在微信公众号“科研圈”。2018年1月22日,美国 2 /page 政治学顶级学术期刊《政治分析》在官方twitter上宣布从当年 第26辑起禁用P值,其主要原因是:“p值本身无法提供支持 相关模式或假说之证据”,但并未提出替代P值的方案。2019 年,《Nature》杂志发表了一篇题为《scientists rise up against statistical significance》的文章,旨在号召科研工作者放弃“统 计显著性”[7]。 3.1 P值的局限性 当前的主流研究普遍提出摒弃P值作为检验统计假设的 “黄金准则”,因为P值并不像大多数研究者认为的那样可靠 且客观。P值在应用过程中主要存在如下局限性[8]:1)假设 检验对样本量具有较强依赖性,只要样本容量足够大,就能 得到拒绝原假设的统计显著性结论;2)P值混合了样本容量 和效应量的影响,当效应量很小但样本容量很大时,也极易 得到显著性结论,因此不能简单根据显著性结果而判定存在 真实的效应;3)P 值代表的统计显著性并不意味着结果可 重复,假设检验得到的是样本可能性而不是总体可能性,并 没有考虑结果的可重复性。 对于导致显著性“差异”结果的因素,主要涉及以下三 个方面 :1)效应大小。效应量越大随机波动的可能性就越 小,如果实验组具有较大的干预效应,这种大效应量的影响 往往很显著,但仅考虑其本身的效应是不够的,还需要设置 对照组进行对比分析;2)样本量大小。实验组与对照组之 间差异的显著性明显受到样本容量的影响,较大样本量能够 检测到较小的影响效应,如果样本量足够大,较小的实验或 处理效应也可能非常显著;3)数据的变异性。数据本身的 变异性越大,受随机误差的影响,实验组之间的差异往往越 大,实验组与对照组之间的较大差异可能归因于随机误差而 不是实验或处理效应。 3.2 P值的误解 由于P值掺杂了费雪学派和N-P学派的思想,本身存一定 的“局限性”,使得研究人员对其存在一些错误认识,进而 导致实际应用中的误用甚至是滥用[9]。 误解一: P 值是 H0成立的前提下,统计量获得现有数据 以及更不利于零假设的概率,即 P( D | H0) 。零假设成立的可 能性是在现有观测数据下 H0成立的可能性,应该是条件概率 P( H0| D) 。而 Bayes 公式需在实验前已知零假设的先验概率 P( H0) ,才可以计算 P( H0| D) 。 误解二:某一研究中拒绝原假设,并不意味着在另一项 重复性研究中一定能得到拒绝原假设的结果。对于同样的实 验经过多次抽样会得到不同的样本,而假设检验对样本容量 又有较大的依赖性,随着样本不同 P值也会发生变化。除此 之外,同样的实验重复多遍,由于影响实验效果的因素存在 不确定性,也不能确保每次实验都能得到显著性结果。 误解三:如果所有实验的显著性水平α都取0.05,则全世 界所有的实验研究犯第一类错误的概率都小于等于5%,这显 然不可能的。因此在分析不同问题时,要根据实际情况和自 己掌握的证据进行不同的考量,选择适合的显著性水平α。 误解四:P值既受效应大小又受到样本容量的影响,对一 个样本容量很大的样本而言,较小的效应也可能产生统计上 的显著性,此时的统计显著性并不能意味着总体效应很大; 而对一个样本容量很小的样本来说,即使检验结果不具有统 计显著性,但也可能具有实际意义。统计意义和实际意义是 两个不同的概念,不能混为一谈,下结论时不能只注重统计 显著性,而应把统计结果和实际意义结合起来。很多统计结 论受到样本量的影响,所以不能因P值小就断定总体存在明显 的实际效应,还需考虑其他影响因素。 误解五:P值不能度量某个研究假设为真或假的概率,也 不能度量数据仅由随机因素影响的概率。研究人员非常希望 将P值转化成一个“原假设”为真的证据,或者能够度量观测 数据仅由随机事件造成的概率,但P值两者都做不到,P值只 能解释数据与特定假设之间的关系,并不能解释假设本身。 3.3 P值的滥用 滥用是P值面临的另一个较大问题。在万方数据库中,限 定主题字段搜索包含“值得临床推广”的论文,2016年为13 万篇,而截至2021年4月7日已增加至61万篇,增长速度迅猛 。P值是临床医学研究中最重要的量化指标之一,当一个临床 研究完成后,研究人员普遍关注的一个问题是:“P值是否小 于0.05?”,并将结果简化为一个二分类结论:“结果是阳 性,或是阴性”。更有甚者,部分研究人员在得到P<0.05的 结果后,就得出了“值得临床推广”的结论。研究结果是否 足够改善临床实践,统计结果达到显著性水平(P<0.05)是 必要的,但还远远不够。 3.4 统计数据的谎言 著名统计学家迪斯雷利(Disraeli)曾经说过,“世界上 有三种谎言:谎言、弥天大谎和统计数据”。收集统计数据 是一项复杂而精细的工作,每一步都有出错的可能。即使所 有的细节都万无一失,最终得到的数据里也会隐藏大量的陷 阱。如果盲目地对收集到的统计数据进行分析,有时会得出 一些明显与事实不符的结论。统计数据可以通过采用不同统 计口径的、忽略规模基数的、图表扩大化造成的视觉误差进 行数据统计,从而造成统计数据的“误差”。统计数据本身 是合理的,且能在一定程度上反应事物发展的客观事实情况 。但问题是采集数据、使用数据以及加工数据的人,导致了 统计数据可以有“空子”可以钻。许多科研人员将P值视为描 述统计差异的“黄金准则”,为让自己的研究结果满足这一 “黄金准则”而使用某些不正当的手段,比如增加样本容量 、更换统计方法、选择性呈现结果等,这些自欺欺人的错误 行径就是典型的 “P值操纵”,也是统计数据会说谎的表现 之一。 4、P值替代方案的可行性 P值在实际的应用过程中,存在误解和较严重的滥用问 题。为提高研究结论的可靠性,一些学者提出P值的补充或替 代策略,用以解决P值应用中的各种问题。常用手段主要包括 以下几种:降低显著性水平、个性化显著性水平和禁用P值等 [10-12]。有学者提出的,将现行广泛认同的显著性水平从 0.05下降至0.005,以提高研究结论可靠性的解决方案,是一 刀切的政策。有研究表明,显著性水平从0.05下降至0.005将 指数倍的增加研究人员的时间、人力、经济成本。如果研发 资金的支持力度不变,则能够获得支持的科研项目将大幅减 少。面对飙升的经费需求,研究者们势必会反复斟酌急需立 项、可能获得收益或有把握实施成功的项目,但这势必严重 阻碍创新的脚步。个性化显著性水平的理念则认为,应该根 据实际情况允许研究者根据研究设计和数据解读的考虑,自 行设定合适的检验水准α[13-14]。这种改进策略固然能在一 定程度上反应研究结果的真实情况,但却无法保证个性化显 著性水平的合理性,结果是既缺失了公信力,又无法保证结 论的科学性。另一种极端的声音认为,应该彻底摒弃P值,并 在科学研究中禁用P值,如国际知名杂志Political Analysis、 Basic and Applied Social Psychology(BASP)就通过官方渠道表 示,P值本身无法提供支持相关模式或假说之证据。但当 BASP的主编被《Nature》问及“禁用P值之后怎么办”时,主 编“淡定”地回答“我也不知道用什么样的统计方法可以取 代P值”。在没有合理方法替代P值的情况下,贸然片面的取 代P值本身就是对科学研究的不符责任。 虽然学界对目前P值的滥用和局限性颇有微词,但P值只 是用于假设检验的一种检验标准,诸多科学研究仍旧需要通 过P值对结果进行说明,且没有合适的方法完全取代现有的P 值评价体系。P值是用来说明数据与假设之间关系,而不解释 假设本身,因此分析数据时不能仅计算P值,而应同时采用其 他适合的或可行性更高的方法对结果进行分析。正确结论的 推断依赖于报告的全面性和透明度,研究者需要公布研究中 所有的假设、数据收集和统计分析过程。统计数据是科研工 作者为了研究需要收集的数据,如果研究人员不遵循学术规 范、严守学术道德的学术风气,无论是否采用P值进行假设检 验或采用何种补救措施,都无法从根本上解决统计数据存在 的问题。因此只有维护良好的学术氛围,才是解决统计数据 问题的长久之计。 3 /page 5、P值在图情领域中的应用现状 为推进高等教育内涵发展,2019年4月教育部、科技部等 13个部门正式联合启动“六卓越一拔尖”计划2.0,其中新文科 建设是教育部推出的“四新建设”之一[15]。2020年11月“新 文科建设工作会议”在山东威海召开,会议指出新文科建设是 我国提升综合国力、建设高等教育强国、坚定文化自信、培养 时代新人、文科教育融合发展的重要基石。图书情报与档案管 理一级学科可以借助国家建设新文科的契机,探索一条独具特 色的新文科建设模式[16]。 从中国知网限定主题字段查询“P值”,检索到21261篇论 文,但其中只有7篇文章来自图情专业。对其分析后发现,图 情研究中P值的应用较少、文献偏老,且已有研究侧重采用卡 方检验等方法来计算P值,进而比较两个样本之间的差别。原 因可能是:1、图情领域数据收集困难,无法收集到能够真实 反映研究对象的数据;2、图情领域的研究对象大多没有客观 的定性或定量标准,而不是客观存在的物质,有唯一正确的答 案或结论,易通过重复和验证判断结论是否正确;3、精神是 人类特有的产物,迄今为止还没有科学客观的手段能够感知和 记录,因此无法即时且翔实的记录这一过程,更无法保证与其 本人完全一致。 6. 结语 P值作为科学研究的必备工具之一,自其诞生至今就一直 伴随着诸多争议。由于P值本身存在的局限性和科研人员对P值 的滥用,P值的弊端和危险性被期刊编辑和统计学家过分放大 。P值常见的问题其实也是统计数据的问题,片面全盘否定P值 而没有更好的替代方式是不可行的。图情领域作为人文社科类 的一个分支学科,需要借助国家建设新文科的“风口”,探索 一条以原有学科为基石的交叉学科发展新模式。 参考文献: [1] R. A. Fisher. STATISTICAL METHODS FOR RESEARCH WORKERS[J]. Science Progress in the Twentieth Century (1919-1933), 1926, 21(82). [2] Neyman J., Pearson E. S.. On the Problem of the Most Efficient Tests of Statistical Hypotheses[J]. Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character (1896-1934), 1933, 231(694-706). [3] Lindquist E F . Statistical analysis in educational research[M]. OXFORD & IBH, 1940. [4] Ziliak D T . Section on Statistical Education – JSM 2009 The Cult of Statistical Significance. 2010. [5] 程开明, 李泗娥. 科学研究中的P值:误解、操纵及改进[J].数量经济技术经济研究, 2019, 36(07):117-136. [6] Cohen, Jacob. The earth is round (p[J]. American Psychologist, 1994. [7] Valentin, Amrhein, Sander, et al. Scientists rise up against statistical significance[J]. Nature, 2019, 567(7748):305-307. [8] 彭佳师. P值争论对生物统计学课程教学的影响[J]. 生物学杂志, 2020, v.37; No.218(06):124-126+133. [9] 鲍贵, 席雁. 统计显著性检验:问题与思考[J]. 南京工程学院学报(社会科学版), 2010(04):27-32. [10] Gandevia Simon, Cumming Geoff, Amrhein Valentin, Butler Annie. Replication: Do not trust your p-value, be it small or large[J]. The Journal of physiology, 2021. [11] 孙红卫,董兆举,赵拥军.对统计假设检验的误解与误用[J].中国卫生统计, 2012, 29(01):147-148+150. [12] 徐波, 沈叔洪. 统计P值的意义及常见统计学表述错误辨析[J]. 浙江医学, 2011(8):1252-1253. [13] 彭佳师. P值争论对生物统计学课程教学的影响[J].生物学杂志,2020,37(06):120-122+129. [14] 权朝鲁.效果量的意义及测定方法[J].心理学探新, 2003(02):39-44. [15] 教育部.“六卓越一拔尖”计划2.0启动大会召开: 掀起高教质量革命 助力打造质量中国[EB/OL].[2021-03-31]. www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/moe_1485/201904/t20190429_ 380009.html. [16] 程焕文,程诗谣.新文科建设与中国图书馆学专业教育的使命与核心价值[J].图书馆杂志,2021,40(04):4-8+27. 眼见不一定为实 李婕1,3 柴苗岭2,3 涂志芳1,3 (1. 中国科学院文献情报中心,北京 100190;2. 中国科学院成都文献情报中心,成都 610041; 3. 中国科学院大学经济与管理学院图书情报与档案管理系,北京 100190;) 【摘要】本研究以美国交通部长上班不环保 、硅谷骗局 、特异功能儿童 ,三个“眼见不一定 为实”的参考案例为研究对象,通过搜集国内外相关报道,针对每个案例所使用的研究方法 、研究方法可能存在的问题、以及得出的结论进行分析,最后根据案例分析结果,总结提出 三点思考与心得体会:(1)对待研究应始终保持一种科学严谨审慎的态度,应当事先分析预 判研究中可能存在的误差,进而采取有效的误差控制机制避免其对研究结果的影响;(2)应 当对所获取的信息保持高度的觉察和敏锐度,尽量采用“第一手原始资料”开展研究;(3) 眼见不一定为实,信息的真伪需要通过科学严格的实验加以检验。 4 /page 1.引言 人们常说“耳听为虚,眼见为实”,但有时候“眼见不一定 为实”。一些研究往往采用低成本行为愚弄社会大众。研究人 员在接受信息时,需要从科学的研究方法中汲取营养,带着批 判性的眼光分析事件真相。 2.案例介绍及分析 本研究利用国内外三个有代表性的“眼见不一定为实”的案 例事件,从案例介绍、研究方法的选择和可能存在的问题两方 面对每个案例进行分析研究。 2.1 美国交通部长上班“不环保” 2.1.1 案例简介 美国新任交通部长皮特·布蒂吉格(Pete Buttigieg)承诺实 施“绿色”交通运输体系和能源基础设施建设,建议按行驶里 程征收“车辆行驶里程税”,以此减少碳排放,改善空气污染 。然而在做出该承诺后不久,4月1日,布蒂吉格在去白宫参加拜 登的内阁会议路上,被CNN驻白宫记者DJ Judd 和当地电视媒体 拍摄到,他的安保人员从一辆SUV的后备箱取出自行车,布蒂吉 格完成骑行前的装备准备工作后,骑车前往白宫。镜头中可见 到,一名安保人员骑车随行、而两辆SUV也紧随其后 。一时间 ,两段视频在Facebook、Twitter、the federalist 等网站上热传,保 守派人士Dinesh D’Souza 将CNN记者的视频上传到Rumble 视频 网站,附标题“Buttigieg CAUGHT Faking Green Lifestyle, Rides Bike to Work After Car Drops Him Off Near Destination” (布蒂吉 格被发现假装绿色生活方式,汽车将他送到目的地附近后骑自 行车去上班),随后转发到Twitter引发网友们的大量观看和评论 ,网友们称布蒂吉格表面呼吁民众节能环保低碳,甚至建议白 宫考虑征收“车辆行驶里程税”,而自己出行却选择SUV“换骑 ”自行车,是表里不一的“作秀”和“马戏表演”。 等,该案例只通过两段视频得出“布蒂吉格不环保、作秀、 马戏表演”的结论是片面的。如果记者长期拍到皮特部长先开 车、再骑车并且宣称自己是上班“环保者”、自我打脸,那么 再嘲讽他“作秀”是有依据的。 第二:该案例缺乏数据细节且研究者的观察和记录可能存 在主观选择和判断。根据DJ Judd和当地电视媒体的两段视频 ,我们可以看到,视频中并未找见布蒂吉格从SUV下车的镜头 ,也没有给出视频拍摄的地点,那么不排除布蒂吉格是在某地 停留(出席白宫内阁会议、并将自行车存放在SUV后备箱), 行程结束后从SUV取出自行车再次去往下一个目的地的可能性 (至少存在全程绿色出行可能性)。因为根据CNN记者发布 推特的时间北京时间2021年4月2日下午16:07,而当日拜登政 府的内阁会议的时间是下午 13:15,布蒂吉格的上班地点交通 部——位于华盛顿特区的东南方向,距离华盛顿特区西北部的 白宫距离是3英里(4828米),皮特全程骑车回到交通部的行 为,单纯从距离方面分析存在可行性、合理性。此外与其它研 究方法不同,观察研究方法存在许多因素影响观察研究结果的 信度和效度,例如此前已有前美国前总统比尔·克林顿慢跑两 个街区,然后被阿肯色州的安保人员接去约会,然后再下车慢 跑回大厦的政治人物“作秀”行为,因此,美网友或许在缺乏 更多细节数据和确凿的事实证据之前,基于以往政治人物的“ 劣迹”行为,对此次布蒂吉格“不环保、作秀”的行为,给出 主观选择和判断,可能影响了研究结果的信度和效度。 第三:即使布蒂吉格确实SUV中途换骑自行车,为了表演 、作秀。那么,比起全程开车出行,骑一段自行车,也是一种 迈向“环保”的进步;需要考虑到全程骑车上班的可行性(如 距离3英里是4828米、花费时间等),判断皮特部长是不是与 其宣称的“节能环保低碳”自相矛盾,还需要看他更多方面的 行为与表现。 第四:视频拍摄者CNN驻白宫记者DJ Judd在该视频的推文 中说,“Transportation Secretary Pete Buttigieg biked to the White House for today's Cabinet Meeting, it would appear.”(交通部长 Pete Buttigieg骑自行车到白宫参加今天的内阁会议,看来是这 样)。DJ Judd是布蒂吉格行为的唯一见证者,从他的视频和 推文中并没有找见布蒂吉格“作秀”的评价,而且除了这段视 频,DJ没有披露更多证据指出皮特在“作秀”。 第五:有一点可以肯定地是布蒂吉格倡导的“绿色”出行 方式,在他的安保人员中间是没有推行成功的。据报道 :仍 然有两辆“高排放量”的SUV“不环保”地护送布蒂吉格骑行 ,在向空气排放污染物,即:无论皮特是否乘坐SUV,他和他 的安保人员一行都是不绿色、不环保的。与他所倡导的“绿色 出行”言论相悖。所以从这一角度分析,实际上布蒂吉格此次 骑行并没有减少碳足迹,仍然是一种不环保的行为,或可理解 为某种程度的“作秀、表演”。 2.2 硅谷90亿美元的科技骗局 图1 交通部长布蒂吉格骑车上班 2.2.1 案例简介 2.1.2 使用的研究方法及可能存在的问题 该案例利用观察研究法对交通部长假环保行为进行揭示。观 察研究法通常是指不人为引入任何变化,不人为地对研究环境 进行控制,且研究人员不介入研究活动和研究环境之中。研究 者客观地观察被研究对象在自然环境中的自然行为。研究者据 此进行科学研究,从而揭示被研究对象上述行为的客观规律。 本案例中保守派人士和网友利用CNN驻白宫记者DJ Judd和当地 电视媒体拍摄的两段视频,得出交通部长上班“不环保”的结 论,但是仅依靠观察研究是不足以支撑此结论的,该方法的应 用存在以下问题: 第一:这是一次性观察研究,广大美网友还是保守派(名字 )得出布蒂吉格的行为“环保”或“不环保”的结论,都只是 基于DJ Judd和当地电视媒体的两段视频,这种“记录和观察布 蒂吉格在上班场合中的行为方式、行为过程”的研究方法,属 于观察研究方法,且该行为的出现频率为一次,实际上,观察 研究方法在确定了所观察测量的行为类型后,应当对有关行为 的以下特征进行系统性地观察和记录:行为的存在状况、出现 频率、增减趋势、表现强度、包含内容、不同行为的出现顺序 硅谷“创业女神”Elizabeth Holmes,19岁从名校斯坦福辍 学创办了一家名为Theranos的血液检测创业公司。2013年以来 ,一直以“隐身”模式推广自己的血液检测产品,对外宣称: 与传统的血液检测动辄数百美元的花费相比,Theranos最低只 需要2.99美元,并且只需刺破手指获取几滴血便可进行多达240 项医疗检查,堪称“颠覆性”技术产品,有望打造千亿美元的 新市场,该公司一度让硅谷甚至是整个世界为之沸腾。她不断 出来为自己公司的“终将改变世界”的新型血液检测技术站台 。吸引无数商业巨鳄为其投资。就这样,公司获得了大量资本 市场的青睐,10年来规模逐渐壮大,估值飙升。 直到《华尔街日报》记者John Carreyrou 2015年开始介入调 查[ , , ],并随后在华尔街日报上爆料了Theranos背后不为人知 的秘密,其他官方机构也相继介入调查,披露Theranos购买其 他公司设备、检测项目与传统无异等事实,戳破了在技术、产 品、运营、创新以及颠覆性等方面的谎言,这家公司最终土崩 瓦解。但这个看似不可能失败的故事,最终却被监管机构定性 为欺诈而尴尬收场。 5 /page 2.2.2 使用的研究方法及可能存在的问题 该参考案例中,记者John Carreyrou通过广泛的社会调查研究( 访谈)确认了“滴血识病”的骗局,把创业女神拉下了神坛。我 们不排除未来可能通过低成本及少量的人体样本实现疾病的预防 预测,但是在本案例中神话是建立在骗局基础上的。记者采用的 方法可以认为是“社会调查研究方法”,该方法是指在一个相对 较大的范围内通过直接询问形式对显示现象或态度进行测量的研 究方法。它的目的是对客观情况进行真实描述,包括问卷、访谈 等具体形式。例如Carreyrou用3年半的时间,对150多人进行数百 次深入访谈,包括60位伊丽莎白的前员工对公司前员工的大量采 访,对用过该公司产品的一位用户的访谈。但是该方法应用仍然 存在一定问题: 第一 ,调查人员范围不足。Carreyrou主要调查对象是前员工 ,而前员工因为和公司有密切的利害关系,存在趋利避害、保护 自己而不说实话的可能性,所以如何尽可能保证被调查者说话是 可信的。如何能够不受调查者的观点影响,保证被调查者的独立 主观意识是一个需要进一步控制的变量。 第二 ,调查对象主要是大量的前员工、只有一位用户,比较单 一、覆盖面不够。除前员工,还应包括大量的用户、投资人、监 管部门等相关方; 第三, 调查对象主要说了什么,Holmes是如何串通整个公司上 上下下那么多员工,继而瞒过精明的投资人、资本家、用户等, 需要结合更多的数据和细节加以判断。 2.3 人体特异功能假象 2.3.1 案例简介 改革开放之初,中国各地掀起了“人体特异功能”、“气功” 、“灵异事件”等超自然现象的讨论浪潮,各种有关特异功能儿 童的报道,如:“耳朵认字”、“耳朵辨别颜色”、“耳朵手心 和腋下认字”、“遥视”、“探宝”、“侦破”、“断案”,“ 用意念改变物质结构”、“改变生物习性”、“焊接金属”,“ 思维传感(你想什么,我知道什么)”等报道经常见诸报端。各 地纷纷开会讨论特异功能事件,并成立特异功能研究会。不少政 界、学界人物也参与进来,如著名科学家钱学森、时任国家科委 副主任的于光远,曾对“特异功能”、“气功”等问题展开激烈 讨论 。 钱学森对“特异功能”研究表现出极大热忱,他对“特异功能 ”持最坚定支持态度 。1982年5月5日,钱学森在写给时任中宣部 副部长郁文的信中表示:“我以党性保证,人体特异功能是真的 ,不是假的;有作假的,有骗人的,但那不是人体特异功能。人 体特异功能和气功、中医理论是密切相关的” 。钱学森晚年将其 对人体特异功能的研究内容出版成书《论人体科学与现代科技》 ,书中称:“特异功能”和“气功”的本质原理是人类运用意念 对人体或者其他物体进行控制。……这些意念力现象可以和量子 力学平行研究,是未来人类科学的发展方向。 钱学森等人对特异功能和气功的支持受到了时任国家科委副主 任的于光远等人的质疑和反对。1981年10月9日到10日,由国家科 委政策研究室出面,召开了“尊重科学,弄清真相”的人体特异 功能问题座谈会。会上,多个机构共同发起建立了“人体特异功 能问题调查研究联络组”, 由申振钰担任该调查组的负责人,负 责对“特异功能人”进行具体的调查实验。在几年的时间里,这 个调查组走遍全国各地,对声称有“特异功能”者进行了深入调 查和科学测试 。 本文的第三个案例即为这个调查组对北京著名特异人——王氏 姐妹进行的一项“双盲”调查实验,并对实验方案设计、实验实 施过程、实验结果进行了详细描述和记录,参与该项实验的科研 人员根据结果,得出4点结论,从而否定了王氏姐妹“耳朵识字” 的特异功能:(1)王氏姐妹、姜×根本没有什么“特异功能”; (2)王氏姐妹、姜×的所谓“特异功能”,实际上是“变相了” 的视知觉功能。(3)所谓“特异功能”并非奇异,是一般人都能 掌握并能表演的“低级魔术”,很容易被识破。(4)有关的宣传 报道,根本经不起客观实践检验。 图 3 1980年,上海科学 技术出版社下属的《自 然杂志》编辑部主持在 上海召开了第一届“人 体特异功能科学讨论会 ”。参与的“特异功能 人士”包括了唐雨、王 氏姐妹、姜燕等14位。 他们也登上了当年第4期 杂志的封面,右下为唐 雨。 王氏姐妹实验之后,测试组在北京、黑龙江、安徽、武汉等地 观看、参与了许多这类的表演和实验,其结果与王氏姐妹相似, 但该案例中没有披露其它特异功能测试的实验细节和实施过程。 2.3.2 使用的研究方法及可能存在的问题 本研究采用了实验研究方法对“人体特异功能”进行了驳斥。实验 研究方法是指,研究者通过一定手段来改变观察环境中的某个或某几个 变量,以观察这个或这些变量对其它变量的影响。实验研究的目的是, 确认独立变量与从属变量间的因果关系,从而解释客观事物间的关系, 解释客观现象。案例通过对“特异功能”王氏姐妹进行观察和实验测试 ,否认“耳朵认字说”的大部分报道。本文笔者对该案例进行分析,认 为该辨识方法可能还存在以下问题: 第一 只介绍 “王氏姐妹”这一组案例,缺少对其他被测者的大规模 案例分析,仅提及做了其它实验,但未披露实验细节,便否认了“耳朵 识字”的大部分报道,无法为第三方提供有效的检验基础。得出一项科 学的结论需要严格的实验和谨慎的回答,少量案例不足以支撑结论。 第二 根据零假设理论,“王氏姐妹”的实验结果增加了“耳朵识字 特异功能不存在”的可信度。但由于实验几乎不可能覆盖所有潜在的实 验对象,只能依据有限事例、在有限的条件下得出较为可信的结论,因 此不排除确实能够用“耳朵识字”的实验对象未纳入实验对象的可能性 ,即:“耳朵识字特异功能不存在”只是“尚未被证明为假”,我们应 在思想上和实践上仍然对出现“耳朵可以识字”的事例做好准备。 第三 由于该案例负责人申振钰受任于时任国家科委副主任的于光远 成立的“人体特异功能调查组”,而于光远和胡耀邦主席对“特异功能 ”是持明确的批评和否认态度的,因此研究者从心理上很难客观地否证 其希望证明的“人体特异功能不存在”的结论。 第四 本实验缺少参照组,应同时对没有特异功能的“正常人”进行 实验,再对两组实验结果进行对比,提高结果的可靠性。 第五 仅从物理学角度,缺少从医学角度的实验。应借助医学实验及 仪器设备对“特异功能”涉及的眼、耳等功能器官进行医学实验。 3. 思考与体会 基于以上三个案例,本研究总结得出以下三点结论: 第一,任何一种研究方法都不是完美的,都可能存在误差,科学研 究者应始终保持科学审慎的态度检验误差,采取严格的误差控制机制规 避可能误差,从而得到经得起客观检验的观点和结论。 第二,作为图情专业的博士研究生,我们应对任何一种来源的信息 及其真实性保持高度的敏感;应当对获取信息的真实性、可靠性、可信 性保持高度的觉察度和敏锐度。有意识地培养自己从多样化信息源中辨 识“第一手事实资料”的信息素养,掌握各种搜索引擎、数据库等信息 获取渠道的使用方式,学会综合利用多种研究方法判别、检验和利用信 息,在尽量保证数据真实、可靠、可经检验的基础上,得出尽可能可靠 的结果和结论。 第三,眼见不一定为实。我们在生活中观察到的现象只是某种本质 的外在表现,有真实的表现、也有虚假的表现。我们常常被一些虚假的 创新发明、科研成果的虚假表现所欺骗,究其原因可能包括思维惯性、 信息不对称、被动接受信息、辨别方法不多等因素,我们需要利用科学 的方法、批判的眼光、客观的结果来透过现象看本质,不能人云亦云。 6 /page 第四范式:智能情报发展现状与趋势 李子星、徐曾旭林、邢思思、刘慧慧、董美 【摘要】随着数据的爆炸式增长,大数据的概念逐渐形成,数据密集型的知识发现,即科学研究的 第四范式也应运而生。可以预见,科学研究范式的变革及大数据技术的开发和推广将对为科学研究 提供数据支撑的情报工作和情报学学科产生洗 礼式的影响。故本文从第四范式出发,基于大数据时 代对于情报学科发展的影响, 引出智能情报的概念,并从理论研究与实践动向两个方面来论述智能 情报的发展现状,最后在总结现状的基础上,指出了智能情报未来发展的重要方向和趋势。 关键词:第四范式、数据密集、智能情报 1引言 1.2 智能情报 18世纪中叶以来,人类历史上先后发生过3次工业革命。第一 次工业革命开创了“蒸汽时代”(1760-1840年),标志着农耕文明 向工业文明的过渡,是人类发展史上的第一个伟大奇迹;第二次工 业革命开启了“电气时代”(1840-1950年),使得电力、钢铁、铁 路、化工、汽车等重工业兴起,石油成为新能源,促进了交通迅速 发展以及世界各国之间更频繁地交流,重塑了全球国际政治经济格 局;两次世界大战之后开始的第三次工业革命,更是开创了“信息 时代”(1950年-至今),全球信息和资源交流变得更为便捷,大多 数国家和地区都被卷入全球一体化和高度信息化进程中,人类文明 达到空前发达的高度。 1.1 第四范式的演化 大数据时代的到来,将事物可量化的程度和范围空前推进,催 生出数据密集型的知识发现,驱动着科学研究范式转换。图灵奖获 得者吉姆·格雷将科学研究划分为四种范式:(1) 用于描述自然现 象的实验科学范式(Empirical Science);(2) 利用模型和归纳法的理论 科学范式(Theoretical Science);(3) 对复杂现象进行计算机仿真的计 算科学范式(Computational Science);(4) 将理论、实验和计算仿真统 一起来的数据密集型科学范式(eScience),也称之为第四范式。第四 范式是通过仪器收集数据或通过模拟方法产生数据,然后用软件进 行处理,再将形成的信息和知识可视化呈现1。这使得人们不需要 再借助“望远镜”或“显微镜”来观 察世界,而只需通过数据来 发现并理解世界。 科学研究范式之间转化并不是革命性的替代,范式演化过程更 像是一种研究能力提升和弥补研究缺陷的过程2。科学研究范式演 化如表 1 所示。 表 1 科学研究范式演化 科学研究范式 定义 第一范式 实验科学范式 最早的科学研究,主要以记录和描述自然现象为特征。 第二范式 理论科学范式 科学家们开始尝试尽量简化实验模型,去掉一些复杂的干扰, 只留下关键因素,然后通过演算进行归纳总结。 第三范式 计算科学范式 利用电子计算机对科学实验进行模拟仿真,推演出越来越多复 杂的现象,典型案例如模拟核试验、天气预报等。 第四范式 数据密集型 科学范式 随着数据的爆炸性增长,计算机将不仅仅能做模拟仿真,还能进 行分析总结,得到理论(比如过去牛顿做的工作,未来完全可以 由计算机来做) 第四范式对人类的认知和与世界交流的方式提出了全新的挑战 。因为人类总是会思考事物之间的因果联系,而对基于数据的相关 性并不是那么敏感;相反,电脑则几乎无法自己理解因果,而对相 关性分析极为擅长。因此有人称第四范式是“电脑+人脑”,电脑 是主角。维克托·迈尔-舍恩伯格撰写的《大数据时代》中指出: 大数据时代最大的转变,就是放弃对因果关系的渴求,取而代之关 注相关关系3。 伴随着情报技术环境和情报人文环境的不断变更,我国情报 研究总体上沿着“事实→数据→信息→知识→情报(智能)→智 慧”的范式路径进行层级推进4。由于智能设备已经被广泛地应 用于人类社会的各个领域,人们在互联网和实际生活中的数据都 被自动化和智能化地采集和存储。各个领域都面临着海量增长的 数据,这让科学研究的模式再一次发生了变化,我们已经进入了 数据密集型科学研究的时代。在数据密集型科学第四范式的驱动 下,情报科学继文献服务、信息服务、知识服务后进入了新的发 展阶段:智慧服务阶段5,6。 在国内,钱学森先生在 1983 年就提出了智能情报的理念, 认为信息的使用有三个层次:剪报式、情报专家式和智慧情报式 ,并指明情报研究需与智能技术相结合7。目前,国内对智能情 报的研究还处于起步阶段,还没有统一公认的定义,对智能情报 的表述主要有情报 3.0,即情报智能服务和智慧情报服务两类。 (1)情报 3.0:情报智能服务 情报 3.0 智能服务的概念从 2013 年提出沿袭至今,其核心思 想是:由于情报生产工具的革命性变化,导致生产力的革命性变 化,进而导致生产关系发生改变, 也就是情报组织模式发生了翻 天覆地的变化8。张惠娜等9认为以智能服务为标志的情报 3.0 是 对互联网新技术与科技情报生产各环节要素相互作用、共同演化 推进情报服务发展新形态的高度概括。巴志超等10认为情报 3.0 是以数据价值为核心,用户需求为导向,以智能化情报分析系统 为工具,融意识、技术、产品、应用于一体的情报服务。 (2) 智慧情报服务 罗立群等探讨了对智慧情报服务的一些认识,认为智慧情报 服务应该至少包括以下三层含义:(1) 运用大数据、人工智能等 智能技术,面向社会-信息平行环境,通过多源大数据、异构、 多层次的融合,基于人工智能的情报计算框架,智能化、敏捷化 、自动化的分析、发现新知识和新情报,在极少人工干预的情况 下,为情报分析、科学发现、创新、领域问题解决提供最优的解 决方案和建议;(2) 智慧情报服务是对人类处理情报过程、模式 的仿真;(3) 智慧情报服务是由人、机器、网络构建的一个包含 人类社会属性的社会情报网络,情报流、知识流、思想流在此交 互融合,最终形成理性的情报产品、情报智慧、群体智慧,从而 支持问题解决的情报决策、创新发现。而王鹏等 5 认为智慧情报 是在“互联网+” 背景下,以信息资源深度整合,通过大数据、 云计算、物联网等技术手段的辅助, 以“人”的科技创新为核心 ,以智慧共享、智慧创造为目标,打造高价值科技情 报产品的 过程。 (3)其它 此外也有学者从其他角度对智能情报分析的概念作了界定。 曾文11认为智能情报分析是一种新的情报数据分析服务模式,即 在情报数据的获取、存储、运营、深层次加工及数据可视化过程 中,利用人工智能的思维与技术方法进行数据管理与深度挖掘。 7 /page 2 智能情报的研究方向 情报活动主要包括情报搜集、情报整理、情报分析、情 报传递和情报用户使用5个环节,主要目标是为用户制定或提 供相对完备的科学性决策。而智能情报旨在通过人工智能技 术应用于多渠道采集来的情报大数据,客观精准地计算用户 的知识储备与能力资质、兴趣偏好与行为习惯,并结合情报 工作的规范和方法,合理地为用户配置个性化服务内容,提 供多模态决策支持。 随着目前人工智能的思维和技术方法渗透进情报生产的 各环节要素,情报工作也得到了不断地发展,进而实现高度 自动化和智能化,具体工作流程包括智能情报采集、智能情 报检索、智能情报分析和智能知识服务等环节。 2.1 智能情报采集 在情报信息采集方面,不同类型的信息可以从不同视角 揭示、评估和解释同一事物,进而弥补单一信息表达表达能 力有限或者无法获取等问题。当今各个领域充斥着种类丰富 的图像、音视频和文本等多模态信息资源,其中蕴含了大量 知识和情报价值,但与此同时信息的采集难度也大大增加。 基于人工智能感知功能的智能化采集技术能实现信息资 源,特别是网络资源的自动搜索、甄别、过滤、监测、跟踪 ,使智能软硬件、数字图书馆、专家、用户等多种数据源情 境下的数据采集能力大大提高。通过对多来源多领域多模态 的信息资源进行采集、汇聚、调整和补充,能进一步推动情 报规划的智能化,推动情报获取方式的变革,进行预测并提 高情报质量以及提高决策效能13。如李时玉等14谈到使用垂 直搜索技术可以在互联网上扩大信息搜集途径,实现科技信 息采集与存储。 2.4 智能知识服务 2.2 智能情报检索 科技情报研究领域存在着海量的情报信息,但目前仍缺 乏对海量数据的快速准确分析能力,很大程度上受限于缺乏 智能情报检索技术。部分学者认为,智能情报检索即针对已 采集的情报成果,结合元数据、本体、语义网等方式对其进 行描述与组织,应用智能技术对内容进行分析与标引,并开 发新的检索方法,提升情报检索效率与质量,降低检索过程 的时间和空间复杂程度,为情报用户提供满足需求的情报资 源 11。此外,也有部分学者15认为智能信息检索即个性化信 息检索,指能够为具有个性化信息需求的用户提供特殊检索 结果的技术,其实质是利用掌握机器学习技术的智能检索终 端分析用户之前的浏览、搜索记录后再来确定用户的需求特 征。 在智能情报检索领域,数据挖掘、人工智能和可视化技 术等得到了广泛应用。Martín A 等16研究了利用智能技术增 强数字图书馆的语义互操作性,提出一种语义与智能搜索引 擎概念架构,利用本体和人工智能查询在线知识库的元数据 ,利用智能代理(Agent)实现更高效的知识获取方法。沈敏等 17在收集了高校图书馆用户的检索行为特征后,运用监督型 机器学习方法,构建了一种用户偏好检索系统, 并对该系统 的工作流程、效果等进行了介绍与评价。而谢智敏等18以深 度学习技术为基础,对学术搜索引擎 Semantic Scholar 进行了 研究,结果表明深度学习使Semantic Scholar 系统具有了能够 理解不同引用间影响力差异的能力。 2.3 智能情报分析 智能情报分析要求将情报研究与智能技术相结合,基于 人工智能高性能的运算功能,保证语义不变性的同时,从多 模态信息中抽取语义并将其投影以实现抽象语义表征,实现 对海量信息的自学习、加工、识别与挖掘,进而构建人工智 能情报分析体系。田倩飞等 13 认为在情报分析处理方面,数 据挖掘、文本挖掘、知识发现、智能计算、专家系统等智能 化分析处理技术,可以大幅提升海量文档调查的工作效率, 帮助情报知识人员分析发展趋势,并从中发现一些表达隐晦 的缄默信息、未知的事实和潜在的情报。 而席彩云等19则认为分析技术作为情报学的核心技术, 在特定条件下,人工智能对于不确定性研究对象的分析能力 已经超过人力分析,而且对于大量、多维性的数据分析占有 绝对优势。因此,人工智能采用的分析方法更加科学,分析 结构更加准确,有效避免了某些人为因素导致的偏差。因此 智能情报分析通过在统一的语义空间中借助语义组合技术, 进一步实现多模态信息实体及其关系的组配和分析计算,一 定程度上提高了信息分析活动的智能性,也提升了信息分析 过程的客观性。 在智能情报分析领域,王飞跃20提出智能化平行情报,利 用智能技术培育“活” 的人工情报系统,构成实际与人工情 报过程平行运行的实时、在线、闭环、自适应的智能情报体 系。袁林等21针对科技情报研究中信息检索和分析的需求,基 于Heritrix 增量式爬虫的科技情报搜集、科技情报语料库的统 计机器翻译、面向主题-内容-结构的多特征文本自动摘要、基 于向量空间模型的科技情报自动分类4 项关键技术,设计了 互联网科技情报搜集分析原型软件的技术架构和功能模块。 基于数据驱动的深度学习技术本质上还是模式识别,一定 程度上存在着可解释性差和鲁棒性差等问题,而基于知识驱 动的智能服务旨在让机器实现类似人类的认知功能,通过概 念推理、语义计算等发现新知识22。在大数据与人工智能蓬勃 发展的新时代,知识占据着越来越重要的地位,传统的知识 服务模式逐渐向用户导向、网络化、交互式的智能知识服务 方向发展。因此,发展智能知识服务既是情报工作自身深入 发展的主观需求,也是知识经济时代和信息化社会环境的客 观要求。 所谓智能知识服务,是指借助人工智能技术,使知识管理 更加智能化,促进知识服务达到自动、深度学习、加工、优 化的效果,更好地整合信息资源,促进知识的创新与增值, 为科研工作助力23。不少学者对人工智能技术在知识服务领域 的应用进行了讨论,比如 Talley N24提到结合人工智能技术, 创建智能化的学科知识问答系统、专题情报分析系统、用户 需求识别与知识服务系统等,创新图书馆服务产品; Kreuchauff25等提到在专利智能化分类和集成检索服务中,将 改进的机器学习算法应用于服务机器人领域,知识服务在网 络应用理念的基础上加入人工智能技术,将能为科研院所的 科研工作提供更强大的支撑。 与此同时,决策者对情报机构的要求已不能满足于信息分 析与知识服务,情报机构唯有借助人工智能的推理与决策能 力,提供更加智能化的决策方案,优化多模态决策结果,快 速为用户提供决策支持和解决方案,方能发挥情报服务应有 的效能13。其中Tweedale 等26指出人工智能与计算智能技术被 成功用于决策制定, 同时能改善信息可获性,解决数据密集 问题。 此外,个性化智能推荐是一种信息过滤技术的发展,情报 学中为不同用户进行个性化推荐,能进一步推进个性化交互 要素的实现,以提供更全面、交互性更强的智能知识服务。 通过具有机器学习能力的智能终端通过对用户数据库中信息 搜寻、阅读、浏览等的记录进行识别与分析,进而判断出用 户的潜在信息需求及兴趣偏好,然后将符合的信息内容在合 适的时间以合适的方式推荐给用户,其实质就是智能终端通 过机器学习与大数据技术相结合来猜用户之所想,供用户之 所需。 3 智能情报实践研究 目前,智能情报的实践研究主要包括功能性的智能情报采 集系统、智能情报检索系统、智能情报分析系统和集成化的 智能知识服务平台等。 3.1 智能情报采集系统 在国内,北京市科学技术情报研究所自主研发了一套由词 库生成器、科技情报分析系统、大矩阵和创新点自动发现系 统构成的大数据采集和筛选工具。百度在线开发的百度 eCIS 软件能够根据用户指定的信息源自动收集来自 Internet、数据 库和文件系统的各种信息,对竞争对手网站进行实时监控, 可根据用户的设置对信息进行自动分类、自动去重和建立信 息间相互联系,可简单方便地生成情报简报并高效地共享。 8 /page 在国外,美国 DARPA 的洞见(Insight)28项目强调多源数据 的收集、索引和存储。Cipher Systems 的 Knowledge. Works 软 件则能够很好地从 Internet、Intranet、E-mail、论坛中自动收 集各种公开信息,并对竞争对手网站进行监视跟踪,识别多 种文件类型,可对信息进行自动摘要,自动分类。 3.2 智能情报检索系统 智能情报检索系统即在传统的情报检索系统中引入人工智 能和大数据的技术和方法。 在国内,国家科技图书文献中心(NSTL)提供智能检索示 范服务,NSTL 实现海量科技文献信息资源的有效组织、深度 揭示和知识化关联29。中科院文献情报中心基于知识图谱技术 构建了科技大数据知识发现平台30,实现了论文、项目、学者 、机构等 10 类科研实体的智能语义搜索和多维知识集成检索 发现,满足了用户精准知识检索需求, 提升了用户体验。清华 大学研发的 AMiner 学术知识服务平台, 集成了学术大数据融 合、专家档案智能抽取、专家智能搜索等研究成果, 在论文 文献搜索以外, 提供了针对研究者信息的强大搜索能力31。 而国外,美国艾伦人工智能研究所(Allen Institute for Artificial Intelligence) 于 2015 年 11 月推出基于人工智能的语义 搜索引擎 Semantic Scholar30,利用 AI 技术抽取科研实体等细 粒度知识,突破传统基于关键词搜索的知识发现服务。德国 马普信息学研究所正开发一款名为 DeepLife13 的专注健康和生 命科学领域的搜索引擎。Microsoft 也于 2016 年 5 月公开发布 其人工智能学术搜索工具 Mic rosoft Academic32。该工具由 Microsoft 网络搜索引擎 Bing 提供语义搜索功能支持,覆盖约 1.6 亿份文献。美国 IARPA——Aladdin33视频项目启动于 2010 年, 旨在以全新的方式集成先进的视频提取、音频提取、知 识表达和搜索技术等,开发一种快速、准确、强健和可扩展 的技术来支持未来的多媒体分析需求。 3.3 智能情报分析系统 国内,中科院文献情报中心开发的“研究所一线科技信息 监测服务平台”从海量的网络科技信息资源中发现最新最重 要的科技资源,自动计算分析科技资源的情报价值、识别科 技资源中包含的重要科技对象、重要科技术语,快速发现研 究领域的研究热点等。而中国科学技术信息研究所与万方数 据联合开发了科技创新辅助决策支持系统 STADS,后演化为 科技创新小助手,可以根据用户的输入快速生成包含有各种 复杂图表的 PDF 报告。北京市科技情报研究所开发的大数据 科技情报服务平台,通过词库生成器、科技情报分析系统、 大矩阵和创新点自动发现系统,在城市交通情报服务、突发 事件应急决策、网络舆情监测管理、战略性新兴产业和文化 创意产业等领域进行了应用实践。 国外,Taylor 出版集团利用大数据分析与机器学习技术, 构建知识图谱,研发 wizdomAI34,为科研人员与研究机构提 供面向全价值链的深度分析服务。美国 DARPA 于 2012 年启 动 XDATA(探索数据)35项目,旨在开发计算技术和软件工 具,用于分析大量数据,包括半结构化数据和非结构化数据 。美国 DARPA——Big Mechanism(大机制)项目:于 2014 年启动,旨在开发自动搜索技术阅读研究论文与摘要,通过 先进大数据分析来发现因果关系模型,如研究导致细胞癌变 的复杂分子之间的相互作用。美国 IARPA——DIVA(深度联 合视频分析) 36项目:于 2016 年发布申请指南,旨在针对多 摄像头流视频环境,开发强健的自动化活动探测技术,用于 取证及实时警告等。 3.4 智能情报平台/智能知识服务平台 在国内,中科院文献情报中心研究应用自然语言处理和人 工智能技术,设计了基于科技大数据中心的智能知识服务体 系,打造了具有“开放学术、开放交流”+“智能检索、关联 导航”+“智能推荐、精准服务”+“思想碰撞、群体智慧” 的智慧型开放学术生态特征的智慧知识服务产品。为科技情 报分析提供了知识挖掘与知识分析工具,但其智能性与精准 性还有待提升37。中国工程科技知识中心(CKCEST)38项目强 调多源数据的收集、索引和存储,并在此基础上,构建集成 系统,让计算机高效地完成从文本、图像、视频等原始的非 结构化数据到有序、可用、标准的结构化知识这一过程,支 撑协作与决策。清华大学研发的学术大数据深度挖掘和知识 服务平台 Aminer31,集成了学术大数据融合、专家档案智能抽 取、专家智能搜索、学术评价、技术趋势分析等多种前沿研 究成果。 国外,全球从事数字科学的数据技术公司 Digital Science39 ,从研究人员(知识发现、分析与评估)、科研机构(创新 、机遇与新发现)、基金项目(公司投资、更科学的数据决 策)与出版物(更贴合用户与作者的喜好)这 4 大数据维度, 研发智能工具,面向科研全流程创造了一种科研信息服务新 模式。作为全球信息技术解决方案的提供商 Elsevier40研发了 Scopus、HiveBench、Mendeley、Pure、SciVal、Funding Solutions、Expert Lookup 以及 Analytical Services 等数字化、知 识化工具,有效满足了科研人员的科研需求,基本覆盖了从 数据、证据、工具与智慧服务的新型科研生态。美国 DARPA 的洞见(Insight)41项目:系统能收集、索引和存储来自多种源 头的数据。然后分析并关联这些信息,在分析师和数据提供 商之间建立请求和共享链接。自动化后台处理能力包括行为 学习和预测算法 等,帮助分析师发现和确定潜在威胁。 4 智能情报趋势分析 通过对智能情报的研究现状与应用展开全面分析,我们观 察到未来该领域的总体趋势将朝向全面、精准、自动、高效 、智能和深度等方向发展,具体表现为智能情报理论的创新 和发展,情报服务的平台化和工程化,情报服务的个性化和 专业化,提供智能决策支持以及加强智能情报团队建设等。 4.1 智能情报理论的创新和发展 我国情报学研究和情报工作一直将重心放在大量的文献性 基础服务工作上, 过分偏重对文献处理和对信息技术的钻研 ,而对情报学基础理论、情报学科特性与本质的研究兴趣极 大锐减。因此,需要借助大数据或人工智能这一“跳板”, 重新审视情报学自身发展的学科定位,构建起完善的基础理 论。 大数据和人工智能环境下,信息资源的内容、类型、形态 以及描述识别都发生巨大变化,信息资源的增长规律以及信 息扩散特征也都发生改变。因此,情报学需要在新的环境下 创新与发展基本理论,系统地开展智能情报服务需求分析, 梳理智能情报服务的特征特点,辨析智能情报服务与传统情 报服务的异同,构建一个统一的具有指导意义的情报学理论 体系框架,以适应大数据和人工智能环境的变化以及社会发 展的需要,使之更加完善和成熟,从而为社会信息环境治理 继续提供独特的功能输出 6。 4.2 提供智能决策支持 在大数据与人工智能蓬勃发展的新时代,决策者对情报机 构的要求已远远不只是信息分析与知识服务,情报机构不仅 要回答“是什么”、“为什么”,还要准确提出智能化的解 决方案,指导“怎么办”,要在科研决策和科技攻关需要时 能够“出对策、出思路和出声音”。情报机构唯有提供更加 智能化的决策方案, 快速为用户提供决策支持和解决方案, 才能发挥情报服务应有的效能5。因此,为用户提供智能决策 支持是未来智能情报发展的一大趋势。 4.3 情报服务的平台化和工程化 大数据和人工智能背景下必须要尽快建立科技信息大数据 平台,拓展信息来源,全部囊括文献、科技报告、科研成果 、科研项目、专利信息等多元化数据, 开发融合人工智能的 数据处理分析技术,以全体样本代替随机样本,用相关关系 代替因果关系,由定性分析向定量分析转变,由系统逐步代 替人完成情报服务活动。 同时知识服务时代知识的生产、新解决方案都是由人工去 完成的,无法进行高效的、大规模的生产。智能情报服务则 需要通过大数据架构下的人工智能与知识融合通过批量的方 式从数据“矿厂”中产生知识,为用户提供全流程一体化的 一站式情报服务,以促进情报服务全过程的自动化、规范化 和系统化 6。 9 /page 4.4 智能情报的个性化与专业化 情报智能服务的个性化、专业化与精细化也将成为未来情报 工作的重点。服务主体已不再局限于向服务对象提供定向的或者 满足特定发展阶段的情报产品,而是考虑不同服务对象的异质属 性和认知差异,根据不同的服务背景输出不同的情报产品,同时 也将情报服务工作伴随、贯穿于情报客户需求发展的各个阶段, 通过多层次、全方位、全链条地介入和支撑决策的各环节,为其 提供深层次、细粒度和时效性的情报服务43。 4.5 智能情报团队建设 最后随着“互联网+”时代的到来,使得情报资源碎片化局 面得以改善,与 此同时打破了以往常规的科技情报工作组织方式 。“互联网+”时代背景呼唤科技情报摆脱“小作坊”的团队工 作模式,建设创新的情报团队工作模式,以适应大数据和人工智 能时代的要求 5。 王鹏等认为团队建设可分为软件和硬件建设。软件指团队文 化,在崭新的“互联网+”环境下,凝聚新的团队思想内涵,建 立适应当下时代背景、满 足未来工作需求的精神内核;而硬件 是指开展新型情报团队建设所需要的信息资源、设备设施、技 术能力等客观条件,比如“云”环境构建、互联网技术培训等 。 5 总结 近年来,随着大数据技术、人工智能技术的急速发展,特 别是在深度网络、自然语言处理、知识融合、机器学习领域的 研究取得了实质性的成果,科学研究不再仅仅基于“对过去的 认识”而有目的性地去处理数据,而是在数据处理的基础上去 发现新的知识。这种第四范式的应用为科学研究带来了重大的 变革,使得科学研究不再局限于人脑的既定的知识水平。因此 为科学研究提供数据支撑的未来情报学的发展将更趋智能化, 同时智能情报、智慧情报、大数据情报也已成为图书情报领域 关注和研究的重点之一。 参考文献: 1 Hey, T., Tansley, S., & Tolle, K. (2012). 第四范式:数据密集型科学发现[M]. 潘教峰,张晓林等. 北京:科学出版社. 2 刘如, 王延飞, 吴晨生, 刘菲. 第四范式视野下的情报感知: 现实与困惑[J]. 情报理论与实践 , 2019,42(5):1-5. 3 Viktor Mayer-Sch nberger(2012). 大数据时代[M]. 周涛. 浙江: 浙江人民出版社. 4 李阳,李纲.我国情报学变革与发展:“侵略”思索、范式演进与体系建设[J].图书情报工作,2016,60(22):5-11. 5 王鹏.“互联网+”环境下的科技情报发展趋势及团队建设[J].竞争情报,2018,14(03):23-28. 6 罗立群,李广建.智慧情报服务与知识融合[J].情报资料工作,2019,40(02):87-94. 7 戴汝为,郑楠.钱学森先生时代前沿的大成智慧学术思想[J].控制理论与应用,2014,31 (12):1606-1609. 8 吴琼,吴晨生,刘如,刘彦君.情报 3.0 思路下的情报工作体系建设研究[J].情报理论与实践,201 8,41(11):34-37. 9 张惠娜,李辉,刘如,付宏,候元元,吴晨生.关于情报 3.0 环境下科技情报工作的思考[J].情报工程,2017,3(05):87-93. 10 巴志超,李纲,周利琴,毛进.数据科学及其对情报学变革的影响[J].情报学报,2018,37(07):653-667. 11 曾文,李辉,李荣,樊彦芳.数据工程视角下的智能情报分析与应用探索[J].情报理论与实践,2 018,41(07):31-34+59. 12 冯秋燕,朱学芳.人工智能在情报工作中的应用研究[J].情报理论与实践,2019,42(11):27-33. 13 田倩飞,张志强.人工智能 2.0 时代的知识分析变革研究[J].图书与情报,2018(02):33-42. 14 李时玉. 基于Hadoop 平台的科技情报数据爬取系统研究[A]. 北京科学技术情报学会.201 7 年北京科学技术情报学会年会--“科技情报发展助力科技创新中心建 设”论坛论文集[C]. 北京科学技术情报学会:北京科学技术情报学会,2017:8. 15 张坤,王文韬,谢阳群.机器学习在图书情报领域的应用研究[J].图书馆学研究,2018(01):47-52. 16 Martín A,León C,López A.Enhancing semantic interoperability in digital library by apply ing intelligent techniques[C].Sai Intelligent Systems Conference.IEEE,2015:904-911. 17 沈敏,杨新涯,王楷.基于机器学习的高校图书馆用户偏好检索系统研究[J].图书情报工作,2015(11):143-148. 18 谢智敏,郭倩玲.基于深度学习的学术搜索引擎——Semantic Scholar[J].情报杂志,2017 (8): 175-182. 19 席彩云,邓胜利,郑晗.人工智能与情报收集分析[J].保密工作,2018(04):16-18. 20 王飞跃. 从激光到激活:钱学森的情报理念与平行情报体系[J]. 自动化学报, 2015, 41(6). 21 袁林,葛唯益,陈晓琳.科技情报智能检索与语义分析[J].指挥信息系统与技术,2019,10(05):34-39. 22 邱韵霏,李春旺.智能情报分析模式:数据驱动型与知识驱动型[J].情报理论与实践,2020,43 (02):28-34. 23 燕娜. 人工智能视角下面向科研院所的知识服务新走向[A]. 北京科学技术情报学会.2018 年北京科学技术情报学会学术年会—智慧科技发展情报服务先行”论坛 论文集[C].北京科学技术情报学会:北京科学技术情报学会,2018:7. 24 Talley N.Imagining the Use of Intelligent Agents and Artificial Intelligence in Academic Law Libraries[J].Law Library Journal,2016,108(3):383-401. 25 Kreuchauff F,Korzinov V.A Patent Search Strategy Based on Machine Learning for the Emerging Field of Service Robotics[J].Scientometrics,2017,111(2):743-772. 26 Tweedale J W,Phillips-Wren G,Jain L C.Advances in Intelligent Decision-Making Techno logy Support[M].Intelligent Decision Technology Support in Practice.Springer International Publishing,2016:3-28. 27 赵芳,吴晨生,刘彦君.自建大数据工具在情报领域的应用实践及对大数据理论的新认识[J]. 情报理论与实践,2015,38(01):76-80. 28 DARPA.Insight [EB/OL]. [2020-07-13]. https://www.darpa.mil/program/insight. 29 国家科技图书文献中心 [EB/OL].[2020-07-13]. http://smartsearch.nstl.gov.cn/index.html. 30 Semantic Scholar - An Academic Search Engine for Scientific Articles [EB/OL]. [2020-07-14]. https://www.semanticscholar.org/. 31 Tang J, Zhang J, Yao L M, et al. AMiner: Extraction and Mining of Academic Social Networks[C]//Proceedings of the 14th ACM SIGKDD International Conference on Knowled ge Discovery and Data Mining (SIGKDD’2008). 2008: 990-998. 32 Nicola Jones.AI science search engines expand their reach [EB/OL]. [2020-07-14]. http://www.nature.com/news/ai- sciencesearch-engines- expand- their- reach- 1.20964. 33 IARPA.ALADDIN [EB/OL]. [2020-07-14]. https://www.iarpa.gov/index.php/research-progra ms/aladdin- video. 34 Intelligence for Everyone [EB/OL]. [2020-07-14]. https://www.wizdom.ai/. 35 DARPA.XDATA [EB/OL]. [2020-07-14]. https://www.darpa.mil/program/xdata. 36 IARPA.DIVA [EB/OL]. [2020-07-14]. https://www.iarpa.gov/index.php/research-programs/di va. 37 钱力,谢靖,常志军,吴振新,张冬荣.基于科技大数据的智能知识服务体系研究设计[J].数据分析与知识发现,2019,3(01):4-14. 38 中国人工智能学会通讯.KS- Studio:一个知识计算引擎[EB/OL].[2020-07-14].https://yq.aliyun.com/articles/216744?spm=5176.100239.blogcont216742.14.JWfETU. 39 Digital Science [EB/OL]. [2020-07-14]. https://www.digitalscience.com/. 40 Research Intelligence[EB/OL]. [2020-07-14]. https://www.elsevier.com/research-intelligence. 41 DARPA.Insight [EB/OL]. [2020-07-14].https://www.darpa.mil/program/insight. 42 崔明贝.大数据时代科技情报机构的转型[J].科技经济导刊,2018,26(31):245. 43 吴晨生, 李辉, 付宏, 等. 情报服务迈向 3.0 时代[J]. 情报理论与实践, 2015, 38(9): 1-7. 10 /page 面向数据密集型科学的信息资源建设 ——以美日为分析对象 方思越、胡雅敏、李明菲、郎宇翔、武楷彪 【摘要】[目的/意义] 在数据密集型科学研究环境下,海量数据对知识发现起着至关重要的作 用,本文旨在探寻如何在第四范式的研究背景下进行信息资源设施建设。[方法/过程] 本文首 先构建信息资源的一般建设框架,接下来,以美国国会图书馆和日本科技政策数据与信息基 础设施建设为例,分析其信息资源建设过程及经验。[结果/结论]最终,本文结合中国的实际 情况,为中国的信息资源建设提供了相应的建议与意见。 关键词:第四范式;数据密集型科学;信息资源建设 1 前言 计算机科学家吉姆·格雷对过去人类从事科研活动过 程进行总结发现,科学的研究范式经历阶段性变化,以时间 和工具这两个维度将历史上的科学研究划分为四个阶段:经 验科学、理论科学、计算科学和数据密集型科学,其中,数 据密集型科学被认为是当下的研究范式,即第四范式。第四 范式的特点之一便是对海量数据进行分析,文章指出,在过 去,研究人员侧重于思考“我可以通过什么实验来验证这一 假说”(例如实证研究),在现在,研究人员侧重于思考“ 我可以在现有数据中发现什么关联” [1],即当下的科研人 员更注重从数据本身的关联(即相关性)寻找新的知识。 面向数据密集型科学的知识发现服务,正处于新的研 究范式、全新的技术环境、全新复杂的数据来源、需要全新 的研究方法和技术才能满足用户日益复杂的需求[2]。知识 发现的核心思想是利用复杂数据之间的关联与融合中发现知 识,而信息基础设施的建设可为知识发现做好数据基础,是 知识发现的重要基石。 信息资源建设是获取针对海量数据分析的先行官。信 息资源全面成为科学研究的基础设施和工具,然而对海量的 数据的管理方面仍然面临较大问题:(1)如何才能可靠地 管理科学数据;(2)如何才能对不同类型的数据格式交叉 操作;(3)如何设计可靠的数据采集工具,为了解决上述 问题,本文以美日两国具体的信息资源建设案例为分析对象 ,介绍两国经验与启示。 在不同的学科领域中,信息资源建设面临着不同的挑 战和需求,本文以美日两国为例分析其信息资源建设经验。 在美国的案例分析中,本文主要以美国国会图书馆为研究对 象,辅以高校图书馆数字人文的服务经验。美国国会图书馆 历史悠久、馆藏丰富,是世界上最先将馆藏数字化的图书馆 之一,美国国会图书馆的数字战略规划对我国公共图书馆的 发展具有一定的借鉴意义[3],高校图书馆的人文服务也能 为我国高校图书馆开展工作提供借鉴[4]。在日本的信息资 源建设案例分析中,本文以日本 SciREX 项目的信息基础设 施建设为研究对象。日本素有“情报立国”的传统,日本对 情报的搜集能力加强和优化促进其成为地区性的情报大国 [5]。自 2011 年以来,日本政府积极推进科技创新政策数据 与信息资源的建设, 促进各级单位的情报共享,建立了“ 基于证据”的科技政策评估体系,该体系的建设经验可以为 我国相关部门参考。 综上所述,首先,本文基于数据密集型科学的研究范式 背景,提出信息资源建设的必要性,并进一步论证信息资源 建设对数据密集型研究范式下知识发现的促进作用。其次, 本文提出数据密集型研究范式下的信息资源建设流程框架。 再次,本文以美国国会图书馆和日本科技政策数据与信息资 源建设为案例,从信息资源服务机构和国家科技信息资源设 施两个角度结合信息基础设施流程框架对其经验进行阐述介 绍。最后,本文针对中国的具体情况提出了针对性建议与意 见。全文行文框架如图 1 所示。 图1 文章行文结构说明示意图 2 信息资源建设与知识发现 信息资源建设为知识发现提供数据基石。面向数据密集 型科学背景下,知识发现的方法核心是通过数据之间的关联 挖掘知识,而海量的数据需要信息资源建设进行加工整合成 新的数据资源。在前大数据时代,信息资源建设是基于纸质 、文献的知识发现提供支撑,为归纳事实提供数据;而当前 的大数据时代,信息资源建设除了提供数据支撑,还需要将 复杂的大数据通过融合与序化方法转化为数据资源[6]。 信息资源建设的技术可以提高知识发现的质量和效率。 随着大数据 4V 特征的普遍,从原来小样本的信息源、基于科 技文献的数据转变为多类型、分布式、大体量的数据资源, 且多为实时性、研判性的信息等。同时,随着现实问题的复 杂度逐渐增大,多学科、跨学科领域的知识越来越多[7],即 知识数据来源越来越复杂。数据和知识的复杂化提高了知识 发现的难度,而信息资源建设如能充分利用计算机技术、情 报挖掘技术以及相应的组织技术将复杂数据转化为知识和情 报资源,则可以大大提高知识发现的效率和质量。 11 /page 综上,数据密集型研究范式下知识发现的核心思想是通过 对多源、复杂、跨学科数据的关联中挖掘出知识,因此对数据 资源的信息建设在新的时代背景下更为重要。 3 数据密集型研究范式下的信 息资源建设流程框架 在数据密集型研究范式下,信息资源的建设应该以能让计 算机能高效识别和处理信息资源为根本目标。如美国国家医学 图书馆开发了生物医学领域中最大的主题词库 UMLS,用于生 物医学的知识表示、知识访问和知识发现[8]。在 UMLS 的基 础上,美国国家医学图书馆还开发了语义谓词抽取工具 SemRep,用于从生物医学文本中抽取生物医学的概念和概念 之间的关系[9],并将这些关系和概念用UMLS 术语表示,这为 计算机高效处理科研论文与医学临床记录奠定了基础;更进一 步,NLM 使用 SemRep 从 PubMed 论文标题或摘要中抽取出了 9400 万个语义谓词[10],并建立了一个名为 SemMedDB 的数据 库,存储这些谓词出现过的论文在 PubMed 中的编号以及谓词 所在分句,SemMedDB 可以理解为将全文数据信息精细化而生 成的内容数据库。结合国外已有经验[11]与我们的理解,信息 资源建设框架可总结如图 2 所示。 发更强大的信息资源处理和挖掘工具,方便用户实现自身的个 性化分析需求。 数据密集型研究范式下的信息基础设施建设流程的最后一 步是整合信息资源的描述、存储与利用三个子框架,综合使用 各个子框架下的基础设施,建立高度集成的知识管理和知识发 现系统,为用户探索知识之间的关联,管理和发现新知识提供 有力支持。 4 美日面向数据密集型科学的 信息资源建设经验 4.1 美国图书馆的信息资源建设经验 信息资源建设中,图书馆提供的服务体现了数据密集型服 务的要求。美国国会图书馆馆藏文献数字化的先驱,对国会图 书馆的数字战略规划进行研读,启示我国公共图书馆的建设; 综合关注美国部分数字人文工作实施较好和影响力较大的高校 图书馆信息资源建设与实施情况,为我国学术型图书馆的相关 工作参考。 4.1.1 美国国会图书馆数字战略规划 美国国会图书馆于 2018 年制定《丰富图书馆体验:美国 国会图书馆 2019- 2023 战略规划》(Enriching the Library Experience: the FY2019-2023 Strategic Plan of the Library of Congress )1,并补充制定《美国国会图书馆 2019-2023 数字战略规划》 (the FY2019-2023 Digital Strategic Plan of the Library of Congress) 2,该数字规划为图书馆未来五年数字化转型描绘了发展前景 ,强调建设丰富用户体验的数据驱动型图书馆。 美国国会图书馆的总体战略规划指出,图书馆的前进方向 是以用户为中心, 实现以数据为驱动的数字化。数据驱动型 图书馆需要将分析数据和推理嵌入决策过程,以数据为驱动力 ,采取数字策略,把握用户与图书馆的交互[12]。数字战略规 划的核心内容如图 3 所示。 图 2 信息资源建设框架 信息资源的描述和组织是一切的基础,而高质量的数据描 述标准是详尽描述信息资源的必要条件;在数据描述标准基础 上开发的受控词表和术语分类标准则可以为信息资源的标引和 检索系统的构建提供资源;统一的信息资源描述语言是信息资 源描述基础设施建设的最终目标,它是大规模数据和数据之间 关系描述的有力工具,也是将数据库转化为内容库、知识库的 基础。 信息资源的存储处于一个承上启下的关键位置,为了满足 数据密集型的研究需求首先它应该有满足系统高效运行的软硬 件条件;其次应该在大规模、规范化的受控词表的基础上为馆 藏信息资源建立完备的全文数据库,全文数据库的建立也为高 效的信息检索系统提供了可靠的数据源;全文数据库可以保存 信息资源的全貌,但是其中并非所有信息都是有用的,图书馆 等信息服务机构有必要利用现有的信息资源描述工具和处理、 挖掘工具从全文数据中提取出全文中真正有价值的内容和知识 ,并充分挖掘出知识之间的关联,建立完备的内容库、知识库 ,让用户能从海量数据中准确、便捷地获取所需要的信息。 信息资源的利用是直接面向用户的,传统的全文检索系统 是信息服务机构的基本要求,但在面对海量信息资源时用户对 信息的挖掘和处理才是关键,因此信息服务机构有必要为用户 开放更多更便捷的数据接口,在完善的信息资源描述框架下开 图 3 美国国会图书馆数字战略规划核心内容 馆藏方面,国会图书馆制订并采取了数字化战略,包括扩 大数字收购计划和独特馆藏数字化。通过对检索与访问的改进 ,帮助用户更好地发现实体及数字馆藏资源;国会图书馆根据 版权情况促进馆藏建设并保护知识产权:记录版权信息, 公 开部分馆藏的权限状态,根据用户角色进行访问授权;国会图 书馆鼓励对内容和元数据的使用,允许用户以创造性的方式使 用馆藏,如数据挖掘、内容分析、创建数字艺术品等。 用户服务方面,采用以用户为中心的设计,优化网站设计 、优化交互体验、优先数字服务、增加数字参与;发挥图书馆 的主观能动性,建立社交平台、与用户进行互动,推广图书馆 内容与服务、扩大图书馆的受众群体,发挥员工智慧、分享故 事、提供数据、科普专业内容;鼓励用户发表意见,分享个人 意见,参与图书馆的人文活动;保持与其他组织如文化遗产机 构和同行的合作关系,拓展新的专业领域和资源。 未来发展方面,探索馆员为用户服务的新途径,创造良好 的创新环境,保证员工有必备设施、工具、知识和机构的支持 ,如通过员工培训、部门交流、对外合作等方式帮助员工成长 ;保证馆藏资源的持久访问,维护数字内容和元数据, 确保 12 /page 文件和程序随着技术发展的可用性;密切关注未来科技发展的 趋势,如虚拟现实、机器学习等,扩大应用研究,探索数字文 化的新趋势。 4.1.2 美国部分高校图书馆数字人文服务 数字人文在数据密集型科学发现研究范式下应运而生,它 是整合了人文社科的传统领域与计算机技术和相关工具的交叉 领域,是图书情报研究的重要主题之一[4]。美国的数字人文 研究比较具有代表性,centerNet 收录的数字人文中心中, 美国机构约占比注明机构所在地的 38%[13]。 部分高校图书馆专门规划和建设了数字人文中心,如耶鲁 大学图书馆、布朗大学图书馆、宾夕法尼亚大学图书馆等。各 高校图书馆提供的数字人文服务有咨询服务、数据管理服务和 技术支持服务,也会帮助协助申请或提供数字人文研究资金。 咨询服务包括项目管理咨询服务、合作咨询服务和数字人 文工具应用咨询服务:阿拉巴马大学图书馆在项目初期会向入 门者推荐相关资源并介绍成功经验, 帮助研究者实施项目管 理战略;普林斯顿大学图书馆提供校内外合作咨询、项目合作 伙伴咨询服务、协助机构之间开展工作;耶鲁大学图书馆提供 语料库创建的相关咨询服务。 数据管理服务包括数据选择、搜集与计划定制服务、数据 分析服务和数据共享和发布服务:宾夕法尼亚大学图书馆数据 语言联盟搜集和提供大量语料支持相关研究;埃默里大学图书 馆的统计分析专家与研究者进行交流沟通,帮助研究者识别和 获取与其工作相关的数据,并帮助清洗数据用于数据分析程序 ;布朗大学图书馆集成了学术、教学、研究和行政活动的数字 资源并保证数据的安全存储。技术支持服务包括数据可视化、 数字人文相关软件的开发、GIS 空间分析、主题建模等;在帮 助申请或提供数字人文研究资金方面,资金来源主要依靠数字 图书馆人文中心申请和一些外部捐赠,如向国家数字人文科学 基金会等上级机构或私人基金申请经费资助。一些公司也会为 项目提供赞助,如 Google 提供数字人文研究奖。而这些资金 一部分用于在校师生的专项使用,一部分用于吸引用户和社区 参与创新研究。 4.2 日本科技创新政策数据与信息资源建设介绍 4.2.1 日本科技创新数据互联共享体系 2011 年,日本发布中长期科技战略第四期计划《科学技术 基本计划》,强调政策的制定与评价需要基于客观证据,这一 计划要求政府、大学、研发机构对自己所拥有的数据标准化, 并促进数据之间联动整合,这一情报互联共享体系涵盖了政策 制定、资源投入、成果产出以及绩效评价四个方面,最终方便 对业务进行PDCA 管理3,具体如图 4 所示。 4.2.2 日本 SciREX 项目信息资源建设架构 在 CRDS 提到的《科学技术基本计划》基础上,文部科学 省推出“‘服务于政策的科学’推进事业”(SciREX)4,这 项系统工程中便包括了对数据和信息资源建设部分,该项系统 建设目标是为了应对信息的供需不充分、不平衡状况,系统的 建设方针包括 4 个方面:(1)重视微观数据;(2)重视数据 库联系;(3)从政策应用的设想出发;(4)系统性建设信息 基础设施。 在 2011 年 SciREX 项目设立开始,NISTEP 已经建成了一套 较为完整的信息资源建设体系,该设施按照机构划分包括企业 辞书、大学与公共研究机构辞书以及政策研究数据与信息基础 设施,而政策数据与信息基础设施建设则包括科技创新政策数 据库、德尔菲调查数据库、NISTEP 定点调查数据库及数据与 信息网络链接,如图 5 所示。 图 5 SciREX 信息基础设施建设关系架构 4.2.3 日本 SciREX 项目信息资源建设介绍 (1)企业辞书基础信息构建 企业辞书的建设的过程中需要对企业名称的记录、消歧和 清洗处理,其信息包括企业的基本信息,同时还可以关联企业 的外部数据源信息,例如专利数据库等。针对企业辞书可以对 企业规模、行业、合作关系、专利申请情况进行分析。 (2)大学和公共研究机构辞书 机构辞书主要针对大学、公共研究机构,也包括实际从事 研究工作的地方公共团体。针对上述机构,NISTEP 可以通过 各类方法对数据进行调查和交叉验证以确定数据来源正确,同 时,该部分数据库还与外部论文数据库,例如 WoS, Scopus 等进行链接。此外,NISTEP 还完成制作了“机构辞书联系表 ”,通过机构ID 与企业辞书 ID 对应链接,从而实现辞书之间 的联系。针对机构辞书,可以实现对机构检索,支持机构的成 果分析。 (3)政策研究数据与信息资源建设 对政策研究数据的搜集部分,包括科技政策的文本、根据 科学技术白皮书中抽取的科技政策每年实施情况的信息、政策 实施过程中的调查数据、产学研机构的专业人士访谈调研数据 、国内外相关报道等数据。 4.2.4 日本科技创新政策数据与信息基础设施特点 图 4 日本科技创新情报互联共享体系机制 日本各级政府均会保存有关科技创新的数据,形成数据共 享机制,例如,内阁府 CSTI 保存有日本医疗研究机构 AMED 的数据库;文部科学省下属的科技政策研究所(NISTEP)、 科学技术振兴机构(JST)与学术振兴会(JSPS)则拥有调查 资源数据库,分别包括科学技术指标、由 CRDS(研究开发战 略中心)俯瞰报告集成的数据资源以及研究资助数据库。 (1)自上而下的顶层设计架构 日本科技创新政策数据与信息基础设施建设是由国家科技 战略《科学技术基本计划》确立并实施的,也因此,该项目在 实施过程中,不仅仅是针对数据资料整理,更多的用数据辅助 政策的制定与评估,从而形成完整的体系。 (2)数据基础设施建设对象类型多元化 日本 SciREX 项目在进行基础设施建设时,除了会搜集科 技政策本身相关的数据和文本,还会使用德尔菲法调查专家意 见并随时关注一线研发人员的观点, 此外还会搜集主要科技 强国的重要数据。在获取得到基础数据后,SciREX 项目还会 针对不同类型主体的特点对数据进行组织,进而形成基础数据 库,便于最终 的可视化展示和分析决策。 13 /page (3)强调单个数据库的可用性和数据库之间的联系 日本 SciREX 项目除了会针对微观层面主体的信息搜集问 题和名称消歧,还会强调多个数据库之间的联系,从而实现多 主体之间合作的复杂网络分析,这一部分数据在产学研相关合 作分析中起到了至关重要的作用。 5 对中国信息资源建设的启示 在如今数字化网络化多元化的环境下,数字信息资源渐渐 成为科学研究中必不可少的一部分,数据密集型科学的研究范 式已经兴起,面向海量数据的信息基础建设是建立坚实数据基 础的根本,是数据密集型科学研究的基石。 本文通过对美日两国信息基础设施建设的案例进行分析, 通过借鉴两国先进的信息基础设施建设经验,总结了以下几点 建议。 (1)制定数字战略目标和规划 在全球知识化的快速发展中,如何在激烈的竞争中把握未 来,谋求发展之路, 是制定战略目标和规划的重要意义[14]。 制定战略目标与规划中,不仅要重视已有的传统纸质资源,还 应重视现代化、网络化的计算机技术在数字资源基础建设中的 研究和应用。强调数字化资源的精准分类、多源应用、多地存 储、安全保护, 积极应对数字化时代的机遇与挑战。 (2)整合现有数字资源 目前数字资源建设中,不同资源库和平台采用独立的资源 格式和技术框架, 为了解决在资源建设与利用问题中的“孤 岛”问题,可以通过采用新的技术标准通过定义规范的资源传 输接口,建设多来源、可一站使用的数字馆藏。如面向“图像 ”资源的国际图像互操作框架(International Image Interoperability Framework, 简称 IIIF)[15-16],这种新的资源交互协议 并不要求改变数字资源,而是通过提供统一的检索入口来展示 各个来源库的信息,能够帮助使用者一站发现、使用和管理数 字资源。值得一提的是,IIIF 也不局限于数字资源,并且在特 藏数字化建设 中可以发挥其长。 (3)完善数字服务体系 图书馆的用户体验是很重要的部分,图书馆“智慧化”转 变中,如何通过现代化技术提升数字化用户体验,优化数字服 务体系,是数字资源建设中需要考虑的问题。让用户参与到“ 智慧化图书馆服务,可以增加用户的认同感,用户可以对图书 馆向数字化、智慧化转型的过程中提出有效意见。 (4)注重跨学科合作 通过组织多个学科的学科馆员组成咨询小组,以提供专业 的学科咨询服务, 促进用户对其研究内容的多领域、跨学科 思考,达成跨学科数字资源融合利用, 高效促进我国科研创 新和发展。 参考文献: [1] 潘教峰, 张晓林. 第四范式: 数据密集型科学发现[M]. 科学出版社, 2012. [2] 马费成. 关注当代信息技术和大数据对人文社会科学 研究的影响[R]. 武汉大学第六期院长论坛. 2019: [3] 钱智勇. 美国图书馆合作数字参考咨询服务[J]. 图书馆 , 2003 (5): 39-41. [4] 田燕飞,盛小平.美国高校图书馆数字人文服务研究及 启示[J].图书馆工作与研究,2019(08):32-40. [5] 余贺麟, 武文汇. 论日本走向情报大国之路[J]. 情报杂志, 2020, 39(1): 10-16. [6] 李品, 杨建林. 基于大数据思维的情报学科发展道路探 究[J]. 情报学报, 2019, 38 (03): 239-248. [7] 王飞跃. 知识产生方式和科技决策支撑的重大变革— —面向大数据和开源信息的科技态势解析与决策服务[J]. 中国 科学院院刊, 2012, 27 (05): 527-537. [8] 郭进京,陈秀娟,任慧玲,曹海霞,刘蕾.开放科学环境下 研究型图书馆资源建设与服务分析——以 NLM 为例[J].图书情 报工作,2018,62(14):41-48. [9] RINDFLESCH T C, FISZMAN M J J O B I. The interaction of domain knowledge and linguistic structure in natural language processing: interpreting hypernymic propositions in biomedical text [J]. 2004, 36(462-77. [10] KILICOGLU H, SHIN D, FISZMAN M, et al. SemMedDB: a PubMed-scale repository of biomedical semantic predications [J]. Bioinformatics, 2012, 28(23): 3158- 60. [11] 崔佳伟,吴思竹,邬金鸣,修晓蕾,钱庆.美国国立医学图 书馆 2017—2027 年发 展战略规划分析与探讨[J].医学信息学杂志,2019,40(03):75-81. [12] 王丽媛,高凌云.美国国会图书馆《2019—2023 数字战 略规划》的分析与启示 [J].图书馆研究与工作,2020(07):81-85. [13] 林泽斐,欧石燕.美国高校数字人文研究项目研究内容 解析[J].图书情报工作,2017,61(22):52-58. [14] 柯平.“ 后评估时代” 公共图书馆的战略重点与发展 方向[J]. 图书馆论坛,2019,39(07):1-12. [15] Snydman, S., R. Sanderson, and T. Cramer. The International Image Interoperability Framework (IIIF): A community and technology approach for web- based images[C]. Archiving 2015, Los Angeles, CA, May 19-22,2015. http://purl.stanford.edu/df650pk4327. [16] 付跃安.国际图像互操作框架(IIIF)及在数字资源集 成中的应用[J].图书馆论 坛,2020,40(04):159-166. 14 /page “相遇国科,期盼同行” 国科大线下联谊活动顺利举行 2019级硕士研究生 严格 2020年11月13日晚,由中国科学院文献 情报中心、数学与系统科学研究院、自动化 研究所、科技战略咨询研究院、计算技术研 究所、化学研究所团委等研究生会联合举办 的联谊活动在骏马大厦三层会议厅举办。尽 英雄。 几度夕阳红。白发渔樵江渚上,都 付笑谈中。 本次联谊活动自预告以来,就受到了万 众期待,大家纷纷踊跃报名。活动还没开始 ,会场外的排队状况就已经十分火爆。在工 作人员的协调安排下,会场内、外的同学都 有了属于自己的座位,在主持人的开场,师 兄的讲话和舞蹈表演之后,联谊会正式拉开 序幕。 通过记名字、击鼓传花等破冰环节,大 家逐渐认识了彼此。在紧张刺激的狼人杀, 谁是卧底等游戏中,现场的氛围慢慢了热络 起来。一位同学表示:“和他们玩游戏的感 觉比在研究所里好多了,里面一个个都是人 才,说话超好听的。”另一位同学刚刚被狼 人在黑夜里淘汰,感到很委屈:“我大意了 啊!没有闪!”所幸工作人员也准备了丰富 的零食,被游戏淘汰了也没关系,总有零食 安慰你。 接下来,来到了各个研究所提前准备 的游戏环节,数学院的蜜蜂采蜜游戏,和 自动化所的神仙眷侣游戏,吸引了很多同 学参与。 联谊活动约在晚间9时落下帷幕,不少 同学在结束时仍依依不舍、相谈甚欢。寒 冷冬日、科研征途,希望每个果壳儿都能 找到那个ta陪你一路同行。 /page ( 责任编辑/严格) 拳拳爱国情,声声入我心 ——经济与管理学院荣获国科大一二 • 九合唱二等奖 2020级硕士研究生 梁静 2020年12月6日,中国科学院大学举行纪念“一二·九”运动85周年歌咏比赛以合唱的方 式追忆往昔峥嵘岁月,向革命先烈们致以崇高的敬意,表达了沿着先辈们的道路不断前进探 索的决心。 本次共有29个院系、23支合唱队伍参赛, 文献情报中心所在的经济与管理学院 2020级 同学合唱队于第七个登场。合唱队的姑娘们 身穿着洁白的纱裙,小伙们穿着帅气挺拔的 西装,整齐有序的走上舞台,展现了经管学 子的自信昂扬。 “百灵鸟,从蓝天飞过……”,伴随着悠 扬婉转的歌声渐起,飞扬的水袖、流畅的钢 琴声与跃动的指挥棒交相辉映,共同构成了 一副和谐生动的画面。随着四个声部间交错 、激昂的声音交汇在一起,合唱也渐渐进入 了高潮。侧耳倾听,彷佛有一只只饱含热情 的百灵鸟在耳边时而低吟,时而高歌。 经典曲目《我爱你中国》再次唱响舞台, 此次合唱不仅传承了经典,而且增添了婉转 悠长的京剧元素,加入了专门为这首歌曲编 排的水袖舞。经典与创新的碰撞,唱出了经 管学院的爱国热情,展示出了广大学子浓浓 的中华情。 感谢同学们的团结一心和刻苦训练,感谢 李璇老师全程给予同学们的关心与陪伴,感 谢王建花老师对合唱队员们的关爱与鼓励! 最后再次感谢所有同学们的认真努力,同学 们的优秀表现体现了文情学子全面发展的底 蕴。 ( 责任编辑/梁静) /page “情深意重、再度启程” ——2021年元旦晚会圆满落幕 2019级硕士研究生 孙蒙鸽 岁岁朝朝,又是一年元旦晚会,文情中心与过程所的老师和同学们相聚在过程大厦A座5 楼多功能厅共度2021年“情深意重、再度启程”元旦晚会现场。 本次元旦晚会首次采用B站直播,并在微信平台上 与所有观看观众开展“我要上墙”的互动。我们在线 上邀请了文献情报中心领导,并在现场有幸邀请到了 数位过程所领导,与同学们一同参与这次晚会。 此次元旦晚会在开场舞《Playing with fire》的 火热氛围中开始,随后,文献中心主任刘细文与过程 所杨超副所长的致辞拉开了元旦晚会的序幕。致辞中 提出,在这不平凡的2020年,此次元旦晚会是弥足珍 贵的。新年新气象,两位领导嘱托全体同学应胸怀热 血,珍惜眼前光景,在新的一年中独立自主,砥砺前 行,把青春理想主动融入中科院这个大家庭中,做一个有道德、有智慧的翩翩少年,最后祝福所 有的同学学有所成,圆梦人生! 晚会正式开始,让我们跟着帅气美丽的主持人,一起来 欣赏大家精彩的表演。一首《小夜曲》娓娓道来,低沉的 弦乐声,奏响了夜的乐章。山上百花香,下山撒日朗,熟 练掌握武术的刘懿韬同学用他的空翻、侧翻等技能征服了 现场的观众。现代研究生的科研生活是怎样的呢?郎宇翔 同学用小品告诉你,《科研人》有苦但也多的是令人捧腹 的大笑。随后,二胡、琵琶、古筝一一出场,展现传统乐 器的含蓄之美。独唱、合唱和舞蹈也齐上阵,让现场的气 氛再达高潮。 在众多节目中,穿插着一系列丰富有趣的游戏和抽奖环 节,备受关注的晚会锦鲤也在大家的瞩目中诞生,将在晚 会结束后领取丰厚大奖。 最后,现场的师生纷纷走上舞台,一起齐唱《最初的梦 想》,我们相信,前进路上,同学们都将保留初心,实现 最初的梦想。 文献情报中心与过程所两所合办的“情深意重,再度启程”元旦晚会就此结束,即使难忘今 宵,但依然要大步前行,即使难分难舍,但也不得不散场。感谢晚会筹办过程中所有老师同学 的辛勤付出,祝愿文献情报中心和过程所能够越来越好! ( 责任编辑/梁静) 17 /page 人类与病毒亲密接触的那些事 ——《病毒来袭,如何应对下一场流行病的爆发》读书报告 刘惠 中国科学院文献情报中心 摘要:新型冠状病毒肺炎大流行使我们再次思考新型病毒为 何会不断入侵人类社会并引发骚乱。人类社会70%的新发传 染病来自野生动物。而病毒从野生动物跳到人类身上的途径 到底有哪些?这是内森·沃尔夫的《病毒来袭,如何应对下 一场流行病的爆发》回答的核心问题。本文将介绍该书的核 心内容和主要观念,并在最后给出自己的思考。 1 引言 如果我们把视野拉长到整个人类文明 史,就可以发现1918-1919那场流行全球的 西班牙大流感的惨痛记忆还未完全消除,新 病毒便一个接一个出现在人类视野中,包括 H5N1、埃博拉、寨卡、尼帕病毒、SARS等 等。引发2019年底2020年初新型冠状病毒肺 炎大流行的SARS-CoV-2病毒是冠状病毒科 中的第七个成员,甚至拥有比SARS病毒更 强的感染能力。SARS发生短短十几年后, 新型冠状病毒再次借由人类餐桌跳向整个人 类社会,引发将再次改变人类历史和世界格 局的全球大流行。那么是谁给了新型冠状病 毒这块跳板?新发传染病为何越来越多?内 森·沃尔夫的《病毒来袭,如何应对下一场 流行病的爆发》能给我们一些答案。 2 概括和讨论 内森·沃尔夫是哈佛大学免疫学和传染 病学博士,他对新型病毒如何进入人体并引 发传染病非常感兴趣,并为此付出了行动。 在非洲和亚洲偏远地区的原始丛林中进行长 期艰苦的考察研究后,他将自己的研究结果 分析整理成了这部优秀的科普作品----《病 毒来袭,如何应对下一场流行病的爆发》。 这部书主体分为三个部分,我阅读过 后认为可以总结归纳两大部分,分别是新 型病毒不断跨种群传播到人类身上的途径 和如何检测防控流行病的爆发。显然作者 的研究和实践经验让他在第一部分给出了 充分且令人信服的论述,但对于检测和防 控,作者的论述稍显薄弱,且篇幅较小。 因此该书最有价值的部分就是“新型病毒 为何不断跨种群传播到人类身上”。新型病 毒不断跨种群传播到人类身上的途径或原 因要从进化树上人类开始与黑猩猩等近亲 分道扬镳说起。这里我从时间角度将传播 途径可以划分为工业革命以前和工业革命 之后。 工业革命以前,人类从原始社会迈向 农耕文明的过程中有两大行为加速了病毒 的跨种群传播——狩猎和驯养。狩猎对食 物链顶端的猎杀者的影响可以从黑猩猩身 上上窥见一斑。艾滋病毒就起源于黑猩猩 对猴子的捕食。这里需要先谈谈病毒的传 播策略,书中谈到三种,分别是重叠读框 能力、产生新基因也就是突变的能力以及 产生镶嵌体子代病毒的能力。2003年科学家 的研究报告就显示黑猩猩SIV是一种镶嵌体 病毒,由红顶白眉猴SIV基因片段和大白鼻 长尾猴SIV基因片段组成。这个研究结果说 明黑猩猩对这两种猴子的习惯性捕食使得 两种SIV基因片段在黑猩猩种群广泛传播并 最终在零号患者体内相遇,并发生了基因 重组,诞生了黑猩猩SIV。然后在19世纪晚 期或20世纪早期的某个时候,由于人类的猎 杀行为SIV跳到人类身上,就有了HIV。所 以,狩猎行动曾经让人类祖先在与恶劣的 18 /page 生存条件作斗争时还要面临多样病毒的 侵扰。驯养活动使得每一种家畜的微生物库 都与人类微生物库进行了交叉。尤其是温带 地区,家畜数量多,导致温带人口携带多样 性更加丰富的微生物。这一点贾雷德在《枪 炮、病菌与钢铁》也提到了。比如麻疹就来 自牛瘟,这种病毒从奶牛跳到人类身上①。 狩猎和驯养扩充了人类的微生物库,使 人类暴露在更多危险病毒下,更进一步,由 于人类种群的单一性造成种群瓶颈、蒸煮食 物行为出现、栖息地迁移等,几千年后人类 的微生物库极大缩减,即微生物净化。微生 物净化使得人类更加脆弱,一些保护性的疾 病预防策略就在基因的遗传选择中被遗弃了 。因此在暴露在更多危险病毒的情况下,人 类被新型病毒感染的概率大大增加。 工业革命发生以后,新型病毒进攻人类 就有了更多途径和工具。不得不说其中的交 通运输革命不仅把人类带入了地球村,还把 人类带入了流行病时代。交通运输的发展是 人类内部的交流更加紧密,也给世界各地的 原本决不可能有交集的微生物带来了交流、 进化的机会。病毒能传播到更多生物体内, 从而同一生物体内就有更多种的病毒相遇, 然后无数个新型病毒混合器就诞生了。它们 激情碰撞,基因片段随机组合,积极努力地 为自己寻找更优的进化和传播路线。此外, 医学技术和生物技术的发展也增加了病毒传 播的风险,包括输血、注射、器官移植、生 物恐怖袭击、实验室研究等等。 3 感想和总结 《病毒来袭,如何应对下一场流行病的 爆发》这本书的核心思想就是只有找到病毒 的传播来源和途径,才能预防像SARS冠状 病毒这样对人体具有极大攻击性的外来病毒 再次入侵人类社会。确实,人类社会70%的 新发传染病来自野生动物。它们都是由原本 不应该在人类之间传播的病毒引起的。而这 些传染病包括已经与人类共存超过80年的流 感、麻疹、鼠疫、疟疾等,人类还没有办法 彻底消灭它们。到目前为止,人类在世界范 围内成功根除的传染病只有天花。这一事实 是对人类肆无忌惮掠夺自然资源和破坏自然 环境的行为的警告! 根据该书的内容,对于SARS冠状病毒 的传播生态过程就能更好地理解了。 SARS冠状病毒入侵人类社会的起源要 追溯到广东野生动物市场。科学家在野生动 物市场的果子狸体内分离出了SARS病毒, 证明果子狸就是SARS病毒的直接来源。但 果子狸只是间接传染源。还需确定病毒的自 然宿主。自然宿主是指自然界中长期携带一 种病毒的一类动物,这类动物与这种病毒和 平相处,不会发病,是病毒长期进化和变异 的基地。根据中国科学院武汉病毒研究所石 正丽研究团队的常年研究,蝙蝠可能是 SARS病毒的自然宿主。该研究团队在云南 某地区的某山洞内发现的十几株SARS样病 毒基因。而SARS病毒就是蝙蝠身上携带的 十几株SARS样病毒基因组合而成的。那么 这个基因重组的过程是怎么发生的呢?这就 跟交通运输有关了。我国南方地区某些省市 存在经常食用野生动物的习惯,其中广东尤 为典型。包括云南在内的各省市捕获的野生 果子狸会源源不断地运往富裕且野味消费能 力大的广东省。被大量捕获的果子狸身上必 然携带着由蝙蝠传染的不同SARS样病毒基 因。在运输、消费、宰杀的过程中病毒进行 了交叉感染,最终进化和变异出了极具传染 性的SARS病毒②。 讽刺的是,新型冠状病毒肺炎的引爆 点是在华南海鲜市场,距离SARS在广东野 生动物市场引爆传染病仅仅过去了大约16年 的时间。2003年的非典仍旧没有让人们认清 人与野生动物、人类与自然的和平相处的平 衡界限在哪里。如果在非洲和南美洲靠近原 始丛林的偏远村庄,人们要靠捕猎野生动物 为生,那还情有可原。那在人口密集,文明 先进的城市地区仍需要通过食用野生动物来 满足猎奇心理、吃什么补什么的迷信观念就 真的让人迷惑。小到基本的生物安全卫生知 识,大到地球命运共同体的观念,人类对自 然的认识和敬意还远远不到位。考虑到全球 人口之多,普及基本生物安全卫生知识和树 立地球命运共同体的观念仍然是一个艰巨的 任务。 ①[贾雷德·戴蒙德:枪炮、病菌与钢铁》,沈捷译 ,上海:上海译文出版社,2006 年,第 67 页。 ②石正丽:一席演讲 | 中科院武汉病毒所石正丽研究 员:追踪SARS来源 ,2018年 7 月 22 日,https://www.sohu.com/a/242597520_749000,2020年 5 月 02 日。 19 /page 刻在芯片上的电路图案,记录着工程师的研发人生 刘鲁静 美国对华为的新禁令于2020年9月 15日正式生效,但也许美国希望华为 继续依赖他们的芯片,AMD、Intel两 家公司日前不约而同地证实了他们已 经获得了对华为的出货许可,这也是 目前仅有的两家公开表态可以跟华为 合作的芯片公司。 芯片,就像一只彩色的甲壳虫, 成为整个行业生态圈中最小但最重要 的部件。越精细的制造工艺,就越需 要高端的光刻机来完成,放眼全球, ASML是一家目前掌握了全球最领先的 光刻技术的荷兰公司,占据全球市场 份额的80%,能做精度在7nm及以下的 光刻机。 这家站在行业顶峰的企业,脱胎 于飞利浦,发展初始并不被高层领导 看好。全靠一群“有勇气,有热血且 不言放弃”的团队成员们,把这个企 业支撑下去,才有了今天的“传奇” 。 善于发明创造的荷兰工程师们 贾特·斯密特是ASML的第一任首 席执行官,他在加入ASML成为管理者 的开始,就将“行业第一”作为目标 。他从来不计成本,除了给员工“画 饼”,还会进行“自我催眠”。在职 期间,他满脑子只想着把所有的事情 做到最好,最佳。也一直希望推出一 款革命性的机器,一举攻下光刻机的 江山。 为此,他奔波于不同的会议、企 业和研究室去推销自己正在完成的产 品,并为未来那台革命性的机器组建 团队,提前攻占市场。面对被美国本 土和日本企业统治的美国市场,斯密 特一改常规的产品宣传图的营销模式 ,决定讲述一群善于发明创造的荷兰 工程师的故事。这些工程师,正是凭 借着一腔热血把ASML支撑下去的人们 。 梅耶是其中最幸运的男青年,也 许他的幸运与他的专业技能是分不开 的。尽管在第二次世界大战中,他失 去了父母,多次被驱逐,但两次从奥 斯维辛集中营中存活下来。 第一次被送入集中营时,因为运 气好躲过一劫。第二次被送入集中营 时,因为擅长机械而被派去修理火车 车厢,而且还两次逃脱了被送进毒气 室的命运,第一次在挑选谁去见死神 时被漏掉,第二次被苏联工农红军赶 到搭救。梅耶后来写道:“如果当时 不是那种情形,我现在就已经是 胶 、化肥或鞋油了。” 这种运气好,又有专业技能的人 加入ASML似乎并不让人感到意外。而 对于吉斯·布休斯来说,他对ASML的 贡献简直就是来源于他惊人的“天赋 ”!他没有接受大学教育,在当地职 业学校就读后便去参军了,退役后便 接替生病的兄弟在卖酒的商店洗瓶子 ,并做做算账之类的杂事。 谁都没想到,世界上世界上第一 台步进光刻机是由他和赫尔曼·范希 克创造的,而且他还研发了一种精确 度最高的对准技术,不仅如此,他还 精益求精,在ASML中挖掘并贡献了自 20 /page 己最大的“潜力”。 与布休斯不同,范希克是一个富二 代,他一边像一个刻板印象中的富二 代,在生活中随性随意,留着披头士 发型,不看重层级,也不关心地位。 一边又为了热爱的光刻机事业,追求 极致,他始终认为,一定有更好的办 法,正是这一想法驱使他在长达几个 月的时间里竭力寻找替代方案。他与 布休斯制造的这台机器因为能将这些 图案直接投射到晶圆上,所以被称之 为晶圆重复曝光光刻机 1 代。 贾特·斯密特的“胆大人生” 在 SEMICON West 春季宴会上, AMD的首席执行官杰瑞旁若无人地哀叹 美国芯片制造商的质量和服务,这一 声哀叹被斯密特牢牢地记在了心里, 他觉得,ASML的机会来了。 为了引起杰瑞的注意,斯密特用 大而粗的文字写上广告标题:“我们 听见了你的话,杰瑞。”标题下面写 着:“ASML光刻机接受杰瑞·桑德斯 的可靠性挑战,保证提供90%的运行时 间,这几乎是该行业现在的2倍。杰瑞 ,你甚至不用担心圣安德里亚斯断层 的地震,我们这些机器是牢不可摧的 。”最终,斯密特如愿与杰瑞达成了 合作。 斯密特的“大胆”远不止如此, 他还负责给团队和应聘者们“画饼” 。实际上,他不知道竞争对手具有什 么样的技术,但他知道如果教练告诉 球员自己的队伍比对手强很多,奇迹 就可能发生。他一遍一遍的重复着: “我们要成为市场的主导者”、“先 生们,我们要争夺金牌”、“伙计们 ,虽然我们现在还没有产品上市,但 我们一定会成功的。” 这一“大胆”还被用在招聘上, 他的策略是把自己的招聘活动作为飞 利浦的招聘活动。尽管广告中没有明 确表示在ASML工作就是在飞利浦工作 ,但看过该广告的人都这样以为。在 描述中他还写道:该公司希望为在各 学科受过良好教育的工程师们提供在 “世界最前沿领域”工作的机 会。尽管很多求职者是冲着飞利浦 公司去的,最终还是被ASML诱导成 功。 “阅读狂人”和“圆桌先生” 接棒斯密特的是维姆·特罗斯 特,他原本在博姆普杰斯迪克读完 高中和职业学校后,准备去代尔夫 特理工大学。但那时荷兰正被德国 入侵,他拒绝签署效忠宣言,最终 没能进入大学学习。回到了博姆普 杰斯迪克后,他便在他父亲的面包 店里工作。1945年9月,年轻的特罗 斯特从战争中恢复过来后,父亲拿 出家里最后的40美元送他去代尔夫 特理工大学学习物理。 他是一个“高效者”,因为觉 得走路浪费时间,所以他走路走得 非常快。 他是一个“细节控”,每当特 罗斯特离开埃因霍温,无论是工作 还是度假,他都会制订详细的计划 ,里面记录了他将入住的每家酒店 的电话号码和将参观的地点。 他还是一个“阅读狂人”,对 他来说,阅读材料就是他放松的最 好的办法。因此,他会阅读公文包 里的会议报告、信件、内部邮件、 备忘录、期刊文章的每一页。 后来,在1990 年年初,飞利浦 宣布威廉·马里斯将领导ASML。年 轻的马里斯认为自己是“圆桌先生 ”,他以此为标签试图像员工们传 达,每个人都在同一级别上合作, 没有人是老板,没有人可以摆架子 。 他还将员工们视为“自己的孩 子”,这群孩子在他眼中是一群年 轻的雄狮,他很清楚地知道他无法 控制住这些人,而且自己也不是一 个有魄力的领导人。正是因为正视 了自己,他才意识到,他需要给“ 孩子们”一个家,和一个肩膀。“ 孩子们”可以做任何喜欢的事,但 如果真正碰到了麻烦,他们总是可 21 /page 以倚在这位“父亲”的肩膀上哭泣。 这样一群有着多元背景,在各自 专业领域颇有能力的人们聚集在一起 ,共同推动着ASML的发展。荷兰作者 瑞尼·雷吉梅克采访了百余位 ASML 员工,从 CEO 到一线的技术工人,酝 酿15年,采访写作7年,写出了世界上 唯一一本详细记录ASML从飞利浦前身 到成为行业之王的书。 这个故事的非凡之处在于 ASML 有在成立最初就有这多元背景的员工 ,第一代领导人斯密特是如何将这些 人聚拢在一起,为了同一个目标而奋 斗,尤其是在项目处在濒临夭折的时 候,斯密特是如何带领ASML一路坚持 下去。 当然,这些优秀的工程师们和领 导者们又是如何将这一目标始终如一 的贯彻下去,最终站在了行业的巅峰 。ASML正是讲述这样一个故事,瑞尼 ·雷吉梅克力求重构ASML发展历程, 让大家有机会了解ASML的文化传承和 崛起之路,以及这家公司是如何独立 影响了全球芯片技术的进步。 22 /page 虚妄的爱与世界里的美梦 ——《了不起的盖茨比》读后感 2019级硕士 武楷彪 炊烟起了,我在门口等你。 夕阳下了,我在山边等你。 叶子黄了,我在树下等你。 月儿弯了,我在十五等你。 我在对岸等你,你不来,我不老! 一、对岸的凝望,妄负的深情 《了不起的盖茨比》通过尼克·卡 拉威的视角,讲述了主人公盖茨比的一 个看似真情却最终是一个虚无缥缈的梦 的爱情故事。 盖茨比,一个贫穷的比达科他州的 农家子弟,在肯塔基州一个军营里当少 尉时,遇见一个上流社会的女子黛西, 并对她一见钟情,把她作为一个完美的 理想追求着,至死不渝。他隐瞒了自己 的真实身世,凭借着自己的英俊、聪明 和敏感获得了黛西的爱情。热恋一个月 后,他被派遣到法国去作战,一去就是 五年。 黛西受不了这漫长的寂寞,结果在 盖茨比走后的第二年就嫁给了富豪汤姆. 布坎恩。婚后的生活使黛西失去了少女 时期的纯真,变得玩世不不恭。她年轻 漂亮,她的周围又是一个浮华的世界, 充满着鲜花的芬香和令她愉悦的阿谀奉 承,充满着用新的曲调来放映现实生活 的意蕴、悲观及其流行风尚的管弦乐队 ,萨克斯管通宵吹奏着,奏出《比尔街 爵士乐》的哀婉音乐,成百对穿金戴银 的情侣们翩翩起舞,踏起的尘土在灯光 下闪闪发亮。在快乐的喝茶时间里,总 有一些茶馆里充溢着恋人们卿卿我我的 甜蜜窃语声,娇嫩欲滴的面庞在这中间 飘来荡去,宛如玫瑰花瓣被奏着凄婉 音乐的喇叭到处吹落在了地面上。黛 西早已不是盖茨比认识的那个少女。 五年后,盖茨比从国外归来,他 仍旧热烈地爱着他心中的黛西,追寻 黛西的踪迹。他在黛西家的对岸买了 一栋豪宅,将它作为富贵的标志,在 隔海相望的地方注视着对岸那绿色的 灯火,向黛西发出无声的召唤,召唤 着他心中的那份爱。 盖茨比认为是金钱的诱惑使黛西 抛弃了他们的爱,当他有钱归来之时 那份依旧会回来。成为大富豪之后的 盖茨比每日大宴宾客、举办晚会,挥 金如土,彻夜笙箫,以引起黛西的注 意,勾起她往日的情思。通过盖茨比 的精心安排和尼克的搭线,两人终于 相见。被家庭生活困扰的黛西最终对 盖茨比说出来“我爱你”。可那份爱 早已变质。当汤姆、盖茨比在同一屋 23 /page 下“战火”四起时,她勉强说出来她 的“爱”,“她手脚发抖”、所说的 话渗入了许多虚假的成份。当她撞死 了自己丈夫的情妇之后“头也不回一 眼地将车开走”,毫无犹豫地与丈夫 汤姆布坎恩合谋将罪行嫁祸给盖茨比 。富家小姐在社会的一步步浸染之下 终是冷漠了。可盖茨比还是一厢情愿 地相信着这份爱,没有直面这血淋淋 的事实。 “问世间情是何物,直教生死相 许。 天南地北双飞客,老翅几回寒暑 。 欢乐趣,离别苦,就中更有痴儿女 。”金庸笔下的李莫愁是个爱中的痴 儿女,盖茨比也是一个痴儿女,痴得 不愿意相信他心目中的黛西已死的事 实,紧抓着现实中早已“变味”的黛 西,忽略她身上“迷离的芬芳和金钱 的铜臭”,他的爱注定也是一个悲剧 ,纯洁的爱就这样献送给了一个俗物 。李莫愁是个为爱痴狂、为爱成魔的 悲剧者,而盖茨比是个沉醉于自己理 想情人之中的梦想破灭者。爱情的幻 灭有着个人的因素也有着时代悲剧的 缩影。“虚幻的美国梦、迷茫的一代 美国青年”在盖茨比的爱之中有,在 叙述者尼克身上亦有。盖茨比从未放 弃对心中理想伴侣的追求,但最终却 被惨死。他的梦美丽而纯真却禁不起 现实的“碾压”。尼克从盖茨比的死 中看清这个世界——浮华又虚假有真 情实意的混合。他从富豪区离开,离 开自己当时已经爱上的女子回到自己 落叶生根的地方。 二、华丽的爵士时代的挽歌,如诗般 梦幻 “他经过了漫漫追寻才来到了这 片绿色的草地上,他的梦想一定已经 离得他如此之近,以至于他认为不会 抓不到它了。他不知道他的梦想已经 被甩在了他的身后,已经隐在了城市 以外的溟蒙之中,在那里,共和国的 黑暗的土地在黑夜中延伸着...... 盖茨比相信那绿色的灯火,相信 那年复一年的令人迷醉的未来。它在 过去曾从我们身边溜走,不过这算不 了什么——明天我们将更快地奔跑, 更阔地伸出我们的手臂...... 终有一天—— 为此,我们将顶在那不停地退回 到过去的潮头,奋力向前。” 作者自己曾言,“这部小说的重 心是放在“幻想的破灭上”——正是 这种幻想才使得这世界那么鲜艳,你 根本无须理会事情的真与假,只要他 们沾上了那份魔术似的光彩就行。” 这部小说以以20世纪20年代的纽约市 及长岛为背景的中篇小说。美丽的“ 美国梦”支撑着人们的信念和前进的 动力。 “美国梦”起源于殖民时期,本 杰明.富兰克林曾提出关于追求个人主 义,通过自力更生获得幸福的信条。 也就是说,任何人,不论他的出身、 种族及宗教信仰如何,凭借勇气、勤 奋及运气,都能获得成功。而之所以 称其为“美国梦”,是因为哪些刚踏 上“新大陆”的欧洲人,面对这片富 饶的土地,相信他们的梦想可以在这 片广阔的土地上实现。 而《了不起的盖茨比》却给狂热 追求“美国梦”的人们泼了一盆冷水 ,在作者的笔下,它不过是人们对于 物质不惜一切手段自私而冷酷地追求 的一种依托。小说中尼克、盖茨比、 汤姆和黛西都意图从中西部到东部去 24 /page 实现他们的梦想——对金钱、名 誉、成功、刺激的追求。黛西不会嫁 给一个一文不名的男人,她和汤姆的 生活必须由豪华的房子、马球、旅游 和每天盘算着如何打发时光构成;而 盖茨比也只有在通过各种非法手段赚 到大笔的钱,住进海滨别墅,过上一 掷千金的生活之后,才感到自己有信 心去追回黛西——他的“美国梦”。 可当他奋力追到自己的“美国梦”时 却被推进的死亡的“悬崖”。个人的 奋斗最终并未换来幸福美满的生活。 他成为富翁之后夜夜笙歌,宴请宾客 ,社会各界名流在他那华丽的宫殿里 欢歌载舞,可又有几人知道在座的何 人是这豪宅的主人?人们关心的不过 是此夜的欢歌与愉悦,重要的是此夜 的笙歌与繁华。这个突然暴富的神秘 人,他们并不想知道是谁,也不想结 交。盖茨比看似是一个上流社会防富 豪然而这个圈子里的人并没有完全接 纳他。又或说这个圈子里的人看重的 是自己,接纳一个人是情与面上的东 西,是隐藏在金钱之下的虚无。 三、只想现在看着你,而不是在以后 黛西撞死丈夫的情妇头也不回的 逃跑,盖茨比认为她是受了惊吓,她 是因为他与汤姆的争执而慌乱了心, 她撞死了眼前的这个妇人不是必然而 是偶然。他细声安慰黛西,在黛西房 下的灌木丛中守护黛西,生怕汤姆对 黛西做出暴力行为。他苦守一夜换来 的却是黛西的冷漠。当盖茨比的尸体 躺在豪堡中时,却没有人来祭拜。整 个豪堡入死一般的沉寂。往日的一切 热闹景象似乎本来就与这座豪堡没什 么关系。而此时的黛茜正和汤姆在欧 洲度假,享受着他们的“美好人生” 。黛西在盖茨比为她丧命后亦“不曾 送来一个唁电或是一朵鲜花”,仿佛 盖茨比的死亡是无意中瞥见的报纸上 的无聊新闻。 爱情成为了泡沫,那亲情总该是 一种神圣与纯洁吧?当尼克第二次见 到盖茨比的父亲时,这位已经得知儿 子死讯的父亲在第一次的伤心之后正 在大厅里激动地踱来踱去,“他对儿 子和其财富的自豪感在持续地增长, 他将每一个精彩的细节急切地指给我 ,从我的眼中寻找赞许的神情。”比 他儿子更重要的是儿子的财富和儿子 取得的荣誉。 盖茨比去世后,他的生意合伙人 沃尔夫西姆忙于生意并未去参加他的 葬礼,当尼克找到他时,他“悠悠然 ”地道出了理性文明剥夺道德本真的 人性灾难――“让我们学会在一个人 的生前对他表示我们的友谊和关怀, 而不是在他死后。我自己的原则是远 离事外。”曾经亲密无间的同伴将这 个世界的冷酷与无情淡淡道出,也说 出了“与其在他走后百般思念不如在 他在世之时与他共饮一杯茶”的情爱 哲学。 25 /page 2019级硕士 妖怪 徐潞杰 夜深人静 窗外有呜呜的响声 我问那是什么 你说 是捕食的妖怪 青天白日 稚子被老妇当街掳走 那老妇慈眉善目 我疑 那是不是妖怪 夜半阑珊 屋外是无边的黑暗 我问都有什么 你说 是狩猎的妖怪 黄天焦日 富贾对女子强取豪夺 那富贾衣冠楚楚 我惑 那是不是妖怪 我在夜阑时轻声歌唱 我在破晓时踏过黑暗 我笑 没有妖怪 我听见警报声长鸣 我看见法槌落定 我笑 没有妖怪 26 /page 求职讲堂 | 干货满满的第二讲,你听了吗? 2020年12月12日,中科院文献情报中心研会再次邀请馆优秀毕业生段 美珍师姐,为馆内外的同学们分享干货满满的求职经验!我们受益良多! 特此分享给大家~ PART-1 首先,求职伊始最重要的就是一 份合格的简历。“好”工作从一份“ 好”简历开始。所谓合格的简历就是 “亮点突出、条理清楚、要有内容、 不断更新”。与去互联网公司求职不 同,如果想要进入高校或者科研机构 ,那学术成果、科研项目相对重要。 PART-2 其次,求职需要丰富的招聘信息 源,美珍师姐给大家提供了三种获取 信息的途径或渠道,分别是关注针对 性的招聘网站、关注重要的考试信息 以及跟导师多沟通交流。其中,师姐 重点介绍了一下军队文职的岗位特点 及相关考试。 PART-3 第三,准备好简历,搜集好信息 ,就进入投递简历和面试环节。这里 友情提示,每个人可能有很多选择, 但投递简历、填报系统和准备面试往 往需要花费时间和精力,所以师姐建 议大家有针对性地投递,平衡好找工 作与科研之间的关系。 27 /page PART-4 第四,有针对性地投递就需要提 前明确自己的兴趣爱好、条件定位、 现实需求以及机构特征。提前规划好 自己的职业生涯,好的开始就是成功 的一半。而当进入毕业季,当面临求 职选择时,不要比较,不要被繁多的 选择冲昏头脑,“没有最好的选择, 只有对你来说更好的选择”。 新岗位后的工作情况,以及军队文职 一类岗位的招人时间点、面试流程、 工作内容等。讲座结束前,进入问答 环节。同学们提出了面试如何更好地 展示自己,找工作的时间节点等问题 。美珍师姐均进行了非常详细的解答 ,提供了丰富的细节。 你若盛开,清风自来!越努力, 越幸运!带着师姐的祝福,让我们都 自信且有把握地走向毕业季吧! PART-5 最后师姐向大家介绍了自己入职 求职讲堂 | 教研岗位求职怎么做?优秀师兄告诉你! 求职讲堂第三讲,我们邀请来了博士师兄田人合。田人合师兄的科研 成果十分丰富,在国家自然科学基金委认定的重要期刊《情报学报》、《 科学学与科学技术管理》,以及西北大学认定的权威期刊《图书情报工作 》,其他CSSCI来源期刊《情报杂志》、《科技进步与对策》、《经济学( 季刊)》,SSCI期刊《Journal of Baltic Science Education》 发表论文10余篇。 担任西北大学认定的权威期刊《图书情报工作》及《农业图书情报》审稿 专家。目前在西北大学公共管理学院工作。 首先,田师兄以自己的简历为例 讲解了如何制作适合自己求职方向的 简历,主要分为三部分:投简历时使 用的PDF版、正式面试时使用的PPT 版、科研及教学试讲PPT。总的来说 ,简历应形式与内容并重、突出重点 、简明扼要、全面展示。其中,突出 重点是指重点围绕“我”展开;简明 扼要是指语言精炼;全面展示是指德 智体美劳全方位立体展示。其他小技 巧包括:PDF版本可以将相关的证明 材料扫描件放在后面,并制作一个目 录方面整体浏览。而PPT版个人简历 则应严格按照面试要求制作,不断演 练,不断打磨。 然后,田师兄介绍了毕业后的求 职经历,包括硕士和博士毕业后分别 正式面试了哪些岗位、获得邀请的岗 位等。经过研究生就读期间的认真学 习以及研究经验的积累,再加上得体 的个人简历和精彩的面试表现,田师 兄几乎拿到了正式面试的全部岗位。 但是每个岗位情况不同,包括地域、 氛围、待遇等等。田师兄用他的实际 经历告诉我们首先要自我定位准确, 然后在面临诸多选择时,结合岗位的 特点和自己的追求进行选择。 接着,田师兄介绍了一下事业单 位求职信息获取渠道,包括各大高校 人力资源部(人事处)、各研究所招 28 /page 聘公告、微信公众号、小木虫等。通 过各大高校人事处(人力资源部)网 站直接查找对口学院招聘信息、邮件 、电话,投递简历是最为直接和有效 的方法。而在投简历等消息的过程中 田师兄叮嘱一定要记住两个字:主动 !静等只会生藓,不会开花。 找工作关系到自己的切身利益, 求职过程中需要明确细致地询问清楚 相关细节。田师兄针对硕士总结了几 个关注点:岗位、编制、考核等,针 对博士总结了几个关注点:岗位、编 制、考核、入职、待遇、发展等。 最后,田师兄跟大家谈了一个很 关键的问题,违约与改派。具体流程 和细节大家可以查找相关文件,或者 询问张章老师。每个人都有一次改派 的机会,但允许的时期长短每个单位 的要求并不相同。所以当你碰到这种 问题,一定要谨慎再谨慎哦! 这次讲座,田人合师兄充分展示 了他讲课的功力,时间不知不觉就过 去了一个多小时,大家依然意犹未尽 。最后,师兄祝福母校的学弟学妹们 都能找到满意的工作,早日做好职业 规划! 29 /page

《研究生通讯》2021年第二期(vol70).pdf




