中国科学院信息化发展报告 2011.pdf
中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 中国科学院 信息化发展报告 中国科学院信息化工作领导小组办公室 i 《中国科学院信息化发展报告 2011》编委会 顾 问: 江绵恒 施尔畏 主 任: 谭铁牛 副主任: 廖方宇 丁二友 委 员: (按姓氏拼音顺序排列) 陈明奇 迟学斌 丛培民 黄向阳 焦文彬 黎建辉 黎 文 李 俊 李望平 刘志江 罗铁坚 马永征 肖 云 张晓林 张曦琼 《中国科学院信息化发展报告 2011》编写组 组 长: 陈明奇 副组长: 刘志江 许海燕 统 稿: 刘 阳 王常青 编 辑: 王常青 唐 成 员: (按姓氏拼音顺序排列) 陈 刚 陈 亮 李长江 炜 陈 肖 邓 勇 杜义华 何洪林 黄朝晖 金 钟 李 寅 刘振清 卢耀华 罗 泽 吕秋培 马俊才 马永征 孙健英 田 喆 王 英 虞路清 袁慧如 张 娟 张耀南 诸云强 ii 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 序 言 发端于上个世纪后期的信息革命,以激情四射的活 力迅速波及人类社会发展的各个领域。信息科技迅猛发 展,信息化的影响不断拓宽和深入,极大地改变了人们 生活、工作方式并深刻影响着人类的思维和行为模式。 2010 年,全球新增互联网用户达到 2.26 亿,使得全球 用户总数超过了 20 亿,比五年前翻了一番。其中,我 国上网人数超过了 4 亿。在 2009 年全球 IT 行业竞争力 指数排名中,中国位列全球第 39 位,较 2008 年上升了 11 个名次。我国已成为信息化进程发展最快的国家之一, 信息化在我国的政治、经济、社会和科技等诸方面都发 挥着重要的作用。 当今世界的政治、经济、科技格局正在发生深刻变 革。世界经济正在从金融危机中缓慢恢复,但面临的风 险和不确定因素依然很多。历史的进程特别是近代以来 的发展昭示我们,人类文明的每一次重大进步都与科学 技术的革命性突破密切相关,科学技术已经成为人类文 i 序言 明中最活跃、最具革命性的因素。当前,世界科技正处 于新科技革命的前夜,物质科学、能源资源科技、ICT (信息通讯技术)技术、材料与先进制造和过程技术、 生命科学与生物技术、生态环保、海洋、空天等领域都 酝酿着重大的创新突破。科学技术的重大突破必将为生 产力的发展打开新的空间,未来的科技与产业必将以绿 色、智能、共创共享和可持续发展为特征。抓住科技创 新突破的机遇,抢占国际经济制高点已经成为世界发展 的趋势。 2010 年是“十一五”规划实施的最后一年,也是全 面谋划“十二五”国家经济社会科技发展的关键之年。 我院要通过“创新 2020”的实施,抢占未来全球科技发 展的制高点,大幅提升我国自主创新能力和可持续发展 能力,引领和带动中国科技创新能力实现跨越发展,促 进产业结构调整升级和发展方式转变,促进战略性新兴 产业培育发展,促进形成支撑创新型国家的八大经济社 会发展的战略体系,为我国实现科学发展、创新发展、 绿色发展、普惠发展、和谐持续发展提供雄厚的知识基 ii 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 础、强大的发展动力和有力的科技支撑。 在“十一五”期间,我院的信息化基础设施能力不 断增强,由高速科技网络、超级计算和科学数据中心构 成的先进科研信息化基础设施及其服务环境已初步建 成;科研活动信息化工作不断推进,探索科研模式的创 新取得了较大进展,e-Science 项目示范应用效果明显; 科研管理信息化工作取得可喜成果,ARP 系统得到持续 优化完善,成为提高效率和支持辅助决策的重要管理平 台;教育业务管理和继续教育培训信息化工作进展明显, 为提升教育水平和质量提供支撑;网络科普资源体量不 断扩大,科普服务日益丰富。院网站群的网络宣传和传 播能力得到提升,院属单位网站建设取得新的进展;数 字文献资源建设不断推进,综合集成和服务水平得到加 强;全院信息化环境建设日趋完善,信息化保障能力稳 步提升,为科技创新提供了强大的信息化基础支撑。 “十二五”期间,我院将面向“创新 2020”发展战 略,建设开放共享、功效一流、安全可靠的信息化环境, 促进信息化与科技和管理创新活动的深度融合,引领我 iii 序言 国科研信息化发展,逐步建成信息化中国科学院。在“十 一五”信息化建立的三大环境、五大平台和三个体系的 基础上,抓住科研信息化和管理信息化两条主线,以信 息获取、传输、存储、处理、应用为主要环节,以全面 整合提升科研、管理和教育的信息化整体环境为抓手, 着力提升资源整合共享、应用服务支撑、辅助决策支持、 网络安全保障等四项重要能力,加速实现从硬件建设到 环境构建、从强调建设到突出应用、从条块布局到整体 推进、从单点示范到全面推广、从相对封闭到共建共享 等等五大转变,为中国科学院实现创新跨越提供有力支 撑。 在新的历史时期,我院信息化工作肩负重任。为了 牢牢把握党和国家赋予中科院的新时期国家科学技术 “火车头”的战略定位,全面完成“创新 2020”提出的 战略任务,我们要进一步明确信息化工作在科研活动中 的战略性、基础性定位,组织实施“十二五”信息化发 展规划,全面推进信息化的各项工作,持续促进中国科 学院科研与管理水平的提高,推动创新能力的跨越式发 iv 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 展。 院党组始终高度重视我院的信息化发展,对信息化 工作寄予厚望。信息化工作需要得到全院同志乃至全社 会的理解、支持和共同参与。我希望,《中国科学院信 息化发展报告》能够集中全院专家的智慧,进一步提高 报告质量和水平,不断深化对信息化工作的认识,总结 我院信息化工作经验,反映国内外、院内外信息化发展 最新进展,争取早日成为有社会影响的信息化报告,为 提升全院信息化工作的整体水平,推进我国科研信息化 深入开展,建设创新型国家发挥更大的作用! 中国科学院院长: 2011 年 1 月 14 日 v 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 目录 回顾篇 ............................................... 1 一 国内外科研信息化发展现状........................... 1 1.1 国外科研信息化发展现状 ....................... 1 1.2 国内科研信息化发展现状 ...................... 13 1.3 中国与欧美等国在科研信息化领域的主要指标差异 17 二 中国科学院信息化总体态势.......................... 25 2.1 提升能力 .................................... 25 2.2 突出应用 .................................... 28 2.3 强化保障 .................................... 30 三 2010 年中国科学院信息化评估结果 ................... 33 四 信息化基础设施.................................... 38 4.1 网络环境 .................................... 38 4.2 超算环境 .................................... 54 4.3 数据环境 .................................... 69 4.4 互联网基础资源 .............................. 82 i 目录 五 信息化应用........................................ 87 5.1 科研管理的信息化 ............................ 87 5.2 科研活动的信息化 ............................ 99 5.3 文献情报信息化 ............................. 121 5.4 教育信息化 ................................. 130 5.5 网络化科普 ................................. 146 5.6 网站建设 ................................... 164 六 信息化保障....................................... 183 6.1 安全保障 ................................... 183 6.2 制度规范 ................................... 189 6.3 支撑服务 ................................... 196 七 信息化环境....................................... 205 7.1 政策环境 ................................... 205 7.2 人才队伍 ................................... 206 7.3 文化环境 ................................... 206 八 信息化交流与合作................................. 209 8.1 院地合作 ................................... 210 8.2 国际/地区合作 .............................. 212 ii 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 展望篇 ............................................. 216 一 中国科学院信息化发展的外部环境................... 217 二 中国科学院信息化发展的机遇 及挑战 ................ 224 2.1 中国科学院信息化发展面临的挑战 ............. 224 2.2 中国科学院信息化发展机遇 ................... 226 三 中国科学院未来五年 信息化发展展望 ................ 230 3.1 总体目标及思路 ............................. 230 3.2 主要任务 ................................... 231 思考篇 ............................................. 234 一 信息化时代的新型科研模式......................... 235 二 互联网的业务发展与技术演进....................... 247 三 构建积极防御综合防范的 信息安全保障体系 .......... 265 四 信息化仍然是推进经济社会变革的重要力量........... 284 五 科学数据:创新的引擎............................. 297 六 云计算及其在科研领域的 应用态势 .................. 305 七 GPU应用及发展态势................................ 315 八 物联网发展的机遇与挑战........................... 325 九 科研机构信息化指数 研究与思考 .................... 339 iii 目录 后记................................................ 353 附录一 缩略词表..................................... 355 附录二 参考文献..................................... 366 iv 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表目录 图表 1 GÉANT网络全球连接示意图........................ 5 图表 2 TERAGRID的科学网关列表........................ 22 图表 3 信息化综合管理得分分布情况.................... 26 图表 4 研究所网络及IT设备环境评分情况................ 27 图表 5 2010 年信息化评估A类研究所得分分布情况 ........ 34 图表 6 2010 年信息化评估B类研究所得分分布情况 ........ 35 图表 7 2010 年信息化评估C类研究所得分分布情况 ........ 36 图表 8 中国科技网骨干覆盖示意图...................... 40 图表 9 野外台站联网图................................ 41 图表 10 GLORIAD网络架构示意图........................ 45 图表 11 视频会议系统使用示意图....................... 46 图表 12 邮件系统业务流程图........................... 48 图表 13 网络管理系统示意图........................... 50 图表 14 全网网络监测分析系统运行示意图............... 51 图表 15 寒旱所VOIP语音系统应用....................... 52 图表 16 院三层超算环境分布情况....................... 56 图表 17 9 个不同星系团的密度分布 ..................... 57 图表 18 1E9 粒子数目的其中一个星 ...................... 57 图表 19 列车表面压力云图和纵截面流线图............... 57 图表 20 锂离子掺杂介孔共轭高分子材料的储氢研究示意图. 58 图表 21 小酸性可溶性蛋白(SASP)与DNA结合模式研究示意图 59 图表 22 我院GPU节点单位应用情况...................... 61 v 目录 图表 23 院超级计算环境系统结构图..................... 63 图表 24 院超级计算网格用户功能视图................... 64 图表 25 院超级计算网格部署结构图..................... 64 图表 26 千核应用规模................................. 65 图表 27 流感病毒膜蛋白-血凝素(HA)构象变化的分子动力学 模拟 ............................................. 67 图表 28 华冠汽车高性能计算服务案例................... 68 图表 29 中国科学院科学数据库数据资源状况............. 71 图表 30 中国科学院科学数据中心海量数据存储设施....... 72 图表 31 数据应用环境主要服务......................... 74 图表 32 2010 年 6-12 月数据资源中心存储服务数据总量(TB) ................................................. 75 图表 33 中国科学院科学数据库网络年度访问人次增长趋势图 ................................................. 76 图表 34 数据管理和共享平台VISUALDB部署案例类别分布... 77 图表 35 全球主要国家或地区IPV4 地址数 ................ 83 图表 36 2006.12-2010.06 中国IPV4 地址资源变化情况..... 84 图表 37 中国分类域名数............................... 85 图表 38 中国分类CN域名数............................. 85 图表 39 ARP二期应用系统结构布局示意图................ 88 图表 40 科研管理核心业务数据分析年度增长情况......... 91 图表 41 敏捷开发平台................................. 93 图表 42 ARP系统架构.................................. 94 图表 43 ARP系统应用效果.............................. 95 vi 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 44 电子文件比例及地区公文交换比例图............. 96 图表 45 核心业务数据按年增长情况..................... 98 图表 46 核心业务数据按年递增比例情况................. 99 图表 47 E-SCIENCE虚拟科研平台软件DUCKING体系结构.... 101 图表 48 面向青海湖区域重要野生鸟类集成研究网络化科学研 究平台 .......................................... 103 图表 49 新蛋白质预测................................ 106 图表 50 内蒙鄂尔多斯 16 万吨高温费托合成技术工业示范. 107 图表 51 传统模型计算模式与在线模型计算模式对比...... 109 图表 52 科学考察信息化平台.......................... 111 图表 53 以网络技术为支撑的空间天气数字实验室系统拓扑图 ................................................ 113 图表 54 空间天气网格三层架构........................ 114 图表 55 空间天气数字实验室系统流程图................ 115 图表 56 中国VLBI观测网 4 站 1 中心分布................ 116 图表 57 中国工业生物技术信息网...................... 119 图表 58 CHINAFLUX E-CARBON SCIENCE环境组成.......... 120 图表 59 2006-2010 年电子资源数量增长情况 ............ 124 图表 60 2006-2010 年网络数据库数量增长情况 .......... 124 图表 61 “十一五”教育信息化建设重点................ 132 图表 62 “十一五”教育信息化平台访问总量............ 132 图表 63 研究生教育业务管理平台用户访问情况.......... 134 图表 64 协同学习服务平台............................ 135 图表 65 协同学习服务平台用户访问情况................ 135 vii 目录 图表 66 课程网站.................................... 137 图表 67 网络化继续教育培训平台...................... 138 图表 68 “中国科学院党校第十四期科技管理骨干进修班”培训 管理信息 ........................................ 140 图表 69 “中国科学院党校第十四期科技管理骨干进修班”培训 学习资源 ........................................ 140 图表 70 教育信息化用户分布.......................... 141 图表 71 研究生教育业务管理平台实现全过程管理示意图.. 142 图表 72 继续教育培训平台在沈阳自动化所试点应用...... 143 图表 73 空中课堂全院院所访问量TOP10(集中教学园区除外) ................................................ 144 图表 74 课程网站全院院所访问量TOP10(集中教学园区除外) ................................................ 144 图表 75 教育信息化项目获得的计算机软件著作权证书.... 145 图表 76 2008 年与 2010 科普网站数量 .................. 148 图表 77 网络化科学传播平台访问统计.................. 148 图表 78 获“2010 中国科学院优秀网络科普栏目”称号栏目 150 图表 79 获“2010 中国科学院优秀网络科普栏目”提名栏目 150 图表 80 中科院科普资源主题分布...................... 151 图表 81 2008 年-2010 年网络化科学传播平台上线资源总量 152 图表 82 网络化科学传播平台共建共享环境.............. 153 图表 83 化石网获得“2009 年世界信息峰会全球大奖” ... 155 图表 84 网络化科学传播平台——有机的网络科普体系.... 156 图表 85 2009 年 7 月中科院日全食异地多路联合直播活动 . 158 viii 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 86 2010 年 10 月中科院嫦娥工程专题 .............. 159 图表 87 面向青少年的科普SNS平台..................... 161 图表 88 2010 年“中国科学院移动科普平台”开通 ....... 162 图表 89 短信科普答题活动受到公众追捧................ 163 图表 90 使用三维全景工具制作的“中国国家动物博物馆”三维 展示作品 ........................................ 164 图表 91 路甬祥院长、施尔畏副院长开启网站群.......... 165 图表 92 院网站群体系架构示意图...................... 167 图表 93 中科院网站群数据分析展示平台................ 169 图表 94 2009 年 10 月 29 日上线时网站群中英文主站院庆 60 周 年专题网站 ...................................... 170 图表 95 网站群资源整合建设方式...................... 171 图表 96 “送服务到家门”活动照...................... 172 图表 97 基于云计算的网站群实验平台体系结构图........ 174 图表 98 主域名CAS.CN的ALEXA排名情况................. 175 图表 99 院主站制作发布的部分专题首页................ 177 图表 100 英文网站群建成前后整体情况对比............. 178 图表 101 网站群英文内容协作平台..................... 180 图表 102 站群中文版信息关联示意图................... 181 图表 103 ARP院级安全加固示意图...................... 187 图表 104 数据应用环境相关标准规范................... 192 图表 105 ARP(二期)管理制度与规范.................. 193 图表 106 教育信息化项目管理制度与规范............... 194 图表 107 网络化科学传播平台标准规范................. 195 ix 目录 图表 108 网站群管理制度与规范....................... 195 图表 109 中科院网站群内容管理与技术保障工作流程图... 202 图表 110 中国科学院研究生院信息化组织结构图......... 204 图表 111 中国科学院信息化网站....................... 207 图表 112 中国科研信息化论坛......................... 209 图表 113 高性能计算的应用........................... 236 图表 114 CERN计算中心的海量数据处理集群............. 241 图表 115 中美科学家设计的国际计算机联网线路......... 242 图表 116 CMS区域性运行中心.......................... 246 图表 117 互联网业务应用的演进....................... 250 图表 118 泛在网所具有的能力......................... 252 图表 119 基于IPV6 的NGN的功能体系 ................... 260 图表 120 NWGN体系的概念............................. 261 图表 121 信息安全保障体系的基本框架................. 269 图表 122 可信计算平台............................... 273 图表 123 可信链建立过程............................. 273 图表 124 可信计算平台体系........................... 274 图表 125 工作流程相对固定的生产系统安全解决方案..... 276 图表 126 信息安全防护框架........................... 278 图表 127 保护环境框架图............................. 280 图表 128 某油田叠前时间偏移计算..................... 318 图表 129 宇宙结构形成过程模拟....................... 318 图表 130 含晶界和位错的Α-钛模拟晶胞在拉伸作用下裂纹形 核的演化过程 .................................... 319 x 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 131 百万颗粒的气固系统的直接数值模拟........... 320 图表 132 H1N1 病毒颗粒体系的大规模分子动力学模拟 .... 321 图表 133 中科院过程所MOLE-8.5 上工业滚筒的大规模准实时模 拟及可视化 ...................................... 323 xi 目录 专栏目录 专栏 1 服务“玉树抗震救灾”,为对地观测数据传输提供高速应 急带宽支持 ....................................... 42 专栏 2 为ITER搭建国际专用高速数据网,实现异地同步的共享 环境 ............................................. 43 专栏 3 视频会议系统应用.............................. 46 专栏 4 邮件系统迁移服务.............................. 48 专栏 5 为完成“嫦娥二号”测轨网络保障工作,灵活定制网管 功能 ............................................. 49 专栏 6 VOIP语音系统应用.............................. 51 专栏 7 凤凰计划...................................... 56 专栏 8 高速列车气动噪声的数值评估.................... 57 专栏 9 锂离子掺杂介孔共轭高分子材料的储氢研究........ 58 专栏 10 超算环境助力系统生物学、基因组学和大分子蛋白质模 拟领域交叉研究 ................................... 59 专栏 11 北京生命科学研究所:流感病毒膜蛋白-血凝素(HA) 构象变化的分子动力学模拟 ......................... 67 专栏 12 北京长城华冠汽车技术开发有限公司:高性能计算服务 一揽子服务解决方案 ............................... 68 专栏 13 VISUALDB软件推广应用取得重要进展............. 77 专栏 14 聚变数据库的发展与应用....................... 81 专栏 15 评估评价系统首次应用,取得良好应用效果....... 89 专栏 16 深入挖掘信息资源,辅助基地管理决策........... 91 xii 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 专栏 17 公共事务处理平台的应用显著提效降耗........... 96 专栏 18 ARP系统在支撑和促进金属所管理工作中发挥越来越重 要的作用 ......................................... 97 专栏 19 嵌入式桌面信息服务工具—E划通系统........... 125 专栏 20 国家科学图书馆努力构建用户驱动的科研信息环境 129 专栏 21 满足研究生课程学习所需的教学互动与协同学习平台 ——课程网站 .................................... 135 专栏 22 继续教育平台应用于“中国科学院党校第十四期科技管 理骨干进修班” .................................. 139 专栏 23 开展“中国科学院优秀网络科普栏目评选活动”,提高 全院科普栏目建设水平 ............................ 149 专栏 24 化石网获得信息峰会大奖,凸显网络科普水平.... 155 专栏 25 2009 日全食异地多路联合直播,抓住社会热点,开展全 方位科学传播 .................................... 158 专栏 26 2010 嫦娥工程科普专题,深入介绍中科院重大科研成果 ................................................ 158 专栏 27 打造面向青少年的科普SNS平台“科学家园”,加强与公 众的互动 ........................................ 160 专栏 28 全国科普日手机互动.......................... 162 专栏 29 “把服务送到家门口”活动.................... 172 专栏 30 云计算环境下的网站群建设研究与实验.......... 173 专栏 31 院庆 60 周年专题网站......................... 176 专栏 32 服务上海世博会期间的院网安全保障............ 184 xiii 中国科学院信息化发展报告2011 回顾篇 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 一 国内外科研信息化发展现状 科研信息化是指充分利用网络信息基础设施与技术、促进科 技资源交流、汇集与共享、变革科研组织与活动模式、推动科技 发展转型的历史进程。科研信息化是当前信息化时代下科研模式 的重大变革,是迈向新一轮科技革命的必由之路。 1.1 国外科研信息化发展现状 总体上,世界各国纷纷将推进科研信息化作为提升创新能力 和国际竞争力的战略举措,持续开展规划和部署,科研信息化基 础设施能力大幅提升。日益复杂科技难题的破解有赖于大规模的 协作,科研信息化已成为推动学科发展应对重大科技挑战的重要 基础支撑。科学数据作为支撑科技创新的战略性基础资源,其共 享共用制度政策环境日益受到高度关注。 1.1.1 国外科研信息化政策与战略 高度整合的信息化基础设施能够极大提升研究团体间的合 作、共享及数据的重复使用,促进研究能力和创新能力的发展, 提高国家竞争力并推动经济增长。因此,各国和地区纷纷将信息 化基础设施(e-Infrastructure)建设列为科研信息化的重点,并制 定了相关的战略与政策。 1 第一章 国内外科研信息化发展现状 1.持续开展科研信息化有关规划和部署 美国等西方各国将科研信息化作为 21 世纪科技创新的战略 举措,通过采用最新信息技术,大力推动科研模式的变革,不断 提升信息化基础设施和科技数据资源的汇集使用能力,着力发展 高端并行计算软件和应用,鼓励各学科领域在信息化环境下进行 规划和部署,以实现科技创新的新跨越。2009 年底,美国国家科 学基金会(NSF)宣布将制定一份题为《面向 21 世纪科学与工程 的信息化基础设施框架(CF21)》的长期战略愿景 1,其中一大主 要目标就是提供可持续和可扩展的高性能计算系统和联网、互操 作数据系统、数据挖掘等各种服务。 欧盟的科研信息化项目统一运行于欧盟框架计划下,其中由 29 个 欧 洲 国 家 代 表 组 成 的 欧 洲 信 息 化基 础 设 施 咨 询 工 作 组 (e-Infrastructure Reflection Group,e-IRG)主要负责建立科研信 息化基础设施。2009 年 8 月 31 日,e-IRG发布 2009 白皮书 2,将 确保信息化基础设施的可持续性确立为信息化基础设施建设的 一大重点领域,并强调要在各种信息化基础设施间开展全球合作, 协调跨洲大型信息化基础设施间的政策和最佳做法。 2010 年 9 月, e-IRG发布 2010 蓝皮书 3,再一次强调了信息化基础设施全球化 的重要性,提出应在整个欧洲研究区域建立一个通用的信息化基 础设施,满足科研基础设施和用户不断变化的需求。 2010 年 7 月 29 日,英国研究理事会总会(RCUK)发布题为 《英国科研与创新的信息化基础设施》的报告 4,将确保信息化 基础设施的长期可持续性发展确立为五个战略领域之一,并指出 其中一大关键是就全国性的信息化基础设施的建设达成一致性 战略意见。 2 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 2.科学数据作为支撑科技创新的战略性基础资源,其共享共 用制度政策环境日益受到高度关注 伴随大科学工程装置、物联网技术在科技活动中的应用,海 量科学数据的获取、传输、整合、处理、共享、长期保存与集成 应用已成为当代科技活动的主要特征之一,各国均强化了对科学 数据的共享和管理。数据正成为跨机构大规模合作的一个领域, 数据交换是不同学科、研究人员和机构间进行协作的最直接、有 效的方式,为提升跨学科和学科内研究的高质量科学生产力带来 了空前的机会,而成熟、明确的数据管理和共享机制有助于研究 人员利用关键的数据资源。这包含了数据的采集和保存、元数据 标准的开发和采用、检索工具,数据处理工具和持久性标识符等。 e-IRG提出应促进跨不同科研基础设施的通用(长期)数据服务, 英国政府则通过“让公共数据公开化”项目来提倡对非个人公共 数据的开放获取。美国NSF的 2011 财年预算中,对数据领域的投 入约 2200 万美元,比 2010 财年增加了 79.6% 5。 3.支撑科研信息化可持续发展的组织管理体系、体制机制及 人才培养等软环境建设受到日益重视 2010 年 2 月,RCUK在《2009 英国科研信息化综述》报告中 强调要成立组织与管理体系和创建更好、更系统化的支持机制, 包括提供可持续的专项基金,使e-Science成为跨所有研究理事会 的持续性专项战略计划,帮助产学界在科研信息化创建、筹备和 应用过程中开展合作与双向知识转移。2010 年 9 月,RCUK发布 科研信息化行动计划,针对上述建议制定了相关的行动计划,包 3 第一章 国内外科研信息化发展现状 括:通过召开定期会议从战略和运营层面协调各种科研信息化活 动;资助与产业界间的合作,通过正常机制开展同行审议;英国 联合信息系统委员会(JISC)则将继续资助有助于改善高等教育 机构(HEI)和产业界参与过程的项目和提议 6。 能力培养是信息化基础设施建设密不可分的组成部分,也是 成功的基础设施采用过程的先决条件。NSF 拟制定的信息化基础 设施长期战略愿景 CF21 中就包含一份全面的计算机科学教育推 广计划的制定。e-IRG 在 2009 白皮书中提出要加强对欧洲公民的 相关教育和培训,使其具备应用信息化基础设施的技能和知识; 《英国科研与创新的信息化基础设施》也强调了信息化基础设施 相关技能的能力培养,并指出培训的目标是青年以及正处于职业 生涯中期的研究人员,要为他们提供早期设施采用过程中所有必 须的全套技能。 1.1.2 国外科研信息化基础设施发展现状 从当前世界各国和地区的科研信息化基础设施建设来看,其 重点主要集中于高速网络、分布式计算设施、高性能计算、科学 数据管理等四大紧密相连的领域。 1.高速科研专用网络建设如火如荼 宽带网络尤其是科研专用网络,支撑着一切基于网络的科研 信息化活动。当前世界各国都在竞相开展高端科研教育网络建设。 目前,全球大规模学术网基本可分为三大主体:欧盟的 GÉANT、 北美的 Internet2 和亚太地区先进网络 APAN。 4 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 (1)GÉANT:世界最大的多千兆教育科研专用计算机网络 由欧盟委员会和欧洲各国科研教育网(NRENs)联合资助兴 建的高带宽泛欧科研教育骨干网GÉANT 7是欧盟e-Infrastructure战 略的核心。它既是专门支持科研信息化的全球科研网络的核心, 也是未来互联网各项核心技术研发的基础。GÉANT目前连接着全 欧 32 个国家科研教育网(NRENs)和全球类似网络,可为 40 个 欧洲国家约 8,000 家科研院所的 4,000 万科研教育用户提供无缝 连接的服务,是世界最大、最先进与多样化的科研教育网络体系 8。 图表 1. GÉANT网络全球连接示意图 9 (2)Internet2 Internet2 已成为最前沿研发和实验的平台,可满足其成员对 协作应用、分布式研究实验、基于网格的数据分析和社会联网等 带宽密集型处理的需求 10。2010 年夏,美国政府拨款 6250 多万 美元,资助Internet2 和其他几家国家科研教育网络建造带宽 100G 的美国统一社区锚点网(U.S.UCAN),以连接美国的学校、图书 5 第一章 国内外科研信息化发展现状 馆、社区大学、保健中心和公共安全组织等社区机构,实现当前 典型互联网服务尚未包括的先进应用 11。2010 年 10 月,NSF又 为Internet2 中间件计划提供了为期 3 年约 265 万美元的资助,旨 在将Internet2 开发的基本认证软件组合为一个工具包,以促进虚 拟组织的协作 12。 (3)亚太地区先进网络 APAN 亚太地区先进网络APAN 13联盟成立于 1997 年,旨在为亚太 地区科研教育团体提供一个先进的网络环境并协调其发展,推进 网络应用和服务。澳大利亚学术与研究网AARNet、日本学术信 息网SINET3 和我国的CERNET网络是亚太地区科研教育网的主 要组成部分。 与上述网络相连构成全球科研教育庞大网络体系的主要国际 科研教育网还包括:美国能源科学网络 ESnet、荷兰国家教育科 研网络 SURFnet、法国国家科研教育网络 RENATER、加拿大的 CA*net4、跨欧亚信息网络 TEIN3、东南欧的 SEEREN,地中海 地区的 EUMEDCONNECT,拉丁美洲的 ALICE,印度的 ERNET, 中亚与高加索地区的 OCCASION,南非的 TENET,连接我国和 欧洲的 ORIENT 等。 2.科学数据及其应用管理备受瞩目 现代科学与工程中,几乎所有领域的数据量每年都在成倍增 长,其分析应用也愈发复杂,不同形式的数据均需得到妥善的管 理、存储、维护,并通过用户友好的信息化基础设施服务提供给 所有的科学团体使用,科学数据资源及应用环境已纳入科研信息 6 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 化环境的基础设施范畴 14。 (1)美国的 DataNet 计划 美国政府历来对科学数据工作极为重视,NSF于 2007 年 9 月 正式发布了科学数据可持续保存与共享网络伙伴计划 ( Sustainable Digital Data Preservation and Access Network Partners, DataNet)项目指南 15,规划创建面向科研信息化的科学 数据保存与共享模式。在此项目支持下,NSF预计未来五年(2009 年开始)投资 1 亿美元,建立一批全景示范的新型数据保存与共 享组织架构,为长期的科学研究提供可靠的数据保存、访问、集 成和分析能力,以及预测及不断适应技术本身及用户需求所带来 的变化等。 活动和拒绝使用来源不明的数据方面都取得了一定成效 16。 (2)英国 DISC-UK 数据共享项目 由 英 国 多 家 机 构 联 合 开 展 的 DISC-UK 数 据 共 享 项 目 (2007.3-2009.3)的总体目标是在一个复杂和动态的信息环境中 促进学术数据共享新模式、工作流程和工具的形成。其利用各方 专业知识,推进数据存放服务,探索新途径,协助研究人员在互 联网上分享数据。 2009 年 5 月 15 日,DISC-UK数据共享项目最终报告发布 17, 总结了近期英国科学数据共享研究的重要进展与特点并得出三 个重要结论:①对研究人员而言,数据管理比数据共享更能成为 使用知识库的动机,但还不足以产生文化变革;②数据馆员、数 7 第一章 国内外科研信息化发展现状 据管理人员和数据科学家可以帮助知识库管理人员和研究人员 开展交流;③机构知识库可以提高在互联网上共享数据的影响力。 (3)澳大利亚科研数据共享基础设施(ARDC) 澳大利亚政府从 2008 年启动建设国家科学数据服务网络 (Australian National Data Service,ANDS) 18,旨在全面整合全 国数据资源,实现数据长期保存和共享利用。2009 年,澳大利亚 高等教育投资基金(EIF)拨款 4800 万澳元,支持ANDS创建和 发展“澳大利亚科研数据共享(Australian Research Data Commons, ARDC) ”基础设施 19,旨在使澳大利亚科研数据作为一个整体, 成为一项国家性的战略资源。其重点领域包括:数据采集基础设 施、元数据存储基础设施、自动数据发布公共基础设施、ARDC 核心基础设施和ARDC软件基础设施。 3.高性能计算成为评估国家创新能力的关键 高性能计算设施对现代科学研究而言是一种极为重要且不可 或缺的战略工具,世界各国都对超级计算能力建设和应用高度重 视,纷纷提出国家级计划。超级计算的能力和应用水平已经成为 评价国家创新能力和国家竞争力的关键因素之一。 (1)欧洲的 PRACE 计划与 DEISA 计划 2010 年 6 月 9 日,耗资 4 亿欧元、有 20 个国家参与、联接 多台超级计算机、每秒计算速度将达百万兆次的欧洲先进计算合 作伙伴(Partnership for Advanced Computing in Europe ,PRACE) 计划在西班牙巴塞罗那正式启动。从 2011 年到 2015 年,德国、 法国、意大利和西班牙的超级计算机将逐步联接在一起,并计划 8 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 至 2019 年将运算速度提升到每秒百亿亿次。目前欧洲计算速度 最快的德国Jugene超级计算机将成为新合作平台的首台Tier-0 系 统供欧洲科研人员使用 20,而采用了平衡模块架构的第二台Tier-0 系统“居里(Curie) ”也于近日确定在法国部署 21。 与PARCE计划紧密相连的欧洲超级计算应用分布式架构 ( Distributed European Infrastructure or Supercomputing Applications,DEISA)计划 22致力于促进世界水平的泛欧计算科 学研究,为部署合作型欧洲超级计算机的高性能计算生态系统铺 平道路。DEISA是建立在欧洲各国现有国内服务之上的欧洲超级 计算服务,可提供网络管理和支持、Global文件系统数据管理、 DEISA运转、资源管理、应用及用户支持、关键运用的实施、安 全应用等服务。 (2)美国能源部先进科学计算研究(ASCR)计划 ASCR计划由美国能源部科学办公室资助 23,主要任务是为 能源安全、核安全、科学发现和创新、环境等科学领域的研究人 员开发和部署计算与网络工具,使其能对复杂现象进行分析、建 模和预测,对原本因危险性和成本过高而无法进行的实验进行验 证。ASCR主导的跨学科项目包括:基于先进计算的科学发现 (SciDAC)项目、理论与实验创新计算项目(INCITE)项目和 多尺度数学行动计划(MMI) 。 2010 年初,INCITE项目宣布为 69 项涉及锂空气电池、纳米 太阳能电池、核燃料循环、先进推进系统、DNA测序、纳米结构 超导材料的微尺度现象的尖端研究分配约 160 亿CPU小时的超级 计算时间,支持他们取得突破性进展 24,而能源、环境、气候变 化和生物学是其中重点。 9 第一章 国内外科研信息化发展现状 (3)日本下一代超级计算机战略领域 2009 年 7 月 22 日,日本下一代超级计算机战略委员会确定 了五大下一代超级计算机战略领域及其在未来五年内拟实现的 目标和预期成果 25。包括:①预测生命科学、医疗及制药基础领 域;②新物质和新能源开发;③灾害现象及全球变化情况预测; ④设计下一代新产品,对产品进行优化组合,模拟评价产品性能 和寿命等;⑤物质与宇宙的起源与构造研究。 4.分布式计算基础设施开创全新科研合作模式 分布式计算基础设施,或者说网格,被认为是继传统 Internet、 Web 之后的第三次浪潮。它逐渐改变了人们使用计算机及其相连 设备的方式,为全球合作研究提供了新的途径。通过网格技术, 人们可以将高速互联网、高性能计算机、大型数据库、传感器、 远程设备等融为一体,将分散在不同地理位置的电脑组织成一台 “虚拟的超级计算机”,实现计算、存储、数据、信息、软件、 知识和专家等资源的全面共享。 (1)欧洲网格基础设施项目(EGI) 2010 年,欧盟启动了新的网格建设项目——欧洲网格基础设 施(European Grid Infrastructure,EGI) 26,试图在当前世界最大 的 多 科 学 网 格 “ 欧 洲 科 研 信 息 化 网 格 ”( Enabling Grids for e-Science,EGEE)的基础上,建立一个基于国家网格计划(NGI) 的协作型泛欧网格基础设施,以满足不同学科对计算资源的需求。 (2)美国的 TeraGrid XD 项目 TeraGrid项目 27于 2001 年 8 月由美国国家科学基金会 (NSF) 10 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 投资 4500 万美元启动,旨在构建全球范围最广、功能最全面、 支持开放式科学研究的分布式网格计算体系。TeraGrid项目于 2010 年结束,其后续项目XD项目将于 2011 年 4 月 1 日启动,并 持续至 2016 年 5 月 30 日。XD项目 28旨在建设一个能提供高端数 字服务的网络基础设施,通过为科研教育人员提供可用的、超越 一般程度的超级数字资源以及相关界面、建议和培训,使科学和 工程研究、科研和教育的融合、科学与工程研究合作范围扩展等 领域的工作取得重大进展。 (3)开放科学网格项目 美国开放科学网格(Open Science Grid,OSG)是由来自全 美各所大学、国家实验室和计算中心的软件、服务和资源供应商 共同组成的联盟,旨在满足所有层次的科学虚拟组织当前和未来 的需求。OSG项目截至日期为 2011 年,其功能包括 29: ①利用一套通用的中间件,将大学和研究团体的计算与存储 资源集中放置到一个通用、共享的网格基础设施之上; ②使参与的研究团体能以低成本的方式访问更多的资源; ③OSG 虚拟数据工具包可为参与的计算和存储节点提供相 应的、经测试的支持软件包,并为终端科研用户提供客户端软件 包; ④与科研团体通力合作,帮助他们评估自身网络基础设施需 求并针对本地、国家和国际需求规划解决方案。 5.云计算日益成为科研信息化的一大支柱 11 第一章 国内外科研信息化发展现状 云计算作为未来发展的重要趋势,已经引起科学界的高度重 视。随着云计算的不断进步与完善,有许多科研机构开始积极尝 试利用云计算从事科研工作,并且已诞生不少成功案例,有人将 这类云计算称为“科学云”(Science Cloud) 。 (1)云计算大幅降低了生命科学和医学的研究成本 生命科学和医学是云计算应用的两大热点领域。云计算可以 解决生命科学和医学研究成本过高的难题。例如,美国威斯康星 医学院生物技术与生物工程中心开发出一套名为 ViPDAC(虚拟 蛋白质组学数据分析集群)的免费软件,与 Amazon 公司的云计 算服务搭配使用,能够让全世界的科学家通过云计算分析蛋白质 组学数据,并利用大量的计算资源提高数据分析速度,为那些目 前没有大量计算资源使用权限的研究人员提供了更多选择,并极 大降低了蛋白质研究成本。美国约翰霍普金斯大学彭博公共卫生 学院开发的基于云计算的 Myrna 软件,可在大幅提高 RNA 序列 数据分析速度的同时降低成本 。此外,IBM 公司也计划与美国 密苏里大学联合创建用于基因组学研究的云计算环境 。 在医学研究方面,哈佛医学院在美国 Platform 公司的帮助下 建立了内部云计算平台,动态满足了各部门的计算需求,并最大 限度地降低了成本。其下一步的计划是使用户能通过内部云使用 到 Amazon EC2 等外部云计算平台的资源。欧盟 BEinGRID 项目 为癌症放射疗法开发了一套云计算解决方案,能以低成本提供更 强大的软硬件资源,方便医院更好更快地获取结果。这套云计算 方案还可用于图像引导放射治疗、强子治疗、近距离放射治疗等。 (2)云计算有助于改善数据传输与科研模拟 12 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 美国伊利诺伊大学研制成功一套云计算系统,可以通过高性 能网络将散布在各地数据中心的数据快速汇聚到一起,比同类系 统的速度快 6 倍。美国华盛顿大学于 2009 年建立的面向海洋学 和天文学研究的云计算网络平台可以处理容量巨大的数据集,进 行海洋气候模拟和天文图片分析。而美国阿贡国家实验室完成一 种新型动态分布式科学计算云资源集成系统,能帮助物理学家动 态地获取云计算资源,以开展重离子仿真工作。云计算有助于实 现长期模拟,从中发现变化趋势,并将相关信息展示在互联网上。 1.2 国内科研信息化发展现状 1.科研网络的覆盖范围不断扩大,普遍服务能力不断提高 网络建设方面,以中国教育和科研计算机网(CERNET)、中 国科技网(CSTNET) 、中美俄环球科教网络(GLORIAD)为主的科 研网络已成为我国科研信息化的重要基础设施,中国下一代互联 网(CNGI)的示范应用已在科研领域率先部署。 CERNET是我国第一个接入Internet2 的互联网,是我国开展 下一代互联网研究的试验基地。而第二代中国教育和科研计算机 网CERNET2 是中国下一代互联网(China Next Generation Internet, CNGI)示范工程最大的核心网和唯一的全国性学术网,是目前世 界上规模最大的纯IPv6 网 30。国家自然科学基金委员会(NSFC) 于 2003 年启动了“以网络为基础的科学活动环境研究”重大研 究计划 31,旨在利用网络技术将地理上位置不同的计算设施、存 储设备、仪器仪表等集成在一起,建立面向网络服务的通用基础 13 第一章 国内外科研信息化发展现状 支撑环境。 中国科技网(CSTNET)已形成核心网和连接十二个地区分 中心的骨干网,与国内主要互联网高速互联,拥有多条国际出口, 与国内外互联网络高速互联,与中国电信、中国联通分别通过 2.5Gbps 链路实现高速互联,与中国教育网互联带宽 2Gbps,与北 京国家互联网交换中心互联带宽 1Gbps,国内出口总带宽达 8Gbps; 拥有多条通往美国、俄罗斯、韩国、日本等国的国际线路。 随着我国、美国、俄罗斯科学研究交流的日益频繁,中国科 学院、美国国家科学基金会、俄罗斯部委与科学团体联盟决定共 同出资建设一条新的环绕全球的支持先进科学应用的高速环状 网络(Global Ring Network for Advanced Applications Development, GLORIAD),这标志着三国之间的科学合作迈出了重要的一步。 2004 年 1 月 12 日中美俄环球科教网络(GLORIAD)正式开通, 目前已成为环绕北半球光网络基础设施,骨干带宽 2.5Gbps 以上, 连接日本、韩国和中国香港、中国台湾等国家和地区的科研网络。 GLORIAD 在香港建立的开放交换节点(HKOEP)已成为亚太地 区互联网的汇聚中心和国际互联网在亚太地区的交换中心。 2.超级计算基础设施建设呈现出蓬勃发展的态势 我国在 2010 年 11 月最新公布的第 36 期世界超级计算 500 强中,来自天津国家超级计算中心的“天河一号A”以 2.57 petaflop/s的运算性能成为全球最快超级计算机,这是我国首次在 这项排名中居首位。排名第三的超级计算机也是我国深圳国家超 级计算中心的“星云(Nebulae)” ,其运算性能为 1.27 petaflop/s, 14 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 两者都采用CPU和GPU的混合架构 32。不少国际专家认为我国高 性能计算成长迅速,率先采用GPU非常明智 33。 我国的网格研究在国家 863 重大专项的支持下,以“需求牵 引、技术跨越、多方协作、持续发展”为指导思想,已初步形成 了国家级的超算网格计算环境。截至 2010 年,我国国家网格 (CNGrid)已建成包括香港在内的 10 个结点(中科院计算机网 络信息中心结点、上海超算中心结点、清华大学结点、华中科技 大学结点、中国科技大学结点、北京应用物理与计算技术研究所 结点、中科院深圳先进技术研究院结点、山东大学结点、西安交 通大学结点、香港大学结点),联合构成了开放的网格环境,通 过自主开发的网格软件,支撑网格环境的运行和应用网格的开发 建设,已初步覆盖了新材料、生物基因、生命科学、药物研发与 设计、天体物理、等离子体物理等重要科研领域。 而作为教育部“211 工程”公共服务体系建设重大专项的中 国教育科研网格(ChinaGrid)项目旨在建设我国乃至世界上“最 大、最先进、最实用”的网格系统 34。目前ChinaGrid进入第二期 建设,主要任务包括 35:建设 6 个高性能计算中心、8 个重点学 科网格和完善网格公共软件CGSP。除了CNGrid和ChinaGrid外, 我国目前正在建设和已经建设完成的初具规模的网格项目还包 括上海网格(shanghaiGrid)、国家自然科学基金委网格(NSFCGrid) 和 863 空间信息网格。 我院在“十一五”期间积极部署超级计算环境,截至 2010 年底已形成地域学科分布合理的三层超级计算环境,聚合中间层 的分中心和第三层的所级中心 20 个左右。 15 第一章 国内外科研信息化发展现状 3.科技资源建设和共享稳步推进 2002 年,科技部启动了“科学数据共享工程” ,2009 年 9 月 正式开通了“中国科技资源共享网”。目前,科学数据共享工程 的工作重点是继续推进 973 计划资源环境领域项目数据汇交试点, 并向国家科技计划项目推广;参照重点实验室建设机制,加快国 家科学数据共享中心的建设;做好科学数据共享立法。 我院自上世纪 80 年代开始就部署科学数据库系统的建设,二 十多年来不间断地支持科研过程数据的积累、整理与共享服务工 作。 “十五”期间,由 45 个研究所参加建设数据库系统总数据量 达 16.6TB,集成了 503 个数据库。“十一五”期间,科学数据库 系统进一步整合了 62 个研究所的科学数据资源,可共享的科学 数据将超过 65TB。 目前,我国一些部委和单位也建立了相应的信息或数据中心, 生产和提供数据服务,如中国化工信息中心、农业部信息中心、 海洋信息中心、中国地震局地震数据信息中心、国家药品监督管 理局信息中心。此外,我国若干高校在承担国家科研项目时,也 产生了大量的科学数据,如欧洲分子生物学网络组织(EMBnet) 中国国家节点——北京大学生物信息中心(CBI)积累了大量生 物信息数据。 总体上而言,我国科研信息化基础设施能力与世界先进水平 差距不大,但尚缺乏国家层面的整体战略和规划,缺乏国家层面 的总体部署、协调和政策支持,科研信息化应用整体上水平与发 达国家上存在较大差距。 16 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 1.3 中国与欧美等国在科研信息化领域的主要指标差 异 1.科研信息化投入 最早开始e-Science研究的英国,其e-Science七大研究理事会 2001-2006 年的科研信息化总投入为 2.13 亿英镑,而e-Science核 心项目的投入达 4,400 万英镑 36。美国方面,根据NSF的财年预 算,NSF网络基础设施办公室(OCI)仅在 2011 财年总预算就达 2.28 亿美元,比 2010 财年的 2.14 亿美元增加了 6.4% 37。 在我国,科技部、教育部、国家发改委、基金委、中科院等 分别部署并开展了有关工作,在科研信息化投入方面,国家“863” 计划信息领域办公室公布的数据显示, “十一五”期间,我国“863” 计划部署了一系列高效能计算机及网格服务重大项目,从 2006 到 2010 年间, “863”计划总共投入近 9.4 亿元人民币,同时带动 地方政府和应用部门的配套经费 10 亿元以上。此外,根据 2010 年中科院信息化评估报告,2010 年中科院各研究所高性能计算应 用项目的经费总计近 4.2 亿元。 2.科研网络基础设施 先进科研网络是重要的科研信息化基础设施。以美国为例, 美国政府的多个部门都投入大量资金支持建设先进科研网络。能 源部科学办公室支持的高速科研网络能源科学网(ESNET)在 2007 年已实现 10Gbps 带宽的 IP 连接和 10Gbps 光连接,并计划 于 2009-2010 年 升 级 至 40-50Gbps , 2011-2012 年 升 级 至 17 第一章 国内外科研信息化发展现状 160-400Gbps。 在欧盟,欧盟委员会和欧洲国家教育科研网络联合资助建设 了泛欧科研网络基础设施 GÉANT2,为欧盟建立欧洲研究区提供 了基本条件。GÉANT2 由DANTE组织管理,通过国家科研教育 网络(NREN)连接 34 个国家的大学和科研机构。GÉANT2 采用 灵活的IP网和交换网混合的体系结构。网络核心部署了多条 10Gbps波长和裸纤。GÉANT2 与CANARIE、ESNET、Internet2 建 立 了 合 作 关 系 , 并 通 过 SEEREN 连 接 东 南 欧 洲 , 通 过 EUMEDCONNECT连接地中海地区、通过ALICE连接拉丁美洲、 通过TEIN2 连接亚太地区。 在中国,以中国科技网和中国教育网为例。中国科技网核心 网和连接十二个地区分中心的骨干网到上海、南京、广州、武汉、 成都和兰州地区分中心实现了 2.5Gbps连接,到其他地区分中心 以 155Mbps带宽连接。中国教育网CERNET有 28 条国际和地区性 信道,与 美国、加拿大、英国、德国、日本和香港特区联网,总 带宽达到 250Mbps,CERNET高速主干网已经升级到 2.5Gpbs。 国外发达国家突出以高速互联网为代表的科研信息化的先导 与引领作用,以科技领域为切入点,进而向国民经济和社会发展 的其它领域拓展。我国“863”和“973”计划中加大了对高速互 联网的战略性、前瞻性和前沿性研究力度,设立了一系列的研究 课题。但我国的高速互联网更多地处于研究测试阶段,与发达国 家相比,我国在高速互联网能力、政策环境及实际应用等方面差 距较大。 18 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 3.超级计算基础设施 根据最新公布的第 36 期全球超级计算 500 强排名 38,我国天 津国家超级计算中心的“天河一号A”以 2.57 petaflop/s的运算性 能力名列榜首,美国橡树岭国家实验室的“美洲豹”(运算性能 为 1.75 petaflop/s)位列第二,我国深圳国家超级计算中心的“星 云”(1.27 petaflop/s)、日本东京工业大学的Tsubame 2.0(1.19 petaflop/s)、美国国家能源研究科学计算中心的Hopper(1.05 petaflop/s)则分列第三至五位。排名前十的超级计算机,有 5 台 来自美国,2 台来自我国,其余 3 台分别来自日本、法国和德国, 其中有 7 台超级计算机的运算性能超过了 1 petaflop/s。 在地区分布方面,500 强中有 275 台来自美国,124 台来自欧 洲,84 台来自亚洲,其中我国占据 42 台,大幅领先于日本的 26 台和印度的 4 台。欧洲方面,德国、法国、英国分别占有 26、25、 24 台。 此外,美国橡树岭国家实验室已经开始建造下一代超级计算 机,该系统的浮点计算能力可达 20 千万亿次(petaflop),比目前 的冠军天河一号 A 高近 7 倍。美国劳伦斯利弗莫尔国家实验室也 正在建造另一套计算能力超过 20 千万亿次的平台,该系统将由 IBM 设计制造,预计在 2012 年完成部署。2010 年 12 月 13 日, 德国巴伐利亚科学人文学院正式宣布,他们已签约 IBM,准备建 造一台名为“SuperMUC”的超级计算机,它有望成为世界最快 的通用超级计算机,运算速度将达 3petaflop/s,建成后将成为欧 洲先进计算伙伴(PRACE)的第三台 Tier-0 系统。 我国在高效能计算机的研制方面,最近几年取得了长足的进 展,在性能指标方面居世界前列,但是国际上这个领域的竞争非 19 第一章 国内外科研信息化发展现状 常激烈,今后两年美国、日本将有若干台万万亿次级系统投入使 用,将再次拉开我们与世界先进水平的差距。 4.科研信息化应用 欧盟方面,欧盟的科研信息化建设主要依托于重大科研项目 和计划。在 LCG2 项目基础上组成的 WLCG 联盟由 LHC 实验、 加速器实验室、以及 Tier-1 与 Tier-2 等中心共同组成,连结整合 全球超过 500 个研究单位,共计十多万台计算机资源。LCG2 平 台已经提供生产性运行服务。分布在全球的高能物理学家可以方 便地使用 LCG2 平台中的计算、数据、存储等资源开展高能物理 研究。EGEE 网格项目汇集了超过 27 个国家的研究机构参与开展 网格和 e-Science 研究。 以英国 e-Science 计划为例,该计划集中开展了一批研究和应 用,重视开展面向学科领域的 e-Science 应用,在相关的应用领域 资助了 20 多个示范项目, 如由英国和欧洲粒子物理研究所 (CERN) 的粒子物理学家与计算机科学家合作的 GridPP 项目;由天文学家 和计算机科学家合作的 AstroGrid 项目;为提高乳癌诊断效率建 设的数字 X 光照片国家数据库 e-Diamond 项目;研究结构-属性 映射的化学网格 Comb-e-Chem 项目;研究浓缩物质和材料工具的 RealityGrid 项目等。e-Science 计划重视运行、支撑机制的建设, 支持信息化基础设施、网格中间件以及应用软件和工具提供生产 性运行和服务。该计划由于整体效果突出,在国际上产生了较大 的影响。 美国方面,以 TeraGrid 上的科研信息化应用为例,TeraGrid 20 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 项目是 2001 年 8 月由美国美国国家科学基金会(NSF)启动,旨 在构建全球范围最广、功能最全面、支持开放式科学研究的分布 式网格计算体系。TeraGrid 已经成为是美国最重要的公共高端计 算资源集,也是全球范围内最具代表性的科研超算网格之一。 TeraGrid 主要通过科学网关对外提供计算服务,为用户提供灵活 的资源选择机制,实现资源的合理分配及使用。已开通 34 个科 学网关,联通 23 个计算资源,总计算资源超过 2000T。2011 年, 蓝水千万亿次机将投入应用并加入网格。34 个 TeraGrid 科学网关 覆盖天文学、地球科学、分子生物学等 21 个领域。 科学网关名称 学科 Open Science Grid Massive Pulsar Surveys using the Arecibo L-band Feed Array (ALFA) Center for Multiscale Modeling of Atmospheric Processes Community Climate System Model (CCSM) TeraGrid Gateway High Resolution Daily Temperature and Precipitation Data for the Northeast United States Linked Environments for Atmospheric Discovery Biodrugscore: A portal for customized scoring and ranking of molecules docked to the human proteome Chemical Informatics and Cyberinfrastructure Collaboratory High-Resolution Modeling of Hydrodynamic Experiments with UltraScan Computational Chemistry Grid Science Gateway for Diffraction Facilities, Data and Methods Cyberinfrastructure for End-to-End Environmental Exploration Portal 先进科学计算 天文学 21 天文学 天文学 天文学 天文学 生物化学和分 子结构与功能 生物化学和分 子结构与功能 生物物理 化学 化学 地球科学 第一章 国内外科研信息化发展现状 GEON(GEOsciences Network) Purdue Environmental Data Portal Network for Earthquake Engineering Simulation Network for Computational Nanotechnology and nanoHUB Dark Energy Survey Data Management 地球科学 地球科学 地球灾害减灾 新兴技术 河外天文学与 宇宙学 Indiana University Centralized Life Sciences Data 遗传学与核酸 TeraGrid Geographic Information Science 地 理 学 与 区 域 Gateway 科学 CIG Science Gateway for the Geodynamics 地球物理 Community QuakeSim 地球物理 The Earth System Grid 全球大气研究 National Biomedical Computation Resource 集成生物学与 神经科学 Developing Social Informatics Data Grid 语言、认知与社 (SIDGrid) 会行为 Neutron Science TeraGrid Gateway 材料研究 VLab - Virtual Laboratory for Earth and Planetary 材料研究 Materials Biology and Biomedicine Science Gateway 分子生物学 Open Life Sciences Gateway 分子生物学 ROBETTA: Automated Prediction of Protein 分子生物学 Structure and Interactions SCEC Earthworks Project 地震学 Asteroseismic Modeling Portal 恒星天文学与 天体物理学 CIPRES Portal for inference of large phylogenetic 系 统 生 物 学 与 trees 人口生物学 TeraDRE - Distributed Rendering Environment 可视化、图形学 与图像处理 TeraGrid Visualization Gateway 可视化、图形学 与图像处理 图表 2. TeraGrid的科学网关列表 1 1 截至 2010 年 4 月 14 日,https://www.teragrid.org 22 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 在中国,以中国国家网格服务环境为例,目前该环境中部署 了 230 多个应用软件和工具软件,用户数量超过 1400 个,其中 包括许多工业界用户,如中国商用飞机公司、宝钢集团、国家核 电、上汽集团、奇瑞 汽车等。同时该环境已经支持了 700 多项国 家科技计划项目和重大的工程项目,在大飞机、支线飞机、载人 航天二期工程等方面提供了计算服务。在其他应用方面,我国也 开发了一些大型并行应用软件,包括面向千万亿次计算机的并行 算法库、大型流体机械整机非定常流动并行计算软件等,在大飞 机专项、点火工程、油气勘探、节能减排、新药开发、计算化学、 天体物理、气象集合预报等领域发挥了应有的作用。另外,我国 过去大多数应用软件都只能支持到 16 核,能扩展到 32 核的都比 较少见,但现在已经可以利用千核以上的计算资源,比如中科院 超算中心 30%以上的都是千核以上的应用。 因此,从整体对比上,欧美科研信息化发达的这些国家将科 研信息化视为提高国家竞争能力,在科学与工程研究领域保持领 先地位的重要手段。各国政府在制定科研信息化长期发展规划以 及统一协调各方需求等方面发挥了重要作用,从国家层面制定了 跨部门的科研信息化发展计划,在体制上保证了科研信息化工作 的持续有序发展;科研信息化基础设施建设注重整体布局、统筹 规划;组织开展了一批跨学科的重大应用;整个科学界普遍意识 到科研信息化的重要性,科研人员广泛参与,应用层次高,渗透 范围广;科研信息化建设得到了充足稳定的经费投入,为科研信 息化建设提供了有力保障。由于长期以来持续有效的支持,出色 的组织和协调,科研信息化发展思路不断优化调整,科学界普遍 觉悟和广泛参与,使得科研信息化整体水平较高,信息化基础设 23 第一章 国内外科研信息化发展现状 施先进,学科应用水平高,处于领先地位。 尽管我国在网络、超算和数据共享平台等方面有一定部署, 但与欧美研信息化发达的国家相比,我国科研信息化基础设施建 设还处于起步阶段,没有形成国家的战略支撑能力和强大的竞争 力。对科研信息化的重要性认识不够,没有将科研信息化视为提 高国家竞争能力、在科学与工程研究领域保持领先地位的重要手 段。在制定科研信息化长期发展规划以及统一协调各方需求等方 面,缺乏国家层面的整体布局、统筹规划、总体部署和推进,国 家层面没有科研信息化发展计划。经费投入不足,项目延续性差, 不能形成长期有效的支持。我国科研信息化应用整体上水平与发 达国家上存在较大差距,多学科协作研发的氛围没有完全形成, 仍然缺少复合型、跨学科高端人才。 24 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 二 中国科学院信息化总体态势 2.1 提升能力 1.信息化综合管理水平显著提升 “十一五”以来,全院上下坚持以科学发展观为统领,按照 院党组及院信息化工作领导小组的统一部署,明确思路,有序管 理,不断提高认识,加大投入,使信息化发展迈上新台阶,信息 化综合管理水平有了显著提升。 从 2010 年信息化评估中信息化综合管理分数分布的情况来 看,相比 2009 年,各单位总体水平有了明显提升:2009 年最为 集中的三个分数段是 4~7 分,而 2010 年是 7~10 分;得分在 7 分以上的单位数量, 从 2009 年的 25 家,增加至 2010 年的 69 家; 而得分在 7 分以下的单位数量,从 2009 年的 73 家,减少至 2010 年的 32 家;显示各单位信息化综合管理水平提升明显。 25 第二 二章 中国科学院 院信息化总体态势 势与特点 单位:家 25 23 25 21 22 21 20 20 13 15 9 10 10 10 10 2010年 2009年 6 4 5 5 0 9分以上 8‐9分 7‐8分 6‐7分 分 5‐6分 4‐5分 4分以下 数据来源:中科院信 信息化评估统计数 数据2010.12 图表 表 3.信息化综合管理得分分 分布情况 2.信 信息化基础设 设施能力显著 著增强 近 近年来,我院高 高度重视信息 息化基础设施 施建设,先后 后组织实施 了互联 联网络、超级计 计算和科学数 数据应用、文献情报信息化 文 化的建设, 初步建 建成了以宽带网络、超级计 计算中心和科 科学数据中心 心为核心的 信息化 化基础设施与服务环境,支撑科研与管 管理活动的各 各个环节, 服务于 于国家重大工程 程建设、经济 济社会发展和 和企业技术创 创新。在网 络基础 础设施方面,目前高速可靠 靠的互联网络 络已覆盖全院 院机构,并 具备下 下一代互联网能力;基础网 网络延伸至数 数据现场,连 连接大科学 装置及 及野外台站,形 形成了覆盖全 全国的野外台 台站网络体系 系;持续推 进国内网间互联,持 持续优化路由 由,提高传输 输质量和稳定 定性;积极 参加国 国际合作,打造 造国际化信息 息高速公路。 从 2010 年信息 息化评估结果 果来看,信息化 化基础设施总 总体建设水 26 中国科学院信息 息化发展报告 20011 中国科学院信息化发展报告2011 平比 20009 年有所提 提高:9 分以上的研究所数 数量增加了 40%;7 4 分 以下的 的研究所数量下 下降了 17%。 。 单位 :家 28 25 30 25 21 23 20 21 20 15 13 15 2010年 12 10 2009年 10 5 32 3 4‐5分 4分以下 0 0 9‐10分 8 8‐9分 7‐8分 6 6‐7分 5‐6分 数据 据来源:中科院信 信息化评估统计数 数据2010.12 图表 4.研究所网络及 4 及 IT 设备环境 境评分情况 在 在超级计算方面 面,学科、地 地域分布合理 理的三层超算 算环境初具 规模;分布式专用 GPU 计算聚 聚合能力不断攀 攀升,达到 5,000 5 万亿 我院超算总中心 心成为国家网 网格的主节点 点,截至 20009 年,我 次;我 院成功 功运行的千核应 应用占国家网 网格公开发布 布总数的 80% %,引领了 国内大 大规模计算应用 用。 在 在数据环境方面 面,科学数据 据库资源不断 断积累丰富;作为数据 存储基 基础设施的海量 量存储系统建 建成上线,存 存储量节节攀 攀升;科学 数据网 网格整合了分散 散的数据资源 源,提供了集 集中管理与共 共享。 在 在文献信息服务 务方面,全面 面改造和加强 强文献服务方 方式,建立 起综合 合集成和可靠服 服务的公共文 文献信息服务 务平台,实现 现了从传统 图书馆 馆到数字图书馆 馆、从纸本文 文献为主到网 网络数字文献 献服务为主、 27 第二章 中国科学院信息化总体态势与特点 从分散自我运行发展到全馆统筹规划分工合作并带动全院协同 发展的转变,正在成为适应信息时代要求的知识情报研究与知识 服务中心,对科技创新的支撑能力大幅度提升。 突出应用 2.2 1.信息化环境下的科研新范式初现端倪,示范引领了国内科 技创新发展 我院坚持以应用需求为出发点和落脚点,在天文 e-VLBI 观 测、宇宙起源、气候模拟、野外考察、可视化铸锻、汽车设计等 多方面,开展了一系列的 e-Science 应用示范。经过“十一五”的 初步实践,已经在探索科研信息化体系结构、标准规范和关键技 术等方面体现出示范效应,形成了有中科院特色的应用服务模式, 有效发挥了助推科技创新跨越发展的作用。 我院依托先进的信息化基础设施,结合学科特点,开展了众 多应用。在保障青海玉树抗震救灾、支撑 2007 年“嫦娥一号” 测轨任务和 2010 年“嫦娥二号”测轨任务的网络安全、实施世 界上精度最高的一组对宇宙最大自束缚系统——星系团的数值 模拟等重大社会、科研应用方面,取得了丰硕成果。 2.有我院特色的管理信息化系统初步形成,应用水平居国内 前列 以 ARP(Academia Resource Planning)系统为代表,全院不 断优化、完善系统运行环境,整合应用系统平台,稳步推进系统 28 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 集成部署,深入挖掘信息资源,辅助决策功能初显。通过实施 ARP 系统,我院规范了全院科研管理,促进了科研管理流程变革,提 高了科研管理效率,进一步带动了研究所科研管理信息化建设。 从 2010 年信息化评估中,ARP 系统得分的分布情况来看, 得分在 7 分以上的单位占全部参评单位的 84.16%,显示出 ARP 系统在多数单位中已经得到了较为深入而广泛的应用;另一方面, 2010 年,得分在 9 分以上的研究所数量远超 2009 年,说明大部 分研究所对 ARP 系统应用更加精益求精,ARP 系统总体应用状 况相比去年有明显进展。 3.教育信息化建设进展显著 我院教育信息化立足全院教育发展战略,建设统一的教育管 理与协同学习平台;把握人才培养规律与环节,实现研究生教育 全过程管理服务;持续积累教育资源,推动协同学习与资源共建 共享;助力学习型组织建设,创建继续教育培训平台;重视软硬 结合,形成了教育信息化良性生态环境。截至 2010 年底,中国 科学院研究生教育信息化基本部署完成并实施,更加注重支持研 究生教育过程管理和内容积累的应用,促进了中国科学院教育资 源的共建共享。 4.网络科普服务水平持续提升 “十一五”期间,中国科学院网络环境下的科普工作取得长 足进步。依托信息化基础设施,我院初步建成了开放互动的中国 科学院网络化科学传播平台,使我院网络科普工作从分散走向集 29 第二章 中国科学院信息化总体态势与特点 中,成为有机的整体;信息技术对网络科普的支撑能力显著提高, 为全院科普人员和机构提供科普协同工作平台、多媒体设计制作 工具软件以及信息技术支撑服务;网络科普从传播走向互动,更 加注重公众与科学家、科研与科普、线上与线下的多方交互;全 院网络科普资源得到深度整合与集成,以整体形象服务于公众。 5.网站群影响力不断扩大 “十一五”期间,中国科学院网络化信息发布平台从无到有, 从弱到强,院属单位网站建设取得了显著进展,初步形成了中国 科学院网站群体系。院网站进一步落实管理机制、明确内容栏目 定位、加强编辑队伍能力建设、强化英文版建设、加大服务支撑 力度、理顺管理体制与明确各相关单位职责、完善平台功能稳定 性和系统安全性,使网站群系统平台运行稳定。院网站持续营造 科学思想传播氛围,全面、准确、及时地反映中国科学院改革、 创新和发展动态,为此先后获得了工信部组织的 2009 年度、2010 年度“优秀政府网站奖” 。 2.3 强化保障 1.信息化保障能力不断增强 近年来,中国科学院通过进一步理顺信息安全工作机制和体 制,完善相关管理措施,研发相关安全技术,不断提升全院的信 息安全意识,为保障信息化基础设施和信息资源的安全发挥了重 要作用。 30 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 从信息化工程项目的过程规范到具体项目实施的标准规范, 我院在互联网络、超级计算机、科学数据库、网站、科普、教育 信息化、ARP 等建设过程中都研制并发布了一系列的标准规范, 有效地促进了项目的建设,还将部分成果上升为国家标准、国际 标准。 “十一五”期间,各项目分别构建了有特点的运维体系,如 科技网的“总中心—地区分中心—研究所”三级管理与运维体系、 科学数据库的面向学科领域的数据服务专员机制、ARP 的“院中 心(信息助理)—区域信息化分中心—研究所”三级运维体系、 科普的“科普联盟—各研究所”网络,并分别建设了基础设施环 境运维和用户服务的队伍,保证相关基础设施能够服务一线科研 活动,同时促进了院科研信息化持续健康发展。 2.信息化软环境建设初见成效 我院印发了《中国科学院关于进一步推进院属单位信息化工 作的指导意见》,下达了《全院信息化 2009 年年度工作要点》 , 印发了《中国科学院信息化工作管理办法》,进一步完善了院信 息化组织机构,明确了工作任务和职责,初步形成了信息化工作 体系,全方位指导和推进院信息化工作的部署和实施。 我院多策并举,推动信息化人才梯队素质提升。形成了面向 “所级信息化管理人员、信息化建设人员、信息化用户”的三层 分类别、多渠道、多形式、重实效的信息化培训体系。举办了多 期信息化局级领导研讨班和信息化主管干部培训班;2009 年,共 举办全院性质的信息化培训 40 余次,培训累计人数 3,840 余人。 31 第二章 中国科学院信息化总体态势与特点 在推进信息化建设及应用的同时,我院开展了多层面的信息 化宣传工作,初步形成了以“一网多刊”为主的院信息化工作宣 传格局,进一步营造了全院良好的信息化氛围。 3.信息化交流合作逐步深化 我院积极推进与国际国内相关机构的交流与合作,采用论坛、 讲座、共建项目等多种方式,互通有无,取长补短,不拘一格地 吸纳外部智慧为我所用,不断推进我院信息化工作发展,扩大我 院信息化工作影响,充分发挥我院在科研信息化领域的引领示范 作用。 32 第三章 2010 年中国科学院信息化评估结果 中国科学院信息化发展报告2011 三 2010 年中国科学院信息化评估 结果 2010 年,中国科学院信息化工作领导小组办公室(以下简称 “院信息办”)委托中国科学院计算机网络信息中心(以下简称 “网络中心” )对院属各单位进行了第 3 次信息化评估。网络中 心成立了项目组, 在对 2009 年评估工作进行总结分析的基础上, 以客观性、方便性、引导性为原则,对评估指标体系进行了完善。 通过信息化评估,项目组对各研究所的信息化工作进展状况进行 了分析。 2010 年度中科院信息化评估的主要内容是:信息化基础设施、 管理信息化、网络信息服务、研究所特色信息化工作、信息安全、 信息化综合管理等方面;尚未涉及的内容包括信息化绩效管理、 信息化集成、深层次决策分析、信息化治理等更高层次信息化建 设状况;信息化节能环保、系统架构技术路线等内容首次列入问 卷考察范围,但未计入得分。 将参加本次评估的研究所按照总成绩排名,可以分成 A 类(33 名,70 分以上)、B 类(39 名,60~70 分)和 C 类(26 名,60 分 以下)。分别考察三个类别研究所的各项平均得分,可以得到部 分信息化建设的共性特征。 33 第三章 2010 年中国科学院信息化评估结果 信息化管理环 境 10 信息化效益 信息安全 8 所级信息化指 网络及IT设备 6 标 环境 4 门户网站 2 0 数据应用环境 科普 ARP 数据文献资源 信息化应用 协同平台 数据来源:中科院信息化评估统计数据2010.12 图表 5.2010 年信息化评估 A 类研究所得分分布情况 A 类研究所信息化建设主要呈现出以下一些共性特征: 1) 综合得分均在 70 分以上,各单位之间得分差距不大; 2) 信息化综合水平较高,各项信息化建设都比较全面和完善, 没有明显的弱项,尤其是在 ARP 系统、信息化管理环境、网 络及 IT 设备环境、信息安全、数字文献资源建设与应用方面 情况良好; 3) 主管领导对信息化有较深入的认识,非常重视信息化建设。 所内部有很强的内生动力,大部分单位均制定了信息化规划 和信息化年度工作计划,信息化组织机构、人才队伍方面也 比较有保证,有较充足的信息化专项资金预算和投入。超算、 科学数据库、协同环境建设等科研信息化手段也得到一定范 围的应用。 34 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 信息化效益 所级信息化 指标 门户网站 信息化管理 环境 10 8 6 4 2 0 科普 信息安全 网络及IT设备 环境 数据应用环 境 ARP 数字文献资 源 信息化应用 协同平台 数据来源:中科院信息化评估统计数据2010.12 图表 6.2010 年信息化评估 B 类研究所得分分布情况 B 类研究所信息化建设主要呈现出以下一些共性特征: 1) 综合得分在 60~70 分之间,各单位之间得分差距不大; 2) 部分研究所在各项工作中已经出现不均衡现象,部分工作内 容与 A 类研究所差距较大。B 类研究所得分较高的 ARP 系统、 信息化管理环境、网络及 IT 设备管理等方面建设水平与 A 类 研究所差距并不很大,分别只相差:0.38、1.33 和 0.96 分; 而在得分较低的协同平台、所级信息化特征指标和网络科普 方面,分别相差:3.39、1.73 和 1.59 分。 3) 主管领导相对较重视信息化建设,部分所内部有较强的内生 动力,大部分单位均制定了信息化规划和信息化年度工作计 划。 35 第三章 2010 年中国科学院信息化评估结果 信息化效益 所级信息化 指标 信息化管理 环境 10 8 网络及IT设备 环境 6 4 2 门户网站 信息安全 数据应用环 境 0 科普 ARP 数字文献资 源 信息化应用 协同平台 数据来源:中科院信息化评估统计数据2010.12 图表 7.2010 年信息化评估 C 类研究所得分分布情况 C 类研究所信息化建设主要呈现出以下一些共性特征: 1) 部分研究所领导对于信息化的重视程度仍有待加强,主要表 现在不重视制定信息化规划和工作计划,信息化规划和工作 计划缺失或质量较低;信息化方面的资金投入很少或几乎没 有投入,普遍在专门的信息化组织机构、信息化人员等方面 存在不足。 2) 部分信息化项目建设及应用存在缺失,主要集中在所级信息 化特征指标、数据应用环境、网络科普和协同平台等方面, 如有 7 家单位未建设和应用协同平台,有 7 家单位未建设和 应用科学数据库,有 1 家单位尚未开展网络科普工作; 3) 综合信息化水平较低,各方面信息化建设和应用水平均有待 提升;部分研究所在信息化工作中各项工作发展水平不一。 36 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 例如,C 类研究所平均得分最高的 ARP 部分比最低的所级信 息化特征指标部分高 6.13 分。 4) 部分研究所受本学科特点影响,对信息化的内生动力不足, 如自然科学史研究所,因此导致研究所内部尚未形成使用信 息化手段进行科研和管理的氛围。 5) 部分研究所是新建所,由于成立时间不长,信息化基础比较 薄弱,还有些研究所由于体量比较小,受人员经费限制,影 响了其信息化水平的提升。 37 第四章 信息化基础设施 四 信息化基础设施 中国科学院院长路甬祥曾指出:信息化基础设施是当代最重 要的科研基础设施。我院实施“知识创新工程”以来,院信息化 建设全面推进,“十一五”期间,我院大力加强科研信息化基础 设施建设,组织实施了互联网络、超级计算和科学数据应用等三 大应用环境的建设,全面推进科研和管理信息化应用。在国家有 关部委的支持下,我院经过多年建设,逐步形成了由高速科技网 络、超级计算环境和科学数据中心构成的先进科研信息化基础设 施及服务环境,不断改革运行体制和机制,不仅服务于科技创新, 而且服务于国家重大工程建设、经济社会发展与企业技术创新。 近年来的实践表明,我院信息化基础设施已初具规模,对提升全 院科研与管理水平、推进各学科创新发展、强化自主创新能力, 日益发挥出不可替代的重要作用。 4.1 网络环境 中国科学院互联网络环境以中国科技网(CSTNET)为基础 网络平台。CSTNET 是中国最早的互联网络单位,兼具全国公益 性网络和中国科学院科研网络双重特征,按照中国科学院信息化 战略部署实施中国科学院骨干网络建设,并对基础网络平台进行 运行管理。经过几年的建设,中国科技网已经成为连接国内外科 技界的网络枢纽,覆盖院内外主要的科研基地,连接超级计算机、 科学数据库资源、大型科学装置、野外台站等科研基础设施,形 38 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 成安全可靠、可管可控的网络应用环境,提供专业的网络服务。 4.1.1 发展现状 1.网络基础设施 (1)互联网络覆盖全院机构,提供高速可靠的网络平台,并 具有下一代互联网服务能力 经过“百所联网”、 “十五”信息化建设、下一代互联网络(CNGI) 核心网建设、CNGI 驻地网建设和“十一五”信息化建设,中国 科技网已经具有了由 10G 双核心层、155M—2.5G 的骨干汇聚层 和千兆接入层构建的高速交换能力,为我院 120 多个研究所、50 多个野外台站和院外国家级科研院所的科研信息化提供了开放 的支撑平台。 截至 2010 年年底,中国科技网以北京为总中心,为上海、南 京、武汉、广州、成都和兰州等 6 个分院提供 2.5G 接入带宽;为 长春、沈阳、合肥、昆明、西安和新疆等 6 个分院提供 155M 接 入带宽;为地理位置相对集中的研究所提供千兆接入带宽,为地 理位置相对分散的研究所提供 60-155M 不等的接入带宽。我院网 络基础设施建设为科研信息化创造了高速、开放、安全、可靠的 网络基础条件。 39 第四章 信息化基础设施 信 图表 表 8.中国科技 技网骨干覆盖示 示意图 通 通过积极参加 CNGI 核心网 网和驻地网建 建设,已使北京 京、上海、 广州、成都、兰州、沈阳和长春 春等 7 个地区 区节点成为 CNGI C 的核 心网络 络节点,并形成 成了有 103 个院内外研究 个 究所组成的科研 研驻地网, 提升了面向下一代互 互联网的网络 络服务能力。 伸至数据产生 生现场,为科 科研数据采集、 、传输与 (2)网络延伸 创造了基础条件 件 共享创 “十一五”期间,通过院、 、网络中心和 和大科学工程 程、野外台 站所在 在研究所“三方 方共建”方式 式,克服台站 站地理分散、位置偏僻 和电信 信基础条件薄弱 弱等困难,积 积极与运营商 商协调争取优 优质优价的 基础线 线路资源,提供 供专业技术支 支持服务,实 实现了科研观 观测与试验 观测的 的信息化数据采 采集、传输和 和共享。20100 年底前已完 完成“十一 40 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 五” 大科学装置与野外台站联网工程中的 32 个子项目建设内容, 网络覆盖 53 个固定台站的近千台套观测和监测设施。野外台站 联网有力支持了近地天体探测、e-VLBI 与“嫦娥二号”测轨任务、 近海海洋观测、子午工程、中国陆地生态系统通量观测研究网络 (CHINAFLUX)和冰川冻土观测等科研活动的信息化,为联合 观测与联网研究创造了基础网络条件。 图表 9.野外台站联网图 (3)努力推进国内网间互联,为科研协作与共享创造更有 利的信息化条件 中国科技网与中国主要的互联网络,如:中国电信、中国联 通、中国教育网和北京国家互联网络交换中心,均实现了 1G— 2.5G 直接连接,国内网间互联带宽达到 8G,保障了网间服务质 41 第四章 信息化基础设施 量。其中,中国科技网与中国教育网的第二互联端口为中科院高 能物理研究所与欧洲核物理研究中心的科研数据传输提供支持, 结合科研需求,寻求多种资源渠道,协调中国教育网,持续优化 路由,保证传输质量和稳定性。 在支持科研应用方面,中国科技网为中国科学院众多的关键 科研领域提供了一个高效、稳定、安全的网络平台,为科研活动 中的海量科学数据、计算设施、野外台站等基础设施提供数据传 输服务,支持天文学科射电天文望远镜实时甚长基线干涉测量 e-VLBI 系统应用,提供了国际观测专用光通道和长距离、高带宽 实时海量数据传输技术服务;为高能所大亚湾核电站中微子实验 室与美国国家能源研究计算中心(NERSC)的长时间稳定可靠数 据传输提供技术支持;为国际热核聚变实验堆计划 ITER 中方参 与单位构建国际高速数据平台,提供数据接入、安全、存储、视 频、网络加速等综合服务;为动物所“物种远程鉴定系统”依靠 CNGI 网络进行数据传输,满足了动物所动物标本远程鉴定的网 络需求。 专栏 1:服务“玉树抗震救灾” ,为对地观测数据传输提供高速应急带 宽支持 2010 年 4 月 14 日,青海省玉树 7.1 级地震发生的当天下午, 对地观测中心启动了航空遥感应急响应。中国科技网积极配合, 紧急调集资源,协助对地观测中心自中国科技网成都分中心将首 批空间分辨率为 40cm 的高分辨率遥感图像传送至对地观测中心 北京数据处理中心,为对地观测中心及时处理地震数据、遥感图 42 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 像和报送抗震救灾信息提供了及时的传输资源。本次紧急保障任 务的完成,充分体现了中国科技网长期建设积累的高速网络带宽 能力、技术服务能力和三级运行体系下整体资源调度与服务能 力。 2009 年,中国科技网曾配合院对地观测中心在科技网广州和 南京分中心,进行了不同带宽等级的数据应急传输测试验证,为 对地观测中心的国家 863 项目——《重大自然灾害遥感快速响应 系统》提供了大空间跨度的高速测试平台,形成了比较成熟的应 急保障方案,并在本次玉树抗震救灾应急数据传输中得到了实战 考验。 专栏 2:为 ITER 搭建国际专用高速数据网实现异地同步的共享环境 ITER 计划是由欧日美俄中韩印七方联合实施的,现阶段的任 务是于 2018 年前把装置建成。整个工程由 ITER 国际组织(以下 简称“IO”)统一组织管理,需要通过一个 ITER 国际专用高速数 据网实现异地同步的共享环境,完成项目的设计、研制、项目合 同、计划进度管理、质量保障管理、经费控制、文件系统管理、 视频会议系统及共享数据中心。中国科技网构建了与 ITER 各成员 国之间以及各成员国与国际组织之间高效、便捷、稳定的交流和 协同设计及管理的国际高速专用数据网络平台,同时在数据接 入、安全、存储等方面为 ITER 科学研究的实验及构建阶段提供具 有良好可扩展性的 IT 服务平台,在国内构建北京、合肥、成都等 三个骨干节点,同时完成 ENOVIA、CATIA 等专用工程软件、数据 库软件、项目管理软件、质量控制软件、经费管理软件的选购、 43 第四章 信息化基础设施 培训和部署实施工作及虚拟实验室软件的研究开发。2010 年 3 月 在 ITER 召开的 WGIT 工作组会议上,ITER 对各方协作网进行统一 网络测试,测试结果显示中国是唯一能够达到双向传输速率为 60M 的参与方,网络性能领先于其他各方。 (4)积极参与国际合作,为科研活动的国际化提供信息高 速公路 中国科技网除具有 1.552G 国际商业出口带宽以外,还具有以 “中美俄科技与教育环球高速网络(GLORIAD)”为代表的科研专 用国际出口带宽总量 18G。至 2010 年,GLORIAD 已经拥有 15 个国家级科教网络成员,成员之间可以通过高速的科研专用网络 进行信息化条件下的科研合作,为高能物理海量数据传输、国际 天文联合观测、气象研究和科学数据库数据交换等科研应用创造 了高品质的传输条件。中国科技网积极参加 GLORIAD 建设,不 断提升所辖香港开放交换节点 HK OEP(HK LIGHT)和北京开放 交换节点 BJOEP 的交换能力,并于 2010 年开通了至美国的 10G 科研带宽,同时积极协调提升与欧洲科教网络的直连容量。 44 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 10.GLORIAD 网络架构示意图 2.增值服务 CSTNET 在互联网络环境的基础上,发挥技术优势和集约优 势,针对通用性的应用提供高质量的增值服务,解决了研究所自 建模式下的建设投入大、运维难和安全管理弱等难题,取得了良 好的运行和应用效果。目前,CSTNET 提供的增值服务主要有: 中国科学院视频会议系统、中国科学院邮件系统、网络管理系统、 网络安全监测系统服务和 VoIP 系统技术服务。 (1)创新建设桌面型视频会议系统,提供以人为本、灵活 高效的服务 会议室型视频会议系统覆盖全院 120 多个院属管理机构和科 研单位,支持速率为 768 KB/S、全院规模的 H.323 标清视频会 议,系统可用率达 99.99%。 桌面型视频会议拓宽了视频会议的应用场景,为用户提供了 更为方便灵活、实用有效的体验。坚持“以人为本”进行系统设 计,充分考虑用户使用习惯,结合二次开发,不仅将参会容量扩 45 第四章 信息化基础设施 展至 500 点,还定制了 50 余项个性化功能,系统易学易用。系 统提供的功能主要包括:音视频互通、共享桌面、共享程序、共 享白板、文字交流、会议议程、会议录制、虚拟场景、文件传输、 影音播放、共享浏览等功能,同时实现了与硬件 H.323 视频会议 系统互联互通等。 院视频会议系统已基本覆盖全院所属各管理机构和研究单 位。截至 2010 年底,院视频会议系统共召开大中型会议 688 次, 涉及京内外约 15 万人次。另据不完全统计,院视频会议系统每 年支撑召开所级和课题组级视频会议达 400 余次。 图表 11.视频会议系统使用示意图 专栏 3:视频会议系统应用 2009 年和 2010 年,中科院长春光机所在院网络中心成功举 行了两次远程视频招聘会北京专场,招聘会由中国科技网网络中 46 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 心全程提供技术支持和网络保障,是视频会议手段在跨地域面试 中的成功运用。在视频招聘中,视频图像清晰、网络传输顺畅, 为应聘者展示自我,与远在长春的专家、学者进行互动交流提供 了良好的技术支持。同期,长春光机所还在中国科技网分中心的 支持下,运用院视频会议系统在西安、南京、成都、武汉、上海 等地开展了远程视频招聘工作。 远程视频招聘的手段创新,扩展了招聘工作的候选范围,丰 富了双方互动环节,节省了招聘成本,有力保证了招聘工作的效 果和质量。 (2)院邮件系统容量和安全稳定性全面提升 院邮件系统实现了全冗余架构的全面升级,系统容量、安全 性和稳定性得到了巩固与提升。邮件系统为每个账户提供的邮箱 基本容量已达到 3GB,附件容量也升级为 50MB,提供了 2GB 的 “网络硬盘”及“文件中转站”。邮件系统院属用户单位已达 119 家,各类实验室 10 个,用户邮箱总数已经超过 10 万个,系统可 用率达到 99.99%。 47 第四章 信息化基础设施 图表 12.邮件系统业务流程图 院邮件系统采用新一代智能型反垃圾邮件系统,集成了国外 著名的反病毒引擎。邮件系统 WEB 界面提供了网络硬盘、文件 中转站、发送超大附件、发送网盘附件、一次下载多个附件、召 回邮件、全文搜索、自助查询和企业公告栏等特色功能,给用户 带来了更加丰富的功能体验。 专栏 4:邮件系统迁移服务 除了为用户提供安全、可靠、高效的大容量邮件系统服务外, 院邮件系统还全力为用户提供应急响应服务。院邮件系统团队及 时响应用户邮件系统的紧急迁移需求,从编写迁移文档到指导用 户修改 DNS 记录等各种细节,力保用户平滑、顺利完成迁移工 48 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 作。 2008 年夏,某研究所邮件系统突然无法正常工作,请求将邮 件服务器紧急迁移到院邮件系统中。接到用户需求后,邮件系统 工程师认真、细致地向该所网管说明了进行邮件系统迁移所需的 准备工作并设计制定迁移方案,按照该所的时间要求,在周末主 动到现场提供技术支持,协助网管老师完成了邮件系统的迁移工 作,有效保证了该所正常业务沟通的开展。 (3)中国科技网网管系统为网络管理提供了多层次的工具 支持 中国科技网网络管理系统实现了科技网全网拓扑的编辑和 保存,对全网几百台设备的连通性、端口流量、CPU 和内存利用 率等关键运行指标进行监测,对异常状态自动产生告警并与运维 业务流程联动,并为中国科技网运行中心(总中心)和中国科技 网用户网络管理人员提供基于 WEB 的网络管理系统服务,为保 障科技网服务质量和响应能力提供了必要的工具。 专栏 5:为完成“嫦娥二号”测轨网络保障工作,灵活定制网管功能 中国科技网网络管理系统具有基于 WEB 的远程管理能力和 可灵活定制的特点,为 2007 年“嫦娥一号”测轨任务和 2010 年 “嫦娥二号”测轨任务的网络安全保障提供了网络管理工具支 撑。针对网络保障任务的要求,中国科技网很快在网管系统中将 上海天文台、新疆天文台、昆明天文台、北京密云站及沿途重要 网元设备纳入密集监控范围,定制了面向 e-VLBI 的链路端口监 49 第四章 信息化基础设施 信 控,提 提高监测采样频 频率,为圆满 满完成保障任 任务提供了高 高效可靠的 工具支 支持。 图表 13.网络 络管理系统示意 意图 中 中国科技网全 网网络监测分 分析系统实现 现了对科技网 网骨干网 以及国 国内国际出口的流量 3—7 层的分析,包括总览、 包 流 流量分析、 安全监 监测、统计报告、系统配置 置以及系统帮 帮助几个模块 块;为网络 上正在 在运行的服务和 和应用程序提 提供保护,提 提供流量过滤 滤功能来监 测和处 处理异常流量;对网络滥用 用进行控制,为重要应用 用的带宽保 障提供 供手段;提供实时的全网流 流量可视化视 视图,提供用 用户及网络 流量的 的精确分析。 50 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 14.全网网络监测分析系统运行示意图 中国科技网运维业务流程管理系统实现了网络告警与网络 流程工单的联动,使中国科技网运维工作中的事件管理、问题管 理、变更管理和配置管理等流程实现电子化,提升了运行服务质 量和响应效率。 (4)VoIP 系统得到广泛推广应用 VoIP 语音系统面向科研和管理需求提供公益性服务,初步完 成中国科学院 IP 语音通信应用示范系统建设,具有单位之间办公 电话免费互通的能力,已有 70 余个院属单位接入了院 IP 语音通 信示范应用系统,部分用户已经开始在单位内部推广使用。 专栏 6:VoIP 语音系统应用 中国科学院计算机网络信息中心与中国科学院寒区旱区环 境与工程研究所(以下简称寒旱所)IT 技术人员通力合作,在寒 旱所成功部署开通 IP 语音系统平台。 51 第四章 信息化基础设施 第四章 信息化基础设施 寒旱所是以自然环境为主要研究对象的专业所,具有 6 个国 家级野外观测站及其它野外观测站,科研沟通成本较高。寒旱所 与网络中心技术人员成功部署了研究所级轻量级 IP 语音通信系 统及语音网关设备。该系统具有 IP IP 语音通信、语音邮箱、呼叫中 心、一号通、电话会议等主要功能,为课题组和出差人员提供基 于网络的 IP 语音通信服务,在很大程度上解决了野外台站和出差 外出人员的通信需求。 外出人员的通信需求。 图表 15.寒旱所 VoIP 语音系统应用 语音系统应用 4.1.2 特点及成效 4.1.2 中国科技网以服务中国科学院知识创新工程为使命,具有鲜 中国科技网以服务中国科学院知识创新工程为使命,具有鲜 明的科研特色和优质的服务质量。 明的科研特色和优质的服务质量。 52 52 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 1.覆盖全国众多科研机构的高性能网络环境进一步优化 中国科技网面向我院研究所、事业单位和院外国家级研究院 所,提供支持 IPv4 和 IPv6 的互联网络环境接入服务。中国科技 网的用户包括我院 120 余个直属研究机构、管理机构和转制单位, 同时还接入其他国家级科研院所十余家,如:中国气象局、中国 地震局、中国医学科学院、中国地质科学院、中国地质调查局、 中国国家图书馆、中国林业科学院、中国农业科学院、中国社会 科学院、中国石油化工科学研究院和军事医学科学院等。中国科 技网为我院科研信息化,特别是数据密集型科研活动,提供了高 速的骨干带宽支撑和丰富的国际科研网络资源。科研网络已延伸 到大科学装置、野外台站等科研活动一线,实现了中科院 53 个 大科学装置/野外台站的联网,为高能物理实验装置、光学和射电 天文望远镜、陆地生态和碳通量观测等多学科的 681 台套科研装 置提供了网络链接环境。 2.形成一系列面向科研的精品服务 中国科技网提供基本的网络接入服务,实现院内开放访问并 为研究所提供 20M 优惠网间带宽;用户可以享受覆盖全院的高质 量会议室型视频会议系统服务,灵活易用的音视频与数据共享集 成的桌面视频会议服务;为用户提供支持大容量、大附件、反垃 圾、防病毒和丰富 WEB 功能的电子邮件服务;为研究所网络管 理和网络安全提供网络监测和检测服务;提供专业技术支持工程 师协助所级网管和信息化主管,开展服务推送和技术培训,为一 线科学家提供信息化解决方案。 53 第四章 信息化基础设施 3.长效运维机制促进网络环境服务水平稳步提升 依托三级运行架构,实现 7×24 小时的运行服务,建立了科 学的运行响应流程,切实保障服务质量。中国科技网总中心负责 网络总体运行管理与技术支持,不断巩固和提升网络质量,并依 托 12 个地区分中心协助研究所网管和信息化主管做好研究所和 科研一线的信息化技术支持工作;中国科技网引入国际先进的 IT 服务管理思想,为 7×24 运维服务建立了基于 ITIL 的业务管理流 程,不但提高了响应效率,还实现了网络运行工作的知识积累。 4.2 超算环境 4.2.1 发展现状 “十一五”期间,中国科学院以“优化布局,整合资源,强 化服务,推动应用”为建设原则,以总中心、分中心、所级中心 超级计算资源的“金字塔”式三层布局为依托,利用网格技术有 效地整合了院内超级计算资源,建成了具有“通用+专用”6200 万亿次以上聚合计算能力的分布式高性能计算环境,在院超级计 算总中心安装了百万亿次高性能计算机系统,并建设相应的应用 软件环境,提供了全院统一的超级计算资源的技术支撑服务体系、 制度规范体系和安全保障体系。截至 2010 年 12 月,已建成 7 个 具有 10 万亿次以上通用计算能力的超级计算分中心,并在 31 个 网格节点完成网格部署,实现了整个环境的统一运行管理、技术 支持与服务。2010 年我院成功建立了基于 GPU 的双精度峰值超 过千万亿次、单精度峰值超过三千万亿次的高效能超级计算系统, 54 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 在院内十家研究所推广了十套百万亿次系统,从而构建了聚合计 算能力达五千万亿次的分布式 GPU 超级计算系统。 1. 学科、地域分布合理的三层超算环境初具规模 初步形成了由院超级计算总中心、分中心及所级中心组成的 三层架构的科学计算网格环境,其中顶层计算能力达到 143 万亿 次,聚合中间层的分中心和第三层的所级中心 20 个左右。 层级 总中心 分中心(7 家) 所级中心(13 家) 名称 地点 计算机网络信息中心 北京 大连分中心 大连 昆明分中心 昆明 青岛分中心 青岛 合肥分中心 合肥 兰州分中心 兰州 深圳分中心 深圳 沈阳分中心 沈阳 北京基因组所 北京 紫金山天文台 南京 力学所 北京 上海药物所 上海 空间中心 北京 苏州纳米所 苏州 山西煤化所 太原 高能所 北京 福建物构所 福州 55 第四章 信息化基础设施 上海天文台 上海 微生物所 北京 新疆生地所 乌鲁木齐 数学与系统科学研究院 北京 图表 16.院三层超算环境分布情况 院超级计算中心作为总中心,部署了深腾 7000 超级计算机 系统,运算速度理论峰值达到每秒 143 万亿次,是目前国内综合 性能最高的通用高性能超级计算机之一。该系统采用了创新的高 性能异构体系架构,突破了传统高性能计算平台的应用限制,通 过包含多种不同架构服务器节点,从而满足用户多样化的应用需 求。自 2009 年 4 月深腾 7000 投入正式使用以来,截至 2010 年 12 月底,已累计为用户提供超过 6,800 万 CPU 小时的机时服务, 支持了一大批国家 863 计划、973 计划、国家自然科学基金、中 国科学院知识创新重大项目和省部级等重大项目和计划。中科院 超级计算中心研究人员协助科学家们在各应用领域作出了众多 出色的成果。 专栏 7:凤凰计划 世界上精度最高的一组对宇宙最大自束缚系统—星系团的 数值模拟,将主要对暗物质湮灭、星系团暗晕的内部结构、星系 团暗物质引力透镜现象、星系团的形成与演化进行系列研究。该 计划利用深腾 7000 系统的 1,024 个计算核心,耗费约 200 万个计 算机时完成。 56 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 17.9 个不同星系团的密度分布 39 图表 18.1e9 粒子数目的其中一个星 系团模拟的密度分布 40 专栏 8:高速列车气动噪声的数值评估 力学所利用深腾 7000 系统以数值模拟手段,结合理论和实 验研究,对高速列车的气动噪声进行预测评估,优化列车关键部 件的降噪设计。该项研究可提高高速列车乘坐的舒适性,缓解噪 声对铁路沿线居民的影响,促进高速轨道交通的可持续发展。 图表 19.列车表面压力云图和纵截面流线图 57 第四章 信息化基础设施 结合我院超级计算应用发展现状及特定计算需求,按照“学 科为主、地域为辅”的原则,在北京、上海、武汉、沈阳、兰州、 合肥、昆明、大连、青岛等地部署了 10 个分中心。遍布全国、 覆盖各个主要地区计算需求的 10 家超级计算分中心具有各自鲜 明的学科特色,成为超算环境的中坚力量。 专栏 9:锂离子掺杂介孔共轭高分子材料的储氢研究 大连化物所利用大连分中心的超级计算机系统开展计算化 学方面的科学研究,以数值模拟手段,对锂离子掺杂介孔共轭高 分子材料的优异储氢性能进行了研究,通过对锂离子掺杂浓度进 行优化,提高了其储氢水平,有力地促进了新材料、新能源的发 现和发展。 图表 20.锂离子掺杂介孔共轭高分子材料的储氢研究示意图 58 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 在基层部署的园区级计算中心主要由研究所自建,以满足研 究所及周边科研单位自身的计算需求为主,现已经吸引了 13 个 具有特色应用的研究所加入,形成了我院超算环境的坚实基础。 专栏 10:超算环境助力系统生物学、基因组学和大分子蛋白质模拟领 域交叉研究 北京基因组研究所是较早加入院超级计算环境的所级中心, 该所利用院超级计算环境的资源对α/β类型小酸性可溶性蛋白 (SASP)与 DNA 结合模式进行了科学探索。在系统生物学、基因 组学和大分子蛋白质模拟领域形成了跨领域、交叉学科的前沿性 研究,促进了我国绿色生物农药的可持续性发展。 图表 21.小酸性可溶性蛋白(SASP)与 DNA 结合模式研究示意图 59 第四章 信息化基础设施 2.分布式专用 GPU 计算聚合能力达 5,000 万亿次 2010 年我院成功建立了基于 GPU 的双精度峰值超过千万亿 次、单精度峰值超过三千万亿次的高效能超级计算系统,在高能 物理研究所、国家天文台、地质与地球物理研究所、电工研究所、 金属研究所、紫金山天文台、深圳先进技术研究院、近代物理研 究所、中国科学技术大学、计算机网络信息中心等中科院内不同 领域的十家研究所推广了十套百万亿次系统,从而构建了聚合计 算能力达五千万亿次的分布式 GPU 超级计算系统。该系统满足 了广大科技人员对超级计算的迫切需求,以低廉的成本和便捷的 网络设施实现了高效的超级计算。 GPU 节点单位 中国科学院过程 工程研究所 应用现状 z z z z 中国科学院计算 机网络信息中心 z z z z 中国科学院深圳 先进技术研究院 z 主要应用领域为计算流体力学、离散介质力学、 分子动力学(生物、材料及纳微系统方向)、图像 数据重构与分析、过程优化等领域,面向化工、 冶金、能源、矿产、医药等产业。 进行了 H1N1 病毒在水环境中的原子级模拟计算, GPU 并行核数 1,728 个,所用粒子数超过 3 亿; 计算材料学和计算流体力学等多项应用中,GPU 并行核数达到 1,500 个,所用粒子数超过 10 亿。 实现了远程分布式 GPU 计算,并行 GPU 核数超过 500 个。 主要应用领域为生物信息、计算物理与天文学计 算、地震波模拟、计算流体等领域。 进行了蛋白质翻译后修饰鉴定开源软件 InsPecT 的计算,GPU 并行核数 667 个; 自行开发了计算物理、天文学计算中的 N 体问题 软件,GPU 并行核数达到 140 个; 自主开发了对称特征问题并行求解代码和线性代 数系统并行代码,GPU 并行核数 100 个。 主要应用领域为计算金融、CT 数据可视化、灾害 预警数值计算、声学地学、化物。 60 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 z 进行了用于经典美式期权定价模型的研究,GPU 并行核数 108 个。 中国科学院紫金 山天文台 z z 主要应用领域为天文学天体测量领域。 对天文图像进行图像处理,用于区分恒星和移动 天体(包括人造天体和自然天体),GPU 并行核数 108 个。 中国科学院近代 物理研究所 z 主要应用领域为晶体与缺陷生长、材料力学性能 研究领域。 利用涨落耗散理论和分子动力学,对离子束辐照 以后材料的力学性能进行大规模相图扫描研究, GPU 并行核数 100 个。 z 中国科学院国家 天文台 z z 主要应用领域为天体物理领域。 用于研究超大质量黑洞周围的大星团的动力学, GPU 并行核数 160 个。 中国科学院电工 研究所 z z 主要应用领域为计算电磁学领域。 用于深亚微米大规模集成电路(VLSI)的互联线 寄生参数提取所依赖的电磁场有限元法求解器研 究,GPU 并行核数 108 个。 中国科学技术大 学 z 主要应用领域为物理化学中的分子动力学模拟和 水分子团簇的全局优化、量子物理中的用并行模 拟退火算法计算三体量子体系的纠缠度、流体力 学中的用 CESE 算法模拟超声速流场中水的相变、 地球物理中的模拟地震波在起伏地形下的三维介 质中的传播过程。 上述研究中最高 GPU 并行核数为 32 个。 z 中国科学院地质 与地球物理研究 所 z z 主要应用领域为反射地震成像领域。 自行开发三维非对称走时叠前时间偏移等软件进 行研究,GPU 并行核数 23 个。 中国科学院高能 物理研究所 z 主要应用领域为粒子物理分波分析、宇宙线物理 领域。 暂无并行应用。 z 中国科学院金属 研究所 z z 主要应用领域为计算材料科学领域。 用于研究钛合金多晶拉伸形变过程中位错与晶界 的相互作用及裂纹萌生机理,不同晶界取向及拉 伸方向对形变与断裂的影响,GPU 并行核数 32 个。 图表 22.我院 GPU 节点单位应用情况 61 第四章 信息化基础设施 截至 2010 年 10 月底,我院 11 个 GPU 计算节点已全部加入 科学计算网格(SCGRID),聚合了单精度峰值达到 5000 万亿次 的 GPU 计算能力。 3.科学计算网格成为国家网格重要组成部分 为了聚合三层架构中异构的多种计算资源,科学计算网格采 用了院超级计算中心自主研发的轻量级网格软件 SCE。2010 年 9 月,SCE 通过了中国人民解放军总参系统软件测评中心长达一个 月的严格测试。 通过院超级计算分中心和网格环境建设,我院已完成院超级 计算环境三层网格结构的主要节点建设和资源共享,实现院超级 计算环境的统一运维管理、统一资源调度和统一计算服务。同时, 在院信息化超级计算环境的三层结构中,对数据提供统一访问方 式,即为用户提供一个统一的用户数据空间视图。用户在网格服 务器上可以访问各个计算机群上的数据。 尽管全院超级计算资源地理上分布甚广,计算能力和规模不 同,使用的效率各不相同,但通过利用网格技术整合建成一个统 一的院三层超级计算网格环境后,可实现统一的运维管理与资源 调度,统一为用户提供服务,方便用户使用,达到资源整合与共 享使用、提高资源利用率的目的,促进应用发展。科学计算网格 将分布的超级计算资源、存储资源和网络资源集中起来,统一管 理,统一调度,并向用户提供统一的服务。其方便的图形化 Portal 和灵活的命令行使用方式,吸引了来自院内、外科研机构、大学 的近百位用户的账号申请,其中包括来自国外的用户申请。截至 62 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 2010 年 12 月底,用户累计提交的网格作业超过 4.5 万个,计算 机时超过 500 万小时。 图表 23.院超级计算环境系统结构图 利用科学院的技术研发优势,科学计算网格成功实现了与国 家网格的联通,成为国家网格的重要组成部分。 院超级计算环境的用户通过统一的网格门户和客户端工具 使用环境内所有资源,通过统一的界面,使用不同的超级计算资 源。同时使用的方式可以多样,包括基于 Web 和基于命令行等不 同方式,以符合不同需求用户的要求和使用习惯。院超级计算环 境的用户实行统一管理,每个用户都能使用全部可用资源。 63 第四章 信息化基础设施 图表 24.院超级计算网格用户功能视图 图表 25.院超级计算网格部署结构图 64 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 4.2.2 特点及成效 1.引领国内大规模科学计算应用 从中国国家网格各节点及应用来看,我院超算总中心作为国 家网格的主节点,截至 2009 年,成功运行的千核应用有 8 个, 占国家网格各个节点上运行的千核应用公开发布的千核应用的 80%。 应用名称 运行核数 星系演化大规模并行程序 P_widgeon 8,192 结合精确相互作用势模型以及新型构象取样技术的蛋白 质折叠过程模拟 6,400 凤凰计划 1,024 复杂生物分子模拟和药物虚拟筛选 4,096 流感病毒血凝素蛋白受低 pH 调控的计算模拟研究 1,024 盘古计划:解析暗宇宙中的结构形成 2,048 基于图形处理器的复杂油气储层介质中声场的多尺度离 散模拟计算研究 1,024 基于分子模拟的中药有效成分作用的生物系统网络构建 7,200 图表 26.千核应用规模 此外,中国国家网格运行管理中心发布的各节点单位应用及 部署情况也表明,在国家网格应用的部署、移植等方面,院超级 计算中心的网格应用在中国国家网格各个计算节点中也居于领 先地位。 65 第四章 信息化基础设施 2.服务社会创新活动初见成效 我院不断探索科研信息化基础设施的共建、共享、共用的建 设与服务新模式,推进与北京、武汉、深圳等地合作,积极为地 方经济社会发展服务,已累计为社会提供机时服务超过 950 万 CPU 小时(至 2010 年 6 月底),涉及化工、冶金、医药、汽车设 计、安全等多个领域。 2009 年,院超级计算中心成为了首都科技条件平台研发服务 实验基地。截至 2009 年 12 月底,院超级计算中心服务于北京市 及驻京各类企事业、科研高校,如中国中医科学院中医药信息研 究所、北京生命科学研究所、清华大学、北京航空航天大学等共 计 12 个案例,取得了较好的社会效益和一定的经济效益。 院超级计算中心的科研人员为中医研究所开发了并行化中 药方剂配伍程序,基于中医科学院提供的中药方剂配伍模型,运 用高性能计算手段,针对中医处方数据统计不同药剂的配伍情况, 加速了配伍计算过程,为研究分析中医处方的成分、剂量及药效 提供科学性统计分析依据。 院超级计算中心利用深腾 7000 超级计算机,为北京生命科 学研究所所做的流感病毒膜蛋白—血凝素(HA)构象变化的分子 动力学模拟提供了千核以上模拟计算的基本条件,为研究流感病 毒入侵细胞过程中的分子机制以及新型广谱抗流感药物的设计 与开发提供了重要的支撑。 院超级计算中心目前正积极组织人力针对美国财富 500 强企 业 SMITH INTERNATIONAL, INC.下属的史密斯钻井设备(常州) 有限公司北京第二分公司的核心知识产权—勘探模拟软件进行 66 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 改进,帮助其找到适合该软件的硬件平台,制定软件改进方案, 其中包括改进并行算法、并行实现方法优化(通信优化)、代码 优化(提高 CACHE 命中率)等多个方面,并正在筹划进一步合 作洽谈。 此外,院超级计算中心正在积极努力为北京长城华冠汽车技 术开发有限公司提供稳定、高效、安全的高性能计算服务,计划 通过与 CAE 软件结合、以工作流方式,为华冠汽车提供软、硬 件平台的一揽子服务解决方案。 专栏 11:北京生命科学研究所:流感病毒膜蛋白-血凝素(HA)构象 变化的分子动力学模拟 研究流感病毒入侵细胞过程中的分子机制对于新型广谱抗 流感药物的设计与开发具有重要意义。利用深腾 7000 超级计算 机,院超级计算中心为北京生命科学研究所所做的流感病毒膜蛋 白—血凝素(HA)构象变化的分子动力学模拟千核以上模拟计算 的能力,通过数值模拟,为 H5N1 和甲型 H1N1 流感新的防治手 段提供了非常好的解决方案。 图表 27.流感病毒膜蛋白-血凝素(HA)构象变化的分子动力学模拟 67 第四章 信息化基础设施 专栏 12:北京长城华冠汽车技术开发有限公司:高性能计算服务一揽 子服务解决方案 北京长城华冠汽车技术开发有限公司是北京市科委重点支 持企业。随着其对高性能计算能力的需求越来越高,院超级计算 中心正在积极努力为华冠提供稳定、高效、安全的高性能计算服 务,通过与 CAE 软件结合、以工作流方式,为华冠汽车提供软、 硬件平台的一揽子服务解决方案,在汽车设计的各个阶段,包括 整车开发、车型改进设计、零部件开发,借助计算机辅助工程 (CAE)分析手段对工程设计进行虚拟验证和分析,从而大大减 少了汽车研发的成本和周期。 图表 28.华冠汽车高性能计算服务案例 3.超算应用服务专业化初步显现 经过多年的积累,并依托超级计算中心的超级计算机、院超 级计算环境,我们已可为用户提供及时、高效、准确的计算机时 服务;为化学、生物学、大气科学、地学、天体物理、可视化和 68 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 工业计算等学科领域提供服务的专业化技术团队已初具规模。通 过建立 VIP 用户服务机制,实现了服务的标准化、规范化和价格 体系化,向打造超级计算机时服务的专业化品牌而努力。 在一年一度的高性能计算培训的基础之上,广泛开展了计算 化学、生物信息等学科的软件使用培训服务,通过“请进来,走 出去”的方式,为广大院内外的科研人员提供高性能计算、学科 软件应用的按需培训服务,截至 2010 年 10 月底,在北京、昆明、 兰州、大连等地共举办高性能计算、GPU、计算化学、生物信息 等专场培训近 20 次,培训学员超过 3,000 人次,覆盖院内外单位 超过 100 家,有力地促进了我院及院外各高性能计算应用领域科 研活动的广泛开展。 4.3 数据环境 “十一五”期间,数据基础设施正式列为我院信息化基本环 境进行重点建设,为科研活动提供综合性的数据应用环境。依据 “统筹规划、整合集成、公开共享、服务科研”的基本原则,重 点加大了科学数据资源体系、海量数据存储系统建设,推动全院 数据资源、存储资源、科学数据网格、数据密集型应用等整合建 设和深入应用。目前,全院面向科研信息化整体运维服务的数据 应用环境已初步形成,为科学数据的存储与积累、分析与处理、 共享与应用奠定了良好的发展基础。 69 第四章 信息化基础设施 4.3.1 发展现状 1.初步形成了资源积累与应用整合并重的科学数据资源体系 “十一五”期间,我院从信息化战略资源高度,系统地规划 科学数据资源体系。根据学科领域的数据整合需求,初步建成了 化合物参考型数据库、中国植物物种信息参考型数据库,以及天 文科学、空间科学、人地系统、资源环境遥感、化学、材料、中 国动物、微生物与病毒等 8 个主题数据库。根据重大项目需求, 建设了核聚变、生态系统功能区划、冻土环境、中科院青海湖联 合科研基地等 4 个专题数据库。同时,根据科研数据整理和共享 需求支持建立了 37 个专业数据库。专业数据库由具体研究所承 担建设,主题、专题和参考型数据库则通过组织相关研究所进行 跨所联合建设。此外,科学数据中心积极引进国际上优质的科学 数据资源,集中建设了陆地资源卫星遥感影像库(LANDSAT) 、遥 感影像数据库(MODIS)、数据高程数据库(DEM)、生物信息学 数据库、气象资料数据库、斯隆数字巡天数据库(SDSS)、大气科 学数据库等数据。截至 2010 年底,科学数据库建成可共享数据 127TB,通过资源整合形成了 528 个数据库。 “十一五”期间,科 学数据库共为 138 项各类科研项目提供重要支撑服务,直接支持 相关学术论文 187 篇。 70 中国科学院信息 息化发展报告 20011 中国科学院信息化发展报告2011 % 海洋, 4% 信 息 2% 能源, 3% 息, 天文, 4% 材料, 2% 2 地学, 37% % 空间, 10% 化学, 8% 生物, 23% 物理 理, 7% 科学数据库资源 源分布(专业库个 个数) 图表 29 9.中国科学院科 科学数据库数 数据资源状况 目前,科学数据 据库门户系统 统能够动态发 发布最新建成 成的科学数 据资源 源,提供统一的 的数据检索入 入口,实现与文献资源的应 应用集成, 用户可 可以直接跨库查 查询数据和文 文献信息。同 同时,建立了 了数据服务 监控与 与统计系统,建 建库单位可以 以动态了解数 数据资源量、数据访问 量、在 在线服务状态等 等信息,确保 保科学数据库 库稳定运行和 和服务。 2.初 初步建立了海 海量数据存储 储与处理基础 础设施 “ “十一五”期 间,启动建设 设了面向全院 院范围统一提 提供存储与 灾备服 服务的海量数据 据存储与处理 理系统。截至 至 2010 年底,海量存 储系统 统已经建成超过 6.42PB 存储环境,院 存 院内连接总带 带宽 4GB/S。 海量存 存储环境与科 科研网络环境、超级计算环 环境实现了优 优化联通, 71 第四章 信息化基础设施 与院 ARP 中心开通千兆专线,可以向超算用户提供万兆连接数 据存储,向院属研究所提供基于 IPv4 和 IPv6 协议的数据存储服务。 按照“边建设、边服务、边完善”的原则,科学数据中心于 2009 年底开始针对院信息化建设、重大科研项目以及研究所等需 求,开展数据存储服务。2010 年 6 月,向全院公告了数据存储备 份服务的通知,9 月,在线存储自助平台正式上线服务,重点面 向科研团体提供网络存储空间。 截至 2010 年底,海量数据存储系统已为 40 余家院内外用户 超过 780TB 数据提供海量数据存储服务,数据备份帐号 80 个, 在线存储帐号 130 个,数据存储空间占用容量近 3PB。 图表 30.中国科学院科学数据中心海量数据存储设施 3.面向分布式资源集成的科学数据网格及示范应用取得重 要进展 “十一五”期间,科学数据网格紧密结合学科领域主题数 72 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 据库的资源整合建设需求,初步形成了科学数据网格基本功能框 架。截至 2010 年底,科学数据网格开发实现了单点登录系统、 存储管理系统、网格信息管理系统等功能,为用户提供完整、透 明和开放的数据资源集成应用环境。“十一五”期间,数据网格 环境重点支持了四个学科领域的示范应用:化学数据网格实现化 合物结构存储及应用格式转换、分布式数据集成检索与统一访问; 空间科学数据网格集成基于太阳质子事件的关联数据发现、空间 科学数据的在线可视化、模式在线计算及三维可视化、科学数据 转换器/阅读器等学科应用;生命科学数据网格整合了 100 多个生 物信息学应用程序,实现了与网格运行服务总中心数据处理环境 的互通与资源共享;人地系统科学数据网格定位于地学 E‐SCIENCE 的基础设施,实现在线空间可视化查询及属性数据的在线统计分 析两项特色服务。 4.基本形成了分工与合作相辅相成的数据服务体系 我院数据基础设施建设整合了科学数据资源、海量存储系统 以及数据处理等资源与设施,初步形成了面向全院的数据应用环 境,提供综合性支撑服务。其中,科学数据中心作为数据基础设 施建设和运维的核心,全面提供存储服务、数据服务和技术服务, 建库单位作为数据资源的建设者主要提供数据服务,网格节点作 为数据网格建设和运行的组成提供面向用户的数据网格服务和 数据应用服务。同时,科学数据中心还为建库单位、数据网格节 点提供技术支持和运维服务。 73 第四章 信息化基础设施 服务内容 重点服务对象 主要服务者 存储与灾备服务 一般用户 数据中心 数据资源共享服务 一般用户 数据中心、建库单位 科学数据网格 数据工作者 数据中心、网格节点 数据库建设技术 数据工作者 数据中心 应用开发技术 数据工作者 数据中心 数据分析与处理应用 科研人员 数据中心、网格节点 图表 31.数据应用环境主要服务 (1)存储服务 科学数据中心于 2010 年 6 月正式开展海量存储环境服务,主 要包括以下方面:数据备份服务,对重要数据资源作为可信的第 三方提供异地存储和容灾备份空间;长期保存服务,提供海量数 据的长期存储、维护和保管,推进科研数据的长期归档和集成共 享;在线存储服务,提供大规模可扩展的在线存储空间;应用托 管服务,针对数据库、业务系统等各类科研应用提供按需配置的 主机环境、存储环境,实现应用托管和服务镜像,并支持数据密 集型应用。 74 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 单位:TB 1000 900 800 780.0 700 751.0 600 515.3 500 400 300 278.3 200 100 154.1 130.0 134.2 0 6月 7月 8月 9月 10月 11月 12月 图表 32.2010 年 6-12 月数据资源中心存储服务数据总量(TB) (2)数据服务 通过科学数据库门户推动科学数据共享和提供集成服务,由 建库单位的数据网站以及部署在科学数据中心的服务镜像保障 服务稳定运行,同时还开展必要的离线数据支持服务。截至 2010 年底, “十一五”期间科学数据库访问量累计达 2606 万人次,数 据下载量累计达 243TB。 75 第四章 信息化基础设施 单位:万人次 800 700 673 678 2009年 2010年 549 600 500 400 328 378 300 200 100 0 2006年 2007年 2008年 图表 33.中国科学院科学数据库网络年度访问人次增长趋势图 (3)技术服务 科学数据中心根据数据库建设和数据应用环境管理等需求, 研发了系列软件系统,包括数据管理与共享发布系统(VisualDB 2.0 版) 、数据服务监控与统计系统(MSIS 1.0 版)、数据库资源 量在线统计系统(DataStat 1.0 版) 、资源与服务注册系统(RSR 1.0 版)、在线存储自助平台(OnlineStore)及客户端工具等。 76 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 专栏 13:VisualDB 软件推广应用取得重要进展 针对中科院科学数据库建设需求,数据中心从 2002 年开始原 型设计,致力于网络数据库的技术解决方案,减轻一般科研人员 的技术负担和降低建库应用技术门槛。2008 年提出了 VisualDB 1.0 版本,2010 年发布了 VisualDB 2.0 版本,具备了更加成熟的 软件框架、更加适用的配置功能,使得数据管理和发布更加简洁、 易用,直接支持了科学数据库建设。 VisualDB 软件为科研人员和数据管理人员提供了基于网络的 数据库管理工具,直接支持数据在线共享;为 IT 技术人员提供开 放的软件框架和数据接口,便于基于数据库的二次应用开发;封 装了元数据、数据访问接口,为分布式、异构数据集成提供快速 解决方案。 VisualDB 获得 2 项软件著作权,各个版本已在院内外得到较 好的推广应用,目前用户数达到 44 家,其中包括科学数据库项 目 35 家。 图表 34.数据管理和共享平台 VisualDB 部署案例类别分布 77 第四章 信息化基础设施 (4)应用服务 利用数据应用环境整体优势,集成数据资源、存储资源、计 算模型和工作流等,科学数据中心研发建立数据密集型分析处理 平台,提供网上分析应用服务,支撑数据驱动的科研工作。通过 联合学科领域用户的实际需求,科学数据中心与植物所等单位合 作,研发了达尔文树数据分析平台,与大气所合作开发了大气科 学数据分析平台,与数学院等单位合作建立了全球经济监测与政 策模拟仿真数据平台等。这些数据应用分析平台在相关单位均得 到部署应用,开始向科研同行合作推广。 4.3.2 特点及成效 数据资源是信息化环境下创新科研模式的核心,现代科学活 动日益依赖先进的数据基础设施,以期实现对科学数据全生命周 期的支撑、管理和运用。全院数据应用环境建设的顺利实施,推 动了服务科研、支撑创新的数据基础设施的理念、应用和发展, 将发挥深远的信息基础支撑作用。 1.基础设施建设力度加大,数据应用环境支撑重大科技创新 活动的效益日益明显 “十五”之前,中科院重点整理积累科学数据资源和建设数 据库, “十五”期间建成 70TB 存储环境,仅为科学数据库保障服 务。随着信息化的深入发展,数据应用环境纳入中科院“十一五” 78 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 信息化三大基础环境之一,并由此加大海量存储环境的基本建设, 以及加大数据资源的整合建设。比照美国 SDSC、NCSA 分别拥 有 27PB 和 10PB 的存储能力,并归档管理 PB 规模数据提供存储 服务和数据服务,2010 年底科学数据中心建成了 6.42PB 存储容 量,与“十五”相比能力建设有了质的提升。目前,数据应用环 境具备向全院提供综合性支撑服务的能力,包括数据存储、容灾 备份、数据共享、分析处理等服务,特别是为重大科学工程、大 科学装置、重要信息系统等产生的海量数据保存和灾备服务奠定 了基础。 2.软环境研发部署不断加强,数据应用环境的集成服务能力 持续提升 为加大集成存储、数据和处理等资源,形成数据应用环境的 整体服务效果,中科院“十一五”数据应用环境制定发布了 27 项标准规范,涉及数据库建设、数据接口、数据质量、数据访问、 存储环境等方面,研发部署了系列的建库管理、监控统计和数据 网格中间件等,积极推动了数据资源的集成管理和共享服务软环 境建设。数据应用环境门户集成了分布式数据库资源,提供统一 的检索入口。科学数据网格环境为数据资源整合建设和统一共享 服务提供了技术平台,通过软件工具动态监控、统计数据库资源 量、数据服务基本情况,实现学科领域数据资源的透明访问和跨 库集成应用。 79 第四章 信息化基础设施 3.加快响应科研需求,数据应用环境的整体应用服务成效日 益突出 数据应用环境通过数据服务专员在线咨询,研发部署在线存 储、在线备份、在线数据等服务,对来自各界的存储和数据需求 可以作出快速反应,并保障 7×24 小时服务。科学数据资源将在 科研活动中发挥基础作用和永恒价值。科学数据库在项目建设过 程中,为基础数据的资源积累和共享服务,为重大科学工程、重 要科学和技术应用、为社会发展和宏观决策,以及科研信息化发 展均提供重要支撑服务。2009 年 10 月,科学数据库作为信息化 建设的重要成果参加了中科院建院 60 周年展。 目前,提供数据服务的各类重大科研项目 138 项,典型应用 案例 101 项。据不完全统计, “十一五”期间共培养了约 54 名硕 士和 23 名博士,发表论文 187 篇,两年一届的科学数据库与信 息技术研讨会于 2010 年成功举办了第十届全国大会,出版了十 辑学术论文集,为国家科技发展作出了应有的贡献。 80 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 专栏 14:聚变数据库的发展与应用 以国家大科学工程项目—全超导托克马克实验装置 EAST 和 国际热核聚变实验反应堆 ITER 为依托,中国科学院等离子体物 理研究所承建了世界上第一个面向聚变研究的综合性专业数据 库 FusionDB(Fusion Database) ,FusionDB 包含聚变核数据、聚 变材料数据、聚变部件数据、等离子体物理数据和相关自主研发 的数据分析软件,如 MCAM、SNAM、SVIP 等。FusionDB 的数 据和软件在 EAST 和 ITER 等重要聚变研究活动中均发挥了作用。 截至到目前,相关数据和软件已经在中国、美国、欧盟、日本、 韩国、 、印度等国的 100 多家单位获得应用,并获得广泛好评。 数据处理软件 MCAM 通过了 ITER 的 QA 认证,被列为 ITER 国 际组织中子学分析的“标准软件”,并在等离子体物理研究所承 担的多项 ITER 国际合作合同中发挥了重要作用。 在中科院“信息化专项”的支持下,FusionDB 得到了全面的 整合和升级。目前,FusionDB 已经成为中科院核能相关重大专项 “高辐照场下的材料研究”、ITER 国内 973 专项“液态增殖剂实 验包层设计和技术可行性研究” 等重大课题的重要研究基础, 在我国重要聚变技术研究活动中发挥着重要作用。 4.坚持科学数据基础地位,国际数据共享合作交流渠道得到 积极拓展 中科院数据应用环境为开展国际学术交流提供了广阔空间, 科学数据中心与美国 NCSA、USGS、NCAR 等机构建立工作关 系。并在推动中美科学数据合作、参与 CODATA 交流等方面,数 81 第四章 信息化基础设施 据基础设施发挥了重要作用。在中科院全力支持下,2010 年 10 月郭华东研究员成功当选 CODATA 主席。随着国际上科研数据基 础设施(global research data infrastructure)愿景的日益发展,数 据基础设施及应用环境对科研合作的支撑服务必将更加突出。 4.4 互联网基础资源 2 IP 地址、域名等互联网地址资源是互联网的重要基础设施, 是支撑互联网发展的战略性资源,其建设与发展引领了互联网的 发展。 中国互联网络信息中心(China Internet Network Information Center,简称 CNNIC)是经国家主管部门批准,于 1997 年 6 月 3 日组建的管理和服务机构,行使国家互联网络信息中心的职责。 作为中国信息社会重要的基础设施建设者、运行者和管理者, CNNIC 负责管理维护中国互联网地址系统,引领中国互联网地址 行业发展,权威发布中国互联网统计信息,代表中国参与国际互 联网社群。 4.4.1 IP地址 截至 2010 年 11 月 25 日,我国大陆地区的 IPv4 地址数量达 到 2.7 亿,稳居全球 IPv4 地址数量的第二位,仅次于美国。截至 2010 年 11 月 25 日, 全球主要国家或地区的 IPv4 地址数见下表。 2 除特殊说明外,本节数据均出自《第 26 次中国互联网络发展状况统计报告》,截至 2010 年 6 月。 82 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 1 美国 1,514,812,416 11 意大利 36,058,368 2 中国大陆 271,179,520 12 俄罗斯 34,156,040 3 日本 186,411,264 13 中国台湾 30,516,736 4 南韩 102,140,928 14 墨西哥 27,793,664 5 德国 90,752,504 15 印度 27,612,160 6 加拿大 79,438,080 16 西班牙 24,147,616 7 法国 79,010,400 17 荷兰 23,982,056 8 英国 76,858,712 18 瑞典 20,687,336 9 澳大利亚 44,585,728 19 南非 17,419,264 10 巴西 40,240,640 20 波兰 16,111,208 图表 35.全球主要国家或地区 IPv4 地址数 IPv4 地址数量依然呈现增长态势,但其增速正逐步回落。截 至 2010 年 6 月,中国 IPv4 地址资源半年增长率为 7.7%,自 2006 年以来,首次滑落至 10%以下。 83 第四章 信息化基础设施 30000 40% 23245 25000 25045 30% 20503 18127 20000 15000 10000 15814 20.6% 13527 15.6% 11825 16.9% 14.6% 9802 14.4% 20% 13.1% 13.4% 7.7% 10% 5000 0 0% 2006.12 2007.6 2007.12 2008.6 2008.12 2009.6 2009.12 2010.6 IPv4地址数 半年增长率 图表 36.2006.12-2010.06 中国 IPv4 地址资源变化情况 我国IPv6 地址达到 395 块/32 3,较去年年底增长 332 块/32, 在全球排名第 13 位。预计全球IPv4 地址最快将在 2011 年 8 月耗 尽,向IPv6 地址过渡是大势所趋,中国进行大规模IPv6 网络部署 势在必行。 4.4.2 CN域名 我国域名总数下降为 1121 万,其中.CN 域名 725 万。.CN 在 域名总数中的占比从 80%降至 64.7%。与此同时,.COM 域名增加 53.5 万,比重从 16.6%提升至 29.6%。 3 IPv6 地址中的/32 是 IPv6 的地址表示方法,对应的地址数量是 2(128-32)=296 个。 84 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 类别 数量(个) 占域名总数比例 CN 7,246,686 64.7% COM 3,318,655 29.6% NET 477,117 4.3% ORG 147,220 1.3% 其他 15,907 0.1% 合计 11,205,585 100% 图表 37.中国分类域名数 目前 CN 域名中,.CN 结尾的二级域名比例仍然最高,占到 CN 域名总数的 63.2%,其次是.COM.CN 域名,为 29%。 类别 数量(个) 占 CN 域名总数比例 cn 4,581,082 63.2% com.cn 2,103,626 29.0% net.cn 283,228 3.9% adm.cn 108,222 1.5% org.cn 107,486 1.5% gov.cn 51,997 0.7% ac.cn 7,347 0.1% edu.cn 3,685 0.1% mil.cn 13 0.0% 合计 7,246,686 100% 图表 38.中国分类 CN 域名数 85 第四章 信息化基础设施 4.4.3 互联网基础资源服务 4 2009 年,CNNIC 完成了国家域名全球服务平台规划:继续部 署境外节点,完成北美节点和香港节点的布置,在新建节点上支 持 IPv6;对国内顶级节点进行全面容量升级。CNNIC 开发完成了 具有自主知识产权的域名服务软件,提高系统安全性能,顺利启 动信息安全管理体系(ISMS)建设工作,建立了全面安全的保障机 制。 2010 年,我国域名的注册、WHOIS、解析服务承诺(Service Level Agreement, SLA)平均水平超过服务标准,解析生效速度达 到国际领先水平。 CNNIC 全面清查已有域名注册管理机构的 CN 域名,对新注 册域名实行书面审核流程,加强实名制注册管理,同时加强源头 治理,建立长效管理机制,在域名注册及应用、管理及服务各环 节落实实名制。为准入、物理接入、身份核对等要素的源头治理 和管理提供域名信息查询接口;建立黑名单共享机制;建立白名 单、灰名单机制。CNNIC 全年共处理电话咨询 51,684 个,咨询邮 件 5,387 封,客户满意度平均值达到 91.63%。12 月,CNNIC 国家 域名投诉处理中心正式投入运营,在已有投诉方式(电话、传真、 邮件)基础上,正式开通在线举报。 4 本节内容引自:中国科学院计算机网络信息中心 2009 年度报告。 86 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 五 信息化应用 5.1 科研管理的信息化 科研管理的信息化一直是我院信息化建设的重要内容。“十 五”之后,在知识创新工程的带动下,中科院提出了建设“数字 化科学院”的信息化发展目标,并于 2001 年制定了“十五”信 息化发展规划。其中,明确提出了借鉴企业 ERP 理念和方法,采 用先进信息技术,建设中科院科研管理活动信息化平台的思路, 决定实施中国科学院资源规划(ARP)项目。ARP 项目是为中国 科学院实现科学资源规划的信息系统工程,从中国科学院院所两 级治理结构出发,以科技计划与执行管理为核心,综合运用创新 的管理理念和先进的信息技术,对全院人力、资金、科研基础条 件等资源配置及相关管理流程进行整合与优化,构建有效的管理 服务信息技术平台。 5.1.1 发展现状 “十一五”期间,我院以实施 ARP 工程为重点,全面推进管 理信息化建设的各项工作,通过 ARP 系统的持续优化完善和进一 步推进应用,不仅为科研管理的日常业务处理提供了信息化平台, 而且为应对院和国家的重大管理需求提供了便捷的手段。目前我 院初步完成了组织管理体系、标准规范体系、安全保障体系和运 87 第五章 信息化应用 维支持体系的建设工作;完成了院所两级系统运行支撑平台的升 级改造,建成了包含科研项目管理、综合财务管理、人力资源管 理、科研条件管理、国际合作管理、院地合作管理、知识产权管 理、评估评价管理、基本建设管理、教育资源管理等在内的 ARP 十大应用系统以及公共事务处理和信息资源管理与服务两大平 台。ARP 系统已经在提高管理工作效率、促进管理方式变革等方 面发挥了重要作用。 ARP 上线单位已达到 128 个, 核心用户约 3000 多人,其中员工自助、网上报销、日常事务等系统涉及的用户面 更广,服务总人数超过 3 万人。 1、优化整合应用系统平台,完善系统应用环境 ARP 项目二期工程已逐步形成了 10 个系统+2 个应用平台+4 个重点应用项目(公文流转、网上报销、预算控制、决策支持) 的 ARP 新应用环境,满足了多层次、多维度的应用需求。 图表 39.ARP 二期应用系统结构布局示意图 88 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 ARP 项目二期工程建设过程中,对系统应用领域进一步扩展, 新增了国际合作、知识产权、院地合作系统,其中知识产权、国 际合作系统已正式运行。 国际合作管理系统涵盖了计划的申报、评审、批复、评估、 考核验收等功能。包括院重点国际合作计划和院级协议合作计划 管理、在华国际会议和海峡两岸会议管理、国际合作获奖管理、 院外国际合作项目、所级国际合作项目管理等。在短短几个月的 时间里,该系统支持完成了近 300 项国际合作项目的申报,30 多 个单位已开始利用系统处理出国批件。 知识产权管理系统以专利论文成果奖励等信息管理为核心, 面向知识产权转移转化,帮助用户掌握第一手知识产权信息和对 专利等知识产权信息进行统计、分析、研究,目前系统中收录各 类知识产权信息 30 余万条。 院地合作管理系统在适应院、分院、所三级院地合作工作管 理的同时,也适应共建机构、院直投企业院地合作业务管理,实 现了数据的实时查询、统计、综合分析。 评估评价管理系统实现了基础数据管理、专家评估管理、评 估体系管理、自评自测管理、自评交流管理的业务处理功能,保 证每年一度的评估评价工作顺利完成。 专栏 15:评估评价系统首次应用,取得良好应用效果 按照院的管理要求,每五年对研究所进行一次综合评估。2005 年启动创新三期时,进行了第一次研究所综合评估,2010 年进行 第二次研究所综合评估。由于 2010 年是创新三期和“十一五” 89 第五章 信息化应用 的最后一年,院要求评估重点放在自我总结,发现经验,诊断问 题。本次评估工作涉及中科院 100 家单位,按学科领域和单位类 型分 6 个片组,并首次利用 ARP 评估评价系统完成。系统在设计 上注重了灵活性、高可用性和并发性,6 月下旬完成了 100 家单 位自评报告以及自评表的上传、分片组交流工作;数据的交换完 全通过 ARP 数据交换中心实现,仅自评报告和自评表的交换量就 在 500M 左右;7 月中旬完成了院内 200 多位专家网上在线评议 及评议结果汇总、导出工作,保证了本年评估评价系统中自评交 流及专家评议工作的及时完成。 评估评价系统,利用信息化手段大大提高了自评交流及评议 工作的效率,降低了工作成本,保证了数据获取的及时性和有效 性,为最终的管理决策提供了有力支持。该项工作得到了主管业 务部门相关领导及用户的好评。 2.“信息资源管理与服务平台”全院部署 ARP 项目二期工程对一期信息资源服务平台进行了改造,组 织建设了集数据汇聚、传输、处理、存储、挖掘利用及展示功能 为一体的高效的 ARP 信息资源管理与服务平台。该平台针对全局 (院所两级平台)信息资源,构建了科研管理资源目录,建立了 共享发布平台,提供了统一的应用服务方式,实现资源信息各级 平台内共享,可以支持满足不同需求的个性看板配置,并提供动 态、多维信息分析服务功能以及统一的报表管理功能和强大的信 息搜索功能。目前,这一平台已经在全院部署,将为各级领导提 90 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 供决策支持服务,为广大用户提供更加方便的信息查询服务。从 信息资源中心建成以来,中国科学院各主管局就开始利用 ARP 信 息资源中心抽取的数据进行分析,辅助决策,利用率呈逐年上升 的趋势。 图表 40.科研管理核心业务数据分析年度增长情况 专栏 16:深入挖掘信息资源,辅助基地管理决策 根据 2009 版“先进制造与新材料基地主要研究所综合状态 监测系统”测试报告的内容,应用信息资源中心中已有的数据, 通过对数据的整合、筛选,系统从人员情况分析、人均经费状态、 资产状况、能源消耗及二氧化碳排放等方面,对已经进入材料基 地的 35 个研究所进行了整体的分析,使主管业务部门的领导能 够了解各单位 5 年以来的发展情况和实时的动态。 根据生物局基地处的要求和提供的进入基地的研究单元列 表,数据中心首次按照最小研究单位的方式对进入先进工业生物 91 第五章 信息化应用 技术创新基地的项目分成 3 个层次进行了分析。 由于一个项目可能由多个单位的多个课题组承担,此次分析 使课题组长、项目负责人、研究所、主管业务局都能通过平台及 时了解项目的进展及产生的带动、示范作用,为主管局下一步进 行项目布局提供详尽的数据支持。系统通过报表和 BI 的分析,既 有详实的明细数据,又提供了大量的发展趋势和深入分析、数据 挖掘等。 3.系统运行环境得到全面优化和完善 ARP 系统结构优化、设备升级改造工作全部到位。在系统架 构的优化过程中,建立了统一 PORTAL,实现了用户权限的统一管 理;通过选用优秀的中间件产品,进一步提高了系统的稳定性。 在设备升级改造工作中, 系统顺利完成了对全院 124 家单位, 共计 951 件/台/套硬件设备的采购、部署与系统迁移工作;完成 了院级核心系统硬件的平台优化,并完善了院级系统备份措施; 建立了地区数据备份分中心。目前一大批研究所的运行环境已经 达到电信级水平。 4.积极探索 ARP 系统可持续发展模式,为规划第三代 ARP 奠定 基础 在 ARP 项目二期建设过程中,我院积极探索自主知识产权管 理信息系统开发模式,为规划第三代 ARP 系统奠定基础。通过二 92 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 期工程我院组织开发了一系列敏捷开发工具(包括:敏捷表单、 敏捷查询、敏捷工作流等),并通过这些工作形成了自主知识产 权管理系统的系统架构,完成了人力资源、综合财务、固定资产、 项目管理等原型系统的开发。 图表 41.敏捷开发平台 另一方面,对 ARP 集中式管理模式进行了深入研究和全面分 析,形成了一部 6 万余字的集中式模式及可行性研究报告。 5.1.2 特点及成效 1.统一科研管理信息平台,有效优化科研管理环境 通过 ARP 项目的建设,统一了全院各单位的科研管理业务处 理平台。全院各单位彻底清理了科研项目、科研经费、固定资产、 知识产权等资源;系统建设及应用过程中对 179 个管理流程进行 93 第五章 信息化应用 了梳理,使得科研管理工作岗位职责更加清晰化、管理工作更加 精细化。 ARP 系统在建设过程中全面梳理了管理流程,规范了科研管 理活动,初步建立了以科研项目为核心的人、财、物信息的关联 和共享环境,基本实现了对项目相关资源投入情况的监督和控制。 搭建了覆盖院、所科研条件业务的管理平台,规范了全院科研条 件的管理工作,实现了科研装备管理的基本需要。同时,系统还 规范和优化了资产管理业务流程,实现了资产和财务的有效对账 以及过程管理。 图表 42.ARP 系统架构 2.全面推进二期新应用平台,科研管理环境实现绿色低碳化 ARP 二期新应用平台创建的科研管理办公平台运用信息化手 段提高管理服务效率,节约办公成本。在中科院院属单位内部, 94 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 除少量存档的公文还需要用到 A4 纸打印外,包括业务材料、日 常申请审批事务、项目评审、工资条打印等传统科研管理模式下 需要用到纸的地方,都已电子化传递与处理。公共事务处理平台 为日常科研管理提供了无纸化办公环境,在院属 128 家单位中, 以每个单位年均使用 200 包 A4 纸估算,每年便可节约用纸 2.5 万 包。 图表 43.ARP 系统应用效果 95 第五章 信息化应用 专栏 17:公共事务处理平台的应用显著提效降耗 新版公文和事务处理系统增加了电子印章、收发文反馈、公 文统计、催办代办、通讯录管理、日程管理、活动管理、会议室 管理、网络硬盘、通知管理、建议管理、消息提醒、投票管理、 论坛、后勤服务及信息发布管理等功能。院机关自 2009 年 1 月 1 日开始应用截至 9 月份,共处理收文 13,471 件、发文 3,463 件、 内部签批件 2,563 件;自 2009 年 12 月 1 日开始全院新版公文系 统已全部正式切换,全院各研究所(除机关外)共处理收文 42,001 件,发文 14,785 件。 图表 44.电子文件比例及地区公文交换比例图 3.变“被动”为“主动”,推进研究所管理信息化建设 ARP 系统上线之初多数研究所还处于被动接受的状态,而随 着应用的深入,系统应用效益日益显现。研究所对科研管理信息 化建设的重视程度明显加强,逐渐由“被动”转变为“主动”。 ARP 系统给研究所的科研管理提供了良好的工作平台,带动研究 所的管理信息化建设。 96 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 专栏 18:ARP 系统在支撑和促进金属所管理工作中发挥越来越重要的 作用 中国科学院金属研究所 2006 年 6 月所级 ARP 系统提前通过 了院里组织的验收并正式投入运行。自 ARP 系统正式运行以来, 该所 ARP 系统累计用户数已达 3,560 人,目前有效用户数为 2,697 人。随着 ARP 系统的不断建设和完善,ARP 系统不仅支撑了研究 所日常管理活动,而且在提升工作效率、促进管理创新方面发挥 越来越重要的作用。 ARP 系统是研究所日常管理紧密依托的工作平台。目前,全 所每年近 200 个新立项的各类科研课题的项目管理以及与人事、 财务、资产等相关的管理,每年近百个科研课题的结题、验收管 理;全所总计 6 亿多元固定资产信息的维护和管理;全所会计核 算和财务管理、每月平均 4,000 余笔财务报销业务的办理、各类 科研项目经费核算、各种财务分析报告的数据采集、年度预算和 决算的信息支撑;每天院所各级公文的流转,以上这些研究所日 常管理工作全都依托于 ARP 系统,可以说金属所的日常管理工作 现在一时一刻也离不开 ARP 系统。 ARP 系统在提供信息支持、提高工作效率方面发挥越来越重 要的作用。金属所人事部门通过利用 ARP 系统,为完成《金属研 究所人才工作规划》 、 《金属研究所非事业编长期聘用人员和临时 聘用人员相关情况调研报告》、 《金属研究所技术支撑队伍调研报 告》等提供了充分翔实的数据支撑。 97 第五章 信息化应用 4、信息资源质 质量稳步提高 高,促进管理 理决策层和管理创新 AR RP 信息资源中 中心的建成,标志着院所 所两级 ARP 基础数据平 基 台已经 经形成,通过数 数据传输通道 道,实现了科 科研管理主要 要基础信息 的定期 期采集、处理和 和展示。通过 过 5 年的建设 设,数据从最初 初的 1,800 万条、15G 1 左右的存 存储,已经增长 长到 1.8 亿条 条数据、110G G 的存储。 随着 AR RP 系统二期十 十大应用平台 台系统上线运 运行,预计到“十二五” “ 的末期 期,数据量可以达到 20 亿条左右,存 亿 存储 1.5‐2TB 的空间。 的 图表 表 45.核心业务 务数据按年增 增长情况 98 中国科学院信息 息化发展报告 20011 中国科学院信息化发展报告2011 图表 46.核心业务数 数据按年递增 增比例情况 目前,已有 84 4.2%的研究所 所利用系统信 信息资源,进 进行分析辅 理决策。分析的 的手段多种多 多样,有些利用 用 ARP 所级查 查询平台, 助管理 有些利 利用 DISCOVER RER,还有些单 单位自行开发 发了数据查询 询分析平台。 5.2 科 科研活动的 的信息化 5.2.1 发展现状 发 科 科研活动信息化 化的基础设施 施和核心技术 术为科研提供 供了信息 化的平 平台和环境,而 而不同的科学 学研究领域及 及具体的科学 学研究活动, 必须开 开展针对相应需求的应用, ,才能够使科 科研活动信息 息化真正成 为现实 实。科研活动信 信息化在突破 破传统科研模 模式和研究方 方法的障碍, 提升科 科技创新能力,解决重大科 科学问题方面 面,越来越发 发挥着不可 99 第五章 信息化应用 替代的重要作用。 “十一五”期间,我院坚持以应用需求为出发点,在天文 e‐VLBI 观测、宇宙起源、气候模拟、野外考察等多方面,开展了 一系列的 e‐Science 应用的探索,并集中在基础、资环、生物、高 技术四大领域部署实施了 14 个“科研信息化示范应用项目”。经 过“十一五”的初步实践,已经有一批项目在探索科研活动信息 化体系结构、标准规范和关键技术等方面体现出示范效应,总结 出科研活动信息化的内在规律,形成了应用服务模式,为全面实 施科研活动信息化提供了经验。信息化对传统科研行为方式的变 革、对科技创新跨越式发展的助推作用开始显现。 为了从技术上保证各个示范应用项目的顺利实施,同时探索 和解决 e‐Science 示范应用项目在应用支撑环境和机制上的共性 问题,我院专门启动了 e‐Science 虚拟科研平台软件 Duckling 的研 发。通过 e‐Science 示范应用项目及 e‐Science 虚拟科研平台软件 的实施,我院科研活动的信息化水平取得了长足的进展,但是整 体上仍处于探索和示范阶段。 目前,e‐Science 虚拟科研平台软件 Duckling 可以为科研团队 提供一个支持数据集成与共享、研究问题相关的特色文献服务、 模拟计算和数据分析、信息发布和即时交流的综合性协同工作环 境。Duckling 不仅已服务于 14 个 e‐Science 示范应用项目,同时 服务于中国科学院多个重大项目和国家 863 项目中。2010 年 3 月 17 日,e‐Science 虚拟科研平台软件 Duckling 正式宣布开源,并在 全球最大的开源网站 Sourceforge 上发布了源代码和部署包,实现 100 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 开源后的 Duckling 进入一个新的发展阶段,将继续为科研工作者 提供更多、更好的功能,并积极鼓励基于 Duckling 进行各类应用 的开发。 e‐Science 虚拟科研平台软件 Duckling 由用户管理工具、文档 协同工具、文档库管理工具和日志服务工具等四个核心部分和会 议服务平台、活动组织工具、统一通信工具和文献管理工具等应 用插件组成,特点是专为科研团队提供的综合性资源共享和协作 平台,目标是集成数字化的硬件、软件、数据、信息等各类资源, 组织跨地域、跨单位的科研人员,构成一个高效易用的网络化环 境,支持和促进信息化时代的新型科研活动方式。Duckling 通过 Duckling 应用集成框架 (Duckling Application Integration Framework, 简称 DAIF)支持用户根据自己的具体需求开发特定的应用插件, DAIF 兼容 WEB2.0 中的标准的 PORTLET 规范。 图表 47. e-Science 虚拟科研平台软件 DUCKING 体系结构 101 第五章 信息化应用 e‐Science 虚拟科研平台已成功地应用于生物能源、加速器质 谱仪和大气监测等 63 个重大应用,为 42 个研究单位或项目组服 务。 5.2.2 部分领域应用示范 1.面向青海湖区域重要野生鸟类集成研究的 e-Science 应用 青海湖区域是众多候鸟的繁殖地或越冬地,而且还是多种候 鸟迁徙路线的中转站。清楚、迅速而准确地掌握青海湖区域重要 野生鸟类的迁徙路线及其迁徙过程中的信息对禽流感疾病的传 播和防治等涉及公共安全的重大事件有重要意义。针对多学科集 成和跨学科协作,科研人员搭建了面向青海湖区域重要野生鸟类 集成研究的网络化科学研究平台,由科研应用平台、科研协同平 台和基础数据平台三个子平台构成。 102 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 48.面向青海湖区域重要野生鸟类集成研究网络化科学研究平台 科研应用平台。科研应用平台基于基础数据平台和科研协同 平台,针对青海湖区域重要野生鸟类的空间分布格局研究、迁徙 路线研究等科学问题,基于信息化基础设施,构建信息化的科学 研究模型和应用系统。 科研协同平台。科研协同平台在整个网络化的科研环境中承 担着承上启下的作用。对开展科学研究的各种资源,如科学数据 资源、网络化的仪器设备资源、计算资源等,科研协同平台承担 着资源集成的工作;对于科研应用和科研人员,科研协同平台承 担着资源调度、应用组织、用户接口的工作。 基础数据平台。基础数据平台建设集数据获取、存储、管理 103 第五章 信息化应用 于一体的基础数据服务系统,支持青海湖相关数据的数字获取, 提供相关数据资源的长期保存、整理、管理和与共享,并提供稳 定的数据服务。 面向青海湖区域的 e‐Science 应用是国内首个应用于国家级 自然保护区的 e‐Science 应用,也是国内首个在高原地区支持生态 保护和研究的 e‐Science 应用。通过构筑信息化的科研环境,支持 开展系统性、集成性、综合性的科学研究,促进科研人员进行跨 学科、跨地域、跨组织的交流和协作,达到了提高科研效率和拓 展科研能力的目标。 2.世界水平的数据密集型网格计算平台 高能物理、天体物理、生物医学、地质地理等现代科学研究 往往涉及大规模的实验规模和复杂的海量数据分析处理。目前尚 没有一个机构的计算能力能够快速处理、研究、应用所有这些数 据,必须依靠有效的信息化手段整合世界各地的科研机构计算资 源协同进行。在大规模科学实验的国际合作中,高性能的网格平 台成为了必要条件。数据密集型网格平台建立在网格技术基础上, 是对海量数据进行高效分析处理的有效工具,在物理、化学、生 物科学、医学、系统科学、经济学、气象、地震、核能技术、石 油探勘、航天工程等众多领域具有广泛的应用前景,并正得到快 速推广。 中国科学院高能物理研究所(以下简称“高能所”)紧跟国 际学科发展潮流,建立了由 1,600 个 CPU 内核、640TB 存储组成 104 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 的数据密集型网格站点,通过与欧洲、北美之间的高速网络,以 及加入世界上最大的网格系统 WLCG,分别部署了高能物理、天 体物理、生物医学、地质地理等领域的应用,是全球 200 多个网 格站点中运行水平最好的站点之一。目前,高能所网格站点每天 传输高达 8 TB 的国际科学数据、处理数千个计算作业。仅 2010 年一年,该站点完成了 700 多万 CPU 小时、200 多万个计算作业。 这些计算服务为物理模拟及数据分析、生物研究和地学研究做出 了重要贡献,得到国内外同行的好评。 高能所数据密集型网格站点与国际高能物理网格系统相融 合,形成一个由高能物理基础设施、网络、超级计算、数据、视 频通信等众多技术协同工作的科研环境,使国内科学家能够充分 利用国际上数万个 CPU 的计算资源以及数十 PB 的海量数据为中 国的科研服务。该站点取得了许多重要成果,是中国科学院典型 的 e‐Science 应用案例。 105 第五章 信息化应用 图表 49.新蛋白质预测 3.国际领先的煤转化技术研发应用 山西煤化所围绕国家能源重大战略需求中的煤炭利用效率 与生态环境保护课题,依托院“十一五”信息化建设 E‐SCIENCE 示 范项目,为煤基液体燃料与化学品合成及其相关新材料制备等过 程中的关键科学和工程技术提供了先进的技术平台和创新手段, 形成了煤制油全流程工业模拟软件,成功开发了拥有自主知识产 权的浆态床煤制油技术,掌握了低温浆态床(220‐250℃)和高温 浆态床(260‐290℃)合成油的关键核心工业技术,为我国煤炭高 效洁净利用提供了核心技术和解决方案。目前取得的成果包括: (1)理论计算与工程模拟相结合,系统用于煤转化过程催化材 料和催化反应的研究。针对铁基催化剂物相结构的高度复杂性, 106 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 采用密度泛函等多种理论计算方法,揭示了催化剂在活化与反应 过程中可能存在的各种物相,确定了最可能的铁基催化剂的活性 相及晶面结构取向。指导研制了具有活性相结构取向的高活性、 高柴油收率、高抗磨损性、可长期稳定运行的浆态床合成油工业 催化剂,为详细机理动力学的建立奠定了理论基础,对费托催化 剂的活性相、表面反应机理与详细机理动力学有了深入系统的认 识,催化剂的设计和制备取得了突破性进展,解决了高温下浆态 床费托合成催化剂选择性控制和积炭失活等关键科学问题。 (2)研究成果成功应用于煤转化产业。2009 年,内蒙古伊泰集 团、山西潞安集团和中国神华集团建成了三个 16 万吨/年合成油 示范厂。示范厂的成功运行标志着我国已完全自主掌握了先进高 效的费托合成催化剂生产技术和大型浆态床反应器工业技术。 图表 50.内蒙鄂尔多斯 16 万吨高温费托合成技术工业示范 (3)技术指标达到国际领先水平。与国际同类技术相比,系统 能量利用效率提高了 5 个百分点,水耗降到 3 吨水/吨油左右,催 化剂产油能力提高了 3‐4 倍,低温浆态床催化剂产能达到 300 吨 油/吨催化剂以上,高温浆态床催化剂产能达到 1000 吨/吨催化剂 以上,过滤蜡杂质含量小于 5PPM,生产的洁净柴油十六烷值大 107 第五章 信息化应用 于 74。上述指标均达到国际领先水平。 4.基于 e-Science 的黑河流域生态—水文综合集成研究 黑河流域综合交叉集成的关键信息支撑环境包含监测、数据、 建模、模拟、高性能计算、可视化与决策支持的 3M 平台(监测 平台(Monitorling) 、模型平台(Modeling) 、操作平台 (Manlipulation) ,在黑河交叉集成研究、流域重大计划的启动和 黑河流域生态—水文研究中,发挥着关键的基础支撑作用。跨学 科综合研究的支撑,促成了流域研究和共享服务的 e‐Science 建立, 起到了具有辐射效果的示范作用。目前,该科研协同工作环境已 经在以下几个方面取得了初步成效: (1)完成了流域的观测系统组网,解决了仪器运行状态监 控问题,实现了数据的自动传输。基于无线传输技术,将传感器 观测到的数据通过数采仪、数据传输设备、高增益天线传送到与 观测点相近的野外台站,再通过野外台站所接入的互联网传送到 所级数据服务器中管理。 (2)完成数据的自动触发入库,实现了数据的有效分类管 理,建立数据格式转换的方法和工具。定点观测数据和无线传感 器网络的观测数据,根据需要实时、数小时或数日自动地传输到 基站服务器,基站服务器再将数据传送到所级数据服务器中,实 现数据触发式自动入库。 (3)整合了已有多个数据库系统,形成统一的数据资源环 108 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 境,提供在线的数据分析工具。在黑河流域 e‐Science 生态—水文 数据综合数据平台的设计中,整合了现有的有关黑河的数据资源 库,如黑河流域的遥感影像、特征矢量、常规野外观测数据以及 诸多调查数据,并用多种方法完善了黑河各参量面上数据的欠缺 以及时间序列上的不完整。 (4)建立了模型资源库,解决了模型的在线编译问题,形 成了基于 WEB 的在线模型计算新模式。为开展基于数据的分析模 拟,建立了生态水文模型库的框架原型,设计并建立了模型在线 计算环境,并实现研究成果的多种可视化的方案。 网上下载模 熟悉模型, 按照驱动数 根据实验区 运行模型、 型或其他渠 编译、调试 据格式制备 域状况调整 结果处理、 道获得模型 模型 驱动数据 模型参数 分析、作图 在线模型计 通过网页了 自动模型已 应用数据库 选择与实验 远程运行模 算 解并选择适 经在服务器 中数据或按 区相应的土 型,不占用本 当的模型 上编译成功 帮助文档制 壤植被类型 机资源(分析 (毋须编译 备数据(节 使模型自动 处理功能开发 调试) 省时间) 配置参数 中) 传统的模型 计算方式 模式 图表 51.传统模型计算模式与在线模型计算模式对比 5.面向科学考察的信息化科研平台 科学考察是科学研究的基本方法之一,是人类认知自然、探 索自然规律、支撑经济社会发展的基本途径和重要手段。科学考 察已经成为国家科技创新工作的重要组成部分。经过 60 多年的 109 第五章 信息化应用 发展,我国的科学考察已经开始从定性考察向定量考察转变,从 静态考察向动态考察转变,从国内考察拓展到国际考察。 中国北方及其毗邻地区综合科学考察就是在这样的背景下, 以中方科学家为主,联合俄罗斯、蒙古科学家对中国北方及毗邻 的蒙古全境、俄罗斯西伯利亚及远东地区的地理背景、自然资源、 生态环境、人类活动与社会经济等开展的联合考察和研究,是典 型的跨国家、跨组织、跨学科、跨领域的地学科研活动,涉及到 地学野外考察、室内数据处理分析、共享利用、合作科学研究等 多个环节。 目前,中国科学院地理科学与资源研究所联合国内外单位, 在中国科学院信息化专项的支持下,首先开展通用地学信息化科 研环境(e‐Science)的研究,理解和掌握地学信息化科研环境的 内涵与总体架构,在此基础上,针对科学考察三大阶段(考察前、 考察中、考察后)的具体需求,完成科学考察信息化平台的设计 与研发。 110 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 52.科学考察信息化平台 通过科学考察信息化平台的建设: 以模型为核心,实现了“数据‐模型‐计算”三位一体的地学 资源共享模式,促使了传统地学约束型模拟计算向高分辨率、精 细模拟的转变,为科学考察提供了大量的基础资料和图件的共享 支撑;促进了“考察前动员—考察中手工采样—考察后封闭汇总” 的传统科学考察模式向全面利用信息技术,开展“点、线、面” 结合的现代科学考察和国际合作新模式的转变;实现了基于网络 地理信息系统的科学考察成果的全方位展示,关联查询(考察日 志、考察数据、考察照片等)和共享,促进了我国科学考察成果 整合集成与共享利用的新模式;将信息技术全面融合到科学考察 111 第五章 信息化应用 三大阶段的活动过程中,构建了支撑服务于地学领域科学考察的 综合信息技术体系,为考察人员提供考察前-虚拟漫游、科学选 线,考察中-快速导航、高效采集,考察后-协同处理、深度利用 等功能,极大方便了科学考察人员、提高了科学考察的效率和信 息化水平。 6.面向空间天气研究的科研信息化环境 空间天气学主要研究空间灾害性天气及其对人类活动的影 响。其多学科交叉、强烈依赖探测数据与超级计算及其国际合作 特征使得传统的小范围、封闭的科研方法与手段暴露出明显的不 足,迫切需要 e‐Science 实现空间天气学领域的全球合作,以“国 家重大科技基础设施‘子午工程’及以此为基础和核心构成第一 个环绕地球一周的‘国际空间天气子午圈计划’”为契机,建设 网格技术为支撑的空间天气数字实验室以有机融合观测台站、网 络通信系统、数据和高性能计算等多种 e‐Science 要素,旨在提升 我国空间天气学研究的国际竞争力,充分发挥科研活动信息化在 促进信息、知识、人才等科技创新要素在全球范围的基础配置作 用,显著增强我国空间天气学的自主创新能力,为我国卫星、通 信、导航、电力网、载人航天等高技术系统的安全运行提供重要 保障。 空间天气数字实验室初级系统的高性能计算整合空间天气 学国家重点实验室的“空间天气数值预报模式研发与演示系统” 与“子午工程”的专用高性能计算平台,形成 15 万亿次的超级 112 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 计算资源。同时,建立起空间天气网格进一步扩展了“子午工程” 中空间天气基础网格的功能,更大程度上突出了其作为科学计算 网格的特点,利用 WEB 技术为从事空间天气学研究的科学家提供 直接在个人电脑上进入计算网格平台进行高性能计算的统一工 作界面,将三维全球磁层 MHD 数值模式通过软件优化和并行化 处理,改进和提高其计算性能;通过深层次的研究和开发,包括 计算结果的三维可视化处理,将相互关联的空间天气因果链物理 模式软件整合在一起,开发出具有实用价值的可初步应用于空间 天气预报的软件工具,同时建立空间天气模式产品的搜索引擎, 便于用户检索相关数据产品,更好地为空间天气学领域的科研工 作者服务。 图表 53.以网络技术为支撑的空间天气数字实验室系统拓扑图 113 第五章 信息化应用 该项目以子午工程的空间天气基础网格、专用高性能计算平 台和北京数据中心为基础,重点建设空间中心海南野外台站的网 络系统,实现子午工程海南观测数据与国际互联网的联通及共享; 建设具有我国空间科学特色的空间天气数字实验室初级系统,建 立空间天气网格以实现互联网络环境、超级计算环境和数据应用 环境等信息化手段对我国和世界空间科学研究活动的支撑作用。 图表 54.空间天气网格三层架构 空间天气数字实验室在空间天气(状态或事件)的监测、研 究、建模、预报、效应、信息的传输与处理、以及空间天气的开 发利用与服务等方面进行有效集成,涵盖了 e‐Science 的全部特征 和意义, “子午工程”及“国际子午圈计划”是 e‐Science 这个具 有普遍意义的先进的科学研究方式在空间天气学研究领域的具 体应用,是空间天气学领域 e‐Science 应用的典范,符合国际 e‐Science 应用的发展趋势,将为中科院乃至全国的 e‐Science 建设 作出示范性贡献,为未来中国空间科学在现代科研条件下的跨越 114 中国科学院信息 息化发展报告 20011 中国科学院信息化发展报告2011 发展积 积累经验。 图表 55.空间天气数 数字实验室系 系统流程图 7.面 面向深空探测 测和天文观测 测的 e-VLBI 信息化平台 e‐V VLBI 是在甚长 长基线干涉测 测量(VLBI)领域出现的新技术。 它将互 互联网络、高性 性能计算和 VLBI V 信息处理 理技术相结合 合,将观测 数据从 从距离遥远的观 观测站通过网 网络直接传送 送至 VLBI 数据 据处理中 心并迅 迅速进行信息处理。e‐VLB BI 是采用信息 息化手段后,传统射电 天文领 领域的一项变革 革,极大地促 促进 VLBI 这一 一高精度射电 电天文技术 在我国 国航天器精密跟 跟踪测量、天 天文地球动力 力学、天体物 物理等多个 基础学 学科和工程应用 用领域发挥重 重要作用。 e‐V VLBI 信息化应 应用平台通过 过高速互联网 网将 4 个国内 内 VLBI 观测 站(上海 海天文台佘山 山站和国家天 天文台密云站、 、乌鲁木齐南 南山站、云 南昆明 明站)以及上海 海天文台 VLBII 数据处理中 中心连接,组成一个最 大口径 径为超过 3,000 0 公里,具备 备多学科应用 用能力的综合 合孔径射电 115 第五章 信息化应用 望远镜系统。在上海 VLBI 数据处理中心建立了基于多个服务器平 台,以流水线方式并行作业,具有数据密集、计算密集特点的相 关处理机系统和深空探测器测定轨与天文应用软件。具备超过 100TB 存储容量,每分钟可传输处理至少 1GB 的数据量。 该平台是由 VLBI 观测网基础设施、通信网、高性能计算、数 据、视频通信等众多技术协同工作的多学科科研环境。经网络、 高性能计算等信息化手段改造后,原本仅限于基础科学领域的 VLBI 技术,被赋予新的实时工作能力,已成功应用于探月工程, 并将融入我国“测距测速+测角”深空测控体制。在 e‐Science 和 下一代互联网等有关科研信息化项目的支持下,正在开展快速天 文成图和地球自转参数快速测量等方面的基础科学研究。 图表 56.中国 VLBI 观测网 4 站 1 中心分布 116 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 8.工业生物技术知识环境及其 e -Science 应用 资源匮乏、能源短缺和环境污染日趋恶化等现实问题,已经 成为社会可持续发展的巨大障碍。工业生物技术是解决人类目前 面临的资源、能源及环境危机的有效手段。中国科学院在“1+10” 基地建设中,设置了“先进工业生物技术基地”,面向国际工业 生物技术科学发展前沿和国家能源、资源、环境重大需求在生物 能源、生物炼制、绿色工业过程等领域布局了一批重要的项目, 信息化技术是这些项目的核心,广泛应用于数据库的整合、虚拟 实验室的建设、网络化办公、战略研究等方面。并且利用该平台 开展面向“纤维素乙醇高温发酵和生物炼制的基础及应用研究” 等重大科研项目的综合信息服务,从项目立项调研、给予全方位 的信息技术支撑,提高 IT 手段对生物学领域重大科研项目的支撑 能力。 其具体情况如下: (1)数据库整合 集成一系列工业生物技术所必需的数据资源的基础上,通过 检索引擎技术、Web Service 技术、超级计算平台等各种信息化技 术的手段,建设工业生物技术知识环境。知识环境能够为科研人 员提供数据分析、过程模拟、系统优化等研究支撑,也能为科研 管理者开展项目管理提供技术,从而实现战略情报支持、个性化 信息服务、微生物改造策略和系统优化策略等知识服务。 (2)基地的信息管理平台 117 第五章 信息化应用 结合院 ARP 建设,设计了一套信息化的管理平台,以及一系 列与基地项目管理相关的数据库,记录了基地所管理的平台和项 目在经费投入、人员组成、建设成果等各方面详细的数据。 (3)虚拟实验室 先进工业生物技术基地涉及的实验室不是独立的个体,必须 加强交流,密切合作。为了给科学家们提供一个更好的信息交流 和科研合作平台,微生物所建立了基于网格(GRID)和 WEB SERVICE 环境的工业生物技术网上虚拟实验室。 (4)重要的信息门户 我们以“中国工业生物技术信息网(WWW.BIOINDUSTRY.CN)”作 为重要依托和出口,提供网络信息服务。该网站定位于建设成中 国工业生物技术领域最权威、最及时、最专业的信息门户网站。 目前,该网站的浏览量和受关注度持续上升,已经在国内生物技 术领域产生了一定的知名度和影响力。 118 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 57.中国工业生物技术信息网 9.面向陆地生态系统碳收支集成研究的 e-Science 应用示范 作为地球系统科学和全球变化科学的前沿问题,开展陆地生 态系统碳循环研究是准确评价我国陆地生态系统碳源汇格局变 化、寻求国家碳汇管理途径和技术、在应对全球变化和制定行动 方案的谈判中维护国家利益的迫切需要。 地理所联合相关单位(野外台站)以实现碳收支的快速评估 为目标,采用先进的信息技术,建立CHINAFLUX e‐Science环境, 为开展碳循环研究的数据采集、传输、存储、管理、分析和模型 模拟提供支撑,从而服务于我国陆地生态系统的碳收支评估。在 119 第五章 信息化应用 CHINAFLUX平台基础上,利用数据远程传输技术、多源数据管理 技术、WEB SERVICES技术、网格技术、协同工作环境套件技术, 构建了由基础设施层、支撑环境层和科学应用层组成的e‐Carbon Science环境(如 图表 58)。 图表 58.ChinaFLUX e-Carbon Science 环境组成 (1)e‐Carbon Science 基础设施层 基础设施层是 e‐Carbon Science 平台研发与应用的物理基础, 包括各野外台站的基于涡度相关技术的碳水通量传感器、数据采 集器、网络设施、视频设备、计算机硬件设备、综合中心的数据 120 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 存储设施、高性能计算机和可视化设备等。 (2)e‐Carbon Science 支撑环境层 e‐Carbon Science 支撑环境层主要由碳循环研究数据集成与 服务环境、模型模拟环境、可视化分析环境以及科研协同工作环 境等四个信息化支撑环境组成。 (3)e‐Carbon Science 应用环境层 以不同尺度的生态系统碳收支研究为科学问题,应用相关数 据处理工具、模型模拟分析工具,基于 WEB 分别构建典型生态系 统碳源/汇季节变化及其机制研究、中国典型区域生态系统碳收支 时空分布格局研究、中国陆地生态系统碳收支时空分布格局研究 等三个陆地生态系统碳收支评估应用系统,从而实现不同尺度生 态系统碳收支快速评估。 5.3 文献情报信息化 “十一五”期间,中科院适应科研环境和信息需求变化,全 面转变文献信息服务模式,努力建设以支撑科技决策的战略情报 服务和支持科技创新的学科馆员服务为主的新型知识化服务模 式,努力建设融入一线、需求驱动、效果考核、资源绑定配置的 服务运行机制,努力构建统筹规划、协调运行、充满活力的组织 机制,实现了从传统图书馆到数字图书馆的转型,实现了从纸本 文献为主到网络数字文献服务为主的转变,从到馆阅读服务为主 121 第五章 信息化应用 到以深入决策和创新一线的知识化服务为主的转变,从分散自我 运行发展到全馆统筹规划分工合作并带动全院协同发展的转变, 初步形成了以战略情报研究和学科馆员的知识化服务为代表的 服务模式,正在成为适应信息时代的知识情报研究与知识服务中 心,显著提高了对科技创新的支撑力度,在我国科技信息体系中 发挥了骨干和引领示范作用。 5.3.1 发展现状 2006 年,中科院党组决定将原有四个院级文献情报机构整合 组建成立国家科学图书馆,以体制机制改革促进全院文献情报系 统创新发展观念、转变发展模式、提高发展质量,使全院数字化 文献资源保障与服务能力持续增强。 截至 2010 年底,全院外文期刊全文的即查即得保障能力达 到 12,870 种(国科图集团采购 6,505 种,借助国家平台开通 562 种,集成开放获取 5,803 种),中文电子期刊 10,434 种,中文电 子图书总量达 32.2 万种(其中国家平台订购 20.4 万种,院集团 采购 11.8 万种) ,外文会议录即查即得能力达到约 27,000 卷/册, 外文图书、工具书即查即得能力达到约 30,000 卷/册。建立了面 向科研一线的融入式学科化服务模式,有效提升了科研过程中的 信息服务能力,在国内外起到了引领示范作用;形成了面向宏观 科技决策的情报研究系列产品,一批自主开发的情报分析工具投 入使用,正在逐步开拓面向研究所的学科情报研究服务;建立了 综合集成和可靠服务的公共文献信息服务平台,实现将文献检索 获取、网络化咨询、文献传递、学科化服务等的集成化一站式服 122 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 务,开发了嵌入用户桌面的 E 划通检索工具,开通了跨多类科技 资源的集成检索系统,实现了根据用户机构和服务环节自动鉴别 资源获取状态和触发所需服务的情境敏感服务;显著扩大了我院 在国家科技文献平台中的资源保障和公共服务份额,显著提高了 对全国科技界的信息服务能力,并通过牵头开展国家科技文献平 台战略研究和重点建设项目,推动国内重点前沿问题的学术交流, 在我国科技信息服务发展中发挥着引领示范作用。 5.3.2 特点及成效 1.数字化资源保障能力不断提升 “十一五”期间,在资源建设方面,基本实现从印本文献到 馆服务向“资源到所、服务到人”的数字化网络化文献服务的转 型,形成了全院文献资源协调保障与联合建设机制,科技文献保 障程度达到国际先进水平。全院及国科图开通的网络版数据库从 2005 年 43 个增长到 2010 年底的 160 个;全院可获取外文电子科 技期刊从 2005 年 4,621 种增长到 2010 年底的 12,870 种,在满足 全院普遍需求基础上,根据特色化个性化需求引进了部分特色资 源;全院开通的电子图书分别从 2005 年 4.8 万种增长到 2010 年 底 32.2 万种;全院开通的外文学位论文从 2005 年 7 万多篇增长 到 2009 年底的 25.8 万篇;全院原文传递服务外文期刊获取能力 从 2005 年 20,000 种增长到 23,000 种;2010 年全文下载量达到 3,169 万次,全院原文传递服务超过 13 万余篇,均比 2005 年增 加超过 3 倍。 123 第五章 信息化应用 35000 30000 25000 20000 15000 10000 5000 0 2006 2007 外文期刊(种) 2008 2009 外文图书、工具书(卷/册) 2010 外文会议录(卷/册) 图表 59.2006-2010 年电子资源数量增长情况 单位:个 180 160 140 120 100 80 60 40 20 0 152 160 122 82 2006年 96 2007年 2008年 2009年 2010年 图表 60.2006-2010 年网络数据库数量增长情况 除通过购买引进、集成开放获取资源、与其他文献情报机构 合作等方式提升数字资源保障能力外,国科图还自主研建特色文 献数据库,积极尝试开展综合科技信息资源体系建设。国科图持 续开展《中国科学引文数据库》研建工作,收录我国出版的中、 英文优秀期刊 1,123 种,覆盖自然科学、医学、工程技术、管理 124 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 科学等学科领域,已累积来源数据 287 余万条,引文数据 2,595 余万条;2008 年启动专业领域知识应用环境建设工作,目前已基 本搭建完成灵长类动物知识环境、中国特有植物和微生物药用活 性物质的基础研究知识环境、中科院植物进化生物学研究组知识 环境、医药与健康知识环境等 4 个领域的试点应用,应用平台已 经在国科图服务网站发布。 2. 文献信息服务平台持续优化 全面改造和加强文献服务方式,建立起综合集成和可靠服务 的公共文献信息服务平台,实现了文献检索获取、在线咨询、文 献传递等集成化一站式服务,开发了嵌入用户桌面的 E 划通检索 工具,开通了跨多类科技资源的集成检索系统,实现了根据用户 机构和服务环节自动鉴别资源获取状态和链接所需服务的情境 敏感服务。 专栏 19:嵌入式桌面信息服务工具—e 划通系统 当前信息环境下科研用户通常面临着信息过载问题。如何准 确、方便、快捷地获取科研所需的信息服务是用户现实需求。目 前,多数服务系统以独立系统的方式存在,用户在实际工作时想 要获取某种信息或服务不得不离开“现场”,进入或登录到其他 服务系统中进行获取,导致当前思路中断以及时间成本的增加。 为此,中科院国家科学图书馆尝试以嵌入式桌面信息服务的方 式,将科研过程中所需的众多信息服务进行集成融汇后即时嵌入 125 第五章 信息化应用 到用户的信息操作“现场”中,力求在最短的时间内为用户提供 “所要即所得”的科研信息环境,开发了桌面信息服务工具 e 划 通。 该工具通过屏幕划词获取用户操作的兴趣点,并自动记录与 该兴趣点相关联的情境信息,通过个性化手段,将科研过程不同 环节中所需的信息服务(如文献检索、摘录、辞典等)进行组织 和集成,在不中断用户当前工作状态的前提下,将用户想要的资 讯即时呈现于现场。同时用户选取的兴趣点可以形成知识单元, 在细粒度层面上为个人知识的积累和交换提供便捷场所。目前 e 划通系统已经推出了 1.0 版、1.5 版、2.0 版本。软件下载量超过 132,000 人次,2009 年在深圳大学城图书馆完成部署并开始推广 使用。 该系统利用屏幕划词的方式将科学研究过程中所需的信息 服务即时嵌入用户工作环境中,绕开了不同应用系统间互操作的 限制,将诸多孤立的系统联系起来,从外部嵌入操作对象,因而 拉近了信息使用者与信息提供者之间的距离,疏通了用户与信息 服务系统间的最后通道。 该系统以其新颖的服务模式以及方便、快捷的服务特征在业 界引起很大关注,得到了众多一线科研人员的认可。它为数字条 件下个人科研信息环境的建设提供了新的途径,也为下一代个人 研究工具的发展提供了新思路。 126 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 我院积极适应研究生信息需求变化,成立了研究生信息服务 协调工作组,在国内率先建立了集信息检索、书刊阅览、网络应 用、互动交流与学习休闲于一体的研究生信息交流学习区,同时 深入拓展数字信息服务形式,在研究生院 BBS 论坛中建立“e 图 淘宝”专栏,还通过撰写网络日志、开设博客网站,建立起有利 于教学互动、知识共享、自我学习的虚拟课堂,通过开展沙龙式 讲座及影视展播等方式,丰富和活跃研究生信息服务。2010 年, 我院正式启动学习共享空间示范建设项目,突破研究生信息交流 学习室的空间局限,进一步盘活现有物理空间资源,为研究生读 者创造更好的学习、研究和交流环境。 适应需求变化,积极借助信息技术不断提升信息服务能力, 开发优化新型集成服务系统。我院开发建立了情景敏感、用户流 程驱动的集成服务系统,实现从个性化资源发现、文献下载、传 递服务到咨询问答的无缝流程;开发推广了个人桌面信息工具 E 划通,使用户在浏览网页、编辑文件、邮件交流等过程中,能随 时划词自动检索所关心的文献、数据或服务;成功开发跨界集成 检索服务,提供对数据、课件、设备、会议、机构、人员、工具、 名词术语等综合信息的集成检索;完善和推广所级信息集成服务 门户和课题组信息服务平台,支持用户建设自己的信息环境;建 成数字资源长期保存示范系统,推广建设研究所机构知识库,发 展知识资产长期保存能力;持续优化中国引文在线分析系统,支 持中文科技文献计量分析;建成中国科学院知识产权网,提供知 识产权信息发布、交流、检索集成服务;自主开发面向全院的专 利在线分析系统,支持专利技术趋势分析;建立科学结构演化分 127 第五章 信息化应用 析系统,支持科学结构及其演变发展分析;建成情报研究集成研 讨厅,形成集文献资源、情报研究资源、专门分析工具、情报研 究人员、战略专家与学科专家、群体研讨机制为一体的交互式战 略研究集成研讨环境,开始支持科技决策中的集成交互研讨活动。 3. 资源共建共享体系建设逐步深入 作为国家科技信息服务系统的重要组成部分,我院一方面以 国家科技图书文献中心为基础积极参与国家科技文献平台建设, 支撑国家平台文献资源优化,牵头发展国家平台数字资源服务, 牵头组织国家平台的国际引文数据库、回溯数据保存平台、数据 集成加工系统等系统建设。同时,用先进理念和优质服务促进国 家平台服务发展,首家实行每周 7 天文献传递服务,首家将国家 平台资源与服务纳入日常宣传咨询之中。另一方面,主动建议和 示范推进国家文献情报服务发展,作为主要单位牵头组织和完成 国家平台十一五规划研究、国家平台数字时代发展战略研究和国 家科技文献服务十二五规划研究,每年建议和承担业界重大高层 学术研讨,包括数字资源长期保存、数字图书馆知识产权热点问 题、数字图书馆协同服务等,牵头组织全国数字图书馆标准规范 研究推广,通过中国图书馆学会专业图书馆分会等多次组织知识 服务创新研讨,促进我国图书馆事业发展。 分布在地方的各个文献情报机构在支撑地方重大科技信息 需求和推动地方科技文献服务方面发挥着重要作用。兰州分馆与 甘肃省共建“甘肃省科技图书馆”,打造“西北地区水资源文献 128 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 库”、“西北地区生态学文献库”、“青藏高原研究专题信息门户” 等信息资源服务平台,承担国家平台甘肃镜像站点服务,作为核 心力量支撑白银地区转型发展的战略研究。成都分馆作为四川科 技文献平台核心单位支撑地方科技文献共建共享,承担国家平台 四川镜像站点服务,积极组织科技援藏信息服务,建立天然药物 信息门户网站、“藏医药信息化平台”、 “中药现代化信息平台” 和“专利信息平台”等。武汉分馆与湖北省共建湖北科技图书馆, 承担湖北省生命科学与生物技术信息平台建设,依托“东湖开发 区信息中心”开展科技信息平台建设。院上海生命科学信息中心 与上海图书馆合作共建上海生命科学图书馆,国科图与广东科技 图书馆在资源建设、文献服务等方面深入合作,支撑对广东省科 学院及当地科技界的服务,与深圳大学图书馆合作建设区域服务 型特色分馆,形成跨地区科技文献共享新模式。 专栏 20:国家科学图书馆努力构建用户驱动的科研信息环境 为适应科研人员利用信息的行为方式和习惯的变化,2006 年 国家科学图书馆结合当前数字图书馆的发展趋势,提出了“用户 驱动的科研信息环境”的建设理念,努力构建以用户需求为中心 的信息服务环境。 通过对科研人员信息需求进行分类抽象,按照用户习惯组织 资源和服务,分析用户信息行为来梳理服务流程,形成了从资源 检索到资源定位,再到获取原文的数字图书馆的总体服务流程; 基于 OPENURL 的服务互连标准,采用 SRU 标准对服务系统进行 统一接口封装,形成了可嵌入式服务模块接口,实现了各系统间 129 第五章 信息化应用 服务传递的无缝链接;建设用户服务知识库,融汇使用资源、用 户、服务、服务策略等信息,支持用户获取信息过程中的情景敏 感和流程驱动。 该项目受到了科研人员、研究生和所级图书馆员的欢迎,认 为这种用户驱动的建设理念、思路和做法真正从用户角度出发, 贴近用户需求,使用的是科研人员理解的语言,考虑的是科研人 员的便利,提供的是科研人员想要的服务。 5.4 教育信息化 中国科学院人才培养信息化的重点是为培育具有服务国家 民族的社会责任感、勇于探索的创新精神和善于解决问题的实践 能力的高层次科研人才提供信息化支撑;通过提供个性化的自主 学习,实现科研人员的终身学习,帮助他们在知识创新、技术创 新、国防科技创新和区域创新中作出贡献。同时利用信息技术, 支持开展自然科学、技术科学、哲学社会科学等跨学科、跨领域 的科研与教学相结合的团队,促进科研与教学互动。另外,通过 促进高校、科研院所、企业科技教育资源共享,推动创新学习模 式,培育加强重点科研创新基地与科技创新平台建设,同时,完 善以创新和质量为导向的教育评价机制,达到科研与教育相互促 进的目的,实现“研学相长”。 130 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 5.4.1 发展现状 截至 2010 年底,中国科学院研究生教育信息化基本部署完 成并实施。教育信息化建设重点对“十五”期间形成的教师、招 生、教务等9个相对独立的管理系统进行改造扩建,新建学工管 理、培养管理、校友管理、决策支持、课程网站、空中课堂和培 养指导系统,并将原有部分系统只面向集中教学阶段应用扩建为 面向全院应用,实现了研究生从入学到就业全过程教育管理工作 的信息化和网络化的协同学习服务;建设了中国科学院继续教育 培训平台,为全院继续教育培训管理、教学互动与自主学习提供 更具特色的网络化服务支持;实现了全院用户的单点登录及教师、 学生和课程等所有数据在整个教育信息化平台中的关联统一,并 更加注重支持研究生教育过程管理和内容积累的应用,促进了中 国科学院教育资源的共建共享。 “十一五”教育信息化项目开发完成了研究生教育业务管理、 协同学习服务和继续教育培训三大平台共 16 个应用系统,覆盖 了研究生教育和继续教育全过程,实现统一信息门户及与 ARP 接口,并建立了相应的支撑保障体系和用户服务体系。 131 第五章 信息化应用 图表 61.“十一五”教育信息化建设重点 截至 2010 年 11 月 30 日, 教育信息化平台中共有用户 116,578 人,活跃用户 41,548 人。各应用系统总访问量达到 548 万人次。 单位:万人次 600 547.9784 500 472.9775 434.5522 400 300.9613 300 200 100 339.1516 326.2759 240.9938 196.7944 163.8553 105.9133 76.7524 0 图表 62.“十一五”教育信息化平台访问总量 132 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 1.研究生教育业务管理平台支持研究生培养的网络化全过程 管理 截至 2010 年底,服务于研究生教育业务管理所需,建成了 贯穿于研究生招生到毕业全过程及相关环节的研究生教育业务 管理平台。 研究生教育业务管理平台面向全院提供研究生教育业务管 理全过程的网络化技术支持服务,主要包括学科、教师、招生、 注册、学籍、教务、培养、学工、学位、就业、校友管理和决策 支持,共 12 个系统。该平台在提供学科、导师、招生、注册、 学籍、教务、学位、就业等全过程教育业务管理支持的同时,满 足了统计分析服务于决策、服务于评价评估等管理要求,全面梳 理了研究生教育管理业务流程,实现了制度、流程、网络管理平 台的一体化。该平台已正式服务于全院 100 余个研究生培养单位 的教育业务管理工作,应用情况良好,功能不断完善,数据逐年 递增,服务成效已达到国内领先水平。 133 第五章 信息化应用 平台 教 育 业 务 管 理 平 台 系统 用户数(个) 访问量 (人次) 教师管理 12,804 25,329 招生管理 465 39,912 注册管理 473 9,579 学籍管理 90,314 189,061 教务管理 113,022 1,183,504 培养管理 532 7,684 学工管理 37,828 22,392 学位管理 92,839 206,992 就业管理 289 9,679 校友管理 108,151 23,127 决策支持 13 573 图表 63.研究生教育业务管理平台用户访问情况 5 2.协同学习服务平台服务教学模式创新与教育资源积累共享 截至 2010 年底,服务于研究生教育随时随地学习与协同共 享资源所需,建成了网络化学习平台并实现了云平台(视频)服 务。 协同学习服务平台面向全院教职员工和学生提供自主学习、 交互学习过程的网络化服务,主要包括空中课堂、课程网站和培 养指导共 3 个系统。该平台已实现面向全院的在线学习交流和对 全院的优质课程、各种学术活动资源以及用户自发贡献的各类知 识内容的发布与共享,其中的视频课件、论文指导等资源共享服 务体系也达到了国际同类应用的先进水平,应用力度不断增强。 5 数据截至:2010 年 10 月 29 日 134 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 64.协同学习服务平台 6 截至 2010 年 11 月 30 日,课程网站已有课程 3,738 门,资源 93,112 个,总访问量达 100 万人次。空中课堂已有视频 19,296 个, 课程 1,057 门,总访问量达 145 万人次。 平台 协同学习 服务平台 系统 用户数(个) 访问量(人次) 课程网站 96,038 1,002,578 空中课堂 107,280 1,453,893 培养指导 55,321 188,362 图表 65.协同学习服务平台用户访问情况 专栏 21:满足研究生课程学习所需的教学互动与协同学习平台——课 程网站 中科院研究生院“课程网站”是根据中科院研究生教学的特 6 网址:http://www2.gucas.ac.cn 135 第五章 信息化应用 点,面向学生、教师和教学管理者而建立的网络化教学互动和协 同学习平台,在充分比较调研的基础上,全面革新了原有“课程 网站”的技术架构。该平台基于目前国际高等教育中广泛采用的 SAKAI 开放源代码进行二次开发,整合了一组支持在线协作和学 习的模块和组件,能够自由组合和扩展,为用户提供了课程资源、 课堂作业、答疑互动、助教管理、统计分析等功能,并可根据教 学特点不断调整扩展;通过组织结构引入班级概念,各班级内用 户和数据资源相对独立,以教师为主导实现高效的课程管理,有 利于课堂教学与课外学习和教师与同学之间的协同互动,通过网 络教学环境实现教与学的延伸,提升教学效果和质量。 该平台的课程共享资源与“空中课堂”形成联动,还可多手 段支持实现资源共享。教师可以为学生提供除课件教学、视频资 源、互联网知识资源等外的直接的教学指导、课后交流和同步互 动积累等资源。这些技术手段的应用非常符合研究生级及上层次 的学生开展研究性学习和知识扩展的实际需求,也为院继续教育 培训提供了平台支持。这种方式将成为目前和今后中科院教学的 重要手段和方式。 136 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 66.课程网站 3.网络化继续教育培训平台全面提升全院继续教育培训管理 与职工自主学习效益 截至 2010 年底,为服务于中国科学院院职工继续教育培训 管理和自主学习,建成了网络化继续教育培训平台。该平台针对 院、分院、研究所、施教单位的各级管理人员和不同的继续教育 培训对象分别开通特色服务和管理功能,并与协同学习服务平台 相融合,面向全院科研、管理和技术支撑等岗位的各类员工提供 统一的网络协同学习交流服务,为全院职工提供内容服务、学习 考核和继续教育培训档案,实现全院继续教育培训网络化管理、 教学互动与自主学习。网络化继续教育培训平台于 2010 年 1 月 面向全院试点应用。 137 第五章 信息化应用 图表 67.网络化继续教育培训平台 7 截至 2010 年 11 月 30 日,共计 181 个单位的 1,556 余名学员 使用培训学习平台进行培训学习,共参与培训课程 336 门,积累 课程资源 2.25G(不含课程视频),积累课程视频 910 个。 7 网址:http://www.cecas.ac.cn 138 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 专栏 22:继续教育平台应用于“中国科学院党校第十四期科技管理骨 干进修班” 中国科学院继续教育培训平台在国内同类平台建设中属于 首创,应用技术处于领先地位。该平台通过在院所局级领导上岗 培训、科技骨干进修班等项目中全面试用,初步形成了符合中科 院特色的网络培训业务流程体系,实现了继续教育培训的业务管 理平台与学习平台有机结合,并根据需要实现了全院教育资源的 整合应用。 “中国科学院党校第十四期科技管理骨干进修班” 自 2010 年 4 月 21 日开班至 7 月 16 日结束,历时近 3 个月。参加培训的 学员为院属 48 个单位的所长助理、管理骨干等共计 45 人。此次 培训采取集中授课与网络学习相结合的教学方式,继续教育培训 平台发挥了很好的作用,与继续教育业务管理平台形成有机联 动,促进了全方位的互动交流学习。该平台形成了完备的学员培 训电子档案记录; 积累中央党校和国家机关分校视频课程 131 个、 课程资源 67 项约 1.1G;学员有 6 个讨论区、8 个主题,完成 10 项作业,有 14 条答疑记录。参训学员对继续教育培训平台给予 充分的肯定,有些学员已开始在本单位试点使用该平台。 139 第五章 信息化应用 图表 68.“中国科学院党校第十四期科技管理骨干进修班”培训管理信息 图表 69.“中国科学院党校第十四期科技管理骨干进修班”培训学习资源 140 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 5.4.2 特点及成效 1.立足全院教育发展战略,建设统一的教育管理与协同学习 平台 中国科学院教育发展纲要提出“科教融合,协同发展,突出 特色,引领示范”。中国科学院的研究生教育实行“两段式”培 养模式,旨在发挥研究所的科学研究优势,培养高质量人才。教 育信息化对这一特有的研究生培养模式提供了强力的支撑。教育 信息化项目通过 2 年多的建设,截至 2010 年底,在原有分散、 局部、非标准的教育管理系统基础上,构建了研究生教育业务管 理、协同学习服务和网络化继续教育培训等三大平台,覆盖从研 究生教育到继续教育的各层面的业务管理与协同学习技术支持 与服务,实现了教育统一门户登录及教师、学生、职工和课程等 基础数据的统一关联,为教育质量的提高与领导决策提供了便捷、 可靠的信息化支持。 图表 70.教育信息化用户分布 141 第五章 信息化应用 2.把 把握人才培养 养规律与环节 节,实现研究 究生教育全过 过程管理服 务 截 截至 2010 年底 底,教育管理 理信息化以研 研究生教育业 业务管理平 台的建 建设为枢纽,全 全面梳理了教 教育管理业务 务流程,奠定 定了工作规 范化的 的基础,实现了制度、流程 程、网络管理 理平台的一体 体化。在研 究生教 教育业务管理方 方面实现了从 从学科建设、导师管理、招生管理 到学位 位管理、校友系统等一体化 化网络化工作 作平台,服务 务成效已达 到国内领先水平。 图 图表 71.研究生 生教育业务管 管理平台实现全 全过程管理示意图 助力学习型组 组织建设,创 创建继续教育 育培训平台 3.助 “十一五”之前 前,中国科学 学院继续教育 育尚无信息化手 手段支持, 工作效率受到制 制约。教育信 信息化项目中 中重点建设网 网络化继续 管理工 教育培 培训平台。该平 平台包括:服 服务全院继续 续教育培训管 管理的“继 续教育 育管理系统”、服务全院院 院所和施教单 单位继续教育 育培训教学 互动与 与职工自主学习的“培训学 学习网站”及继 继续教育培训 训门户“中 国科学 学院继续教育 育网”。该平台 台依据院组织 织体系特点与 与需求而建 初步形 形成了符合中科 科院特色的网 网络培训业务 务流程体系,实现了继 续教育 育培训的业务管理平台与学 学习平台有机 机结合,并根 根据需要实 142 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 现了全院教育资源整合应用,为全院职工的终身学习打下了基础。 图表 72.继续教育培训平台在沈阳自动化所试点应用 4.持续积累教育资源,推动协同学习与资源共建共享 中国科学院的教育资源与科研紧密结合,但由于人才培养地 域分布的特点,使得资源呈现出相对的分散和稀缺。因此,在“十 一五”教育信息化建设中,我院建设了以课程网站、空中课堂、 培养指导为核心系统的协同学习服务平台,实现了面向全院的在 线学习交流和课程学习、自主学习、论文指导培养过程的信息化, 其中的视频课件、论文指导等资源共享服务体系达到了国际同类 应用的先进水平。其中,空中课堂作为面向全院的数字化教学资 源库和公共服务平台,平均日点击量已达 10 万人次以上;课程 网站平均日点击量 5 万人次以上。特别是,院所也开始积累和提 供教育资源,供全院共享。例如,长春光学精密机械与物理研究 所在光学领域组织制作了独具特色的课件,也共享了研究生院的 143 第五章 信息化应用 科技哲学等公共课程资源。 3000 2500 2457 2063 2000 1500 1787 1736 1644 1639 1537 1462 1420 1325 1000 500 0 图表 73.空中课堂全院院所访问量 TOP10(集中教学园区除外) 10000 8000 6000 7733 7669 6806 6589 5354 5231 5218 5202 4704 4495 4000 2000 0 图表 74.课程网站全院院所访问量 TOP10(集中教学园区除外) 144 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 5.重视技术创新,形成自主知识产权和关键技术的研发环境 中国科学院“十一五”教育信息化项目的用户地域分布广、 角色类型多、数量大,项目提供的软件和服务种类齐全。为此, 项目组在建设开发的同时,注重信息技术与教育理念的紧密结合, 以需求为牵引,以信息化促教育创新,自主研发了 3 个核心技术, 即:支持大规模并发访问的视频云服务平台、简便易用的演讲影 音录制软件和专业便捷的学术搜索引擎。视频云服务平台支持数 万人同时点播视频,用户点播视频不会产生流量计费,视频点播 效果更加流畅稳定;演讲影音录制软件实现了计算机桌面及视频 的同时高清录制,一次完成制作和优化编码,占用空间是传统方 法产出的三分之一;学术搜索引擎基于中科院雄厚的科研学术内 容源,将课程、论文、视频与人物结合起来进行综合检索和精细 分类,实现专业个性化学术内容的深度挖掘。教育信息化项目实 施期间,申请了 20 项计算机软件著作权。 图表 75.教育信息化项目获得的计算机软件著作权证书 145 第五章 信息化应用 6.重视软硬结合,形成人才培养的信息化良性生态环境 在教育信息化三大平台建设的同时,教育信息化基础设施也 得到了同步的建设发展,在服务规模和带宽容量方面名列国内高 校前茅。为满足平台服务要求,我院共部署服务器节点 40 个, 支持并发在线人数大于 3,000 人,存储容量 15T;安装了防火墙 系统、网络监控软件等软件;主干网络服务带宽达 1G,校园网内 到终端节点带宽 10M,网络服务平台平均无故障时间小于 24 小 时/年。 院“十一五”人才培养信息化,构建起了服务全院近 4.5 万 在学硕士、博士研究生的网络化培养管理和学习互动平台,服务 全院 5.5 万科研、管理及支撑等岗位职工的继续教育网络化培训 平台,以及集成全院各类教育资源的知识共享和共建平台,形成 了服务于全院研究生和职工的网络协同学习环境,达到了国内先 进水平,更好地满足了中国科学院人才培养对网络资源日益丰富 及科研与教育日趋紧密关联的需求,同时也为教育信息化的持续 建设打下了坚实的基础。 5.5 网络化科普 “十一五”期间,中国科学院网络环境下的科普工作取得了 长足的进步。依托我院的信息化基础设施,初步形成“资源汇聚、 开放互动、二网融合、三类互动”的中国科学院网络化科学传播 平台,服务于全院网络科普工作的信息化基础环境,以及面向公 众统一的院所三级服务体系;网络化科学传播平台资源和应用的 146 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 科学性、趣味性、互动性、先进性进一步提升,用户访问人数和 满意度显著提高;在全院范围内形成了一支网络科普专业队伍, 网络科普能力得到显著提升,进一步确立在国家网络科普工作中 的领先地位。 5.5.1 发展现状 1.分布与集中相结合的网络科普服务体系初步形成 以“平台门户——专业科普网站——所网站科普栏目”为核 心的院所两级网络科普服务体系初具规模,包括一个平台门户 (中国科普博览) ,10 个专业科普网站,以及 109 个所网站下属 的科普栏目。此外,正在尝试将院内其他 50 多家科普网站纳入 网络科普服务体系。总体来看,2010 年我院科普网站共约 69 个, 较 2008 年增加 35 个,上升 103%;科普栏目总共 110 个,基本 覆盖我院全部学科领域。 147 第五章 信息化应用 单位:个 80 69 70 60 50 40 34 30 20 10 0 2008年 2010年 图表 76.2008 年与 2010 科普网站数量 截至目前,网络化科学传播平台日均访问人次达到 22 万, 年服务人次达 7,920 万,成为传播科学资源和科学思想的重要窗 口。其中,平台门户中国科普博览日均访问人次达到 5.2 万人次, 较 2009 年的日均 3.5 万人次增长了 48.6%;年服务人次达 1,872 万人次。 图表 77.网络化科学传播平台访问统计 148 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 专栏 23:开展“中国科学院优秀网络科普栏目评选活动”,提高全院 科普栏目建设水平 为了全面提升我院各研究所科普栏目的建设水平和影响力, 打造面向大众、服务大众的“院网络科普门户—专业科普网站— 所科普栏目”的网络科普服务体系,2010 年 9 月 1 日至 10 月 31 日期间,中国科学院办公厅和中国科学院院士工作局联合主办了 “中国科学院优秀网络科普栏目评选活动”,全院共 109 家单位 的科普栏目参加评选。此次评选活动大大促进了我院各单位科普 栏目的建设。在评选期间,共有 58 家单位在单位网站首页或科 普栏目首页添加了“网络科普服务体系导航”;有 13 家单位根据 评选活动的评价指标对在科普栏目的内容、版面设计、技术应用 等方面进行了全新改版;有 30 家单位的科普栏目积极更新,并 向平台门户推送了精彩科普内容。通过专家评议和网络投票,最 终产生 10 个优秀网络科普栏目,并对 10 个网络科普栏目予以提 名表彰。 主办单位 栏目地址 中国科学院大连化学物理研究所 http://www.dicp.cn/kepu/ 中国科学院寒区旱区环境与工程研究所 http://www.careeri.cas.cn/kxcb/ 中国科学院心理研究所 http://www.psych.cas.cn/kxcb/ 中国科学院西双版纳热带植物园 http://kepu.xtbg.ac.cn/ 中国科学院南京地质古生物研究所 http://www.nigpas.cas.cn/kxcb/ 中国科学院力学研究所 http:/ lxyd.imech.ac.cn 中国科学院高能物理研究所 http://www.ihep.cas.cn/kxcb/ 中国科学院动物研究所 http://www.ioz.cas.cn/kxcb/ 中国科学院物理研究所 http://www.iop.cas.cn/kxcb/ 149 第五章 信息化应用 中国科学院新疆生态与地理研究所 http://www.egi.cas.cn/kxcb/ 图表 78.获“2010 中国科学院优秀网络科普栏目”称号栏目 主办单位 栏目地址 中国科学院武汉植物园 http://www.wbg.cas.cn/kxcb/ 中国科学院声学研究所 http://www.ioa.cas.cn/kxcb/ 中国科学院昆明植物研究所 http://www.kib.cas.cn/kxcb/ 中国科学院微生物研究所 http://www.im.cas.cn/kxcb/ 中国科学院昆明动物研究所 http://www.kiz.cas.cn/kp/ 中国科学院上海硅酸盐研究所 http://www.sic.cas.cn/kxcb/ 中国科学院地理科学与资源研究所 http://www.igsnrr.cas.cn/kxcb/ 中国科学院烟台海岸带研究 http://www.yic.cas.cn/kpzx/ 中国科学院国家科学图书馆兰州分馆 http://www.llas.cas.cn/kxcb/ 中国科学院计算技术研究所 http://www.ict.cas.cn/kxcb/ 图表 79.获“2010 中国科学院优秀网络科普栏目”提名栏目 2.知识性与交互性相结合的网络科普资源体系逐步完善 通过科普网站、科普栏目以及数字化科普资源的建设,我院 初步形成了以虚拟博物馆、科学体验、科普专栏、科普专题、数 字化资源库为主要形式的网络科普资源体系,内容几乎覆盖我院 全部学科领域。 150 中国科学院信息 息化发展报告 20011 中国科学院信息化发展报告2011 16% 天 13% 10 0% 10% 地 生 综 综合技术 51% 理 图表 80.中科院 院科普资源主题 题分布 截 截至目前,全 院总共建成近 近 100 个中英文虚拟博物 物馆,100 多个科 科普专题,30 多个科学体 体验,75 期科 科普纵览,以 以及面向 8 万用户发放的 120 多期电子杂志 志,知识面涵 涵盖了我院主 主要学科领 域,初 初步形成开放式 式的数字化科 科普资源库。截至 2010 年 10 月, 平台资 资源积累总数达 达 2,000G,上 上线资源量达 达 100G,较 2009 年的 上线资 资源总量 85G 增长了 17.6%。 151 第五章 信息化应用 单位:个 120 100 100 85 80 74.8 60 40 20 0 2008年 2009年 2010年 图表 81.2008 年-2010 年网络化科学传播平台上线资源总量 3.开放式的网络科普共建共享环境初步建立 依托院信息化基础设施,完成了网络化科学传播平台的网络 环境、运行服务环境、存贮环境、安全保障环境等软硬件环境的 建设,拥有 50M 带宽、100T 存贮和 40 台服务器集群的服务能力, 为全院科普网站提供统一、稳定、安全的运行和服务环境。目前 院网络化科学传播平台的门户(中国科普博览)、化石网、科学 探险网、时间科普网、土壤植物与粮食丰产网、数字地球网、动 物馆网站,以及古动物馆网站等均在该环境中运行。同时,依托 院信息化技术,完成了网络科普共建共享工具软件的开发和应用, 为院内网络科普工作提供网络科普协同工作和支撑服务平台。通 过该平台,院内科普工作者可以及时获取院网络化科学传播平台 的最新信息、技术文档和网络科普的标准规范等,也可以下载使 用包括图片处理、科普网站/栏目建设工具(内容管理系统)、站 152 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 点管理工具、访问统计工具、元数据管理工具、3D 物体制作工具, 以及三维全景制作工具等,还可以通过平台获取科普内容策划、 设计制作和开发服务。 图表 82.网络化科学传播平台共建共享环境 4.在国家科普工作中发挥了示范和带头作用 2006 年到 2009 年期间,我院十多家单位参与了中国科协和 中国科学院的主持和领导的中国数字科技馆建设工作,创造性地 提出了网络科普新理念和新形式,建成虚拟博物馆 11 个、科普专 栏 6 个、科学体验区 17 个。通过三维动画、虚拟场景、动态演 示等技术的运用,开发了集交互、参与、动态于一体的科学体验 馆,实现科学性与趣味性的有机结合,总结出“Do Science”的 科普理念,探索出“科学观察、科学实验、科技应用、科学考察” 的科学体验新形式,有效地指导了此后网络虚拟科学体验的建设 153 第五章 信息化应用 工作,在国家科普工作中起到示范作用。2007 年,中国数字科技 馆获得“世界信息峰会大奖”,其中我院承建的“生态小博士”、 “大熊猫探秘”等体验馆获得了国内外专家的一致好评。 2010 年,参与中国科协主持的“国家科普资源网格”建设, 综合利用网格、P2P 等网络技术搭建了国家科普资源网格平台, 把地理上广泛分布的图片、报告、游戏、展品等科普资源连成一 个逻辑整体,为用户提供一体化服务。国家科普资源网格技术平 台的建设为全国范围内科普资源的共享与应用建立了坚实基础, 踏出了探索资源共建共享新模式的第一步。 154 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 专栏 24:化石网获得信息峰会大奖,凸显网络科普水平 2009 年 9 月,在网络化科学传播平台的策划支撑和包装服务 下,运行于平台网络环境中的中国科学院南京地质古生物研究所 科普网站“化石网”参与 2009 年世界信息社会峰会大奖的评选, 因其“互动” 、 “知识推送”、 “专家引导”和“社群建设”等方面 的成功,以及大量的科普知识在 157 个国家的 545 个网站中脱颖 而出,被授予“世界信息峰会全球大奖” e-Science 组别大奖。 图表 83.化石网获得“2009 年世界信息峰会全球大奖” 5.5.2 特点及成效 1.从分布走向集中,初步形成开放、互动的网络化科学传播 平台 2008 年以前,我院各单位的网络科普工作各自为政,缺少交 155 第五章 信息化应用 流与合作,且尚未形成信息化支撑的整体机制,网络科普整体水 平不高。2008 年,我院以全国优秀科普网站“中国科普博览”为 基础,发挥院信息化环境和技术优势开始建设院网络化科学传播 平台。经过两年的建设,在院内研究院所的通力合作下,构建了 以网络科普服务体系、网络科普资源体系、网络科普共建共享平 台为有机组成,集“资源汇聚、开放互动、二网融合、三类互动” 于一体的院网络化科学传播平台。 通过该平台初步形成了我院资源集成、共建共享、统一服务 的有效机制,将我院科学家、研究所、科普机构整合到统一的网 络科普环境中,形成有机的网络科普体系面向公众提供服务,初 步搭建了公众与科学家沟通的桥梁。其中,平台门户中国科普博 览实现了从传播到交流、互动、服务的全面提升,实现了从综合 网站到开放门户的转变,实现了知识、成果、科研项目、科学家、 研究所、科普场馆以及其他我院特色资源的全面、分层次集成和 服务。 图表 84.网络化科学传播平台——有机的网络科普体系 156 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 网络化科学传播平台的构建为院内各单位的科普信息化提 供了基础环境和条件,改变了我院科普网站各自为政的局面,加 强了我院网络科普资源交流和共享,发挥了整体优势,提高了我 院网络科普的整体服务水平和整体影响力。 2.从全面走向深入, “点、线、面”资源集成初见成效 以虚拟博物馆为代表的资源集成方式,以其知识的系统性、 学科覆盖的全面性获得了普遍认同,从面上对我院科普资源进行 了广泛集成。目前,我院已经形成了一批优秀的虚拟博物馆,例 如中国科普博览以“生命奥秘、地球故事、星宇迷尘、科技之光、 万物之理、文明星火”六大展区为主的虚拟博物馆群。 “十一五” 科普信息化建设突破了纯粹“面”上的集成方式,尝试“点、线、 面”全面的资源集成。 在面上,不断新建虚拟博物馆,推出了“新能源”、 “海洋生 物”、“湖泊”、“土壤”、“从粒子到宇宙”多个新主题;在线上, 开发了中科院实体科普场馆和科普网站导航系统,为公众提供便 捷的场馆咨询服务;在点上,抓住我院先导工程、前沿学科内容、 重大科学事件策划专题性科普内容,比如推出“量子通信的奥秘”、 “嫦娥工程” 、 “光谱之王 LAMOST”、 “北京正负电子对撞机”等 科普内容,深入剖析热点科技问题,推出“2009 日全食异地多路 联合直播” 、“专家解读地震频发”、 “转基因食品安全吗”、“关注 甲型 H1N1 流感”等特色专题内容,从而将资源集成从全面推向 深入。 157 第五章 信息化应用 专栏 25:2009 日全食异地多路联合直播,抓住社会热点,开展全方 位科学传播 2009 年 7 月,中国科普博览联合中科院国家天文台、中科院 上海天文台等多家机构和单位组织“2009 年长江日全食异地多路 联合直播”活动。中国科普博览在异地多路信号采集、高速传输、 剪切处理到最终发布的全过程中提供了技术支持和保障,特别是 承担起直播中心和直播门户的重要职责,将公共信号通过互联 网、手机 WAP 网、卫星电视网进行发布,使全球分享日全食奇 观的梦想成为现实。在历时 3 个小时的直播过程中,共有 110 万 人通过中国科普博览观看了日全食,另有 7.5 万人通过中国科普 博览手机 WAP 观看图文直播,并有 10 家国内外电视台和 18 家 国内外知名网站使用我们的信号,全球有 2 亿人通过我们的直播 观看了此次日全食天象。 图表 85.2009 年 7 月中科院日全食异地多路联合直播活动 专栏 26:2010 嫦娥工程科普专题,深入介绍中科院重大科研成果 158 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 2010 年 10 月 1 日,结合我国嫦娥二号发射的重大科学事件, 中国科普博览与中国科学院国家天文台合作,共同推出了“中科 院与嫦娥工程”科普专题,全面介绍了我院在嫦娥工程中所承担 的重要任务和取得的重大成果,并对嫦娥二号结构和原理进行了 详细的讲述,让公众对我国的探月工程有了更深入的认识和了 解。 图表 86.2010 年 10 月中科院嫦娥工程专题 3.从传播走向互动,初步形成科研与科普、公众与科学家、 线上线下多维互动的氛围 159 第五章 信息化应用 “十一五”信息化建设以前,我院网络科普工作以传播知识 性内容为主,重在“传播”;随着互联网理念和信息技术的发展, 我院网络科普理念也不断发展变化,更加注重“互动”,尤其是 科研与科普的互动、公众与科学家的互动、线上线下的互动。 将科研过程与信息化技术相结合,让公众近距离观察、参与 科研过程并应用科研成果,从而推动科研与科普的互动。例如中 国科普博览网将 GPS 网络监测技术与青海湖鸟岛的鸟类研究项 目相结合,开发了《迁徙的鸟》科普内容,让公众通过网络远程 观察和跟踪候鸟的迁徙过程,研究其迁徙规律。 通过 BBS 论坛、SNS 平台、博客/微博系统、留言系统为公 众提供与科学家面对面交流的渠道,促进公众与科学家的互动。 比如中国天文科普网的天之文论坛、化石网论坛、中国科普博览 的科学论坛等,均起到了公众与科学家沟通的桥梁作用。 组织网络与实地相结合的科普活动,将公众尤其是科普爱好 者团结在周围,打造线上线下的互动,提高我院网络科普工作的 吸引力和公众参与性。比如动物博物馆的“小达尔文俱乐部”活 动,科学探险协会的科学考察活动等。 专栏 27:打造面向青少年的科普 SNS 平台“科学家园”,加强与公众 的互动 2010 年,中国科普博览开始建设面向中小学生的社会化网络 (SNS)——科学家园,提供科学测试、思维培养、科学小游戏 (如低碳人生、化石猎人、科学圈子)等在内的科普服务产品, 为中小学生提供一个以科学为纽带的互动和交流场所。 160 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 87.面向青少年的科普 SNS 平台 4.从互联网迈向三网融合,尝试新媒体领域的科普研究与应 用 随着电信、广电和互联网三网融合的发展,我院网络化科普 工作也不断谋求打破互联网的局限,向移动互联网和电视网迈进。 2010 年,中国科普博览与中国科技馆合作,开展了“移动通 信领域科普产品开发规律和运作机制”的研究工作,为我院今后 在移动科普领域的实践提供了理论基础。同时,网络化科学传播 平台门户——中国科普博览基于 12302 公益短号码开通了支持全 院各研究所开展移动科普服务的“中科院移动科普服务平台”, 为院内研究所开展移动平台的科普服务提供了安全稳定的信息 化运行环境,提供基于该平台的移动科普产品(如科普短信,科 161 第五章 信息化应用 普手机报,科普应用,科普图铃等)的设计开发支持服务。目前, 已经推出免费订阅的《科学无限》手机报,联合中科院心理所定 制开发了“中组部干部心理培训的移动心理服务平台”以及“移 动心网”等手机科普应用。 图表 88.2010 年“中国科学院移动科普平台”开通 中国科普博览同时抓住互联网与电视网融合的趋势,与电视 台共同推出科教节目、制作科教电视片、动画片等。2010 年,与 中央电视台青少频道“成长在线”栏目组合作摄制了“解密 2012” 栏目;与中国科技馆和院士工作局合作,拍摄“科学与中国”院 士专家巡讲团科普视频,并计划在此基础上推出精品电视片。 专栏 28:全国科普日手机互动 2009 年 9 月与 2010 年 9 月,中国科普博览网站在中国科学院 奥运村科技园开展“科学知识短信互动有奖竞答”活动,以其新 颖的形式激发了首都各界的科学爱好者尤其是青少年科学爱好 162 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 者的浓厚兴趣和参与热情,成为整个活动的亮点之一。 图表 89.短信科普答题活动受到公众追捧 5.信息技术对科普的支撑能力显著提高,信息化支撑服务更 加便捷 为了使信息技术能够切实服务于全院各单位的网络科学传播 工作,提高我院网络科普资源建设的效率和质量,网络化科学传 播平台提供了一系列集实用性和便捷性于一体的信息化支撑工 具,包括元数据管理工具、图片缩略工具、图片水印工具、全景 图制作工具、三维物体制作工具、数字化资源管理工具等,同时, 通过网络科普协同工作平台面向全院提供信息化支撑服务。院内 机构可直接通过网络提交申请,便可快速地获取相应的服务。目 前,国家动物博物馆、古动物博物馆、科学探险网站、心理所科 普网站等多家科普网站均通过平台获得了设计制作支持服务。 163 第五章 信息化应用 图表 90 0.使用三维全景 景工具制作的“中国国家动物 物博物馆”三维 维展示作品 5.6 网 网站建设 “十一五”期间 间,中国科学 学院网络化信 信息发布平台从 从无到有, 从弱到 到强,基本形成 成了中国科学 学院网站群体 体系,全面、准确、及 时地反 反映中国科学院改革、创新 新和发展动态 态,提升面向 向全社会的 知识传 传播与信息服务效率。 20009 年 10 月 29 日,在迎 迎来中国科学院建院 60 周年之际, 周 一个以 以中国科学院门户网站为主 主站、院领导 导、院机关各 各部门及涵 盖院属 属各单位门户网站为子站的 的网站群体系 系建成。全国 国人大副委 员长、中国科学院院长路甬祥和 和副院长施尔 尔畏出席了网 网站群发布 仪式,并共同开启院网站群。自 自此,由 2700 余个中英文 文版网站组 成的中 中国科学院网站 站群展现在互 互联网中。 164 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 91.路甬祥院长、施尔畏副院长开启网站群 2010 年,网站承建单位在主管部门的指导下,进一步落实网 站群管理机制,以明确网站群内容栏目定位与加强编辑队伍能力 建设、强化英文版建设、加大服务支撑力度、理顺管理体制与明 确各相关单位职责、完善平台功能稳定性和系统安全性等为着力 点,使院网站群系统平台运行稳定。同时开展“把服务送到家门 口”活动,以推进网站群内容建设为重点,到各分院进行培训与 上门服务,推进了中国科学院的网站内容建设。院网站持续着力 于营造科学思想传播氛围,全面、准确、及时地反映我院改革、 创新、发展动态,院属单位网站建设取得了显著进展,为此先后 获得了工信部组织的 2009 年度、2010 年度“优秀政府网站奖”。 165 第五章 信息化应用 5.6.1 发展现状 1.建立院网站群体系,信息发布由分散变统一 院网站群采取“统一建站、分级管理、制度约束、服务保障” 的设计原则,以“体现国际科学组织和国立科研机构特点、反映 科学院文化、满足社会公众对科学信息需求”为基本定位,改变 了原有网站分散、各自为政的建设和信息发布模式,自顶向下, 完成了院网站群“主站+子站”体系结构的整体设计。遵循艺术 与技术统一、形式与内容统一,把握主题,强调整体,简洁大方, 突出科研机构特点、针对各站点不同学科类型设计不同风格模板, 完成了主站和各子站的视觉形象设计。 院网站群体系中包含中文版、繁体版、英文版(科研机构子 站) ,主站和子站全部纳入 cas.cn 域名体系,充分利用中国科学院 域名 cas.cn 的优势,提升 cas.cn 品牌形象。 166 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 92.院网站群体系架构示意图 2.建成院网站群系统运行支撑平台,集中管理信息发布流程 院网站群按照“集中建站”的原则集中建设了系统平台,满 足“应用集中、数据集中、分级管理、安全可靠”的要求,支撑 院网站群运行,为院属单位网站建设提供了良好环境和技术支撑。 在中科院网站群系统平台体系架构中,设置了 Web 发布区、 对外服务区(综合应用区)、服务管理区(SSL VPN 内)和核心 数据库区,部署了前台发布服务器、后台管理服务器、数据库服 务器、互动应用服务器、全文检索服务器、视频点播服务器、站 群监测服务器等集群系统。通过安全的网络拓扑结构、合理的配 置部署及安全保障制度共同做好安全防护,较好地解决现网站易 受攻击问题,支持百万级页面数据资源量访问服务。 167 第五章 信息化应用 网站群建设有集中式院网站群内容管理与发布平台,包括网 站群内容管理(采编发)系统、互动交流服务系统、各类网上应 用系统、多维导航和集中检索系统以及数据管理,其中订制开发 实现的内容管理系统,用于为运维人员和信息员提供网站管理与 信息采编发服务,实现具有丰富排版、完全 office 格式文档兼容、 流媒体支持的信息发布功能、提供灵活授权、工作流配置、模板 修改、栏目管理、专题制作等管理功能。 在网站群平台中开发建设了站群监管与评测系统。系统包括 面向公众展示的“访问统计分析系统”(http://stat.cas.cn)、面向各 级子站管理员的“运行监测平台”两部分及面向系统管理员的监 控系统。其中,面向互联网公众的“访问统计分析系统”,可直 接查看中英文各子站的访问情况、新闻排行、文档更新、主站收 录、子站推送数据等信息,以及网站群整体访问情况排名、文档 更新排名、收录量排名、热点新闻排名、全球访问来源监测等信 息,为实现“以评促建”的网站群发展氛围创造了良好条件。 168 中国科学院信息 息化发展报告 20011 中国科学院信息化发展报告2011 图表 93.中科院网站 站群数据分析 析展示平台 3.完 完成院网站群 群站点及内容 容建设,不断 断充实网站群 群信息资源 根 根据政府网站 建设和信息公开条例的要 要求,按照统 统一展现、 全面反 反映、信息唯一 一、体现特色 色的原则,对 对网站群主站 站和子站栏 目进行 行统一规划,建 建成网站群内 内容目录体系 系;完成站点 点建设;完 成存量 量信息资源的迁 迁移和整理, ,专题栏目内 内容的搜集和 和整合,实 现网站 站群信息资源有 有序发布。 169 第五章 信息化应用 图表 94.2009 年 10 月 29 日上线时网站群中英文主站院庆 60 周年专 题网站 在院新闻宣传主管部门的指导下,依照院新闻宣传工作原则 统筹策划网站群新闻宣传内容。主站突出门户特点,信息鲜活、 170 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 资源丰富、导航明确、服务便捷。子站突出学科特点,信息全面、 内容清晰、管理有序、资源共享。英文版突出国际化特点,以科 学技术为中心,版面清新、风格统一、内容直观、信息快捷、资 源丰富、获取方便。 截至 2010 年 9 月 30 日,项目组在全院各单位的支持下,网 站群中的站点数量已经达到了 356 个,其中,中文站点 229 个, 英文站点 127 个。中文版已发文档(不含镜像和引用) 共计 626,251 条,其中中文主站文档总量 327,339 个,英文主站文档总量 8,785 个;资源库中共有 19.75 万余条记录。 按照动态信息同步、基础资源库共建共享、资源分类导航的 原则,编制了中国科学院动态信息资源分类体系,实现了各类子 站与主站的动态信息同步;建立了专家人才、科技产出物、院地 合作、国际交流、成果转化、政策法规等基础信息资源库,导入 了 ARP 相关信息,丰富了网站群科技信息资源,实现集中建设和 分级管理展示;建设了多媒体资料库管理点播平台,将分散在各 媒体和各单位的媒体报道、重大活动、科学探索、科普等资料进 行加工整理,统一管理和分类展现;使中国科学院网站群中的主 站与子站、子站与子站之间形成了一个有机整体。 图表 95.网站群资源整合建设方式 171 第五章 信息化应用 专栏 29: “把服务送到家门口”活动 2010 年 4 月至 8 月,网站群项目组开展了“把服务送到家门 口”支持服务工作,支持小组深入到各个分院和地区,讲解《中 科院网站群管理办法》及《操作规程》,介绍院主站情况和网站 群建设工作进展,并进行新闻撰写、操作规程及网站群内容维护 操作培训。 支持人员到现场了解信息员队伍建设、内容发布制度和运行 机制,倾听各单位对网站群建设发展的意见和建议,解决实际问 题,总参加培训人员超过 500 人,现场解决问题超过 200 项。通 过分析研究所中英文网站,他们提出栏目内容和页面展示布局修 改意见,以及具体的文字编辑建议,取得了显著成效。各单位不 但了解了网站群的整体要求和重要意义,而且推送的稿件质量有 明显提升,内容丰富,语言规范,形式多样。此次活动增进了项 目组与研究所的感情和沟通,为下一步更好地开展工作奠定了基 础。 图表 96.“送服务到家门”活动照 172 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 4.启动云计算环境下的网站群建设研究与实验 为了构建一个既充分利用网络及硬件资源随需而扩,又能节 省管理成本的网站群应用环境,支持院网站群体系的可持续发展, 网站群提出基于云计算概念建立新的网站群平台,现已建成了基 于云计算的网站群系统实验平台并构造了网络化信息发布环境, 建成 2 个研究所子网站群,形成了应用案例。为院网站群发展提 供了可操作的技术条件。 专栏 30:云计算环境下的网站群建设研究与实验 2010 年,网络化信息发布平台项目组启动了云计算环境下的 网站群扩展建设研究与实验项目,构建一个既可以充分利用网络 及硬件资源随需而扩,又能节省管理成本的网站群应用环境,为 支持院网站群体系的可持续发展提供典型案例。 该项目实验内容包括验证子网站群应用及扩展能力的可用 性、站点建设与应用管理的方便性和独立性、站点功能的丰富性、 子站群管理的安全性和可靠性、子站群资源与院网站群的整合度 与关联性等。通过试点建设云平台和子网站群,该项目组初步验 证了云计算及应用环境的适用性和可靠性,并在实验过程中不断 对系统平台进行改进和完善,满足网站群建设与应用需求,并与 院门户网站群互联互通、实现资源共享,为“十二五”院网站群 的大规模建设探索可行性。 173 第五章 信息化应用 图表 97.基于云计算的网站群实验平台体系结构图 5.6.2 特点及成效 1. 具有国立科研机构特色的网站群整体影响力不断扩大 网站群上线后,站群访问量及主域名 Cas.cn 的 Alexa 排名均 大幅上升,并荣获工信部电子科学技术情报研究所评估发布的 “2009 年中国政府网站优秀奖”。 174 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 98.主域名 Cas.cn 的 Alexa 排名情况 2.中文网站群内容建设取得长足进展 “内容为王”,这是中科院网站群建设所遵循的宗旨。近年 来,网站群主站信息的新闻实效性、科学准确性、原创性得到了 进一步加强,信息的数量和质量得到大幅提升。新版院主站栏目 设置和布局根据受众需求,突出了科研进展的报道力度、强化了 传统品牌栏目《科学在线》的建设,加大了专题制作的频度和时 效性。在编辑部方面,实行了编辑频道负责制,建立了详尽的管 理规范和编辑业务流程。 主站的信息宣传工作围绕全院宣传工作重点要点,积极策划 实施宣传报道,同时不断拓展表现形式,善于利用先进的互联网 技术,用多媒体形式立体反映中科院的各项工作成绩。为了配合 175 第五章 信息化应用 国家和科学院重大事件的报道,主站以科学的视角适时推出了大 量制作精良的专题。2009—2010 年共发布专题 40 余个,在专题 质量方面比之前有了很大提升。其中,主站精心制作的深入学习 实践科学发展观、院庆 60 周年、玉树救灾、嫦娥二号等专题或 专题网站,页面精美,内容信息丰富,展现形式多样,引起了社 会公众的极大关注,起到了良好的宣传效果,营造了科学思想的 传播氛围。 此外,《科学在线》访谈和视频直播栏目也受到了公众的积 极响应,弘扬了科学精神,普及了科学知识。2009 年 10 月以来, 主站共举办了 14 场《科学在线》活动,包括 5 位新建所所长访 谈等,关注了玉树地震灾害心理援助、展望中国八大科研领域突 破等热点问题。 专栏 31:院庆 60 周年专题网站 2009 年 9 月,根据中科院建院 60 周年宣传要求,院网站编 辑部和网站群项目组在新平台下设计、制作、发布“爱国奉献 创 新 报 国 — — 庆 祝 中 国 科 学 院 建 院 60 周 年 ” 专 题 网 站 (www.cas60.cn) 。网站设有一级栏目 19 个,二级 70 多个,设计 独立网页 48 个,整理相关文字资料约 70 万字,网站于 2009 年 9 月 21 日正式上线,此后一直及时更新相关动态消息。 院庆 60 周年专题网站使公众深入了解了中科院 60 年来的发 展历程,集中反映了中科院在各个科研领域取得了一系列举世瞩 目的成就,以及不懈努力,顽强拼搏,勇攀高峰,为中国科学事 业和社会发展作出重要贡献的几代科学家们。 176 中国科学院信息 息化发展报告 20011 中国科学院信息化发展报告2011 该 该专题网站已 已成为反映中 中科院发展历 历程的重要窗 窗口和重要 的资源 源信息库。 图表 99.院主站制作 作发布的部分 分专题首页 作 作为网站群有 有机组成部分 分的院机关各 各部门及院属 属各单位子 站,突 突出学术氛围和 和科普特色, ,形成了中科 科院网站群的 的基础。项 目组采 采取信息推送审核,基础资 资源库共建共 共享等方式,为实现发 布信息 息、传播知识、服务大众的 的工作目标奠 奠定了基础。 177 第五章 信息化应用 3.英文网站群影响力不断提升 英文版是中科院网站群建设中的一大亮点。路甬祥院长等院 领导对院属单位英文网站十分关心,指出:“英文网页是我院对 外交流和沟通世界的窗口,要充分重视,使国际同行能利用网页 了解我们,沟通合作渠道”。中科院英文网站群瞄准国外科学界 用户,突出国际化特点,以科研进展、国际合作信息为中心,突 出科学性、科普性和可读性,内容涵盖了科研部门介绍、院所动 态、科研进展、人才、招聘、国际合作、论文、公共资源等多方 面内容,强调资源整合,强化网站信息检索,让国际用户能快捷 地了解中科院,并利用相关资源。从栏目内容到页面风格,中科 院英文网站向着国际化的方向迈出了一大步。 建成前 建成后 栏目结构 各子站栏目少,内容单 一,缺失情况普遍存在 根据国外科研机构的网站设置, 进行了栏目规范设置(参考路院 长指示) 页面风格 设计 良莠不齐,普遍设计专 业性较差 美工专业设计,页面表现形式较 丰富 信息完 整度 很不完备,甚至缺乏必 要的基本信息 90%以上网站基本信息完整 更新频度 更新频度很低,长期不 更新情况普遍存在 半数以上网站能够保持在月均更 新两条信息:其余更新很少,最 近三个月不更新有 15 家 信息员 队伍 基本没有英文信息员队 伍 研究所初步配备了专(兼)职英 文信息员,质量堪优 稿件标准 没有统一的写作编辑标 准要求,稿件质量很低 经过培训,有了初步提高 图表 100.英文网站群建成前后整体情况对比 178 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 新版英文主站动态信息栏目由 1 个增加到 6 个,静态信息栏 目能做到随时更新,同时整合院属单位英文网络资源,提供英文 信息服务。信息发布数量与项目执行前相比也有了大幅提升,从 建设前发稿量 40 篇/月提升到建成后 130 篇/月。主站还协助国际 合作局加强境外的宣传工作,组织、策划并完成多次有国际影响 的重要英文专题报道。 在院网站群平台上,基于威客模式搭建了“英文内容协作平 台” (http://witkey.cas.cn/),充分利用社会力量和社会资源,帮助 英文信息更新困难的研究所将中文素材编译为符合西方受众阅 读习惯的英文新闻,满足了各院属单位英文网站内容建设和信息 更新的需求,得到了积极响应和一致好评。目前,已经有 90%以 上院属科研单位注册使用该平台,协助进行英文子站内容建设。 179 第五章 信息化应用 图表 101.网站群英文内容协作平台 180 中国科学院信息化发展报告 中国科学院信息化发展报告 2011 2011 中国科学院信息化发展报告2011 目前,网站群英文版共有文档 目前,网站群英文版共有文档 33 万余条,英文站群日均访问 万余条,英文站群日均访问 量约为 量约为 7.89 7.89 万次,来自院外的访问者数约占 万次,来自院外的访问者数约占 94%。英文主站日均 94%。英文主站日均 页面浏览量约为 页面浏览量约为 1.62 1.62 万次。 万次。 4.网站群信息共享能力显著提高 4.网站群信息共享能力显著提高 院网站群实现了各类子站与主站、子站与上级站点的动态信 院网站群实现了各类子站与主站、子站与上级站点的动态信 息推送同步功能。 息推送同步功能。主站与子站间有对应关系的信息 主站与子站间有对应关系的信息(如招生招聘、 (如招生招聘、 科研动态、会议通知等)通过数据推送方式上报,主站编辑审核 科研动态、会议通知等)通过数据推送方式上报,主站编辑审核 后发布, 后发布,站群上线以来, 站群上线以来,平均每月子站向主站推送量 平均每月子站向主站推送量 1,500 1,500 多条, 多条, 主站采用量率约 主站采用量率约 67%,子站信息可以在第一时间展现在主站上, 67%,子站信息可以在第一时间展现在主站上, 扩大影响力。 扩大影响力。 图表 图表 102.站群中文版信息关联示意图 181 181 第五章 信息化应用 站群平台同时设计实现人才专家、科技产出物(包括论文、 专利、成果、软件)等基础信息资源库的管理与展示平台,由各 研究所自行实时维护更新,同时在主站可共享使用,较充分展现 中科院的专家人才、科技成果,并使主站与子站、子站与子站之 间形成了一个有机整体。 182 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 六 信息化保障 近年来,我院已逐步建立起较为完善的信息安全保障体系、 制度规范体系和支撑服务体系,具有较完善的制度规范,和较强 的信息安全防护、支撑服务能力,形成有特色、成效显著、保障 有力、自主可控的我院统一的信息化安全保障体系,为全院的科 研与管理工作提供全面、优质的信息化保障。 6.1 安全保障 信息安全保障体系是项目和系统正常运行并发挥效力的关 键。中国科学院高度重视信息安全保障体系建设,推进信息化与 信息安全协调发展。近年来,中国科学院通过进一步理顺信息安 全工作机制和体制,完善相关管理措施,研发相关安全技术,不 断提升全院的信息安全意识,为保障信息化基础设施和信息资源 安全起到了重要作用。 从 2010 年信息化评估的数据来看,大部分研究所领导层更 加重视信息安全。相比较 2009 年定期召开信息安全相关会议的 情况,2010 年有 96.03%的研究所定期召开信息安全相关会议。 从具体的预防措施和手段来看,也比 2009 年更加细致深入,有 89.1%的研究所制定了应急预案,有 76.2%的研究所制定了灾难恢 复预案。 183 第六章 信息化保障 1.网络环境安全 中国科技网开发了网络安全监控及评估系统:在院网网络汇 聚位置部署了入侵检测系统,能够对中国科学院十二个分院的一 百多家单位的出口流量进行入侵检测,能够对网络安全入侵行为 进行安全监控;利用自主研发的网站挂马监测平台,可对我院重 要网站进行监测,及时发现被挂马的网站并通知用户处理;安全 评估系统包括主机漏洞扫描和网站安全扫描,具备对全院主机和 重要的院属网站进行一年两次安全扫描的能力,并提供解决方案 方面的技术支持服务。 专栏 32:服务上海世博会期间的院网安全保障 中国科技网安全部除了做好日常的网络安全监测和响应工 作之外,还对重大国事如每年两会召开、2008 年北京奥运会、2010 上海世博会期间提供网络安全重点保障。 2010 年 3 月,中国科技网网络中心按照上海分院针对上海世 博会进行网络安全技术支持的需求,立即采取行动,紧急制订了 上海世博会安全保障工作计划。从 3 月 22 日至 4 月 13 日,中国 科技网完成了对上海地区的网络远程安全检测,对网站备案信息 进行核查,对数十台具有弱口令问题、SQL 注入漏洞问题的电脑 进行检测和修补,并在世博开幕前组织团队协助上海分院做好安 全检查和提供现场技术支持。在世博会期间,继续严密监测网络 安全状况。 中国科技网还发挥自身技术力量和网络优势,不断地提高网 络安全的预警和监测能力。从 2010 年 6 月底开始,中国科技网 184 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 将本网络范围内监测到的用于网页挂码的活跃恶意域名信息,定 期通报给国家计算机网络应急技术处理协调中心(国家互联网应 急中心,CNCERT/CC),与 CNCERT/CC 建立了网站活跃恶意域 名数据双向通报及共享机制。 2.超算资源安全 中国科学院超级计算环境是由地理上广泛分布的通用计算 系统、专用计算系统、存储系统等通过广域网连接而形成的高性 能计算环境。为确保为分散在不同机构、不同地理位置的广大科 研工作者提供安全可靠的优质计算服务,中科院超级计算环境通 过 SSH(Secure Shell)、TLS(Transport Layer Security)、防火墙及 VPN(Virtual Private Network)等多种安全设备和机制保障计算资 源及使用者的信息安全。 在流量控制层面,中科院超级计算环境通过防火墙设备识别 并抵御来自互联网的扫描、攻击及入侵行为。在访问控制层面, 通过 LDAP(Lightweight Directory Access Protocol)、多点部署及 VPN 设备和机制,为使用者提供安全、便捷的认证及登录服务, 拒绝非授权访问请求。在数据传输层面,中科院超级计算环境利 用基于 SSH 和 TLS 的数据加密机制加密其核心网格软件 SCE 和 计算环境使用者的控制及计算数据在不同地理位置计算资源之 间的传输。因此,无论通过 Web 还是命令行方式,使用者都可以 获得中科院超级计算环境安全可靠的计算资源和数据存储服务。 185 第六章 信息化保障 3.数据资源安全 中科院数据资源中心从机房环境、网络架构、主机系统、应 用系统和数据存储等各方面采取安全保障措施。其中,机房环境 管理方面,建立机房日常巡视制度并正式实施,强化数据环境基 础设施安全保障工作。通过安全访谈咨询,着重进行安全检查、 漏洞扫描、渗透测试等具体工作,提出配套整改措施稳步构建存 储安全体系,并将数据、系统和应用等安全管理规范制定工作与 日常安保措施落实执行。同时,确保海量数据存储服务基础环境 健康稳定,并采用三级存储策略,结合按需备份,为科学数据存 储提供合理的备份策略和解决方案,稳固基础设施环境、加固网 络及系统软件、加强数据资源应急灾备响应等多方面来保障海量 数据存储服务的有效提供与便利运行。 4.ARP 系统安全 为确保 ARP 系统的安全,通过防火墙、VPN 网络的安全管 理、入侵检查系统对 ARP 系统网络进行实时监控,提高系统环境 安全;在系统与应用安全方面,主要从操作系统安全、应用系统 安全、业务系统安全方面考虑。最后,还要从系统数据保密性管 理及权限管理方面提升用户意识,确保信息的安全。 ARP 项目二期工程对安全加固做了专门的部署。经过实施, 已经初步取得了进展,ARP 整体安全防护措施得到加强。优化后 的网络支撑环境,将全院的网络层次划分为三层:涉密网、业务 专网和外网。在全院范围通过统一更新 VPN 设备,并强化相应 186 中国科学院信息 息化发展报告 20011 中国科学院信息化发展报告2011 的管理 理措施,提高了用户访问 ARP 系统的 的安全性,有 有效防止了 ARP 敏感信息遭受 敏 受恶意或非恶意的破坏和违 违规操作,并 并进一步加 强了系 系统安全的防范措施与手段 段,使 ARP 虚拟专网的管 虚 管理和运行 更加安 安全和稳定。 图表 表 103.ARP 院级安全加固 院 示意图 5.教 教育信息化系 系统安全 中 中国科学院教 教育信息化在 在建设实施过 过程中非常重 重视安全保 障工作 作。教育信息化 化项目通过网 网站提供网络 络化服务,数 数据集中存 储在中 中国科技网研究生院网络节 节点的互联网 网数据中心机 机房,教育 信息化 化项目下设有信 信息安全小组 组专门负责相 相关工作。安 安全保障工 作主要 要从三方面入手 手:第一,网 网络安全方面 面,在中国科 科技网的整 体网络 络安全框架内,自身部署了 了安全防护策 策略、防火墙 墙策略和入 侵检测 测策略;第二,服务器安全 全方面,重点 点应用服务器 器采用双机 187 第六章 信息化保障 热备方式,避免因为单机故障而影响系统的访问,安装网络版防 病毒软件,内网搭建了微软补丁升级服务器,确保系统及时更新 安全补丁;第三,教育信息化数据中心机房按照行业标准,从湿 度、温度、监控、电力、出入门禁等各方面保证机房安全运行。 同时,与国家计算机入侵防范中心密切合作,提出了一套针 对 Web 体系的安全增强方案,该方案主要涵盖中科院教育信息化 系统整个 Web 体系的风险管理以及开发运维中的安全指导,包括 渗透测试、风险评估、安全培训等可实际操作方案。安全性增强 方案的实施显著减少了教育信息化系统 Web 体系的攻击点,增强 了开发运维人员相应的安全技能与意识,显著提升了中科院教育 信息化系统 Web 体系的安全性。安全团队对教育信息化系统 Web 体系进行了较充分的黑盒测试,下一步将结合源码审核等多种方 式来进一步增强教育信息化系统 Web 体系的安全性,同时对整个 体系进行充分的安全测试和与时俱进的安全运维。 6.网站安全 院网站群运行平台,由基础网络、防火墙、DMZ 服务区、 Web 发布区、对外服务区(综合应用区) 、服务管理区(SSL VPN 内)、核心数据库区的前台发布服务器、后台管理服务器、数据 库服务器、互动应用服务器、全文检索服务器、视频点播服务器、 站群监测服务器等二十多台服务器组成。平台采用“应用和数据 分离”、“网站内容管理平台前台和后台分离”的原则进行建设, 彻底解决现网站中经常受人攻击如 SQL 注入等问题,支持百万级 页面数据资源量访问服务。 188 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 开发订制中国科学院网站群监管与评测系统,可以实现网站 性能监控和网页质量检查,并集成了声学所 HNC 研究组的“不 良信息检测系统”,能根据语义识别敏感内容,较好地保证了网 站平台和网站内容的安全。 6.2 制度规范 随着信息化工作的逐步开展,我院在夯实信息化基础建设的 同时不断强化制度规范,着力推进信息化工作的制度化、规范化 和程序化。“十一五”期间,我院已经初步建成了信息化工作制 度规范体系,加强全院统一领导和一致实施,为信息化发展奠定 了扎实的基础。 1.强化全院信息化制度规范体系 在全院工作层面,为进一步明确规范全院信息化组织管理, 明确机构职责,2009 年 5 月中国科学院办公厅印发了《中国科学 院信息化工作管理办法》,在客观认识信息化重要性(信息化是 实现中国科学院科研与管理现代化的必由之路,是提高创新能力 和国际竞争力的关键)和定位(事关我院全局和未来发展的长期 战略任务,是一项关联性强、涉及面广的复杂系统工程)的基础 上,全面明确了中国科学院信息化工作的领导决策、咨询决议、 组织管理、工程实施、运行维护、检查监理、考核评估等相关事 项,为全面推进信息化工作提供了组织架构方面的有力保障,同 189 第六章 信息化保障 时也进一步明确院信息化工作是“在院党组的领导下,实行院信 息化工作领导小组决策,院信息化工作领导小组办公室归口管理, 院机关各部门、院属各单位及相关机构分工合作,各司其职,共 同推进的管理体制。 ” 为规范院信息化专项验收工作,2010 年 4 月,中国科学院办 公厅印发了《中国科学院“十一五”信息化建设专项项目验收办 法》 (科信字〔2010〕4 号)以及《中国科学院“十一五”信息化 e-Science 示范项目及运行维护与应用支持项目的验收办法》(科 信字〔2010〕15 号) 。验收办法对“十一五”期间信息化建设专 项项目的验收组织相关工作,尤其是验收组织、验收条件、验收 申请、验收程序、验收结果及处理等方面作出了明确规定。验收 办法的发布将进一步规范信息化专项项目验收工作,保证验收质 量。 2.构建信息化项目建设、应用及运维制度规范体系 全院信息化的具体制度规范主要体现在信息化建设及各个 信息化基础设施运维及应用中,从信息化工程项目的过程规范 (招投标、项目设计、预算与报价、工程监理、项目验收等)到 具体项目实施的标准规范,互联网络、超级计算、科学数据库、 网站、科普、教育信息化、ARP 等建设过程中都研并发布了一系 列的标准规范,有效地保障了建设、运行,并促进了信息化基础 设施的应用。 (1)互联网络环境制度规范 “十一五”期间,中国科技网针对互联网络建设项目与服务 190 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 与分中心签订了运行服务任务书,对地区网的运行与服务进行规 范;对有关成本分摊机制下的收费制度确定了有关原则。中国科 技网还建立了以 ITIL 为指导思想的业务流程系统,通过信息化手 段对服务工作流程进行优化和规范,保障了运行服务质量。 (2)超级计算环境制度规范 “十一五”期间,超级计算环境建设与应用项目已经制定发 布了用户管理规范、资源共享机制的组织保障、技术保障和激励 手段,以及考核评价制度、收费管理制度等规范化文件。 为了规范超级计算中心的发展和业务,超算环境制定和建立 了《中国科学院超级计算环境运维及共享管理办法(试行)》、 《中 国科学院超级计算环境用户服务细则(试行)》、《中国科学院超 级计算环境收费细则(试行)》等规范和制度。它们的施行使超 级计算中心的业务和管理水平迈上了新的台阶。 (3)数据应用环境制度规范 “十一五”期间,数据应用环境制定、发布的系列标准规范 27 项,涉及数据资源加工与建库、元数据、数据资源集成应用和 数据共享政策与管理等,并在科学数据库项目中得到推广应用, 包括用于支持数据服务网站、数据库系统和数据网格开发,以及 数据存储管理与服务等。 序号 名称 1 主题数据库建设规范 2 专题数据库建设规范 3 参考型数据库建设规范 4 专业数据库建设规范 5 数据资源加工指导规范 191 第六章 信息化保障 6 学科领域数据处理和加工规范 --地学领域数据处理和加工规范 7 元数据参考模型 8 科学数据库数据集核心元数据规范 9 学科领域数据集元数据应用规范 --人地系统主题数据库元数据标准 10 学科领域科学数据元数据规范 --土壤科学数据库元数据标准 11 资源唯一标识规范 12 科学数据分类规范与分类词表 13 数据加工增值管理方法 14 建库技术指导规范 15 元数据访问服务接口规范 16 数据跨域互操作技术规范 17 跨域用户认证接口规范 18 数据库服务网站建设指导规范 19 数据服务指导性规范 20 海量存储设施运维与服务规范 21 数据应用环境建设与服务标准规范框架 22 数据库建设技术文档参考规范 23 数据质量管理规范 24 数据质量评测方法与指标体系 25 共享服务评价指标体系 26 数据托管存储管理办法 27 数据共享办法 图表 104.数据应用环境相关标准规范 (4)ARP 相关规章制度 在 ARP 项目一期工程实施过程中,制定了《ARP 系统运行 管理规范》 、《ARP 系统基础数据质量检查规范》等一系列规范。 在二期建设过程中注重标准先行,编制了一套《ARP 标准规范》。 规范是在院相关职能部门的指导下进行的,先后有数百人参加了 192 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 工作,梳理业务流程 264 个,设计数据实体表 746 个,涵盖了日 常科研管理的主要方面,基本符合目前中国科学院科研管理的实 际需求。经过参与项目专家、用户、一线管理人员的共同努力、 深入研究,一部近百万字的《ARP 标准规范》编纂完成,其内容 覆盖了《ARP 管理规范》、 《ARP 应用规范》和《ARP 技术规范》 三个部分。 《ARP 标准规范》不仅可以有效支持应用系统的建设, 而且将促进我院科研管理工作的规范和流程优化。 ARP 项目二期工程目前已经编纂完成的标准和规范如下: 序号 名称 1 《ARP 系统组织管理规范》 2 《业务系统管理规范》 3 《数据管理规范》 4 《安全管理规范》 5 《运行与维护管理规范》 6 《基础数据质量检查规范》 7 《应用推进规范》 8 《应用推进评价规范》 9 《ARP 系统安全体系技术规范》 10 《ARP 系统运行环境技术规范》 11 《ARP 所级系统支撑平台技术规范》 12 《应用系统开发与实施技术规范》 13 《系统监控与运维服务技术规范》 图表 105.ARP(二期)管理制度与规范 (5)教育信息化规章制度 中国科学院“十一五”教育信息化项目组在项目建设的同时, 制定了相应的项目开发和项目管理的规章制度和相应的规范,以 保证项目的建设和应用效果。 193 第六章 信息化保障 序号 名称 1 教育信息化项目文档及设备管理制度 2 项目组考勤管理制度(试行) 3 配置管理制度规范 4 《中国科学院研究生院信息化建设管理办法(试行)》(院 发网络字[2007]299 号) 图表 106.教育信息化项目管理制度与规范 (6)网络化科普制度规范 2009 年,网络化科学传播平台的标准规范组完成了用于指导 和规范我院网络科普资源建设的 19 项标准,并组织院内研究所 参加了标准规范适用性的问卷调查和使用培训,确保了标准规范 的实用性和使用效果。 序号 名称 1 网络化科学传播平台项目管理办法(试行) 2 网络科学传播资源共享办法 3 网络科普资源描述元数据标准(试行) 4 数字化科普资源库标准(试行) 5 专业科普网站建设规范 6 虚拟实践中心建设规范 7 虚拟博物馆建设规范 8 所网站科普栏目建设规范 9 科普专题建设规范 10 门户建设规范 11 网络科普资源质量控制和评估标准 12 网络科普资源和信息提交、发布、更新管理办法 13 安全技术规范和管理制度 194 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 14 网络化科学传播平台运行管理制度 15 网络化科学传播平台运行效果评估办法 16 网络科普资源唯一标识符 17 网络化科学传播平台知识产权管理办法 18 网络化科学传播平台项目验收办法 19 研究所网络科普工作考核评估体系和评估指标 图表 107.网络化科学传播平台标准规范 (7)网站群规章制度 为进一步提高了整个网站群内容建设的水平和质量,中科院 网站群在建设过程中同步开展了相关标准规范体系建设工作,完 成了《中国科学院网站群管理办法》和《中国科学院关于网站群 工作的指导意见》的制定。为保障中国科学院网站群体系建设与 运行,推进站群内容建设,规范院网站群建设及运维中的栏目框 架设计、页面设计、模板制作、功能实现等,起到了关键性作用。 序号 名称 1 《中国科学院网站群管理办法》(暂行) 2 《中国科学院网站群内容管理操作规程》 3 《中国科学院关于加强我院网站群工作的指导意见》 4 《中国科学院网站群技术规范》 图表 108.网站群管理制度与规范 在此过程中,我院还培养了一支专业的标准规范工作队伍, 在完成院信息化工作标准规范的基础上,也承担或参与国家标准、 国际标准的相关工作,如科学数据中心与我院生态科学家一起完 成了国标《生态科学数据元数据(GB/T 20533-2006)》,并在 195 第六章 信息化保障 CODATA 中 委 会 支 持 下 承 担 完 成 了 《 Gas Hydrate Markup Language》国际标准的工作。而且,部分标准规范工作团队已经 发展为国家标准或国际标准的重要组成或联络机构,并于其中担 任重要职务。 6.3 支撑服务 伴随着信息化基础环境建设的日益完善,我院信息化建设正 在从大规模建设阶段专项建设与运维并举的发展阶段,在全院层 面建立了以用户委员会为核心,专家委员会参与的信息化基础设 施及公共平台的运行监督机制,各信息化基础设施及公共平台必 须委托第三方进行日常运行服务质量的满意度调查,根据用户满 意度调查结果提出改进措施,并向用户委员会报告,接受用户委 员会的质询和监督;院机关主要根据用户意见予以核拨运行经费, 从而建立了以用户为核心的服务质量监督的制度。目前,已建立 了互联网络、超级计算、教育信息化用户委员会,其他用户委员 会正在筹备过程中。此外,从 2010 年 3 月起,院信息办、院计 算机网络信息中心每季度向全院每个研究所提供《院信息化设施 运行与服务季度简报》 。从 2010 年 5 月起,院信息办面向院领导 及机关各部门领导发布《中国科学院信息化设施运行与服务月 报》,主要通报互联网络、超级计算、数据应用环境等信息化基 础设施,ARP 系统、教育信息化、院网站群系统、网络化科学传 播平台等信息化主要应用系统及平台,以及国家域名系统的月度 运行服务情况。从 2010 年 9 月起,院安保办、信息办向院属各 196 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 单位、院机关各部门发布《中国科学院网络与信息安全情况通报》, 通报院网络安全运行整体情况、院重点计算机安全防护、网络安 全漏洞以及院网站群安全防护情况。 在院信息化基础设施日常运行服务层面,院计算机网络信息 中心及研究生院各运行部门在满足我院需求现状的基础上探索 建立了“服务当前、面向未来”的支撑运维机制,特别是“十一 五”期间分别构建了符合各自特点的运维体系,如科技网的“总 中心—地区分中心—研究所”三级管理与运维体系、科学数据库 的面向学科领域的数据服务专员机制、ARP 的“院中心—区域信 息化分中心—研究所”三级运维体系、科普的“科普联盟—各研 究所”网络,并分别建设了基础设施环境运维和用户服务的队伍, 保证互联网络、超级计算机、科学数据库、ARP 等基础设施能够 服务一线科研活动,同时能够助推院科研信息化工作的进步,引 领信息化工作的持续发展。 1.科技网 —— “总中心—地区分中心—研究所”三级管理 与运维体系 科技网的“总中心—地区分中心—研究所”三级管理与运维 体系已经发展的较为成熟,通过工作流程规范化实现了体系内的 统一管理,“总中心—地区分中心—研究所”各司其职、分工协 作、互相配合,共同服务于科技网的管理、运维和服务。科技网 总中心全面负责中国科技网建设与管理、运行与维护,提供全面 的技术支持与服务,重点承担核心网、骨干网(北京到各分院、 独立所广域网)、北京地区网、国际国内互联等方面的业务。12 197 第六章 信息化保障 个地区分中心遍布全国,依托分院设置,主要负责管理分院地区 网以及当地网络运行管理与技术支持,是总中心和研究所之间的 桥梁与纽带,面向科研一线提供技术支持。研究所网络中心则针 对本单位一线科学家的需求,负责本所网络运行管理与信息化应 用,把科技网提供的服务推送到科研一线。 2.超级计算环境 —— “总中心—分中心—所级中心”三层 架构 为实现院超级计算环境的统一管理;超算环境已初步建成相 应的技术支持队伍,提供超级计算技术支持和应用服务。面向全 院,提供计算机时、HPC 咨询、技术支持、HPC 培训等四个方面 的支撑服务。 计算机时:在现有百万亿次超级计算机的基础上,通过聚合 院超级计算环境的三层架构可提供丰富的计算资源、稳定持续 7 ×24 小时的计算机时以及专业技术支持; HPC 咨询:面向用户需求拟定适合应用的集群解决方案,对 HPC 系统进行基准测试,建立 HPC 运行管理策略; 技术支持:利用现有的上百种软件,提供包括专业软件应用 服务与支持、基础并行软件开发、并行应用软件开发及性能优化、 科学计算可视化、科学计算网格和远程技术支撑等服务项目; HPC 培训:包括高性能计算培训,HPC 系统安装配置,作业 调度系统的安装配置及管理、HPC 系统运行管理、网格计算服务 及网格应用和专业应用软件使用。 3.科学数据环境 —— 围绕科学数据生命周期的五项服务 198 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 科学数据中心是提供数据应用服务的核心部分,设置了包括 数据服务、系统运维、支撑软件、应用服务、推广发展。 数据服务即以科研和应用需求牵引科学数据资源建设,组织 全院重要数据资源的长期保存与管理,组织对数据资源的加工、 整编与整合,通过科学数据服务门户面向全院服务,逐步形成按 学科布局的数据服务专员机制,同时制定科学数据相关的标准规 范。 系统运维即负责全院科学数据管理与共享的公共基础设施 建设与运行维护,向全院提供海量科学数据灾备管理、重要数据 资产的长期保存与网络存储空间服务,构建海量科学数据的分析 处理环境和在线服务环境,建立适用的数据安全管理机制和运行 保障机制。 支撑软件即开展科学数据管理、共享与应用的共性需求的应 用技术研究与开发,支撑科学数据中心开展各项数据服务,并为 全院数据应用环境建设与服务提供软件工具、IT 技术支持、服务 与培训。 应用服务即面向中科院科研活动信息化需求,结合院和国家 重大科研、工程项目或联合院属科研单位,与科研人员密切配合, 构建、研发各种数据加工、分析、处理与应用的环境、软件工具 等,支撑和推动科学数据在科研活动中的应用。 推广发展即组织和参与全院科学数据库发展需求调研、战略 研究与服务推广活动,组织数据用户培训与科学数据库技术培训, 负责科学数据中心数据资源、存储资源和应用技术等服务的宣传 推广,并依托 CODATA 中委会秘书处、W3C 中科院秘书处,协 调开展国际、国内数据科学和网络应用技术标准的交流与合作。 199 第六章 信息化保障 4.ARP —— “院中心—区域信息化分中心—研究所”三级 运维体系 为加强 ARP 的推广应用、提升服务水平 ARP 建立了运维服 务平台,以确保用户提出的问题及需求得到及时反馈。该平台的 建设参考了 IT 服务管理领域的标准 ITIL,建立了基于 CTI 的企 业级呼叫中心,充分利用电信技术与计算机网络技术,使各种信 息数据能够及时、远程、方便地处理。系统支撑环境在语音系统、 服务模式、服务流程等方面加大了推进力度,支撑环境建设得到 全面改善。ARP 项目二期工程于 2009 年初完成了 ARP 系统监控 平台和运维服务平台的建设工作,提高了系统监控和运维能力。 在运维服务平台的基础上,进一步完善了运维网站 (http://www.arp.cn)的建设,并与网络科普教育中心一起合作建 设了一个以网络为基础、依靠良好的网络环境、建设丰富的多媒 体培训课件资源、面向全院各研究所用户的远程培训管理的 ARP 在线学习平台(http://train.cnic.cn),通过该平台用户可以完成课 程的学习并与教师进行教学互动,方便了 ARP 中心与用户之间的 进一步沟通和交流。 2010 年推出了新版 ARP 运维服务支持网站。 新版网站对原有频道进行了调整,内容更丰富。截至 2010 年底, ARP 运维服务支持网站注册用户约 3,210 名。新版网站有效提高 了用户检索效率,增加了互动栏目,能够获取大量用户需求,使 得科研管理工作中遇到的问题得到快速响应;优化了系统支撑环 境,从 2008 年起开展多种形式的主动服务,2010 年度针对重大 问题的主动服务 73 次,涉及 20,557 人次。进一步丰富 ARP 运维 200 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 知识库,本年度合计整理 791 条知识点, 全年访问人次数为 15,065。 为了进一步加强区域组织协调工作的组织,充分发挥区域协 调作用,本年度召开了多次区域信息化协作会,分别在十三个地 区(包括合肥)初步建立了区域化信息化协调中心,并提供了相 应的硬件及经费支持。 5.网站群 —— 统一平台与运维团队提供强大技术保障 随着中科院网站群上线,由院主站+子站的分级管理运维体 系随之形成:办公厅负责中文各网站内容建设工作的指导与协调; 国际合作局负责英文各网站内容建设工作的指导与协调;信息办 负责院网站群项目建设、技术支撑和运行保障的指导与组织协调 工作。院机关各部门和院属各单位通过院统一建设的院网站群平 台,按照“统一管理,各负其责”的原则,全面承担本单位(部 门)中英文子站建设与运行管理,负责内容建设和日常维护工作。 科学时报社设立了院网站群中英文编辑部,负责院网站群中 英文版内容的整体建设、组织协调和检查评估工作,为院网站群 各子站的内容建设提供培训、支持与服务;计算机网络信息中心 设立了院网站群技术部,负责院网站群平台的管理维护、技术保 障和运行监控工作,为院网站群各子站的运行维护提供培训、支 持与服务。 201 第六章 信息化保障 第六章 信息化保障 图表 109.中科院网站群内容管理与技术保障工作流程图 图表 109.中科院网站群内容管理与技术保障工作流程图 网站群技术支持方面,建立了网站群支持服务与技术交流平 网站群技术支持方面,建立了网站群支持服务与技术交流平 台,开通热线电话(010-68597001),加强安全监控,协助各子站 台,开通热线电话(010-68597001),加强安全监控,协助各子站 管理员进行页面改版或专题建设,不断进行平台网络环境优化和 管理员进行页面改版或专题建设,不断进行平台网络环境优化和 内容管理系统功能改进,并组织多次不同层次培训形成院所两级 内容管理系统功能改进,并组织多次不同层次培训形成院所两级 运维体系,开展“把服务送到家门口”活动,编制月度运行报告 运维体系,开展“把服务送到家门口”活动,编制月度运行报告 和季度内容建设情况通报,为院主站、院属单位各子站的建设应 和季度内容建设情况通报,为院主站、院属单位各子站的建设应 用提供强大技术保障。 用提供强大技术保障。 网站群平台建设开发的站群监管与评测系统。系统包括面向 网站群平台建设开发的站群监管与评测系统。系统包括面向 公众展示的“访问统计分析系统”(http://stat.cas.cn)、面向各级子 公众展示的“访问统计分析系统”(http://stat.cas.cn)、面向各级子 站管理员的“运行监测平台”两部分及面向机房管理员的监控系 站管理员的“运行监测平台”两部分及面向机房管理员的监控系 统。其中“访问统计分析系统”面向互联网公众,可以在院主站 统。其中“访问统计分析系统”面向互联网公众,可以在院主站 首页上直接进入,直接查看中英文各子站的访问情况、新闻排行、 首页上直接进入, 直接查看中英文各子站的访问情况、新闻排行、 文档更新、主站收录、子站推送数据等信息,可以查看网站群整 202 文档更新、主站收录、子站推送数据等信息,可以查看网站群整 202 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 体访问情况排名、文档更新排名、收录量排名、热点新闻排名以 及全球访问来源监测等信息,并集成了声学所HNC研究组的“不 良信息检测系统”。系统的应用为形成“以评促建”的网站群发 展氛围创造了良好条件。 6.教育信息化 —— 呼叫中心提供多维、立体服务 研究生院网络信息中心是教育信息化环境建设及运行保障 部门,主要负责教育信息化平台的运行维护、网络教学资源平台 的建设与运行维护等。 中国科学院教育信息化呼叫中心主要提供技术支持、业务咨 询与查询、投诉与建议受理功能。服务方式采用以用户拨入为主、 座席外拨为辅,服务资源以人工座席服务为主、自动语音服务为 辅,在服务过程中充分利用 CTI 的自动路由分配策略,最大限度 地利用服务资源。除了电话接入外,还提供邮件、WEBCHAT、 技术支持网站等多种方式,从而构建起一个多维、立体的服务系 统。 服务对象与内容:面向中国科学院各培养单位提供教育业务 管理平台服务,涵盖了教师系统、招生系统、注册系统、学籍系 统、教务系统、学工系统、培养管理系统、学位系统、就业系统、 校友系统、空中课堂、课程网站、培养指导系统等;面向中国科 学院各级单位提供继续教育平台服务,包括继续教育业务系统、 继续教育网和培训学习网;面向中国科学院研究生院教学园区, 提供校园网络维护服务。 203 第六章 信息化保障 图表 110.中国科学院研究生院信息化组织结构图 7.网络化科普 —— 以专职人员+外围团队方式提供多层面 服务 网络科普教育中心现有正式员工 27 人,其中硕士 15 人,学 士 11 人,其中包括网络科普内容策划和编辑人员、美术设计人员、 二维三维动画制作人员、视频摄制人员、软件开发人员、科普活 动组织和宣传人员,以及网络系统运维人员。此外,还拥有一支 由数十位学科领域专家和十多位实习生、兼职人员组成的外围团 队,拥有丰富的网络科普资源和创作经验。网络科普教育中心面 向全院全社会提供网络科普存储环境、安全环境等基础运行环境 服务;提供科普作品创作工具、软件和平台服务;提供数字化科 普展板、展品、二维三维动画、影视动画等多媒体科普作品的创 意策划和设计开发服务,以及提供科普网站的设计开发和科学教 育系列产品的策划服务等。 204 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 七 信息化环境 经过几年的建设,我院信息化工作已经由大规模建设阶段逐 步转入“建设与服务并重,着力深化应用”的新阶段。在此阶段, 我院信息化工作将进一步加大深化信息化应用实施力度,加强信 息化培训和交流,进一步提升信息化绩效;充分注重以服务促建 设、以应用促效益,更加注重信息化软环境的建设;进一步完善 政策环境,充实人才队伍,不断提升人力资源水平,重视宣传推 广,在全院范围内营造良好的信息化发展环境。 7.1 政策环境 为了信息化战略的具体部署和落实,2009 年—2010 年间中 科院相继发布了信息化政策和工作文件,全方位指导和推进院信 息化工作的部署和实施。 2009 年 10 月下发《中国科学院关于进一步推进院属单位信 息化工作的指导意见》(科发办字〔2009〕198 号) ,指导基层研 究机构的信息化战略研制和信息工作实施。指导意见明确了全院 信息化工作的指导思想及基本原则,从工作机制、基础设施建设、 管理信息化建设、信息化归口部门、制度规范、网络信息安全技 术保障、信息化培训和评估激励机制、信息化工作宣传、日常经 费预算等方面,对院属各单位的信息化工作提出了全面要求,进 一步推进院属单位信息化工作。 205 第七章 信息化环境 自 2009 年起,中国科学院每年发布全院信息化工作要点, 指出新一年度全院信息化工作要点和方向,极大促进了信息化工 作的推进和落实。 上述一系列政策制度的相继发布,已经初步形成了中科院信 息化工作的制度体系,加强了全院的统一领导和贯彻实施,全面 促进了信息化工作。 7.2 人才队伍 为了促进人才队伍的健康发展,我院多策并举,推动信息化 人才梯队素质提升,在信息化工作中锻炼、培养了大批的优秀人 才,全方位培养信息化的队伍,特别是强化科技人员的 IT 素质, 培养高素质的学科领域的信息专家,形成了面向“所级信息化管 理人员、信息化建设人员、信息化用户”的三层分类别、多渠道、 多形式、重实效的信息化培训体系。同时,我院还举办了多期信 息化局级领导研讨班和信息化主管干部培训班。 7.3 文化环境 在推进信息化建设及应用的同时,我院开展多层面的信息化 宣传工作,初步形成以“一网多刊”为主的院信息化工作宣传格 局,进一步营造了全院良好的信息化氛围。 院信息化网站(www.ecas.cn)将成为方便、快捷了解我院信 息化工作的窗口。信息化工作网站定位服务于全院信息化工作, 206 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 以“需求牵引、开放前瞻、整合资源、服务第一”为目标,设置 “组织体系、规章制度、信息资源、项目管理、新闻动态、教育 培训”等栏目,及时反馈最新工作动态,推广我院信息化资源, 促进信息化学习及经验交流经验,逐步成为展示我院信息化工作 的窗口。 图表 111.中国科学院信息化网站 207 第七章 信息化环境 出版发行了《科研信息化技术与应用》 (CN11-5943/TP)、 《信 息化工作动态》、 《信息化研究与应用快报》、《科研信息化年度资 料汇编》、 《专题调研报告》等交流刊物。2010 年 2 月 21 日,经 过国家新闻出版总署批准, 《科研信息化技术与应用》获得 CN 刊 号—CN11-5943/TP,这是 2008 年创刊以来,刊物取得的又一实 质性重大进展。 208 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 八 信息化交流与合作 近年来,中国科学院持续加强与国际国内相关组织机构的合 作,通过共建项目、人员交流、会议论坛等活动,增强了我院与 世界各国、国内各地方在信息化理论与战略、信息化工作经验与 成果等方面的交流,互通有无,取长补短,促进了我院信息化工 作的发展。 2009 年 12 月,中科院与科技部、基金委成功举办首届“中 国科研信息化论坛”,来自国务院有关部委、科研机构的领导及 专家近 300 人参加会议。此次论坛全面宣传了科研信息化的理念 及我院开展的工作,科研信息化的重大意义和作用得到国家主管 部门、科技界的广泛认同和响应,发挥了我院科研信息化领域的 示范引领作用。 图表 112.中国科研信息化论坛 209 第八章 信息化交流与合作 8.1 院地合作 1.与广东省科学中心等单位合作,开展科教创意产业共性技 术研究与应用 2009 年至 2010 年,中国科学院计算机网络信息中心分别与 广东省科学中心、东莞市科技博物馆以及东莞市新南方科教投资 有限公司合作,开展“科教创意产业关键共性技术” 、“电子信息 产业集群云服务公共培训学习平台”的研究与应用,并获得了“广 东省中国科学院全面战略合作”专项资金和“广东省产学研项目” 专项资金的支持。 2.与卧龙保护基地合作,开发大熊猫远程观测系统 与四川卧龙大熊猫保护中心合作,在卧龙大熊猫保护区域 (现在雅安)安装设置网络摄像头,为公众提供通过网络远程实 时观测大熊猫的渠道。 3.与中国青少年基金会合作,让中国科普博览走进中小学课 堂 与中国青少年基金会合作,精选中国科普博览的特色资源, 策划和出版了面向中小学生的科普读物,以及面向教师的科普教 材和课件,并为希望工程提供了“志愿者培训与互动平台”,使 希望工程的志愿者能在线注册、培训、接受管理以及分享经验。 4.与中国科技馆合作,开展新媒体上科普应用的研究 针对目前新媒体的发展情况,结合双方的科普实践工作,与 210 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 中国科技馆开展了关于在移动互联网上开展网络科普工作的研 究,并推出《移动互联网科普产品开发规律与运作机制研究报告》。 5.与北京昌平旅游局合作,打造昌平旅游信息化综合服务平 台 2010 年,与昌平区旅游局合作,联合策划昌平区农村信息化 综合服务平台,为昌平区构建集“吃、住、行、游、娱、购”于 一体的旅游信息服务平台和昌平农村旅游一卡通、手机昌平游等 增值产品和服务,促进昌平农村经经济社会的快速发展。 6.与北京青少年俱乐部合作,开展多种科普项目 与北京青少年俱乐部合作,定期摄制科学家讲座、报告,通 过网络视频点播系统向公众提供服务;共同策划“北京市中小学 科技公开课活动周”,结合网上的科普主题组织院士专家走进学 校,向学生普及相关科学知识。 7.与北京计生委合作,支持计生科普工作的网络化展示 与北京计生委合作,设计开发了“925 避孕生殖健康网”,并 利用网络多媒体技术,设计了“孕育健康”虚拟博物馆”、“男性 生殖健康”虚拟博物馆等兼具知识性和互动性的内容,有力地支 持了计生委的科普工作。 8.通过参与数字科技馆的建设,与多家单位开展合作与交流 在参与 2006 年—2009 年中国数字科技馆建设期间,与南京 大学、北京航空航天大学、香港中文大学等十多家院外单位就项 211 第八章 信息化交流与合作 目建设和技术交流开展了广泛的合作。 9.与媒体开展广泛合作 中国科学院计算机网络信息中心通过开展丰富的科普活动、 参与科普实践,与国内外 20 多家媒体达成了广泛合作,尤其与 新浪、搜狐、腾讯、网易、新华网、人民网等科技频道达成长期 合作,定期在上述媒体上发布平台建设的最新内容,有效提高了 网络化科学传播平台的影响力。 10.“三方两地”合作共建“达尔文树——分子数据分析平台” 计算机网络信息中心与中国科学院植物研究所、深圳市中国 科学院仙湖植物园“三方两地”合作共建“达尔文树——分子数 据分析平台”,实现了数据资源、计算模型和分析工具的集成, 现已投入使用。 11.与北京市合作共建北京超级云计算中心 超级计算中心与北京市积极合作,积极开展成立北京超级云 计算中心的筹备,为其早日成立打下良好的基础。同时,与北京 市公安局在指纹快速识别系统上积极合作,通过算法优化和程序 优化,提供快速、大通量指纹识别程序。 8.2 国际/地区合作 中科院充分利用在国际交流中的优势,特别是依托在中科院 212 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 有关单位的部分国际机构在华分支机构,如 CODATA 中国委员会、 WDC 中国学科分中心等,促进院信息化与国际信息化领先机构 的合作与交流。 中国科学院国家科学图书馆积极促进国际信息资源与服务 的交流合作,参与国际科技信息发展。与 Google 合作,将自建的 全国外文期刊联合目录和全院图书联合目录纳入 Google Scholar 服务之中;与美国汤姆森科技信息集团合作,将自建的中国科学 引文数据库纳入 Web of Knowledge 平台集成检索;牵头与德国文 献传递机构 subito 合作,建立了 subito-China Direct 服务系统;瞄 准国际发展,主动策划组织高层国际交流,两次主办“数字资源 长期保存国际会议”,牵头组织数字图书馆知识产权热点国际研 讨会,牵头组织中德图书馆数字信息服务合作伙伴项目,组织中 美数字图书馆高级研讨班,积极参与和美国斯坦福大学、国际数 字资源开放保存联盟(COAR) 、国际图书馆电子信息联盟(eIFL) 等的合作,9 位同志担任国际图书馆协会与机构联合会(国际图 联)管理委员会和学术委员会委员。2010 年 10 月 25-27 日,与 马普学会联合举办第八次开放获取柏林国际会议,这是该会议首 次在欧洲以外的国家举行的一次盛会。 “十一五”期间,中科院计算机网络信息中心与多家国际机 构广泛开展关于网络科学传播的交流与合作。与法国第八大学雷 顿实验室就建立“中法双方新媒体科学文化研究中心”达成初步 合作意向;与美国“中国旅美科技协会” (CAST-USA)协商开展 双方科学传播和科教旅游的合作;与美国西北大学探讨科普资源 的共享问题;与台湾中研院讨论设立中国科普博览镜像站点事宜, 以及与台湾嘉义市天文协会开展 2009 日全食多路联合直播活动 213 第八章 信息化交流与合作 等。其中,与美国德州农工大学的合作以及与国际极地年组织的 合作具有典型意义。为了汲取世界顶级超级计算中心成功发展的 经验,提升超级计算中心的技术水平,扩大国际影响力,中科院 计算机网络信息中心与美国国家超级计算应用中心(NCSA)于 2009 年 9 月在北京签署战略合作备忘录,开创了双方的长期战略 合作关系。根据战略合作备忘录,中科院计算机网络信息中心下 属的超级计算中心圆满完成了每年召开的中美高端信息化研讨 会 —— ACCESS09 的组织工作并积极参与了 ACCESS10 会议, 同时,积极派出人员与对方开展项目合作研究。IESP(International Exascale Software Project)是美国 DOE 和 NSF 联合资助的支持 E 级计算机软件研发的先导性国际合作项目。从 2009 年起,超级 计算中心积极地参与到项目中去,追踪并发数、功耗、异构、容 错及恢复机制、I/O 与内存对下一代高性能计算机系统软件和应 用软件的影响,为 E 级计算时代的到来,积极做好准备。 2010 年,国际科学技术数据委员会(CODATA)中国委员会 积极牵头并参与多项国际活动,在 CODATA 组织中继续发挥重要 作用。其中,2010 年 3 月 29—31 日,第四届“中美双边科技数 据合作交流圆桌会议”在美国洛杉矶尔湾市召开。中科院副秘书 长谭铁牛作了题为:“基于先进科研信息化基础设施的中科院科研 数据应用”的主题报告,郭华东研究员发表了题为“中国的全球 变化研究和数据共享状况”的主题发言。中美双方就遥感数据、 地震数据、环境数据、医学数据等方面的数据共享和信息基础设 施互联等进行深入探讨。10 月 24—27 日,第 22 届国际 CODATA 学术会议在南非开普敦举行。依托 CODATA 中委会,策划编辑《科 学数据通讯》,刊登科学数据领域国内外动态,推荐优质数据资 214 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 源,并发布中科院科学数据库运行服务报告,推进数据应用环境 的交流和宣传服务。 215 展望篇 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 一 中国科学院信息化发展的外部环境 科学技术是第一生产力,随着科学研究的日益复杂化和信息通信技 术的迅猛发展,为抢占发展先机,世界各国竞相开展各种信息化建设, 而且不约而同地将重心放在科研信息化发展上,纷纷投入巨资建设核心 的信息化基础设施,谋求为具有不同特点与需求的用户提供他们所需的 各种服务。其中,围绕超级计算机建设展开的竞争显得尤为激烈。超级 计算机 500 强排行榜期期都有变化,虽然我国在计算速度方面已走在世 界前列,但在核心器件尤其是应用方面仍与发达国家存在很大差距。新 兴的虚拟技术和云计算作为未来发展的重要趋势,已经普遍引起全球科 学界的强烈关注,为我们带来了新的机遇。科研信息化的深入发展为正 处于起步阶段的信息化科研管理带来了极大挑战,许多科研教育机构积 极投入科研管理系统的开发与集成,以实现对科研活动的深度管理。此 外,教育信息化成为各国信息化建设的又一项重点,利用 IT 技术更好 地辅助和促进教育活动、落实教育理念,并加强相关的标准化建设成为 教育信息化发展的重要方向。 1. 科研信息化模式转变成为潮流 随着现代科学从微观和宏观两个层面向纵深发展,科学研究变得空 前复杂化,通信和计算机技术已成为目前科研活动的必备手段,同时科 研信息和科研设备的共享,以及全世界科研人员间跨领域跨地域的合作 也变得前所未有的重要,科研信息化在此形势下应运而生。科研信息化 217 第九章 中国科学院信息化发展的外部环境 是建立在新一代网络技术和网格基础上的全新科学研究模式,受到了世 界 各 国 的 共 同 瞩 目 , 以 英 国 的 e-Science 计 划 和 美 国 的 Cyber-Infrastructure 为首,许多国家都从政府层面部署了推进科研信息 化的计划,致力于开展信息化基础设施建设和科研信息化应用。 此外,日渐庞大和泛滥的数据催生了数据密集型科学研究。微软公 司在其 2009 年 10 月发布的《第四模式:数据密集型科学发现》论文集 41 中明确指出,随着科学越来越依靠于计算和数据,如何更好地获取、分 析科学信息,如何将之模型化、可视化,最终辅助科研人员、决策者和 公众作出明智决策是该科学模式面临的重大技术挑战。 2. 信息化基础设施转向“以服务为导向” 随着信息化基础设施被越来越多的具有不同特点和需求的用户所 使用(尤其是那些没有专门IT基础设施或支持的小团体),信息化基础 设施开始加速从“以技术或产品为导向”转向“以服务为导向”,并日 益商品化,其面临的一大挑战是通过多种方式在商品化过程中展现用户 的利益 42。 从用户的角度来说,信息化基础设施应当提供无缝的交互式服务。 构建一个统一的信息化基础设施服务模型需要网络服务、高性能服务、 商用计算服务和数据管理服务的密切协调。网络服务需要采取新的治理 原则和方法,有针对性地管理和资助网络基础设施的混合使用;对高性 能计算服务需要重新检验目前使用的大量软件;商用计算面临的关键挑 战是通过设置性能和可靠性等标准要求提高透明度;而对于大多数研究 领域至关重要的数据管理,需要将不同的数据需求汇集成一组通用服务, 这也为未来数据网络的架构提出了新的要求。 218 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 3. 超大规模并行计算备受重视 2009 年—2010 年,美国能源部先进科学计算研究项目(ASCR)与 其他科学项目合作召开了一系列会议,确认了发展超大规模计算尤其是 百亿亿次(exascale)计算的必要性及其对基础学科、能源环境、生物 学、国家安全、材料等学科研究的重要性 43。2010 年初,美国、英国、 俄罗斯、加拿大等多个国家达成协议,将共同资助百亿亿次超级计算软 件的开发项目, 预计在 2019 年实现,比目前最快的计算机强大 1000 倍, 并将重点用于气候变化、能源、水资源、环境领域的研究 44。2010 年 5 月 30 日,“国际百亿亿次软件项目”(International Exascale Software Project, IESP)技术路线图发布,旨在为建立一个共同的开源科学计算 软件基础设施提供指导,使领先的科学工程研究团体能利用百亿亿次计 算平台实现各种应用。该计算平台将在 2018-2020 年间上线,被称为“极 端/百亿亿次软件堆栈”(X-stack) 45。此外,超级计算开始逐渐被用于 开展社会和经济分析,欧洲科学家正计划利用超级计算机模拟地球上的 人类生活,包括模拟金融系统、经济和整个社会 46。 然而,百亿亿次计算也面临着软硬件挑战。硬件方面最大的挑战是 降低运行(包括冷却系统)所需的耗电量,而软件挑战包括可恢复性与 可靠性管理、能源控制、资源规划、输入/输出和编程。 4. 虚拟科研组织日益重要 虚拟科研组织(VO)可以突破地理位置的限制,聚集世界各地的 科研人员,对昂贵的设备进行优化使用,解决各种复杂问题。因此,美 国和欧盟都将虚拟科研组织视为未来科研信息化的重要组成领域。美国 219 第九章 中国科学院信息化发展的外部环境 政府已率先开始在生物医学、海洋学、天体物理学、分子生物学和核科 学等领域建设虚拟实验室 47,而欧盟计划建立更强大的欧洲虚拟科研共 同体,促进最优方法、软件和数据的共享 48。然而,虚拟科研组织也面 临着可持续性发展,所需计算资源与数据共享平台能力不足,不同学科、 文化和观念之间存在潜在冲突,以及法律和道德问题等挑战。 2010 年 1 月,英国联合信息系统委员会(JISC)发布了《虚拟研究 环境协作概况》研究报告 49,为VO的建设提出了相关建议:①将虚拟 科研组织视为研究社区建设项目而非技术项目,确保VO在未来中长期 的持续性,建立相关组织来协调国际合作活动;②VO有助于访问数据、 工具、计算资源和合作者等,从而带来更快速的研究结果和新颖的研究 方向;③VO具有国际性,需要对管理数据和资源共享的法律、道德和 其他政策框架等有清晰的认识,并将这些认识清楚地传达给研发人员。 5. 学科资源服务门户建设快速发展 门户提供包括内容聚合、单点登录、个性化定制和安全管理等服务。 各个学术研究机构和文献服务机构由于面向特定的用户群体,更多地关 心如何在海量信息环境下将特定的一个或多个学科或研究领域的资源、 工具和服务集成,为研究人员提供更为方便和快捷的检索和服务接口。 这方面的研究和实践带来了学科资源门户的出现和迅速发展 50。目前世 界各国都已开展了大量的实践活动,建立了很多单学科门户。其中有一 些还发展为门户间的合作,形成了聚集多个单学科门户的“门户之门户”, 也叫“元学科门户”,实现了同一界面下跨门户检索多种学科资源,例 如美国NSF建设的TeraGrid科学网关。 一个真正意义上的学科信息门户不仅拥有丰富的数字化资源,而且 220 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 始终体现着“以用户为中心”的服务理念,根据其目标用户群确定服务 方向,创建友好的用户界面,通过个性化服务来满足用户需求。同时, 学科门户也将个人用户的资源纳入管理和共享范畴,开创了资源采集的 新途径。 6. 科学研究日益依赖云计算 在科学界,云计算作为未来发展的重要趋势已经引起高度重视,国 外已有许多科研机构在利用云计算从事科研工作,也已经有多项面向科 研的云计算计划,有人将这类云计算称为“科学云”(Science Cloud) 。 2009 年 10 月,美国能源部启动了经费为 3,200 万美元的Magellan项目, 其重点是建设私有“科学云”,研究云计算在能源、气候、生物、物理 等领域的应用前景 51。2010 年初,微软公司与NSF达成协议,将为NSF 筛选出来的研究人员和研究团体免费提供为期三年的Windows Azure使 用权限,并将安排一个支撑团队帮助科研人员在其研究中应用云计算技 术 52,以增强研究能力、培育协作式研究团体、加速科学发现。此外, 美国航空航天局(NASA)也正在考虑把科学应用迁移至“云”中 53。 2009 年底,CERN表示将采用Platform Computing公司的私有云计算管理 和高性能云计算软件Platform ISF及相关的自适应集群实现虚拟基础设 施管理流程的自动化,创建全球最大的科学云计算环境,为全世界 85 个国家的近万名科研人员提供更好的计算能力和基础设施服务。 为了实现向“科学发现”第四模式的转变,云计算环境不仅要提供 能共享由计算科学和各种观测结果产生的数据的能力,而且还要提供具 有成本效益的高性能计算能力,以快速有效的对数据进行分析 54。此外, 云架构尚不能完全取代网格的某些复杂应用,最佳科研支撑体系应是网 221 第九章 中国科学院信息化发展的外部环境 格与云的混合系统。 7. 科研管理信息系统将更通过整合集成推动科研活动的深度管理 科研管理是一项复杂的系统工程,包括规划、经费、人力和科技情 报等内容,涉及范围相当广泛。随着计算机网络技术的发展,构建完善 的科研管理信息化系统,实现科研信息存取和处理的规范化、科学化管 理,推动科研机构管理体制的创新,已日益成为科研管理工作中不可忽 视的课题。许多致力于推动科研教育发展的组织和管理机构积极投身于 科研管理信息系统的开发,从更广的层面推动科学的发展。例如,英国 正在创建“科研管理和行政系统” 55,旨在整合大学所用的人力资源系 统、财务系统、员工名录、资助管理系统和数据仓库等服务,以更好地 满足内外部需求 56。美国夸里(Kuali)基金会目前正在进行Kuali Coeus 科研管理系统的开发,旨在设计并开发出一套囊括了最先进科研管理技 术及进程,能灵活适应不同的机构结构与需求的集成科研管理系统,为 科研管理提供支持 57。在我国,除了国家自然科学基金委员会正在积极 建设新一代的信息管理系统 58外,中国科学院也一直致力于开展中国科 学院资源规划(ARP)项目 59,以进一步推进中国科学院管理创新,促 进科技创新和人才培养效益的最大化。 8. 信息技术将与教育活动更广泛的融合 对于高等教育和继续教育而言,日新月异的IT技术能够更好地辅助、 优化和促进教育活动,帮助教育理念的落实,使教育活动更有活力与效 率。教育信息化关注的是IT技术在教育活动中的应用,而不是对IT技术 222 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 本身的研究,这个趋势将越来越明显。教育信息化的其他趋势还包括: (1)从以软硬件基础设施建设为中心转向以信息服务集成为中心; (2) 以继续教育为重要组成的终身教育体系将在整个教育体系中发挥日益 重要的作用; (3)科研资源、科学数据等将与教育紧密结合,丰富实时、 在线教育的内容; (4)云计算、移动技术、分布式协同等手段受到更多 青睐; (5)通过新一代教育平台、聚合与推荐工具帮助学习者建立个人 知识体系; (6)标准化建设成为国内外专家学者的关注焦点 60。 223 第二章 中国科学院信息化发展的机遇及挑战 二 中国科学院信息化发展的机遇 及挑战 2.1 中国科学院信息化发展面临的挑战 经过三个五年计划的持续发展,我院信息化基础设施服务能力显著 提升,信息化在科研活动中的作用日益凸显,提升科研管理水平的作用 明显,促进教育发展和科学传播取得显著成果,信息化资源共享政策与 机制初具雏形,信息化和全院科技创新工作逐步融合,信息化文化氛围 初步形成。但是,面对“创新 2020”战略及“十二五”我院各领域发展 的新需求,我院信息化迫切需要解决以下六个方面的问题。 1.信息化基础设施综合服务与集成能力有待加强 网络、数据与超算三大信息化基础设施环境建设取得了一定的成绩, 但建设和服务还没有高度融合,整体服务效果尚不明显。在我院新的发 展战略、科技布局调整和实施先导工程的需求下,特别是国际科研信息 化新的发展态势下,我院基础设施的综合服务和集成能力要进一步提高。 2.信息化催生一流科研成果的能力亟待提升 信息化对典型科研活动中各个环节渗透还不够,还没有形成完整的 224 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 信息链。部分科研现场缺乏有效的数据采集与传输手段,各领域缺乏符 合自身特点的海量数据分析处理与可视化的工具。信息化对研究所科研 活动的渗透与带动作用明显不足,无法满足各种个性化与差异化的需求, 科研人员对信息技术和手段的应用能力还需要进一步提升。 3.管理信息化科学决策支撑能力有待完善 ARP 系统建设初期遵循了重点满足共性应用需求的原则,取得了重 大进展,但在满足研究所的个性需求和具有多级管理结构以及跨地域设 置分部的研究所、重大科技专项和科研基地的管理需求等方面有待加强。 随着系统应用的不断深入,ARP 系统已积累大量的科研管理信息资源, 具备了进行信息资源挖掘的条件,但挖掘利用这些资源以支撑科研管理 与科学决策的辅助决策工具还比较薄弱,停留在各类报表、简单统计的 工作较多,缺乏各个模块、各类参数的综合分析、方便快捷的软件系统 和分析工具。 4.信息资源的整合共享利用水平需不断提高 通过两个五年计划的信息化建设,积累了海量信息资源,建立了一 批专业数据库和 ARP 数据资源、教育资源、科普资源及各类学科、领域 的工具软件等。但是,这些资源相对独立,缺少整体综合集成和利用的 环境和有效措施,资源整合和高效利用的技术平台也还刚刚起步。 225 第二章 中国科学院信息化发展的机遇及挑战 5.信息化建设与院重大项目的结合有待加强 信息化支撑保障作用虽得到全院科研和管理人员的认可,但信息化 建设与院重大项目布局之间的结合还不够深入和紧密,信息化对科技创 新的促进作用主要取决于项目负责人的认识和重视程度,在整体学科、 领域的发展布局和项目规划立项时缺乏对信息化进行整体策划和制度 安排。 6.全院的信息化政策与发展环境需进一步完善 针对我院科研信息化特点的政策、制度、标准、运维机制、资源配 置、人才队伍等信息化保障机制亟待加强,政策软环境需进一步完善, 必须着力提高全院上下各类人员的信息化意识,形成在信息化环境下开 创我院科技创新跨越发展新局面的文化氛围。 2.2 中国科学院信息化发展机遇 在全球科技创新和信息产业加速发展的背景下,我国提出加强自主 创新能力、建设创新型国家的任务,“十二五”期间国家信息化将向高 端应用发展,我院也启动实施“创新 2020”战略,国际、国内的外部环 境和我院自身的内在需求,使我院信息化发展面临新的挑战和发展机遇。 1.“十二五”期间是我国实现可持续发展、提升自主创新能力、建 设创新型国家的关键时期,为提高我院信息化整体水平提供了难得的战 略时机 226 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 党的十七届五中全会明确提出未来五年是全面建设小康社会的关 键时期;是深化改革开放、加快转变经济发展方式的攻坚时期;是我国 提升自主创新能力、建设创新型国家的关键时期。国家“十二五”规划 的指导思想也明确提出,以科学发展为主题,把科技创新和进步作为重 要支撑,把建设资源节约型、环境友好型社会作为重要着力点,把改革 开放作为强大动力。这一系列战略部署不仅对我院发挥在国家创新体系 建设中的火车头作用,促进我国自主创新,实现科技跨越发展提出了新 的要求,也对我院信息化环境如何提供支撑科技创新跨越发展提出了更 高的要求,这也必然带来了难得的发展机遇。 2.信息化向高端发展将成为我国信息化的重要发展趋势,为科研信 息化发挥示范和引领作用带来了良好的外部机遇 “十二五”期间为适应全球信息化发展浪潮,我国信息化将向高端 应用发展,不断提高自主创新能力,充分发挥信息化在提高国家基础设 施应用效能方面的作用,在智能电网、智能交通、气象预报、国土资源、 环境监测、地理信息等领域加快发展传感网、物联网及其他信息化的高 端应用技术,开发利用各类信息资源,降低社会运行成本,加快国家现 代化进程。 这一系列信息化高端应用发展都与高速宽带、超大规模计算和数据 密集型研究等科研信息化技术密不可分。以超级计算为例,只有自主地 解决超级计算中并行计算、建模和模拟软件,才能更好地解决科学、工 程以及社会科学中各种复杂问题。通过科研信息化的示范和引领,先期 解决信息化应用中的超级计算、海云计算、海量数据分析、可靠传输、 动态建模、大规模智能控制软件等各种基础性问题,将为各行各业信息 227 第二章 中国科学院信息化发展的机遇及挑战 化的广泛应用、全面提升我国信息化水平打下坚实基础。 3.我院实施“创新 2020”发展战略,为我院科研信息化发展提供了 极好的发展契机 随着我院“创新 2020”的启动实施,我院的科技创新活动和组织管 理方式必然突破时空、学科和机构的限制,不断创新科研活动模式,最 终实现“创新跨越、布局合理、四个一流、开放合作、和谐有序、持续 发展”的目标,在我国科技事业发展中发挥服务全局、骨干引领和示范 带动作用。为实现“创新 2020”的宏伟目标,必然要求我院信息化的发 展必须围绕这一战略实施带来的科技创新活动和组织管理新的模式变 革,以及随之而来的各类科研信息化、管理信息化的个性、动态、泛在 的需求,必然要求大幅提升基础设施能力和应用水平,以支撑我院各学 科、各领域的跨越发展。 4.科技创新活动和科研模式转变的迫切需求,为促进我院信息化与 科研融合创造了内生动力 当代科学及工程问题日益复杂,国际合作日渐频繁,迫切需要新的 研究方法、手段,带动科研模式的变革,信息化已经发展成为提升科技 创新能力的重要手段。西方发达国家无不将科研信息化视为国家创新核 心竞争力的关键因素,纷纷从国家战略高度推进科研信息化发展,满足 当代科技发展的新需求以保持各自的科技创新优势地位。 我院为实施“创新 2020”提出了实现各类发展目标的新型科研组织 方式,如创新基地、区域创新集群、交叉学科中心、网格化研究单元等, 228 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 信息化如何有力支撑这一科研管理组织和方式的转变成为我院信息化 发展的内在动力。利用信息化环境实现数据采集、传输、分析、应用、 计算模拟,实现科技资源交流、汇集、共享和协同工作,可以有力、有 效支撑我院科技创新活动和科技管理活动新的变革。 5.全球信息技术创新及产业的加速融合发展,为我院信息化发展创 造了良好的技术产业环境 信息技术是当今最具活力的科技创新领域之一,不断孕育着重大突 破。信息网络基础设施进入重大变革期,宽带、泛在、智能、融合的新 一代信息基础设施建设步伐不断加快。全球信息产业在复苏中加速结构 调整和转型,进入了新一轮增长周期。云计算规模化、商业化进入实施 阶段,Google、IBM、Oracle、Amazon、DELL、HP、Microsoft、EMC 等都将成为云计算的主要推动者。预计到 2012 年,将有 80%的全球 500 强企业使用云计算服务。 目前,我国已确定将新一代信息技术产业列为国家战略性新兴产业 之一进行支持和布局。2010 年 10 月,国家为推进云计算中心(平台) 建设,按照自主、可控、高效原则,在北京、上海、深圳、杭州、无锡 等五个城市先行开展了云计算创新发展试点示范工作。我院在先导工程 中也启动了“面向感知中国的下一代 ICT 技术研究”专项。 信息技术及产业的加速创新和发展,为我院加快科研信息化的建设, 强化信息化与各领域发展的深度融合,提升科技创新能力和效率提供了 良好的技术基础和环境。 229 第三章 中国科学院未来五年信息化发展展望 三 中国科学院未来五年 信息化发展展望 3.1 总体目标及思路 面向“创新 2020”发展战略,建设开放共享、功效一流、安 全可靠的信息化环境,促进信息化与科技和管理创新活动的深度 融合,引领我国科研信息化发展,逐步建成信息化中国科学院, 为中国科学院实现创新跨越提供有力支撑。 紧密结合“创新 2020”发展战略的需求,以信息化推动科技 创新,以科技创新牵引信息化,突出抓应用、抓服务、抓安全, 以实际应用带动能力建设,为建设信息化中国科学院迈出关键与 坚实的一步。 在“十一五”信息化建立的三大环境、五大平台和三个体系 的基础上,抓住科研信息化和管理信息化两条主线,在信息获取、 传输、存储、处理、应用五大环节,以全面整合提升科研、管理 和教育的信息化整体环境为抓手,着力提升资源整合共享、应用 服务支撑、辅助决策支持、网络安全保障等四项重要能力,加速 实现从硬件建设到环境构建、从强调建设到突出应用、从条块布 局到整体推进、从单点示范到全面推广、从相对封闭到共建共享 等五大转变。 230 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 3.2 主要任务 为适应国家信息化战略发展的需求及国际信息化发展的前 沿趋势,“十二五”期间,我院信息化工作将围绕面向 2020 的创 新发展战略,紧密结合我院布局的先导工程和承担的各项国家任 务,以提供云服务和实现海计算为指导理念,建成开放共享、功 效一流、安全可靠的信息化环境:构建支撑科技创新的科研信息 化服务环境,构建支持科学决策的管理信息化服务环境,构建促 进科教融合的教育信息化服务环境。 为实现“十二五”信息化发展的目标,我院“十二五”信息 化工作重点部署科研信息化应用推进、科技数据资源整合与共享、 信息化管理与决策支持、信息化继续教育与科教融合、网络化科 学传播服务、网络安全保障与服务等 6 项主要任务。 1.科研信息化应用推进工程 以科技创新的需求为牵引,通过实施科研信息化应用推进工 程,进一步夯实科研信息化基础设施,提升基础设施的综合应用 和服务能力,实现基础设施之间的互联互通与协同服务,完善科 研信息化应用环境,部署一批直接服务于重大科研活动需求的应 用平台(领域云),推进信息化与科研活动的深度融合,显著提 升我院科研信息化水平,有力支撑我院创新跨越,持续发展。 231 第三章 中国科学院未来五年信息化发展展望 2.科技数据资源整合与共享工程 面向科学发现数据驱动的新趋势和当代科技数据海量化的 新特征,通过实施科技数据资源整合与共享工程,推动全院科技 数据资源、数据存储与处理设施、科技数据与信息资源共享、科 学数据应用环境等建设与服务,形成以海量科技数据为核心的系 列云服务,成为科技云的重要支柱,进一步提升科技数据战略资 源管理和支撑服务能力,逐步建成面向科技界开放共享的国家级 科技数据中心,为我院我国的科技创新提供强大的数据基础。 3.信息化管理与决策支持工程 以实现研究院所科研活动的全面、实时、精细化管理和规范 管理流程为核心,通过工程的实施,基本形成服务全院科研管理 的安全、高效、便捷的科研管理信息化支撑平台,有效提高我院 科技资源配置和管理的水平和能力,直接服务“一流管理”的战 略目标,有力支撑“一流成果、一流效益、一流人才”战略目标 的实现。 4.信息化继续教育与科教融合工程 充分发挥全院办学、所系结合的优势,通过信息化的教育创 新与科教融合服务工程的实施,推动先进的教育理念和信息技术 在科研人才教育培养中的应用,创新教育模式和科教资源转化机 制,建设教研融合的资源池,建立科教结合的服务云,提供创新 教育的学习网。 232 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 5.网络化科学传播服务工程 以国际化视野构建互联网科学传播体系,助推“创新 2020” , 打造“网上中科院”。进一步发挥我院科研、技术、人才和思想 库方面的优势,不断提升我院网络科学传播能力和水平,在国家 网络科学传播领域发挥引领示范作用。 6.网络安全保障与服务工程 构建特色鲜明、使用便捷、保障有力、自主可控的全院一体 化信息化安全保障体系,增强我院网络与信息安全保障和监管能 力,在深度和广度上确保我院信息化设施的安全运行。 为保障“十二五”我院信息化发展目标的实现,要不断创新 信息化工作机制与体制,完善政策与保障措施,包括强化信息化 战略研究,完善信息化组织管理体制,健全信息化制度与标准, 夯实信息化运维体系,优化信息化评估工作,推进信息化人才的 培养和发展,形成多层面、多渠道的经费资源配置格局,全面开 展国际国内合作交流。 通过未来五年全院上下的共同努力,将使我院信息化工作再 上新台阶,为实现“创新 2020”战略目标提供更加有力的信息化 支撑和保障! 233 思考篇 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 一 信息化时代的新型科研模式 陈和生 院士 中国科学院高能物理研究所 1、科学研究方式的发展 人类探索世界的脚步永无止境,而科学研究的方式也在不断 发展。远古时期,人们依靠观察和思辨来认识和探索世界。17 世 纪以来,随着牛顿经典力学基本运动定律的发表,科学家们逐渐 把实验与理论作为科学研究的基本手段。然而,随着人类探索世 界的不断深入,许多科学问题的实验研究和理论研究变得越来越 复杂,甚至难以给出明确的结论。近半个世纪以来,随着电子计 算机的诞生与快速发展,计算机仿真模拟变成第三种不可或缺的 科学研究手段,以帮助科学家们去探索实验与理论难以解决的问 题,比如宇宙的起源、汽车碰撞、天气预报等等。而在当前社会, 各个学科领域的研究不断向纵深发展,不管是实验装置还是计算 机仿真模拟的规模都变得越来越大,产生了越来越多的数据,从 而催生了围绕海量数据获取、存储、共享和分析的第四种科学研 究手段 61。这种科学研究手段称为数据探索,也叫做科研信息化 62 (e-Science) 。在科研信息化的环境中,来自大科学装置或者 计算机仿真模拟的实验数据被收集和存储起来,并通过先进高速 的网络分享给处于不同的国家或机构的合作者。依靠分布式计算 技术以及协同工作环境,科学家们不仅共享数据,还共享软件、 模型、计算、专家知识甚至人力等资源,从而加快科学成果的产 235 第一章 信息化时 时代的新型科研模 模式 出。现 现代科学研究,特别是粒子 子物理、生命 命科学、能源 源环境、先 进材料 料与纳米科学等 等新兴或交叉 叉领域的发展 展要进行跨国 国家、跨地 域的协 协作与交流,而 而科研信息化 化的手段的发 发展与完善正 正在对其产 生深远 远的影响。 算是科学研究 究的有效手段 段 2、高性能计算 高 高性能计算是信 信息领域的高 高端技术,是 是保障科学研 研究、国家 安全、国防科技进步 步等方面的直 直接推动者,是科研信息 息化环境的 重要组 组成部分。 相对 对于传统计算 算,高性能计 计算 HPC 具有 有更强的计算 算能力,可 以更深 深入细致的模拟 拟复杂过程, ,并解决工程 程和科学计算 算领域许多 原来无 无法解算的问题 题。例如,高 高能物理计算 算是典型的数 数据密集型 任务,计算工作量太 太大,人工根 根本无法完成 成,只能利用 用 HPC 的高 性能才 才能满足 PB 级数据量的分 级 分析处理;生物 物医学研制一 一种新药, 从研发 发到临床试验,一般需要十 十到十五年的 的时间,在 HPC H 的科学 模拟和 和计算的帮助下 下,专家们可 可以在较短的 的时间内完成 成药物的研 发,不 不仅降低了购买真实化合物 物的成本,而 而且还大大缩 缩短了药物 研发的 的周期。 图表 113.高性能计算的应 应用 236 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 由于日益增长的技术的需求,高性能计算在国内外受到高度 的重视,在科学研究和工程技术方面已经取得了巨大的成就,并 对科研信息化的发展产生了深远的影响。科研信息化的进步和高 速便捷的网络,极大降低了科学数据产生和收集的成本,使得科 学数据如井喷般急速增长。处理如此庞大的数据,没有万亿次以 上的高性能计算是无法解决的。高性能计算机强大的计算能力为 大规模海量数据处理分析和理论模型研究提供了有效的工具,是 科学研究与工程技术的一种不可或缺的手段和方法。21 世纪人类 所面临的重要科技问题,如环境污染处理、人类基因、能源等; 不少应用尤其是航天制造业、化工业等这些关系国计民生的重要 行业,面临着高成本、或高能耗高污染等严峻的挑战,必须使用 高性能计算机才能解决。科学计算和数值模拟在这些领域起着不 可或缺的作用,然而模拟对象和计算的复杂性决定了它对超级计 算的迫切要求,高性能计算能很好的处理各种科学计算。我们要 突破传统的计算模式,充分利用高性能计算带来的好处,降低生 产成本,提高生产效率。 社会经济的发展与人类探索复杂世界的活动,推动科学研究 方法从传统的理论研究和实验分析逐步转向计算科学。随着高性 能计算机性能的提高、价格的降低,高性能计算从传统的满足科 研和国家战略需求走向更为广泛的行业应用,同时也对高性能计 算提出了更高的要求。 3、分布式计算构建大规模计算环境 现代科学研究需要跨地域、跨国家的协作,高性能计算也从 传统的集中模式转向面向网络的分布式模式,实现大规模的协同 237 第一章 信息化时代的新型科研模式 计算。 半导体芯片的发展在过去的几十年中一直遵循着摩尔定律, 并在今后的一段时间内依然有效,即每隔 18 个月,集成电路上 可容纳的晶体管数目便会增加一倍,性能也将提升一倍。相比较 而言主,网络速度的提升则是每 12 个月即能提升一倍,大大超 过芯片发展速度,这为分布式计算的应用奠定了坚实的基础。分 布式系统是由多台通过网络连接的独立的计算机构成的集合,对 于用户而言,是一个单一系统,它把一个大的任务被切分成许多 小部分,每台计算机负责一个部分。虽然这需要通过网络在计算 设备之间快速地传送必要的计算消息,增加了计算处理的复杂度, 但获取的好处确是显而易见。不仅避免了计算过程中单点失败, 减少了大规模计算所消耗时间,还能充分地利用各种计算资源, 毕竟超级计算机的建造是十分昂贵的。 当前的很多学科领域需要研究解决复杂的科学问题,其数据 分析或科学计算的规模也随之越来越大,这些问题包括认识自然 界物质的微观结构、天体的演化、全球气候变化等各个领域。这 对计算科学提出了新的挑战。为了应对挑战,人们建立了计算集 群,通过局域网络较为松散地将一组计算机硬件、软件连接为一 个整体,用以紧密协作地完成复杂的计算任务。计算集群中的计 算机的造价远远低于超级计算机和小型机,这使它在很多的科学 领域中得到了广泛应用。 人类对世界一直在进行着不懈地探索,以世界上最大最前沿 的高能物理实验,大型强子对撞机(LHC)为例,其已于 2010 年 3 月开始运行,每年产生大约 15PB的数据,大约是 170 万张双面 DVD光盘的容量。开机 6 个月以来,分析处理这些数据,每天需 238 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 要提交大约 100 万个作业,240 万个CPU小时。目前尚没有一个机 构拥有的超级计算机或计算集群有能力快速处理、研究、应用所 有这些数据。这必须依靠有效的信息化手段,整合世界各地的计 算资源协同工作。网格则是最好的选择。网格技术提供了共享和 协调使用各种不同资源的机制,因此它能将地理上、组织上分布 的各种组件整合起来,创建出一个虚拟计算机系统,充分集成各 种资源以获得理想的服务质量。例如CERN建立了WLCG项目 63, 这是当前世界上最大的网格项目,其目标是在全球范围内,部署 一个高效的网格环境,将不同国家与地区的计算中心集成到一个 虚拟组织,统一调度计算和存储资源,以满足高能物理的实验需 求。 近几年来,在分布式处理、并行处理、网格计算、效用计算、 软件即服务(SAAS)等技术的基础上,发展出云计算技术。云计 算以其灵活的 IT 基础架构、QoS 保证的计算环境和可配置的软件 环境的能力,成为了一个炙手可热的话题。云计算的发展将为分 布式计算以及科研信息化活动提供更加广阔的未来。 4、大规模科学研究产生海量数据 在“纸笔研究”时代,科学家们的数据记录在笔记本上,帮 助分析数据的工具可能是一把尺子,在今天,科学研究成果的获 得不仅取决于科学家的智慧和勤奋,还取决于海量科学数据的处 理能力。基于海量数据处理的科学探索已经成为一种新的科学研 究方法,也是科研信息化的重要内容之一。 科学仪器和电脑仿真产生的新数据以每年一倍的速度急速 扩张,超过了CPU处理能力的增长速度(摩尔定律:CPU处理能力 239 第一章 信息化时代的新型科研模式 每 18 个月翻一番)。1946 年,美国军方的ENIAC(Electronic Numerical Integrator And Computer)被称为世界上第一台“电脑” , 人类信息处理能力的大飞跃。在当时,它作为通用计算机被用于 处理各种问题,从氢弹的设计到气象预报。然而在今天,CERN的 大型强子对撞机平均每秒钟产生的数据,需要 600 万个ENIAC来 存储,图表 114 是CERN计算中心的海量数据处理集群。基因工程、 计算流体力学、天文学,生态学,环境科学等领域同样经历着这 样的科研方式变迁:天文学领域,为了实现更大,更快,更深的 天文学观察目标,将在 2015 年投入使用的大视场全景巡天望远 镜(Large Synoptic Survey Telescope,LSST), 直径将达到 8.4 米, 每夜能够生成 30TB的彩色图像数据。它每 15 秒便能拍摄一张约 为月球直径七倍大的空间的照片,每三天将累积拍摄成一张天空 全景图像。整个项目计划拍摄 20 多万张照片,拍摄精度将达 3200 兆像素,预计第一年就将产生 1.28PB的科学数据。在地学领域, 对南加利福尼亚建立一个分辨率为 10 米,深度为 100 千米的地 面模型,将产生 1PB的数据。生物医学领域,使用电子显微镜重 建人脑 1 立方毫米的神经电路,会产生 33,000 张扫描片,每张片 子至少 2x10^10 个像素,大约合 1PB 的数据。人脑有 100 万立方 毫米的神经组织,建立一个完整的大脑电路图,需要海量的数据 存储和处理能力。 240 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 114.CERN 计算中心的海量数据处理集群 越来越精密的仪器,越来越多的传感器,廉价的网络产生大 量的数据,冲击着科学家们。然而,数据不是知识,真正的知识 只是数据冰山上最有价值的山尖。重建、分析、可视化、存储和 长时间保存这些数据的过程对算法效率,计算能力、数据访问效 率和存储备份机制提出了很高的要求。与科研数据规模同时发展 的 IT 技术为应对这样的需求提供了如多核计算、GPU 计算、网格 计算和云计算等计算解决方案,以及如并行文件系统、分级存储、 面向对象的存储等存储解决方案。以北京正负电子对撞机上的 BESⅢ实验为例,为了处理高达 5PB 的实验和用户数据,BESⅢ计 算系统采用了分级海量存储系统保存实验数据,采用面向对象的 并行文件系统为分析、重建作业提供高吞吐率的 I/O;在传统集 群技术的基础上,采用网格技术实现跨地域海量数据共享和计算 241 第一章 信息化时代的新型科研模式 资源共享,通过整合多个站点资源来完成海量数据的重建,分析 和模拟。 5、高速网络支撑科研活动 网络一直都是现代科学研究的重要技术支撑手段,现代科学 研究对网络的需求也促进了互联网技术的快速发展。 由于高能物理研究国际合作需求, 中国科学院高能物理研究 所的VAX785 计算机在 1988 年 7 月首先卫星通信线路,以X.25 的 方式通过CERN接入了国际互联网,节点名为BEPC2. IHEP. CERN. CH。 在国家自然科学基金委的资助下,高能物理研究所于 1994 年 4 月 20 日接入国际 互联网, 完成中国正式连入INTERNET,当时信 道宽度只有 64Kbps,也就是这 64 Kbps的网络带宽,开启了中国 互联网发展的序幕。 图表 115.中美科学家设计的国际计算机联网线路 242 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 中国教育网(CERNET)于 1996 年建立了与德国 DFN 学术网络 的 64 Kbps 互联,在 1998 年开通了中国 CERNET 与英国 JANET 的 学术网络的 512 Kbps 互联,用于满足中国和欧洲之间的科学研究 合作需求。 随着中美、中欧以及亚太之间的许多重大科学研究合作计划 (如高能物理合作、伽利略计划、网格计划、龙计划等)的开展, 提高互联网带宽和性能已成为当务之急。中国科技网(CSTNET) 于 2004 年 1 月开通了“芝加哥—阿姆斯特丹—莫斯科—新西伯 利亚—北京—香港—西雅图—芝加哥”的中美俄环球科教网络 (GLORIAD) ,实现了中国同美国、俄罗斯等国之间的高速网络连 接;清华大学于 2004 年代表中国教育网(CERNET)作为中方合 作伙伴参加了欧盟第六框架计划下的目标为改善欧洲与亚太间 教育科研的网络连状况的第二代跨欧亚信息网络(TEIN2,该项目 2009 年升级为 TEIN3)项目,建立了中国与欧盟以及亚太国家之 间的高速网络互联。 科学无国界,当今世界科学研究国际化程度不断提高,国际 国内合作早已成为科学研究当中的客观需求,科学实验数据和数 据分析资源共享则是科学研究合作中最重要的组成部分,目前中 国主持或者参与的大型科学实验,如北京正负电子对撞机 (BEPCII),羊八井宇宙线观测实验(ARGO) ,大亚湾中微子实验, 国际热核聚变实验堆(ITER),大型强子对撞机(LHC)的四个大 型实验,虚拟天文台……等均有大批量科学实验数据在全世界范围 内进行共享的需求,高速网络则是实现这些实验和科学研究成功 的根本保障。 美国、欧洲等发达国家的互联网发展经验告诉我们,高速网 243 第一章 信息化时代的新型科研模式 络的发展是一种技术革新,也是基础设施建设的一部分,更是国 家战略,它是一个国家科学研究的基础性保障。 中国下一代互联网示范工程(CNGI 项目)是国家级的战略项目, 该项目由工信部、科技部、国家发展和改革委员会、教育部、国 务院信息化工作办公室、中国科学院、中国工程院和国家自然科 学基金委员会八个部委联合发起并经国务院批准于 2003 年启动, 目标是打造我国下一代高速互联网的基础平台,这个平台不仅是 物理平台,相应的下一代研究和开发也应该在这一平台上进行试 验,目标是使之成为产、学、研、用相结合的平台及中外合作开 发的开放平台,目前 CNGI 核心网项目已通过验收,但这仅仅是 中国下一代高速网络发展的标志,我国将继续大力支持下一代互 联网技术研发和产业发展工作,力争实现新突破,为推动高速互 联网技术以及其它科学研究的发展做出新的贡献。 6、协同工作环境提高工作效率 在现代科学研究的大规模合作模式下,科学家虽然在不同的 国家或区域工作,但是可以像在一个机构内一样使用实验数据、 计算资源、软件工具等,甚至还可以跨区域进行大型实验设备的 远程运行。这一切依赖于科研信息化中的协同工作环境。 “协同” 不仅包括人与人之间的协作,也包括不同应用系统之间、不同数 据资源之间、不同终端设备之间、不同应用情景之间、人与机器 之间、科技与传统之间等全方位的协同。协同工作环境集协同编 辑、信息发布、文档管理、即时通讯、网络电话、视频会议、数 据与计算资源共享等为一体,形成一个面向科学家的虚拟组织。 虚拟组织的概念来自于网格计算 64,指共享数据与计算等资源的 244 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 工作组,现在泛指一种区别于传统组织的一种以信息技术为支撑 的人机一体化组织。其特征以现代通讯技术、信息存储技术、机 器智能产品为依托,实现传统组织结构、职能及目标。在形式上, 没有固定的地理空间,也没有时间限制。组织成员之间有着高度 相同的兴趣爱好或科研目标,比如LHC上ATLAS,CMS等大型实验 都建立各自的虚拟组织。 大型实验设备在运行时需要 7×24 小时的值班,通过协同工 作环境则可以将该任务分配到不同的时区,实现人力资源的共享。 比如 2009 年 6 月, 高能物理研究所为CMS建立了CMSROC@BEIJING 区域运行中心。CMSROC@BEIJING是继美国费米实验室和德国电 子同步加速器研究所之后的第三个区域运行中心。这是CMS首次 将远程运行从欧洲、北美扩展到了亚洲。如 图表 116 所示,三 个运行中心分别位于三个不同的时区, 每个运行中心值班 8 小时, 这样就轻松的实现了 24 小时轮班制。这种轮班制可以有效地保 证CMS实验的顺利进行。CMS远程值班就是一个典型的协同工作 环境,集成了高能物理基础设施、网络、超级计算、数据、视频 通讯等众多IT技术。 245 第一章 信息化时代的新型科研模式 图表 116.CMS 区域性运行中心 7、总结 信息化时代背景下,信息技术快速发展,正对科学研究的模 式产生革命性的影响。高性能计算、大规模的分布式计算、海量 的数据、多种形式的信息和先进的网络以及协同工作系统正在广 泛应用于各科学技术领域。已有的科学研究方式,包括实验、理 论与计算模拟正在发生深刻的变化,实验与计算模拟的规模庞大 高度复杂,产生了前所未有的海量数据,而只有对这些数据进行 快速有效分析才能产生科学成果。因此,基于海量数据处理的科 研信息化已经成为一种新的科学研究模式,同时正有力的推动信 息科学技术的发展。 246 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 二 互联网的业务发展与技术演进 邬贺铨 院士 中国工程院 摘要:本文首先从传送业务、Web 业务、物联业务和泛在业 务几方面说明互联网的业务发展,分析了互联网面临的诸多挑战, 它们涉及可扩展性、IP 地址资源、频谱资源、可管理性、安全性、 节能环保、数学模型的可信性等方面,最后介绍互联网技术的演 进,着重讨论了向下一代互联网发展的兼容路线与基于“一张白纸” 重新设计的路线。 关键词:互联网 下一代互联网 Web 业务 物联网 泛在网 一.互联网业务应用的发展 1.传送业务 互联网自出现到现在已有 40 年,其业务应用有了很大的扩展。 早期的互联网强调 IP over Everything,即 IP 数据包可以在具有数 字信道能力的任何网络上传送,为互联网初期的介入提供了必要 的生存环境。传送业务是互联网最早的应用,传送业务也在发展, 现在互联网从传输数据扩展到话音、视频以及 M2M(机器到机器) 通信业务,从基于客户/服务器的点到点业务到 P2P(对等体系)业 务,从网络业务到电信业务、媒体业务,还将发展到物联业务。 2008 年美国互联网流量中视频包括 IPTV 占到 32.6%,P2P 流量 占到 44.4%,Web 和邮件及数据占 18.5%,VOIP 占 0.7%,从中 可见 P2P 和视频主导了流量,而且 P2P 业务中还有很大部分也是 247 第二章 互联网的业务发展与技术演进 视频类业务。 2. Web 业务 Web 技术的出现极大地扩展了互联网的影响,现在互联网几 乎无所不包,形成了 Everything on Web 的局面。Web 是分布在全 球的服务器中使用 HTML(超文本标记语言)编写的网页和其他 资源的集合,客户机通过浏览器并使用 HTTP(超文本传送协议) 访问服务器中的这些信息资源。Web 应用也在演进,早期的 Web1.0 中网站内容是由网站专职编辑人员产生的,网民作为消费 者以 Web 作为浏览器,浏览和下载网页内容。即时通信、博客、 微博、播客、维基百科和社交网站等应用催生了 Web2.0,它在客 户浏览器与 Web 服务器之间增加了 Ajax 引擎,允许用户/页面的 交互和页面/服务器的交互异步进行,它结合了 JavaScript 和 XML 这两种编程语言技术,提高了 Web 应用系统的交互能力和 可靠性,网民不仅是消费者而且是参与者,很多内容由网民上传 的并且在网民间分享,网站的诸多功能也由用户参与建设,增强 了网站与用户的互动。随着 Web 的应用需要,还将出现 Web3.0 (语义 Web),它借助于 XML 的精确描述与微缩格式,将微内容 进一步拆分并通过词义标准化达到计算机能理解的程度,以便分 类存储和提炼加工及聚合。它的代表性技术还有语义搜索、 Mashup 和 Web Widget 等。Mashup(网络聚合应用)是从多个分 散的站点获取信息源组合成网络新应用的一种模式,通过第三方 信息平台同时对多家网站的信息进行整合分类,实现网站间信息 的互动。Widget(微件)是一小段可以在任意一个基于 HTML 的 Web 页面上执行的代码,它的表现形式可能是视频、地图、新闻、 248 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 小游戏等,借助通用 Widget 平台终端,可以充分激发用户的创造 力和热情,参与创建网络新的业务、新的商业模式和生态系统。 Web3.0 可以跨终端平台应用,其内容不仅由网民来产生,甚至是 物联网上物件所感知的内容也可直接上传到网页。现在还有人预 测未来会出现 Web4.0(WebOS),Web 操作系统意味着互联网 成为一个具有高度智能互动的全球计算机,它基于新网络架构的 应用程序,提供更多的智能和更好的用户体验。总之,基于 Web 的新业务会层出不穷,将超出现在的想象。Web 的强势使以 Windows 为平台的网络共享迅速过渡到以软件为中心的信息共享, 未来云计算还将带动以服务为中心的资源共享,从网络共享到资 源共享反映了互联网应用的发展。 图表 117 表示了互联网业务从上世纪七十年代以来的演进。 地址体系从早期的NCP到现在的IPv4,还将过渡到IPv6;代表性 的 技 术 从 TCP/IP 到 Web , 再 到 P2P/Web2.0 , 还 将 发 展 到 Cyber-Physical System(综合计算、网络和物理环境的系统);接入 手段从有线到无线、宽带和移动;接入方式从拨号接入到永远在 线;从连接终端到连接人、连接服务和连接物件;互联网的作用 从联系平台到浏览平台、交互平台,并将成为工作平台;互联网 从简单的网络业务到电信业务、媒体业务和物联业务以及泛在业 务;互联网已经完成了与电信网的融合,也具备了与广播电视网 融合的条件,可以说互联网为三网融合奠定了基础。互联网经历 了早期的ARPANET(美国国防部先进研究项目署网络)到公众 互联网、全球互联网阶段,正朝着下一代互联网演进,这几个阶 段对应着研究性网络、商业网和泛在网。 249 第二章 互联网的业务发展与技术演进 第二章 互联网的业务发展与技术演进 图表 117.互联网业务应用的演进 图表 117.互联网业务应用的演进 3.物联业务 3.物联业务 物联业务和物联网近年受到特别的关注。物联网(Internet of 物联业务和物联网近年受到特别的关注。物联网(Internet of Things)是指通过传感器、RFID(射频标签)、二维码等信息传 Things)是指通过传感器、RFID(射频标签)、二维码等信息传 感设备,使需要连网的物品具有拟人化的身份、物理属性和智能 接口,按照约定的协议,把这些物品与通信网络连接起来,进行 感设备,使需要连网的物品具有拟人化的身份、物理属性和智能 信息交换和通信,以实现对感知对象和环境的智能化识别、定位、 接口,按照约定的协议,把这些物品与通信网络连接起来,进行 跟踪、监控和管理。物联网的组成可分为三个层次,底层是利用 信息交换和通信,以实现对感知对象和环境的智能化识别、定位、 RFID、传感器等的泛在化传感单元及网络,提供透彻的感知能力, 跟踪、监控和管理。物联网的组成可分为三个层次,底层是利用 中间层是提供通信传送功能的基础网络设施,支持全面的互联互 RFID、传感器等的泛在化传感单元及网络,提供透彻的感知能力, 通,上层是数据分析与智能服务的应用层,支持智能决策与行动。 中间层是提供通信传送功能的基础网络设施,支持全面的互联互 虽然物联网可用的基础网络不限于互联网,但通常互联网是最适 通, 上层是数据分析与智能服务的应用层,支持智能决策与行动。 合作为物联网的基础网络,在这种情况下,物联网相当于互联网 虽然物联网可用的基础网络不限于互联网,但通常互联网是最适 上面向特定任务来组织的专用网络(VPN),需要指出,互联网 合作为物联网的基础网络,在这种情况下,物联网相当于互联网 是全球性的,但物联网往往是行业性的或区域性的。因此与其说 物联网是网络,不如说物联网是业务或应用,物联业务是互联网 上面向特定任务来组织的专用网络(VPN),需要指出,互联网 250 是全球性的,但物联网往往是行业性的或区域性的。因此与其说 物联网是网络,不如说物联网是业务或应用,物联业务是互联网 250 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 应用的拓展。为了支持物联网的应用,互联网也需要增强一些功 能,例如物联网的行业应用的多样性与网络承载平台的通用性之 间需要有中间件来适配,在传统互联网的上层还需要增加智能信 息处理、数据挖掘与决策支撑等功能。物联业务广泛应用在各领 域,例如工业领域可用于供应链管理、生产环境监测、生产过程 用料与工艺优化、生产设备和仪器管理、产品全生命周期监测、 节能与环保监测、员工管理等,智能电网、智能交通、智能物流、 数字医疗、安全监视、智能家居等也是物联业务可以发挥重要作 用的领域。 4. 泛在业务 泛在网被作为通信网络发展的愿景,它是在物理网上以泛在 联网业务为表征的概念性网络。国际电信联盟标准局ITU-T在其 建 议 书 Y.2002 中 对 泛 在 联 网 给 出 了 如 下 定 义 , “ 泛 在 联 网 (ubiquitous networking)是个人和/或设备在预订服务的情况下以 对服务被接入的地点、时间和方式的最少技术限制接入到服务和 通信的能力”。这一定义被用于命名需要提供支持要求“任何服务、 任何时间、任何地点和任何对象”的各类应用/服务的网络能力, 具有这样能力的网络被称为泛在网,其基本目标之一是满足人和 物等无缝通信的挑战,泛在网支持人与人、人与物、物与物等三 种类型通信 65。物联网的物件是可寻址、可通信和可控制的,泛 在网则将物体看成是可寻址、可语义化、可调用的资源。泛在网 提供泛在连接性(允许无论何时、何人、何地和何种类型的通信)、 普适现实性(提供可连接实际世界环境的有效接口)和电子环境 智能性(能够感知和响应人的存在的电子环境,允许创新的通信 251 第二章 互联网的业务发展与技术演进 第二章 互联网的业务发展与技术演进 和提供增值的创造)。泛在网具有 IP 连接性、个人化、智能化、 物品标签化、智能设备等基本特征。图表 118 表示了泛在网所具 和提供增值的创造)。泛在网具有IP连接性、个人化、智能化、 有的能力, 即连接任何对象的能力(包括识别、 命名和寻址能力)、 物品标签化、智能设备等基本特征。图表 118 表示了泛在网所具 基于开放的 Web 业务环境的能力、上下文感知和无缝通信能力、 有的能力,即连接任何对象的能力 (包括识别、命名和寻址能力)、 网间互通能力、 异构网上的端到端连接性等。其中 Web 环境能力 基于开放的Web业务环境的能力、上下文感知和无缝通信能力、 网间互通能力、异构网上的端到端连接性等。其中Web环境能力 指利用 Web 技术(例如搜索引擎、社交网络引擎、内容聚合工具、 指利用Web技术 (例如搜索引擎、社交网络引擎、内容聚合工具、 Web GIS 等)来配置、管理、定位各种资源,创建内容和应用。 Web GIS等)来配置、管理、定位各种资源,创建内容和应用。 上下文感知即场景感知,场景意味着用户所处的位置、用户接入 上下文感知即场景感知,场景意味着用户所处的位置、用户接入 的状态等, 网络借助先进的高端移动终端(具有定位、中间件环境、 的状态等,网络借助先进的高端移动终端(具有定位、中间件环境、 传感器功能等)和 RFID 等能够感知用户所处的场景,根据预置的 传感器功能等)和RFID 等能够感知用户所处的场景,根据预置的 或用户的喜好自动配置用户周边的电子设备和终端,从而能给用 或用户的喜好自动配置用户周边的电子设备和终端,从而能给用 户提供包括位置感知服务、定位服务、内容感知服务、环境感知 户提供包括位置感知服务、定位服务、内容感知服务、环境感知 服务等在内的个人环境服务(PES),即设身处地投其所好为用 服务等在内的个人环境服务(PES),即设身处地投其所好为用 户服务。 户服务。 图表 118.泛在网所具有的能力 图表 118.泛在网所具有的能力 252 252 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 二.互联网发展面临的挑战 互联网设计之初只考虑支持尽力而为的数据业务,现在的互 联网应用已无所不包,互联网设计时的假定很多已经不成立,例 如假定主机是PC类智能终端,而现在主机已经扩展到包括RFID 和传感器;假定主机固定使用,即使用者、主机、物理位置和IP 地址是等效的,而现在移动终端作为主机已经很普遍;网络是黑 匣子的假定,排除了网络与业务类型的关联,已不适应业务发展 的需要;尽力而为服务的假定,无法满足实时业务QoS(服务质 量)的要求;业务流可信任的假定,已被网络日益增多的安全问 题所推翻;与商业应用无关的假定,导致了至今互联网的建设缺 少经济激励,宽带化也缺乏可持续发展的商业模式。互联网的应 用已经超越了互联网设计的初衷,互联网的发展面临诸多挑战 66。 1.可扩展性的挑战 互联网的流量继续高速增长,日本互联网干线流量十年增加 1000 倍 67, 2012 年全球互联网的视频流量将是美国 2000 年全网 流量的 400 倍。中国互联网国际干线的带宽从 1997 年末的 18.64Mb/s发展到 2010 年中的 998Gb/s,十年增长了 1.68 万倍, 年均增加 249%,这一数字比同期互联网用户的年均增长率 106% 高一倍多,但仍不能满足网民对带宽的需求。在 2009 年底中国内 地每个网民平均接入速率和可用的国际带宽分别为 857kbps和 2.3kbps ,而香港对应的分别是 8.6Mbps和 24.5kbps,均比内地高 一个数量级 68。互联网流量的增长还表现在路由表上,核心网中 边界路由器网关协议(BGP)的转发信息表(FIB)的条目数 2005 年为 15 万条,2010 年为 30 万条,预计 2050 年可能达到 1000 万 253 第二章 互联网的业务发展与技术演进 条。流量的高速增加对传输能力、交换能力都带来极大的挑战。 尽管综合利用 OFDM、PDM、DWDM 等多种调制方式和多 电平线路编码以及相干检测等光传输技术在实验室可达到单根 光纤传输 25.6Tbps(160 波×160Gbps),但在长距离传输时的色 散补偿和非线性管理仍然困难,离实用仍然较远。由于没有合适 的光存储器件,用光分组交换取代路由器还可望不可及,光突发 交换也有颗粒性的不足,总之,目前还没有理想的光交换设备。 单机架商用电信级路由器目前仅为 Tbps 量级,虽然多机架互联 可提供高达数百 Tbps 量级的能力,但由于可靠性等原因,大规 模商用尚难预期。增加路由器数量以代替超大容量路由器似乎是 解决办法,但路由器数量的增加将面临网络扁平化与路由收敛的 两难选择。 2. IP 地址资源的挑战 中国在 2010 年 6 月底有 2.5 亿个 IPv4 地址, 仅占全球的 7%, 平均每个网民仅有 0.6 个 IPv4 地址,还未考虑目前使用私有地址 的移动互联网用户。宽带上网的永远在线特性将需要更多的 IP 地 址,泛在网的应用也将消耗大量 IP 地址。到 2012 年将没有新的 IPv4 地址可分配,转换到 IPv6 是必然的选择。IPv6 为真实源地 址溯源提供了可能,但伴随 IPv6 的 IPsec 加密协议的采用对内容 监管也是挑战,此外 IPv6 海量的地址解决了地址可扩展性后又带 来路由表长度的海量扩展,需要改进路由器的选路协议。 3. 频谱资源的挑战 中国的城市的中心区移动通信用户密度很高,每平方公里区 254 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 域内已经达到 12~14 万移动用户规模,假设这些用户在忙时打 电话不超过 2 分钟,还假设移动通信蜂窝半径在密集用户区已缩 短为 50 米,为支持这些用户的通信,需要 2G 的上下行频谱各 30MHz 以上,还需要 3G 7~14MHz。上述计算还未考虑移动数 据业务的迅速增长,中国移动公司 2010 年 1~5 月与 2009 年同 期相比,数据卡流量年增 388%,其中 3G 数据卡流量增加 30 倍。 根据 Cisco 公司估计,2013 年移动互联网的流量将与 2005 年固 定互联网的流量相当。尽管 ITU(国际电信联盟)计划将 2.3~ 2.4GHz 和 2.5~2.6GHz 以及 700MHz 频段调整分配给移动通信使 用,但这些频段面临与已有的无线电定位业务和广播电业务等应 用的冲突,协调难度很大。 4.可管理性的挑战 将面向数据传输而设计的无连接模式用到话音、视频等实时 业务时总有些勉为其难,服务质量保证与网络效率提高的矛盾仍 未得到很好解决,视频对实时性和抖动有严格要求,QoS 问题比 过去更受关注,但仍未看到突破性的进展。P2P 流加快了带宽的 消耗,运营商承受网络带宽扩容的压力但又难以从这些业务中获 利,需要解决对流量及其业务特征的优化管理,开发合理的商业 模式。宽带化使得互联网用户不仅仅是消费者,也是网络内容的 生产者,要加强对网络内容的引导和净化网络。版权管理等问题 也因宽带化而更突出,互联网的治理需要法律支撑,但目前相关 法律缺失。互联网离可信可管还有不少距离。 255 第二章 互联网的业务发展与技术演进 5.安全性的挑战 Windows 2000 和 Windows XP 的源代码估计分别约有 3500 万行和 4500 万行,平均每 1500 行可能有一个 bug 或缺陷, Windows 2000 和 Windows XP 的 bug 或缺陷将分别达到 2.3 万 和 3 万个。 安全性是无法回避的技术挑战,宽带接入的永远在 线特征为病毒和黑客的攻击提供了更多机会;云计算平台一旦出 现故障,将使大规模的服务瘫痪;因内存与功耗原因不太可能把 装在 PC 的防火墙和杀毒软件移植到手机上;物联网的使用为重 要的基础设施引入了智能,但对感知元件的误报与智能决策误判 的风险不能掉以轻心;与安全性相关的还有隐私保护问题,这也 是泛在网推广应用的前提。 6.节能环保的挑战 信息通信技术(ICT)能够帮助众多的行业节能降耗,但 ICT 产品的广泛渗透,使其总能耗年增 5%,ICT 产品的 CO2 排放占 全球 2%~2.5%,其中电信设备约占 1/4,随着宽带大容量电信 产品的使用,能耗问题不容忽视。2008 年思科公司的大容量路由 器 CRS-1 带宽为 1.2Tb/s,功耗 15kW,假设十年后容量需要增加 1000 倍,则需要 1.2Pb/s,一般而言,路由器容量增加 1000 倍,功 耗增加 100 倍,1.2Pb/s 的路由器的功耗将达到 1.5MW,如果全 国需要 1000 个这样的路由器,则共耗电 1500 MW。 7.互联网数学模型的可信性 尽管对互联网局部的网络性能、流量的测量有一些研究,但 目前还没有一个令人信服的网络数学建模,理论研究落后于互联 256 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 网建设与应用,仿真的模型还不能反映实际应用环境,研究性试 验床的规模又无法与实际网络相比,对于一个人类社会高度依赖 的系统,没有可信的数学模型,没有系统的性能分析和行为预测 等理论支柱,互联网未来的发展充满不确定性。 三.互联网技术的演进 互联网的核心思想是无连接、端到端和尽力而为,但在坚持 这些基本思想的前提下现在已经出现了一些演变,例如在 IP 层之 下引入了面向连接的分组交换 MPLS(多协议标签交换)以改进 对实时业务的支持。 又如在主机之间引入 IMS (IP 多媒体子系统) 和 DPI(深度分组包的监视)引擎以及 SIP(会晤启动协议)信 令,甚至为了防恶意攻击而加入 DDOS(分布式拒绝服务)预防 和缓解工具,这种情况下的端到端之间已经不是原来意义的无需 中间介入便可直接通信的透明性了。再有 Diffserv(差分服务) 和 MPLS-TE(带流量工程的多协议标签交换)等技术的使用,在 尽力而为之外增加了 QoS 的服务类别。 鉴于互联网的现状和业务发展的要求与挑战,近年来发达国 家纷纷从国际竞争战略制高点出发,将向未来网络的过渡提升到 国家战略高度,通过建立试验网来推动向未来网络的过渡。正如 ITU-T的未来网络焦点研究组指出的 69,通过诸如IRTF (国际), GENI/FIND ( 美 国 ), FP7/FIRE ( 欧 盟 ), CNGI ( 中 国 ), AKARI/NwGN ( 日 本 ), FIF ( 韩 国 ) 项 目 以 及 在 ISO/IEC JTC1/SC6 的标准化工作,未来网络已经成为全球议程的一部分。 国际上关于未来网络的研究项目多数将目标网称为下一代互联 网(Next Generation Internet—NGI),也有称为未来互联网(Future 257 第二章 互联网的业务发展与技术演进 Internet)、下一代网(Next Generation Network—NGN)、新一代 网(New Generation Network--NwGN)和Internet3.0,有些时候同 一个研究项目的目标网同时使用了上述多种称呼 70。从所采取的 技术路线看,上述研究项目可分为两大类,一类是兼容路线,基 于IPv6 对现有互联网做大的改进的同时维持后向兼容,另一类是 基于“一张白纸”重新设计的路线,不受现有互联网体系的约束。 目前已知的多数下一代互联网试验项目基于兼容路线,它们 基于这样的认识,即在 2020 年之前原有的互联网体系仍将处于 继续完善的过程中,IPv6 和语义Web将成为系统持续演进的一部 分,利用对网络的分拆或特定的“有围墙的花园”来维护网络控制, 可以改进网络的安全性和可靠性,因此没必要用完整的新系统来 替代现有体系而承受不兼容的代价 71。兼容路线是在IPv6 平台上 演进和创新发展的互联网,虽然IPv6 不可能解决互联网存在的所 有问题,IPv6 也不是下一代互联网的全部而仅仅是开始,但IPv6 是当前互联网发展必要的措施和下一代互联网的基本特征。 IPv6 的采用不仅具有海量的地址可解IPv4 地址枯竭之困从而 能适应物联网对地址的需求,还将有以下优点 72。首先IPv6 能够 增强服务能力,IPv6 地址结构的报头含有流标记字段,可用于识 别流的类型和实现流控从而改进QoS;IPv6 支持移动性,可避免 IPv4 的移动选路三角形问题;IPv6 地址结构报头可嵌入AH (认证 头标)和ESP (封装化安全净荷)协议,提供对报文的加密和认证。 其次,IPv6 利用邻居发现协议等能够提供地址自配置功能,有利 于支持地址动态分配和多用户、多网络识别,通过将IP层与下层 的关联,自配置易于实现网络管理的自组织和业务发现,降低了 对管理的要求。第三,IPv6 能够实现多归属(Multi-homing), 258 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 IPv6 允许一个用户具有多个异构接入接口或多个IPv6 地址。第四, IPv6 有助于提供对真实源地址的寻址与溯源。 ITU使用下一代网络(NGN)作为在网络体系方面标准化工 作的目标,在ITU-T Y.2001 建议书中对NGN给出如下定义:“NGN 是能够利用多种宽带和具有QoS机制的传输技术并能提供电信业 务的基于分组交换的网络。该网络中与业务相关的功能独立于承 载的传输技术。该网络允许用户不受限地接入网络,可以自由选 择服务提供商和/或业务。该网络支持通用移动性,使得网络可以 随时随地向用户提供业务”。此定义中虽然没有指明NGN与NGI 的关系,但在Y.2051 建议书中则说明NGN将采用IPv4 或IPv6 协 议,并且指出IPv6 将构成NGN的基础,NGN将逐步过渡到基于 IPv6 的NGN,图表 119 是基于IPv6 的NGN的功能体系。NGN的 主要特征是业务与传送解耦,允许它们分别提供与独立发展。这 也是现有互联网所遵循的基本思想,从这一特征以及将要过渡到 IPv6 来看,NGN与NGI有很多共性。如果分析两者区别的话,NGI 突出端到端的原则,NGN则更强调依靠各种控制功能来管控网络 以适应业务的需要,可以说NGN是基于电信网向下一代互联网发 展的网络。3GPP(第三代移动通信伙伴组织)最近定义的LTE(3G 长期演进)的网络称为EPC(演进的分组核心网),这是一个扁平 化的全IP核心网,它清楚地分开控制面与数据面,允许多个接入 网以受控方式(安全、QoS) 连接到运营商的IP云(例如IMS 或 任 何 Intranet)或互联网,重要的 EPC 功能包括NAS(移动管理设 备与用户设备之间的非接入层信令协议) 和 AAA(验证授权与 记账)、移动和连接性管理、策略 QoS 控制与计费等,可见EPC 与NGN长远发展目标基本一致。 259 第二章 第二章 互联网的业务发展与技术演进 互联网的业务发展与技术演进 图表 119. 119. 基于 基于 IPv6 图表 IPv6 的 的 NGN NGN 的功能体系 的功能体系 基于重新设计的路线的研究试验项目以美国的全球网络环境 基于重新设计的路线的研究试验项目以美国的全球网络环境 创新(GENI)计划、欧盟的未来互联网研究实验(FIRE)计划 创新(GENI)计划、欧盟的未来互联网研究实验(FIRE)计划 和日本的AKARI计划为代表,目标是面向未来 和日本的 AKARI 计划为代表,目标是面向未来15 15 年甚至更长远 年甚至更长远 73 73 的互联网。美国的GENI计划 的互联网。美国的 GENI 计划提出未来互联网的目标是:信息接 提出未来互联网的目标是:信息 入的高可用性与可信性;无论何时何地的无缝接入;实时接入物 接入的高可用性与可信性;无论何时何地的无缝接入;实时接入 理世界的信息;动态和挑战环境的信息接入。这些目标可以概括 物理世界的信息;动态和挑战环境的信息接入。这些目标可以概 为未来的互联网应是可信的互联网、移动互联网、可支持物联网 括为未来的互联网应是可信的互联网、移动互联网、可支持物联 业务的互联网、支持泛在网应用的互联网。为了实现这些目标, 网业务的互联网、支持泛在网应用的互联网。为了实现这些目标, 正在试验一些新技术,例如美国的GENI计划中的未来互联网设计 正在试验一些新技术,例如美国的 GENI 计划中的未来互联网设 (FIND)项目提出了分片化(Slicing)、虚拟化(Virtualization) 计(FIND)项目提出了分片化(Slicing)、虚拟化(Virtualization) 和可编程化(Programmability)的设计思想,通过逻辑上分离的 和可编程化(Programmability)的设计思想,通过逻辑上分离的 方式动态地支持不同的业务共享物理实体,以便将传送资源与业 方式动态地支持不同的业务共享物理实体,以便将传送资源与业 务服务质量对应。 务服务质量对应。 260 260 日本 AKARI 计划提出未来泛在社会(UNS) 要满足 2020 年 社会对通信速度、容量和安全性要求,并将面向 2050 年应对价 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 值创造、异构、节能、 自治和复杂性五方面的挑战。UNS 将基 日本AKARI计划提出未来泛在社会(UNS) 要满足 2020 年社 于 NwGN(新一代网络)技术、通用通信技术和安全技术三大支 会对通信速度、容量和安全性要求,并将面向 2050 年应对价值 柱,实现增值网、可信网、泛在网、自治网、可持续网(绿色网) 74 创造、异构、节能、 自治和复杂性五方面的挑战。UNS将基于 这五个目标。NwGN 的研究方向是从目前的无连接数据报体系 NwGN(新一代网络)技术、通用通信技术和安全技术三大支柱, 演进到分组与通道交换混合的体系,一方面尽可能在低层即承载 74 实现增值网、可信网、泛在网、自治网、可持续网(绿色网) 这 网以通道交换模式实现大业务流的传送与交换,显著减少对比特 五个目标。NwGN 的研究方向是从目前的无连接数据报体系演进 /分组的处理和功耗并降低成本, 还能为实时性的大容量业务流提 到分组与通道交换混合的体系,一方面尽可能在低层即承载网以 供带宽保证,另一方面对于要求细颗粒性和快速配置的业务,则 通道交换模式实现大业务流的传送与交换,显著减少对比特/分组 放在的处理和功耗并降低成本,还能为实时性的大容量业务流提供带 IP 层选路处理。NwGN 研究重点是应用层、重叠网(例如 P2P 宽保证,另一方面对于要求细颗粒性和快速配置的业务,则放在 等分布服务网)、 IP+α 或后 IP 网和承载网(包括光纤传送网、移 IP层选路处理。NwGN研究重点是应用层、重叠网(例如P2P等分 动网和传感器网)。NwGN 项目明确提出将基于后 IP 的技术路 75 布服务网)、 IP+α或后IP网和承载网(包括光纤传送网、移动网 线 ,即引入后 IP(post-IP)协议或对现有 IP 协议做戏剧性的变 75 和传感器网)。NwGN项目明确提出将基于后IP的技术路线 , 化。图表 120 表示了 NwGN 的体系概念。 即引入后IP(post-IP)协议或对现有IP协议做戏剧性的变化。图 表 120 表示了NwGN的体系概念。 图表120. 120.NwGN NwGN 体系的概念 体系的概念 图表 261 261 第二章 互联网的业务发展与技术演进 欧盟的FIRE项目 76通过建立大规模的试验床进行长期研究, 该项目明确提出要进行破坏性创新的探索,虽然有风险但有可能 获得有意义的突破,同时FIRE项目认为兼容路线与重新设计的路 线是可以互补的,指出在近期显然需要关注兼容路线,而长远有 必要考虑互联网体系或其一部分可能需要的根本性变化。 两条路线的差别表现为要不要考虑与现有互联网兼容,就目 前的认识而言,两条路线离应对挑战的目标都还有相当大的距离, 还有待更多的创新突破。两条路线既是互相竞争也互相借鉴,重 新设计的路线并非一概排斥IP,兼容路线的研究项目也在试验分 片、虚拟与可编程的技术。还有一些技术思想是两种路线的研究 项目都关注的,例如身份与位置分离的概念 77。 互联网设计之初未考虑主机会移动,当时设计IP地址具有双 重属性,即不仅表示主机位置还表示端点的识别。在主机从移动 网关GW1 的区域移动到GW2 的区域时,需要改变IP地址才能正 确选路分组到新的位置,但IP地址的变化将意味服务中断。在目 前的移动互联网方案中在主机移动后为维持业务连续性,信息仍 然需要经过GW1 再绕到GW2,导致流量迂回,浪费了城域网带 宽,增大了时延,增加了管理和规划IP城域网的复杂性,在LTE 情况下还会因用户永远在线而使问题更严重。另外,主机IP地址 的变化将导致难于跟踪与识别实际的主机,带来安全隐患,而且 IP地址的分配在组织与网络拓扑之间出现矛盾,不利于网络的扩 展。总之,IP地址的双重属性带来移动性、安全性和扩展性问题。 为了支持移动业务,位置(地址)应该是可变的,但为了业务连 续性,主机的身份(命名)是不应该变化的,唯一的解决办法是 将主机身份与位置分离,IP地址用于表示网络层的位置,在网络 262 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 层之上的传送层处理主机的身份识别符,并通过命名解析系统建 立身份与位置的映射关系。命名与地址的分离将解耦命名与网络 层协议的关联,网络层的协议可以是IP或后IP甚至是非IP,这有 利于支持异构网、移动性、多归属、安全性和选路功能。有资料 将身份与位置分离的网络称为NDN(命名数据网)或CCN(内容中 心网),即基于命名(或其对应的内容)而不是基于IP地址来来选路, 因为用户本来关心的是获得所需的内容而不关心从何处获得这 些内容,甚至可以从多处抽取信息并聚合为用户所需的内容 78。 我国在“十一五”期间部署的网络技术研发与产业化项目取得 了可喜的进展,中国下一代互联网示范工程项目(CNGI)建设了 网络研发试验环境,部署了一批下一代互联网的研发和试验项目, 在推动国产 IPv6 路由器的产业化方面起到重要作用,在 IPv6 源 地址认证和 IPv6 over IPv4 方面的创新性成果促进了国际标准化 工作。CNGI 项目在重点研究兼容路线的技术和系统的同时,也 适当安排了不以兼容为目的的互联网技术的研究。在新一代宽带 无线移动通信网的科技重大专项中,不仅在 TD-SCDMA 增强型 系统产业化和 TD-LTE 系统的研发方面取得显著进展,而且还开 展了移动互联网技术与业务、物联网关键技术和应用示范及泛在 网的总体技术研究。在国家 863 计划和 973 计划中分别部署了可 信网络开发和面向未来的网络演进科学问题的研究。在“十二五” 期间,对作为战略性新兴产业的重点之一的信息网络产业将加大 支持力度。但是应该看到我们在网络技术方面仍有不少差距,当 前网络技术正处在换代演进的时期,既充满创新的空间,又面临 严峻的挑战,发达国家纷纷将其视作战略制高点力图夺取先机, 我们必须抓住这一机遇,突破核心技术,为国民经济和社会信息 263 第二章 互联网的业务发展与技术演进 化提供可靠的支撑。 264 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 三 构建积极防御综合防范的 信息安全保障体系 沈昌祥 院士 国家信息化专家咨询委员会委员 1、前言 构建积极防御综合防范的信息安全保障体系是当先信息安 全建设工作中的重中之重。信息是社会发展的重要战略资源,信 息技术和信息产业正在改变传统的生产、经营和生活方式,成为 新的经济增长点,但是,信息的作用是建立在安全可信的基础上, 如果信息变得不安全,则错误的信息将起极大的反作用,甚至阻 碍经济的增长,危害国家安全 79。信息安全成为维护国家安全和 社会稳定的一个焦点,各国都给以极大的关注与投入。目前我国 信息与网络安全的防护能力处于发展的初级阶段,许多应用系统 处于不设防状态,很多时候忙于封堵现有信息系统的安全漏洞。 要解决这些迫在眉睫的问题,归根结底取决于信息安全保障体系 的建设,需要建立适合我国国情的信息安全保障体系。首先,需 要明确信息安全相关内涵: (1)信息安全是指保护信息和信息系统不被未经授权的访 问、使用、泄露、中断、修改和破坏,为信息和信息系统提供保 密性、完整性、可用性、可控性和不可否认性。 (2)信息安全保障是保证信息与信息系统的保密性、完整 性、可用性、可控性和不可否认性的信息安全保护和防御过程。 265 第三章 构建积极防御综合防范的信息安全保障体系 它要求加强对信息和信息系统的保护,加强对信息安全事件和各 种脆弱性的检测,提高应急反应能力和系统恢复能力。 (3)信息安全保障体系是实施信息安全保障的法制、组织 管理和技术等层面有机结合的整体,是信息社会国家安全的基本 组成部分,是保证国家信息化顺利进行的基础。 2、美国网络空间安全战略形成和发展 (1)美国将网络空间安全由“政策”、“计划”提升为国家 战略 1998 年 5 月 22 日,美国政府颁发了《保护美国关键基础设 施》总统 80令(PDD‐63) ,成为直至现在美国政府建设网络空间 安全的指导性文档。此后,美国围绕“信息保障”成立了多个组 织,其中包括:“全国信息保障委员会”(NIAC)、 “全国信息保障 同盟”(NIAOP)、 “关键基础设施保障办公室”(CIAO) 、“首席信 息官委员会” (CICO) 、 “联邦计算机事件响应能力能动组” (FEDCIRC) 等 10 多个全国性机构。1998 年美国国家安全局(NSA)制定了《信 息保障技术框架》 (IATF) 81,是信息保障技术领域中最为系统的 研究。2000 年 1 月,克林顿政府发布了《信息系统保护国家计划 v1.0》,提出了美国政府在 21 世纪之初若干年的网络空间安全发 展规划。2001 年 1 月,发布了《保卫美国的计算机空间—保护信 息系统的国家计划》 ,该计划分析了美国关键基础设施所面临的 威胁,确定了计划的目标和范围,制定出联邦政府关键基础设施 保护计划(其中包括民用机构的基础设施保护方案和国防部基础 设施保护计划),以及私营部门、州和地方政府的关键基础设施 保障框架。2001 年 10 月 16 日,布什政府意识到了 911 之后信息 266 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 安全的严峻性,发布了第 13231 号行政令《信息时代的关键基础 设施保护》 ,宣布成立“总统关键基础设施保护委员会” ,简称 PCIPB 82,代表政府全面负责国家的网络空间安全工作,委员会由 克拉克担任主席。该委员会于 2002 年 9 月 18 日制定发布了《保 护网络空间的国家战略》 (草案),于 2003 年 2 月正式发布。2003 年 12 月 17 日发布了《第 7 号国土安全总统令》 ,重新对关键基 础设施和资源进行标识、优先级排序和防护,要求国防部建立合 适的系统、机制和流程与其他部门进行协调和沟通。2005 年 4 月 14 日,美国政府公布了美国总统IT咨询委员会 2 月 14 日向总统 布什提交的《网络空间安全:迫在眉睫的危机》的紧急报告,对 美国 2003 年的信息安全战略提出不同看法,指出过去十年中美 国保护国家信息技术基础建设工作是失败的,短期弥补修复不解 决根本问题。2006 年 4 月信息安全研究委员会发布的《联邦网络 空间安全及信息保障研究与发展计划(CSIA)》确定了 14 个技术 优先研究领域,13 个重要投入领域。改变无穷无尽打补丁和封堵 的被动防御策略。美国国防部 2007 年 2 月 4 日公布的《四年一 度防务评审》报告非常关注网络空间安全,把加强网络空间安全 研究作为未来重点发展的作战力量之一。报告指出,网络不仅是 一种企业资产,还应作为一种武器系统加以保护,如同国家其它 的关键基础设施那样受到保护。针对当前和未来可能的网络攻击, 报告重点提出了“设计、运行和保护网络,确保联合作战连续性” 的需求。2008 年 1 月,为了应对社会各界所提出的政府工作不力 的质疑,以及为了进一步从对抗战略攻击的角度加强美国的网络 空间安全,美国发布了机密级的第 54 号国家安全总统令(同时 也编号为第 23 号国土安全总统令),通过该令设立了“综合性国 267 第三章 构建积极防御综合防范的信息安全保障体系 家网络安全计划” ,提出了很多新的政策与行动计划,还扩展了 国家安全局对政府信息系统安全的主管权力。最近解密了网络安 全计划摘要,提出“曼哈顿”计划(二战研制原子弹)。工程计 划以“爱因斯坦”命名,全面建设联邦政府和主要信息系统的防 护系统,建立全国统一的安全态势信息共享和指挥系统。 (2)美国网络空间安全当前的战略 美国在 2007 年 8 月成立了第 44 届总统网络空间安全委员会, 经过一年半的工作,形成了《提交第 44 届总统的保护网络空间 安全的报告》 。报告引言:暗战,以二战时期“阿尔法和英格玛” 事件为警示,提出“网络安全是美国在一个竞争更加激烈的新国 际环境中面临的最大安全挑战之一”。2008 年 12 月,为了加深美 国政府对信息安全现状的认识,美国开展了为期 2 天的“模拟网 络战” ,总计有 230 名来自军方、政府和企业的代表参与了这次 演习活动,演习结果认为,美国在网络攻击前抵抗能力很差,这 为奥巴马政府敲响了警钟。2009 年 2 月 9 日,奥巴马指示美国国 家安全委员会和国土安全委员会负责网络空间事务的代理主管 梅利萨•哈撒韦主持组织对美国的网络安全状况展开为期 60 天的 全面评估。经过几个月的工作,2009 年 5 月 29 日,奥巴马在白 宫东厅公布了名为《网络空间政策评估——保障可信和强健的信 息和通信基础设施》的报告,并发表重要讲话。奥巴马在演讲词 中强调,美国 21 世纪的经济繁荣将依赖于网络空间安全,他将 网络空间安全威胁定位为“我们举国面临的最严重的国家经济和 国家安全挑战之一”,并宣布“从现在起,我们的数字基础设施 将被视为国家战略资产。保护这一基础设施将成为国家安全的优 先事项” 。2010 年 2 月 16 日,美国两党间政策问题研究中心组织 268 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 了“网络风暴”演习,旨在使美国领导人演练应对未来灾难性的网 络袭击。 3、信息安全保障体系的基本架构 十六届四中全会提出了增强国家安全意识,完善国家安全战 略,有效防范和应对各种风险与挑战,确保国家的政治安全、经 济安全、文化安全和信息安全的要求。中办发[2003]27 号文件《国 家信息化领导小组关于加强信息安全保障工作的意见》中关于加 强信息安全保障工作的总体要求是:坚持积极防御、综合防范的 方针,全面提高信息安全防护能力,重点保障基础信息网络和重 要信息系统安全,创建安全健康的网络环境,保障和促进信息化 发展,保护公众利益,维护国家安全。信息安全保障能力是 21 世纪综合国力、经济竞争和生存能力的象征,是未来国际斗争的 “杀手锏” ,信息安全保障体系的基础性、全局性、战略性作用 进一步突出。 图表 121.信息安全保障体系的基本框架 269 第三章 构建积极防御综合防范的信息安全保障体系 信息安全保障体系的基本框架包括四个层面,两个支撑,一 个确保(如 图表 121 所示)。 信息安全保障体系中四个层面是指: 在信息安全平台及安全基础设施层面,需要加强信息安全平 台及基础设施建设。建立安全事件应急响应中心、数据备份和灾 难恢复设施;发挥密码在保障体系中的基础和核心作用,加强密 码基础设施(KMI/PKI)的建设。加强以密码技术为基础的信息保 护和网络信任体系建设。 在信息安全技术保障体系层面,需要强化国家信息安全技术 防护体系。采用先进技术手段,确保网络和电信传输、应用区域 边界、应用环境等环节的安全,既能防外部攻击,又能防内部作 案。加强信息安全技术研究开发,推进信息安全产业发展,重视 信息安全应急处理工作,建设和完善信息安全监控体系。 在信息安全组织体系层面,需要完善国家信息安全组织管理 体系。强化管理机构的职能,建立高效能的、职责分工明确的行 政管理和业务组织体系。加强国家信息安全保障的综合协调工作。 加强对信息安全工作的领导,建立健全信息安全责任制,实行信 息安全等级保护。 在信息安全法制体系层面,需要建立信息安全法制体系。确 立信息化领域法规框架,做到有法可依,有法必依。加强信息安 全法制建设和标准化建设。 两个体系是指信息安全经费保障体系以及信息安全人才保 障体系。其中,信息安全经费保障体系需要确定国家信息安全经 费支持规划,明确信息安全保障体系建设经费占信息化经费的比 例,保证信息安全资金;信息安全人才保障体系需要确立信息安 全人才教育和培训体系。信息安全应列为一级学科,进行学历教 270 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 育,除培养大批高质量的专门人才外,还须进行社会化的培训和 普及教育,以提高全民的信息安全素质,加快信息安全专业人才 培养,增强全民信息安全意识。 一个确保是指确保国家关键信息基础设施的安全运行,加强 信息安全保障工作的总体要求和主要原则。 4、对当前信息安全保障的反思 当前大部分信息安全系统主要是由防火墙、入侵检测和病毒 防范等组成。常规的安全手段只能是在网络层(IP)设防,在外围对 非法用户和越权访问进行封堵,以达到防止外部攻击的目的,对 访问者源端(客户机)未加控制,信息资源随意共享,操作系统 的不安全导致应用系统的各种漏洞层出不穷,无法从根本上解决, 导致应用系统的各种漏洞层出不穷。封堵的办法是捕捉黑客攻击 和病毒入侵的特征信息,其特征是已发生过的滞后信息,不能科 学预测未来的攻击和入侵,更不能防止操作层面上的问题。随着 恶意用户的攻击手段变化多端,防护者只能把防火墙越砌越高、 入侵检测越做越复杂、恶意代码库越做越大,误报率也随之增多, 使得安全的投入不断增加,维护与管理变得更加复杂和难以实施, 信息系统的使用效率大大降低,而对新的攻击毫无防御能力(如冲 击波蠕虫)。反思上述的做法为老三样:堵漏洞、作高墙、防外攻, 防不胜防。产生这些安全事故的技术原因是:现在的 PC 机软、 硬件结构简化,导致资源可任意使用,尤其是执行代码可修改, 恶意程序可以被植入。病毒程序利用 PC 操作系统对执行代码不 检查一致性的弱点,将病毒代码嵌入到执行代码程序,实现病毒 传播。黑客利用被攻击系统的漏洞窃取超级用户权限,植入攻击 271 第三章 构建积极防御综合防范的信息安全保障体系 程序,肆意进行破坏。更为严重的是对合法的用户没有进行严格 的访问控制,可以进行越权访问,造成不安全事故。积极防御应 该是主动防止非授权访问操作,从客户端操作平台实施高等级防 范,使不安全因素从终端源头被控制。 5、用可信计算技术解决安全问题 可信是指“一个实体在实现给定目标时其行为总是如同预期 一样的结果” 。强调行为的结果可预测和可控制。为了解决PC机 结构上的不安全,从基础上提高其可信性,在世界范围内推行可 信计算技术,1999 年由COMPAQ、HP、IBM 8384、INTEL 85和 MICROSOFT 8687牵头组织TCPA(Trusted Computing Platform Alliance), 目前已发展成员 190 家,遍布全球各大洲主力厂商。TCPA 专注 于从计算平台体系结构上增强其安全性,2001 年 1 月发布了标准 规范(v1.1),2003 年 3 月改组为TCG(Trusted Computing Group) 88, 其目的是在计算和通信系统中广泛使用基于硬件安全模块支持 下的可信计算平台,以提高整体的安全性。 可信计算指一个可信的组件,操作或过程的行为在任意操作 条件下是可预测的,并能很好地抵抗不良代码和一定的物理干扰 造成的破坏。可信计算是安全的基础,从可信根出发,解决PC机 结构所引起的安全问题 89。 272 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 122.可信计算平台 可信计算平台基于可信平台模块(TPM) 90,以密码技术为 支持、安全操作系统为核心(如 图表 122 所示),具有以下功能: 确保用户唯一身份、权限、工作空间的完整性/可用性;确保存储、 处理、传输的机密性/完整性;确保硬件环境配置、操作系统内核、 服务及应用程序的完整性;确保密钥操作和存储的安全;确保系 统具有免疫能力,从根本上阻止病毒和黑客等软件攻击,做到内 部人员无法篡改系统资源。 图表 123.可信链建立过程 273 第三章 构建积极防御综合防范的信息安全保障体系 可信计算平台从可信根开始到硬件平台、到操作系统、再到 应用,逐层进行可信度量,建立一套可信链从而完成信任的传递 (如 图表 123 所示),并且把这种信任扩展到整个计算机系统, 从而确保整个计算环境可信。 图表 124.可信计算平台体系 可信计算平台体系结构中,可信平台模块TPM是底层硬件, 主要负责密钥存储、密钥生成,以及计算度量值等工作。TSS 91核 心服务层TCS并通过TDDL层提供的接口来访问TPM。每个平台只有 一个TCS,他类似于系统服务功能来执行。这个模块提供所有原始 的功能,例如密钥管理,来有效的管理TPM中的有限资源。TCS 为每个平台上的所有TSP提供了一组通用服务。因为TPM是单线程 的,所以TCS提供单线程对TPM的访问。TSP可以获得TCS上的可用 服务,为应用程序提供各种可信服务。 可信计算作为一种技术,能够在一定程度上保护信息安全, 但是在重要信息系统中必须以防内为主,要处理的工作流程都是 274 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 预先设计好的,操作使用的角色是确定的,应用范围和边界都是 明确的,这类工作流程相对固定的生产系统与 INTERNET 网是有 隔离措施的,外部网络的用户很难侵入到内部网络来,其最大的 威胁是来自内部人员的窃密和破坏。据权威机构统计,83%的信 息安全事故为内部人员和内外勾结所为,而且呈上升的趋势。因 此我们应该以“防内为主、内外兼防”的模式,从提高使用节点 自身的安全着手,构筑积极、综合的安全防护系统。应该做到强 机制、高可信、控使用、防内外,积极防御,做到非法人员进不 来、拿不走、看不懂、改不了、赖不掉。 6、积极防御的技术框架 积极防御应该是主动防止非授权访问操作,从客户端操作平 台实施高等级防范,使不安全因素在终端源头被控制。这对工作 流程相对固定的重要信息系统显得更为重要而可行。对工作流程 相对固定的重要信息系统主要由操作应用、共享服务和网络通信 三个环节组成。如果信息系统中每一个使用者都通过可信终端认 证和授权,其操作都是符合规定的,网络上也不会被窃听和插入, 那么就不会产生攻击性共享服务资源的事故,就能保证整个信息 系统的安全,以此来构建积极防御、综合防范的防护框架。 275 第三章 构建积极防御综合防范的信息安全保障体系 图表 125.工作流程相对固定的生产系统安全解决方案 可信终端确保用户的合法性和资源的一致性,使用户只能按 照规定的权限和访问控制规则进行操作,能做到什么样权限级别 的人只能做其身份规定的访问操作,只要控制规则是合理的,那 么整个信息系统资源访问过程是安全的。这样构成了安全可信的 应用环境(子信息系统) 。 应用安全边界设备(如安全网关等)保护共享服务资源,其 具有身份认证和安全审计功能,将共享服务器(如数据库服务器、 WEB 服务器、邮件服务器等)与非法访问者隔离,防止意外的非 授权用户的访问(如非法接入的非可信终端) 。这样共享服务端 不必作繁重的访问控制,从而减轻服务器的压力,以防产生新的 安全后门。 采用 IPSEC 实现网络通信全程安全保密。IPSEC 工作在操作系 统内进行,实现源到目的端的全程通信安全保护,确保传输连接 的真实性和数据的机密性、一致性,防止非法的窃听和插入。 综上所述,可信的应用操作平台、安全的共享服务资源边界 保护和全程安全保护的网络通信,构成了工作流程相对固定的生 276 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 产系统的信息安全防护框架(如 图表 125 所示)。 要实现上述操作平台、边界和通信有效的保障,还需要授权 管理的管理中心以及可信配置的密码管理中心的支撑,即两个中 心支持下的三重防护体系结构。从技术层面上可以分为以下五个 环节: 应用环境安全:包括单机、C/S、B/S 模式,采用身份认证、 访问控制、密码加密、安全审计等机制,构成可信应用环境。 应用区域边界安全:通过部署边界保护措施控制对内部局域 网的访问,实现局域网与广域网之间的安全。采用安全网关、防 火墙等隔离过滤机制,保护共享资源的可信连接。 网络和通信传输安全:包括实现局域网互联过程的安全,旨 在确保通信的机密性、一致性和可用性。采用密码加密、完整性 校验和实体鉴别等机制,实现可信连接和安全通信。 安全管理中心:提供认证、授权、审计、实施访问控制策略 等运行安全服务。 密码管理中心:提供互联互通密码配置、公钥证书和传统的 对称密钥的管理,为信息系统提供密码服务支持。 对于复杂的重要系统构成三纵(公共区域、专用区域、涉密 区域)三横(应用环境、应用区域边界、网络通信)和两个中心 。 的安全防护框架 92(如 图表 126 所示) 277 第三章 构建积极防御综合防范的信息安全保障体系 图表 126.信息安全防护框架 三种不同性质的应用区域在各自采用技术相应的安全保障措 施之后,互相之间有一定的沟通,应该采用安全隔离与信息交换 设备进行连接,在重要应用域之间,也需要采用安全隔离与信息 交换设备进行边界保护。 7、重要信息系统等级保护建设整改技术框架 (1)高安全等级防护要求 总体上讲,重要信息系统安全建设要按照《信息安全等级保 《计算机信息系统安全保护等级划分准则》 护管理办法》 93、 (GB17859‐1999)94从技术和管理两个方面进行安全建设。 《计算 机信息系统安全保护等级划分准则》(GB17859‐1999)是根据国 务院 147 号令要求制定的强制性标准,是等级保护的基础性标准, 是其他标准制定的依据。该标准以访问控制为核心构建基本保护 环境和相关安全服务。《信息系统安全等级保护基本要求》是在 278 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 GB/T25070‐2010 等标准基础上,根据现有技术的发展水平,提出 和规定了不同安全等级信息系统的最低保护要求,包括基本技术 要求和基本管理要求。 《技术设计要求》 (GB/T 24856‐2009)遵照 GB17859,以及参照《通用要求》 、《基本要求》等标准的技术要 求部分,对信息系统等级保护安全从技术上进行了框架性的规范。 不包括物理安全、安全管理、安全运维等要求。高安全等级技术 保护要求主要是针对国家信息安全等级保护第三级以上系统。实 施分级保护,其保护水平总体上不低于国家信息安全等级保护第 三、四级水平。监督检查级(三级)涉及到重要性信息的系统, 要具有抵御来自外部有组织的恶意攻击能力和防内部人员攻击 的能力,不仅要对安全事件有审计纪录,还要能追踪、能响应处 理,要实现多重保护制度。强制监督检查级(四级)要有能抵御 来自敌对组织的大规模攻击的能力,和防止内部人员内外勾结的 恶意攻击的能力。不仅要全面审计违规行为,还要具有及时报警 和应急处理能力。 (2)保护框架功能和流程 从总体上讲,信息系统安全建设要按照《信息安全等级保护 管理办法》 、《计算机信息系统安全保护等级划分准则》 (GB17859‐1999)等要求进行,从技术和管理两个方面进行安全建 设。建设重要信息系统的可信计算基(TCB),即为信息系统建立 基本的保护环境,并提供安全保护所要求的附加服务。下面以三 级系统为例展示在安全管理中心支持下的计算环境、区域边界和 通信网络三重安全防护结构框架,如 图表 127 所示,可划分为 节点、区域边界、通信网络、安全管理、审计管理、系统管理和 应用支持等子系统。三级信息系统安全保护环境各子系统的主要 279 第三章 构建积极防御综合防范的信息安全保障体系 功能如下: 图表 127.保护环境框架图 1)计算环境 节点子系统。节点子系统通过在操作系统核心层、系统层设 置以强制访问控制为主体的系统安全机制,形成了一个严密牢固 的防护层,但是它需要跟别的网络连接,形成局域网,通过对用 户行为的控制,可以有效防止非授权用户的访问和授权用户的越 权访问,确保信息和信息系统的保密性和完整性,从而为典型应 用子系统的正常运行和免遭恶意破坏提供支撑和保障。如果节点 子系统安全了,那么处理信息基本就安全了,在这点上,主要解 决什么样的人能做什么样的事,身份要认证,人要授权,其防护 策略是有强制性的,这方面如果做到了强制访问控制,那么操作 行为也就不可能违规。 典型应用子系统。安全保护环境为应用系统(如安全 OA 系统 280 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 等)提供安全支撑服务。它包括:OA 系统、网站和自己编的一些 业务处理的应用程序,如果这些程序得到了强制访问控制以后, 就不可能在业务程序上发生泄密、攻击行为等问题。我们所说的 内网主要是靠这两个系统完成的。使用安全保护环境所提供的安 全机制,为应用提供符合三级要求的安全功能支持和安全服务。 2)应用区域边界。区域边界子系统通过对进入和流出安全 保护环境的信息流进行安全检查,确保不会有违背系统安全策略 的信息流经过边界,这是三级信息系统的第二道安全屏障。 3)通信网络。通信网络子系统:通信网络子系统通过对通 信数据包的保密性和完整性进行保护,确保其在传输过程中不会 被非授权窃听和篡改,使得数据在传输过程中的安全得到了保障, 是三级信息系统的第一道安全屏障。如果在通信环节出现了问题, 那么也就失去了信息安全的基础。所以,在通信网络中必须要做 到身份认证,不许把信息送到不该去的地方去;要做到数据的保 密性,该加密的进行加密;通信网络子系统通过对通信数据包的 保密性和完整性进行保护,确保其在传输过程中不会被非授权窃 听和篡改,使得数据在传输过程中的安全得到了保障。 4)管理中心 系统管理子系统:系统管理子系统负责对安全保护环境中的 计算节点、安全区域边界、安全通信网络实施集中管理和维护, 包括用户身份管理、资源管理、应急处理等,为三级信息系统的 安全提供基础保障。 安全管理子系统:安全管理子系统是信息系统的控制中枢, 主要实施标记管理、授权管理及策略管理等。安全管理子系统通 过制定相应的系统安全策略,并且强制节点子系统、区域边界子 281 第三章 构建积极防御综合防范的信息安全保障体系 系统、通信网络子系统及节点子系统执行,从而实现了对整个信 息系统的集中管理,为三级信息系统的安全提供了有力保障。 5)审计子系统 审计子系统是系统的监督中枢,安全审计员通过制定审计策 略,强制节点子系统、区域边界子系统、通信网络子系统、安全 管理子系统、系统管理子系统执行,从而实现对整个信息系统的 行为审计,确保用户无法抵赖违背系统安全策略的行为,同时为 应急处理提供依据。 (3)安全防护效果 1)攻击者进不去 加强信息系统整体防护,建设管理中心支持下的计算环境、 区域边界、通信网络三重防护体系结构,实施多层隔离和保护, 以防止某薄弱环节影响整体安全,有效防止外部攻击。 2)非授权者重要信息拿不到 重点做好操作人员使用的终端防护,把住攻击发起的源头关, 进行强制访问控制,将有效防止非法操作。 3)窃取保密信息看不懂 对重要信息采取加密等手段进行保护,非法用户只能拿到重 要信息的密文。 4)系统和信息篡改不了 实行系统资源管理,进行可信验证,配置、代码信息防篡改, 自动纠错,使木马种不上,病毒染不了。 5)系统工作瘫不成 从网络通信、区域边界、计算环境,层层访问控制,而不是 封堵。将攻击信息流有效分解,提高系统的强壮性和弹性,可信 282 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 验证,自动恢复。 6)攻击行为赖不掉 在系统的重要环节设有审计点,及时记录违规操作信息,能 及时发现异常事件,并能跟踪追击。 8、总结 本文通过分析国内外信息安全保障体系的现状,充分阐述了 我国构建积极防御综合防范的信息安全保障体系的重要性,在此 基础之上,首先,提出了包括“四个层面,两个支撑,一个确保” 的信息安全保障体系的基本框架,并且利用可信计算技术从 TCM 可信根开始逐步建立信任链,最终搭建从底层硬件到上层应用的 可信计算环境,从而确保信息安全保障框架中的终端可信。然后, 提出了对于复杂的重要系统构成三纵(公共区域、专用区域、涉 密区域)三横(应用环境、应用区域边界、网络通信)和两个中 心的安全防护框架,从而确保信息系统的安全。最后,以三级系 统为例展示在安全管理中心支持下的计算环境、区域边界和通信 网络三重安全防护结构框架,为重要信息系统等级保护的建设与 改进提供依据。 283 第四章 信息化仍然是推进经济社会变革的重要力量 四 信息化仍然是推进经济社会变 革的重要力量 高新民 国家信息化专家咨询委员会委员、中国互联网协会副理事长 2010 年是我国十一五收官之年,也是十二五谋划之年。党的 十七届五中全会提出的十二五规划建议,全面分析了国内外环境 形势,提出了规划指导思想、主要目标以及各项重大任务。这一 重要文件既是我们下一步推进信息化工作的主要依据,也是制订 十二五信息化规划的方法指导。 1. 后金融危机时期国外信息化新战略定位 2008 年全球金融危机后,在众多国家经济刺激计划中,不约 而同地将提升宽带网络放在重点位置以至战略高度。目前约有二 十多个国家制定了单独的或包含在刺激经济复苏措施在内的宽 带互联网计划,强调推进信息化的重要性。其动因既有扩大内需, 增加就业的短期目标,更有基于战略上的认定:高速互联网及其 信息化应用是能促进经济社会高性能发展—高产出、高效率、高 创新力—的新基础设施和战略举措。它们认为宽带网络投资不仅 有拉动经济的直接效用,而且具有促进其他产业转型,形成新兴 产业,带动新型消费,改善民生,提升国家竞争力的战略意义。 早在 2002 年,美国曾提过网络宽带化目标,要实现 100 兆 进 1 亿家庭。但是,2008 年美国信息技术创新基金会(ITIF)调 284 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 查表明,美国接入互联网用户的平均下行速率仅 2.9M,(日本 63.6M)宽带家庭普及率仅 57%(韩国 93%),在调查国中排名第 15 位。当时,奥巴马就此表态说:“美国在全球宽带应用排名 15 位,这是令人无法接受的。作为发明互联网的国家,所有家庭都 应有条件上(宽带)网。在我任职期间,他们将获得机会,因为 只有这样,我们才能保持和增强美国在全球的竞争力。”他要求 联邦电信监管委组织专家起草国家宽带计划。经过近一年的研究, 2010 年 3 月公布了美国国家宽带计划建议案(计划案) 。此报告 从美国发展史角度,总结了一条规律:在每个时代美国都必须面 对重新联结国家的挑战,一旦成功应对,抓住机遇,经济社会发 展就会跨入一个新阶段。19 世纪 30 年代铁路网络联接全国,促 进了商品化农业的发展;20 世纪 30 年代电力网络联接全国,促 成了美国工业化转型;20 世纪 50 年代的全国高速公路网络,促 进了高度专业化分工的现代工业的发展。该计划案认为,当今, 美国又面临重新联结国家的挑战:如何加快以宽带互联网联结国 家。该计划案设定了 2020 年目标:至少 1 亿家庭以可承受价格 接入宽带,实际下载速率 100M 以上,上行速率 50M 以上;美国 必需成为世界上移动网创新领先者,建成比任何国家都先进的高 速率高覆盖的无线网络;每个美国公民可以可接受价格获得可靠 的宽带服务,可选择多种手段和技术(普遍服务要达到 4M 水平); 每个社区将以可接受价格获得 1G 以上宽带服务,如学校、医院、 政府机构均有宽带接入;要确保美国人民安全,每一首先反应情 况者可接入全国无线互联成一体的宽带公共安全网络;要确保美 国率先进入清洁能源型经济,每一公民可利用宽带网了解和管理 其实时能源消费。这个计划实际上是基于宽带网络的信息化规划, 285 第四章 信息化仍然是推进经济社会变革的重要力量 被认为“是美国在 21 世纪保持和重夺竞争优势的关键” (奥巴马 语) 。 欧盟在 2008 年也制订了新的经济社会发展战略“欧洲 2020” 和相应信息化规划“欧洲数字议程”。 “欧洲 2020”设计了二十一 世纪欧盟社会市场经济发展目标,概括为“三个增长”:智慧增 长,即发展基于知识和创新的经济;可持续增长,即高效利用资 源,发展更绿色化和更有竞争力经济;包容性增长,即实现高就 业、社会和区域和谐发展的经济。“欧洲数字议程”是实现“欧 洲 2020”的支柱之一。其目标是:建成欧盟单一数字市场,即覆 盖欧盟的基于高速和超高速互联网,提供可互操作应用和数字内 容的统一市场。 在制订金融危机对策背景下,日本也出台了新的信息化战略 规划 I—JAPAN,提出的新愿景是:建成以公民为中心的可信任 的、有活力的数字社会,要使信息通信技术在经济社会各领域全 面渗透,加速知识和信息的创新传播,加速数字技术与政府、产 业、公众生活的融合,从而形成日本国家发展新模式,以确立在 国际社会中的领导地位。 新战略基本理念体现在 I—JAPAN 的“I” 含义上:包容性(Inclusion) ,要力促信息通信技术以常态准则普 遍接受和使用,犹如水和空气一样渗透在每一角落。创新性 (Innovation),完善数字创新环境,引发自主性前瞻性创新和革 新,创立低成本高利润的产业结构,可持续增长模式和与国际社 会合作发展。 这些案例充分说明,全球信息化新战略新形势有两个突出特 点:一是信息化仍然是推进经济社会发展转型的重要力量;二是 今后信息化深入发展的关键是融合、渗透。 286 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 2. 我国信息化深入发展的机遇、挑战和总体趋势 自从 2000 年党的十五届五中全会提出“信息化是覆盖现代 化建设全局的战略举措”判断以来,我国工业化、信息化、城镇 化、市场化、国际化深入发展,取得明显成绩和丰富经验,我国 信息化有条件也有需要上一个新台阶。 首先是发展新战略需要信息化上新台阶。十七届五中全会建 议指出:“综合判断国际国内形势,我国发展仍处于可以大有作 为的重要战略机遇期,既面临难得的历史机遇,也面对诸多可以 预见和难以预见的风险挑战”,特别强调“我国发展的外部环境 更趋复杂”。这可以理解为:后金融危机调整长期化,国际资源 约束尖锐化,气候变化责任分散化,引发我国发展外部形势更趋 复杂。又分析“我国发展中不平衡、不协调、不可持续问题依然 突出,主要是,经济增长的资源环境约束强化,投资和消费关系 失衡,收入分配差距较大,科技创新能力不强,产业结构不合理, 农业基础仍然薄弱,城乡区域发展不协调,就业总量压力和结构 性矛盾并存,社会矛盾明显增多,制约科学发展的体制机制障碍 依然较多”。国内环境形势更加凸显了产业结构调整的紧迫性、 社会和谐发展的必要性和环保资源矛盾的尖锐性,从而引出加快 经济发展方式转变成为今后的“主线”。为加快解决上述突出矛 盾和问题,促进经济发展方式转变,十二五期间经济社会发展必 将对信息化提出旺盛需求,可以预期各个领域信息化更加具备内 在驱动力,这是信息化深入发展的客观环境。 我国信息化发展既有良好的基础,又面临急需解决的问题。 最近十年,我国信息化在经济社会各个领域都取得重大进展。在 287 第四章 信息化仍然是推进经济社会变革的重要力量 电子政务方面,大多数政府机构的核心业务已完成不同程度的信 息化;网络化公共服务的提供已在不同深度上普及,部委、省级、 地级和县级政府网站的拥有率分别为 100%、 100%、98.5%和 95%; 金关、金税、金盾、金审、金信、金水、金农、金保等一大批重 大电子政务工程发挥了重要作用,成为支撑各自系统业务的必不 可少的手段,总体上看,经济效益和社会效益远远超出信息系统 建设的总投入;在局部地区和部门,信息化也明显带动了政府职 能转变,创新公共服务和公共管理新模式;电子政务总体架构开 始构筑,为今后信息共享,业务联动奠定基础。在产业信息化方 面,各重要产业如钢铁、电力、石油化工、汽车、船舶、装备制 造、航空、铁道运输、纺织、烟草、外贸等产业的大型骨干企业 信息化已达到高水平,有的达到国际水平。电子商务发展势头强 劲,即使在金融危机冲击下,仍保持高增长幅度。2009 年电子商 务交易额 36000 亿,增长 23%;网上购物规模达 2600 亿,增长 65%。预计 2010 年仍将翻番。应用电子商务的中小企业数量占中 小企业比重由 2005 年约 9%增加到 2009 年约 30%。在沿海大城 市经常应用电子商务的中小企业的比重上升到 50%。社会对于信 息化的认知度、依赖度、期望值急速提高反映在互联网应用规模 和影响力上。全国居民互联网普及率达 31%(全球 26%)。北京、 上海市的互联网的居民普及率已高达 65%,城区电脑家庭普及率 达 80%,达到发达国家平均水平;农业信息网络服务初具规模。 全国农业类网站达到 3 万余个,31 个省、97%以上的地方和 80% 以上的县级农业部门建立了农业信息网站。教育信息化规模宏大, 已投入资金约 2000 亿元左右。远程教育用户增多,基础设施建 设、基础教育、学历教育、职业与认证培训、企业数字化学习呈 288 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 加速发展态势。在医疗卫生、社会保障、城市管理、文化建设、 社区服务等方面,信息化也做了大量工作。在信息网络与信息安 全方面,国家信息安全设施建设、协调监查、政策法规和规划标 准制定、应急处理等工作卓有成效,特别是在一系列特别时期和 敏感时期,没有发生重大信息安全事件,保障了国家信息安全。 在信息化和出口的带动下,电子产品制造业的产业规模、产 业结构、技术水平得到大幅提升,我国已成为全球最大的电子信 息产品制造基地。2001—2009 年行业销售收入年均增长速度为 GDP 增速的三倍,占 GDP 比重约 5%,对当年 GDP 增长的贡献 超过 0.8 个百分点,出口额占全国外贸出口总额的三分之一。在 通信、高性能计算机、数字电视等领域也取得一系列重大技术突 破。我国的通信业的用户规模、网络规模、网络能力和技术水平 均跃居世界前列,构建了一个先进的国家信息基础设施,有力地 支持信息化持续发展。所有的进展和成功案例都证实了信息化对 我国现代化进程的重大作用,为下一步信息化上台阶打下良好基 础。 在肯定成绩的同时,也要实事求是地分析我国信息化面临的 问题和困惑。主要是:信息化与各领域业务发展目标的融合度不 够,在一定程度上仍然是“两张皮”,以信息化促发展模式创新 的战略意义没有充分体现;信息化业务应用是从单项业务、以机 构职能为导向开展的,多数行业处于单项应用向综合应用过渡, 虽有其历史意义的合理性,但为实现科学发展目标(更全面、更 协调、更可持续)所需的部门之间业务联动和资源整合难度相当 大,影响信息化整体效能发挥;缺乏总体设计,缺乏治理结构, 信息化从规划到实施再到运维、提升,方法论缺失,知识库不丰 289 第四章 信息化仍然是推进经济社会变革的重要力量 富,推进信息化仍然是传统路子、陈旧办法;区域间、机构间、 群体间信息化发展水平差别大,在农村、小企业群信息化基本条 件和接受能力普遍较差;适合我国国情的、支撑各领域信息化的 信息服务业发展迟缓,公共服务平台的机制不完善,服务体系不 健全;一些重大民生领域如医疗健康、住房保障等信息化相对滞 后;信息化公共资源投入分散,利用率不高;互联网产业过于依 赖个人消费者,商业模式较单一;网络普及率偏低,网民结构不 均衡,网络和信息安全的形势依然严竣,发展与安全之间平衡的 创新治理模式还没形成;当然还有经常提到的核心技术和产业竞 争力的问题,有待进一步破解。 综合考虑我国经济社会发展对信息化的需求,以及信息化自 身要解决的问题,当前和今后一个时期,我国信息化发展总方向 是:融合、整合、渗透、治理。所谓“融合”,指信息化要与各 领域业务发展和创新融为一体,信息化成为业务发展和创新的内 在要求、具有内生驱动力,信息化与业务发展的互动互进要成为 常态。“融合”既是各领域各行业发展的高级阶段,也是信息化 的高级阶段,有别于传统业务,也有别于一般意义的信息化。主 要区别反映在由信息化支撑的(催生的)新型业务模式,实现向 新型发展模式转型,形成可持续的创新能力。 所谓“整合”,指资源整合。有两层含义:一是以信息化整 合外部有型和无型资源,达到提升机构管控和服务能力。通过内 外部资源整合,促进机构向扩展型/服务型机构转型,大幅度提升 管控、服务水平和创新力。另一层含义是指信息系统资源整合, 包括 IT 服务外包的发展,实现信息系统简约化、集成化,以降低 IT 成本,提高 IT 资源利用率和系统安全性。 290 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 所谓“渗透”,也有两层含义,一是技术导向型渗透,以充 分发挥新一代信息通信技术的利用潜力;二是业务导向型渗透, 信息化向广度和深度发展,造就人人受益的信息化。 所谓“治理” ,指信息化推进的制度建设,做到统筹、有序、 协调、有效。信息化治理体系是一项复杂工作,也是目前一个薄 弱环节。从一些先进单位信息化治理建设经验看,建立项目管理 制度、标准工程制度、组织协调制度、资金保障机制、培训咨询 机制等尤为重要。 3. 以互联网为代表的信息通信产业发展新趋势 在全球范围内,互联网重要性日益俱增,为互联网产业带来 巨大机遇。互联网产业发展新趋势特别值得关注。 互联网产业的发展趋势可归纳为“五化一重点”:宽带化、 泛在化、融合化、平台化、生产化和以安全可信为重点。 (1)宽带化 后经济危机时代,构建高速宽带下一代互联网基础设施被列 为发展重点和国家政策的优先议程。各国政府先后确立了宽带领 域的公共投资,为互联网产业的发展奠定网络基础,成为国家战 略的重要组成部分。美国联邦通信委员会提交的《连接美国—— 国家宽带计划》,确立了 2020 年的美国宽带目标。欧盟委员会提 出《欧洲 2020 战略》 ,明确了 2020 年欧盟宽带目标为接入速率 全部大于或等于 30 Mbps,50%或更多家庭的宽带接入速率大于 100 Mbps。日本 IT 战略总部 2009 发布的《I-JAPAN 战略 2015》 目标,将在 2015 年实现固定接入设备达到 Gb 级速率,移动接入 291 第四章 信息化仍然是推进经济社会变革的重要力量 设备达到 100 Mbps 的宽带目标。 (2)泛在化 “泛在化”强调任何时间、任何地点、任何主体(人、物) 都能顺畅地沟通信息。互联网、移动网、无线传感器网等各种异 构网络完成共性的融合与个性的协同,构成泛在网。泛在化包涵 主体泛在、空间泛在、时间泛在等三个维度。主体泛在是指任何 人、任何物体都是网络上的一个节点,具有智能化的计算能力。 物联网是泛在网的重要体现,通过感知层,采用不同的传感技术 把物体接入到网络。物联网进一步利用了互联网网络平台能力, 形成更广泛的服务领域,使得任何人、任何物都成为互联网上的 一个主体。空间泛在是指互联网不受地域、空间的限制。移动互 联网的快速发展大大扩展了互联网空间泛在特性。摩根斯坦利 2010 年 4 月份发布的互联网发展趋势报告认为,移动互联网较固 定互联发展迅速,5 年内移动互联网用户将超过固定互联网用户。 时间泛在是指互联网信息随时生成、随时获取,指即时网络的到 来,有人称是互联网第三次浪潮的标志。WEB2.0 核心是“社会 化” ,网民不仅仅是受众,而且成为内容和应用的创造者。而“即 时网络”是以大规模同时在线的网民的实时互动。时间泛在应用 将可能成为未来 3-5 年互联网产业最活跃的创新热点之一。 (3)融合化 融合化包括网络服务融合,电信、电视和互联网融合(三网 融合):产业跨界融合,设备制造、网络运营、内容提供、软件 开发业界融合:还包括互联网与物理基础设施网络的融合,如与 电力网融合,形成智能电网,与铁路、公路网融合,形成智能交 通网等。 292 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 产业跨界融合催生了众多的新模式和新业态。例如,在移动 互联网领域,由于竞争要素不断演化,产业加速发展。产业链多 方参与,产业边界逐渐融合。包括电信运营商、互联网服务商、 移动通信设备商、消费电子设备商、IT 制造商等在内的产业上下 游企业纷纷参与跨界竞争,推动跨界运营。以谷歌(Google)为 例,作为一家互联网服务商,已经逐步渗入产业链上下游,实现 跨界竞争。一方面通过呼吁网络开放接入、申请空白波段(无线 载波、电视波段)、将电信运营商拉入开放手机联盟等措施进入 产业链上游。另一方面,推出了手机开放出操作系统 Android 以 及基于该操作系统的手机 Nexus•one,实现向产业链下游的扩张。 通过跨界融合,拓展了融合化互联网服务。 (4)平台化 业务及网络的开放性、技术的渗透性、信息传播的交互性等 特点使得互联网加速渗透到各个领域,互联网产业不单纯是诸多 产业中的一个垂直产业,已演变成其他产业不可或缺的基础设施 平台。另一方面,互联网产业的特性是较少受地域的限制,具有 天然的辐射和扩张的特质,能够立足一点、带动一片乃至全球相 关领域的发展。就互联网产业本身来讲,其技术、业务及产业均 向平台化发展。在业务平台化方面,SNS、电子商务等互联网服 务搭建了一个对行业、领域、用户不敏感的平台;在技术平台化 方面,MASHUP、增强现实(AR)等技术用于实现互联网上多 种应用的聚合;在数据存储、计算平台化方面,以云计算为代表 的虚拟化技术发展迅速,形成 IT 资源的云服务平台是一大趋势。 (5)生产化 互联网技术和应用渗透到传统制造业和服务业,衍生出生产 293 第四章 信息化仍然是推进经济社会变革的重要力量 型互联网服务,其主要服务对象是企业,而不是个人,其功能是 为企业生产创造价值,而不是仅满足个人消费需求。生产型互联 网将促使互联网由“眼球经经”变为“价值经济”。制造业价值 链正加速向前期的产品研发及后期的销售服务转移,而生产型互 联网服务恰恰在上述环节发挥其长,有力推动了制造业服务化进 程。 互联网已经深入到制造业的各个环节。在研发、设计环节, 互联网创新了诸多模式,如 Innocentive 网站,借助互联网连接的 世界顶尖智力,以解决各类研发难题,Traceparts 网站利用互联网, 将地理位置各异的供应商零部件数据集中起来,实现企业间的协 作设计和数据共享,实现快速反应市场,降低新品的开发成本, 提高产品的开发效率的目的。 (6)安全可信 互联网网络与信息安全从上世纪 80 年代以来已经受到关注, 但是目前面临的安全问题不仅没有得到解决,反而变得日趋严重, 成为互联网发展的最大挑战。最近几年恶意软件的数量呈爆炸性 增长趋势。举例而言,据国内某安全中心报告,2007 年截获的恶 意软件样本数为 73 万个,2009 年暴增 12 倍达到 1.2 亿个,2010 年全年的恶意软件样本数预计将超过 8 亿! 网络安全不仅关乎互联网产业的健康发展,也关乎着整个国 民经济的良好运行以及国家安全。建立包括网络与信息安全产业 在内的网络和信息安全可信保障体系是一项迫切任务。 网络与信息安全产业包括两个方面:网络安全:提供计算机 网络与终端安全的软硬件产品和服务,以保护计算机网络与终端 免受恶意软件或恶意代码的侵害和威胁,保护计算机网络和终端 294 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 的系统安全、数据安全以及用户个人隐私信息安全。信息安全(内 容安全):采集、分析和存储互联网上各种不良信息内容进行监 控和过滤的产品和服务。 与此对应,就形成了两个相关行业:(1)网络安全行业。包 括两个细分市场:个人网络安全市场:提供个人电脑终端安全的 软硬件产品和服务,例如杀毒软件、网络安全套装软件、综合安 全防护软件等。企业网络安全市场:安全硬件供应,例如防火墙、 IDS、IPS、UTM、安全网关等。终端安全软件开发:以网络版或 企业版的终端安全防护软件为主。安全咨询外包服务:规划、部 署、实施网络安全策略、提供网络安全维护服务。(2)内容安全 行业。内容安全厂商的主要目标客户是政府部门、运营商以及学 校、网吧等特殊上网环境。提供不良内容屏蔽或过滤功能。互联 网舆情的发现、监测产品或服务。 4. 对十二五信息化规划的若干建议 总的指导思想:信息化规划必须由机构职能引导转变为战略 目标引导,由技术主导转变为业务主导,由注重投入转变为注重 效能,实现科研管理和服务的跨部门有效整合,以切实发挥信息 化在支撑机构履行职能、促进科研模式转型、解决发展难题的作 用。 要更加注重整体协同。围绕发展战略需求,按照部门的职能 和事权,合理布局任务,提高信息资源共享水平,支撑和完善管 理和服务多功能、跨部门的运行协同机制,发挥信息化支撑战略 目标实现的作用。 295 第四章 信息化仍然是推进经济社会变革的重要力量 要更加突出应用实效。以服务科研为出发点,深入进行需求 分析,科学量化相关指标。优先建设重大公用设施,着力建设解 决重点领域问题和矛盾的业务信息系统,避免建设需求不清晰, 效果不明显的工程项目。 要更加重视集约开放。遵循统一标准和制度规范,实施信息 资源和业务流程的规范化,为信息系统工程的集约化和系统资源 利用的开放化奠定基础,有效避免低水平重复建设,确保信息化 的可持续发展。 要更加强调安全保障。针对不断变化的信息安全威胁,围绕 跨密级和安全等级、跨部门和区域的应用,分析隐患,评估风险, 制定策略,强化信息安全管理和基础设施建设,优先采用自主可 控的产品和服务,保障信息化的安全可靠。 十二五信息化专项计划要与新的科研发展战略融合。需要有 新的架构,反映新的基础设施(网络、平台、数据、安全),新 的融合性应用,新的信息化治理模式。规划总体架构可由基础设 施与重点业务信息系统组成。基础设施包括:互联的统一网络、 共享基础信息资源、信息安全保障设施。重点业务信息系统由领 域、主题、任务和项目等层次组成:例如在科研水平升级,资源 管理精细,国际影响扩展,队伍素质提高等四个领域,以全院发 展战略目标为导向,设立若干主题,再按机构职能和事权分解任 务,确立在协同机制作用下的可操作的工程项目。值得强调的是, 一定依融合和整合的原则,基本上按大系统而不是按机构或部门 立项。公共投资方向要有重点,项目边界要清晰,拿得准的上工 程,看不太清的搞试点。同时加强信息化治理制度建设。 296 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 五 科学数据:创新的引擎 郭华东 中国科学院对地观测与数字地球科学中心 摘要:本文剖析了数据密集时代的科学数据特点与特征,论 述了科学数据已成为科技创新与自然发现的引擎,建议从政策和 操作层面进一步推动科学数据共享,提出应大力发展并加强数据 科学的研究。 1. 人类正在进入数据密集时代 现代科学研究正在从单一学科向多学科、跨学科方向转变, 从自然科学向自然科学与社会科学的充分融合方向过渡,从个人 或者小型科研团体向国际学术组织方向发展,其发展方向和发展 规律的重要驱动源头来自海量科学数据。纵观人类文明的进化史, 得益于工具的制造,人类从实验时代进入理论时代;借助计算机 的发明,人类社会逐步迈入信息时代;而后由于计算机技术的高 速发展、数据信息量的迅猛增长和数据研究方法的改进,一个数 据密集时代正在到来。 数据在当今社会扮演着重要角色,其重要性正取得广泛认同。 2005 年联合国世界信息峰会上,“数据是我们人类的共同财富” 的主题报告赢得大家的关注与好评;国际科学理事会(ICSU)2006 至 2011 年度的战略报告中强调了“数据和信息是科学的重要组成 297 第五章 科学数据:创新的引擎 部分”。国际科技界对于数据的关注和研究正在达到前所未有的 高度。 全球性大量而复杂的数据正在不断地增长。互联网数据中心 (IDC)2009 年度报告中指出,数据每 18 个月就会上涨一番。就 对地观测数据而言,自 1986 年以来持续增长。截止到 2007 年, 欧空局(ESA)获取的对地观测数据总量已达 3000 兆字节。预计 到 2020 年,数据量会增加 7 倍 95。除了数据量的高幅增长与存储 介质的改进等方面外,数据的研究方法也在随之升级。 如果说科学研究促进了社会进步,推动了人类文明发展。那 么在数据密集时代,科学研究正在呈现以下一些特点。 (1)数据密集时代的科学研究将以数据为本 人类所不了解的知识,在现今社会呈现不断上升的趋势,它 们将来可能会发展成为新的学科并服务于社会。对于这些知识的 科学研究,需要大量的数据和科学的研究方法来支持。在数据密 集时代,对于科学数据的研究需要从专业角度进行分析,针对不 同的数据生成不同的研究方法。而且,在数据的无缝链接、循环 利用等方面存在着巨大的研究价值,通过不断的努力必将产生相 应的科技成果。最后,数据会更加开放的在世界范围内共享,数 据的获取将更加便易。 (2)数据密集时代的科学数据的权威性与可靠性将被进一 步加强和深入理解 系统的、具有代表性的全球数据共享平台取得了公众的信任, 并能够切实有效地保证数据的及时共享和下载。用户在得到数据 的同时,不必为数据安全担心。而且针对机密而重要的数据,存 在更加严格且直接的共享机制来保障。 298 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 (3)数据密集时代的科学研究呈现一种分散式的“云计算” 方式 参与研究的人员也许素未谋面,但是却可以将自己的研究成 果、数据实时地与他人进行交流和共享。公众也将以“数据消费 者”和“数据提供者”的双重身份参与进来,成为数据密集时代 科学研究的重要组成部分。与此同时,伴随着科技的进步、数据 种类的增加和数据研究方法的进化,数据密集时代的科学研究将 具备更多样的互操作方式和更强的交互性。 2. 科学数据带来持续的科技创新 随着现代科学技术的发展,科学研究方法和科技手段的日益 提升,数据处理、存储设备的革新,较之传统的观测和计算方法, 科学研究能更快速、深入并多角度的获取想要的数据和信息,借 此来挖掘更多的事实和规律,从而带来更多的突破和创新。对于 诸如生命科技、信息技术、空间科技等基于海量数据的高科技新 兴学科,数据密集型的学科特性很好的推动了这类学科的技术系 统变革。20 世纪 80 年代,随着基因测序技术和计算机技术的发 展,DNA的测序工作变得易于操作,更多的生物基因组被辨识, 这个时期提出的人类基因组计划 96旨在揭开组成人体的 4 万个基 因和 30 亿个碱基对的秘密,研究过程涉及庞大的数据量。由 6 个国家的科学家耗费十多年时间建立了人类基因组图谱,这在生 命科学领域乃至全球范围内都是一项重大的科技创新。基于海量 碱基对序列中发现的人类基因,科学家能进一步解码生命、了解 生命的起源、生命体生长发育的规律、认识疾病产生的机制以及 299 第五章 科学数据:创新的引擎 生老病死等生命现象,对人类的发展有着深远的意义。另一门数 据密集型的学科遥感科学是以航空摄影技术为基础,在 20 世纪 60 年代初发展起来的一门新兴科学技术,利用传感器从空间探测 地物目标,收集地面数据,获取大量空间信息。遥感学科充分利 用数据获取的范围广、速度快、限制条件少、信息量大的这些数 据密集的优势,广泛应用于农业、林业、地质、海洋、气象、环 保等领域,它为地球科学提供了创新的研究平台。全球综合地球 观测系统 (GEOSS 97)是遥感领域极有影响力的计划,它将全球 星载、机载、海洋、陆地环境监测数据与网络衔接起来,提供大 量的观测数据和地物信息,提高人类管理自然资源和生态系统的 能力,应对气候变化、生物多样性、粮食安全等挑战,以期解决 灾害、健康、能源、气候、水资源、天气、生态系统、农业和生 物多样性等九个人类社会经济发展的重大问题。 在现今信息时代,更大的数据量和更多元、深入的信息挖掘 是今后各学科创新的基础和挑战,数据密集型的科学创新以海量 的数据作为基础,以数据的有效组织、深入发掘作为助力,表现 出了强大的生命力。数据密集型的科学创新方式是传统的科学创 新方式在新的数据密集时代的一个发展,是人类世界科学技术、 研究能力发展到一定阶段的产物,它具有先进性、有效性和普适 性的特点。数据密集在涵盖更多规律和现象,为科学研究带来更 为便利的途径和全面的视角这些变革的同时,也将产生更为复杂 的处理过程,过多信息的干扰,以及数据冗余的问题。因而,如 何利用数据密集带来更多的科技创新和学科变革,是各学科发展 的一项重要科学任务。 300 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 3. 深入认识与加强科学数据共享 第二次世界大战后,世界各国越来越认识到科技的重要性, 开始投入大量资金和精力发展科技,并产生了很多有价值的数据, 但令人遗憾的是大量数据没能得到有效地保护和维护,在战乱中 丢失,一些前沿科研机构开始意识到数据共享及数据保护的重要 性,数据共享理念相应而生。 伴随着数据密集型时代的到来,数据共享已经成为现今各领 域关注的焦点。所谓数据共享的理念之一就是让世界各地、各行 各业的用户能够利用不同的网络终端和软件读取他人数据并进 行各种操作运算和分析。数据共享的程度也反映了一个地区、一 个国家的信息发展水平,可以认为数据共享程度越高,信息发展 水平越高。 目前,全球许多国际组织和科研机构都在致力于数据共享工 作,一些国家也逐渐意识到数据共享对整个国家发展的强大推动 作用。通过加强数据共享可以更充分地使用已有数据资源,有效 地减少资料收集、数据采集等重复劳动及由此产生的相应费用, 帮助科学家提高科研成果产出,加速科研成果转化,并逐渐缩小 发达国家与发展中国家的数字鸿沟,帮助不发达国家或落后地区 提高科技水平。 随着科技和互联网技术的快速发展,不同国家和地区间的信 息交流日益增加,科学数据量激增,给数据共享发展带来严峻挑 战。与此同时,数据共享在许多方面依然存在着诸多长期未解决 的问题,如:数据共享政策、数据标准化、数据管理、数据质量、 信息分类、知识产权、版权等等。另外,出于国家安全和利益, 301 第五章 科学数据:创新的引擎 以及不想承担过多的责任和义务等考虑,一些国家、地区、机构 等至今仍未能接受数据共享的理念。 数据共享工作非一朝一夕之功,既需要政府与科技界的长期 支持和投入,也需要探索更有效的途径。20 世纪 90 年代末,我 国开始关注数据共享领域的发展,对科学数据共享尤为重视。 2002 年国家科学技术部提出实施科学数据共享工程,我国的数据 共享开始步入正轨,在科学数据采集和积累方面,形成了良好的 发展态势,主要学科领域的科学数据的产生和利用也逐步形成体 系,并且建成了一批科学数据管理机构,使得数据共享的机制更 加完善。在 2008 年的汶川地震和 2010 年的玉树地震中,中国科 学院全方位实施遥感数据共享,为 15 个部委 28 个单位近实时提 供急需数据,为灾害评估、监测和救助工作提供了强有力的支持。 近年来我国积极参与国际合作,形成了较为稳定的国际交流渠道, 通过政府间组织、国际数据组织、民间交往等途径,大力开展国 际间数据合作与交流,与国际科技数据委员会(CODATA)、世界 数据中心(WDC) 、世界气象组织(WMO)、地球观测组织(GEO) 、 国际标准化组织(ISO)等国际组织建立了良好的合作关系。然 而,数据共享的工作依然受到诸多问题的制约,如:海量数据的 整理分类还未成体系、数据共享的政策法规尚不完善、跨学科间 的数据共享亟待发展等。 CODATA 作为在数据领域十分活跃的国际组织,有许多理念 与举措值得我们借鉴和利用。它建立国与国之间的数据共享机制, 并逐渐统一数据标准,不断完善数据管理与分类体系。但是囿于 数字鸿沟和重大技术的产生与变化所带来的挑战,数据共享依然 任重而道远。 302 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 我们应进一步推进数据共享,特别要关注以下三个方面:1) 完善数据共享政策法规和管理体制建设,加快制定数据共享相关 政策,为数据共享提供保障;2)建立发达国家、发展中国家和 不发达国家间友好平等的合作关系,促进数据提供者与使用者之 间更好的交流,使数据资源不但能够服务于学术界,也能为决策 者提供更好的决策依据;3)加强数据保护、收集、分类、管理 与数据质量控制方面的评价体系,为数据共享提供坚实可靠的基 础。 数据共享的广泛开展,必定会经历一个渐进发展的过程,这 将依赖于全社会对数据共享认识的全面提高,通过实现数据共享 更好的为社会经济的可持续发展做出贡献。 4. 大力发展数据科学学科体系 今天的我们正身处第二次发现革命之端,这是一场将会在社 会、经济、科技中产生广泛影响的革命。伴随着“电子科学”的 产生,人们对数据的理解也在发生变化,数据科学也因此而诞生, 作为一门新兴的学科,它正在被越来越多的人所关注。 数据科学并不是简单的使用数据,而是通过对数据的使用充 分实现数据本身的价值,并且形成一个数据产品创造更多更有价 值的数据。谷歌(Google)作为数据科学领域较为成功的机构, 有许多方面是值得我们学习和借鉴的。 众所周知,谷歌最为出众的是它强大的搜索引擎,它依据网 络自身结构,清理混沌信息,缜密组织资源,不仅能为使用者搜 索出包含所有关键词的结果,而且还可以对网页关键词的接近度 303 第五章 科学数据:创新的引擎 进行分析,根据接近度确定搜索结果的先后次序,避免了使用者 在无关的结果中查找信息而浪费时间。近几年,谷歌所推出的谷 歌地球(Google Earth)也是充分利用对地观测数据体现数据科学 的方式。 目前,数据科学还未有一个统一公认的概念,但是数据是数 据科学的基础是无可否认的事实,因此要更好的发展数据科学, 首先是提高对数据各方面能力的增强,主要应该体现在以下四点: 前所未有的海量数据收集和管理的能力;向全球直接快速提供数 据的能力;利用计算方法提取分析海量数据集的能力;使用计算 机代替人工手段指导科学发现假设、测量、评估的能力。 其次应该大力加强对数据科学的宣传与普及,提高数据科学 知悉度,融合各个领域的智慧共同构建数据科学。报告表明,2010 年全球从事数据科学研究的机构较 2009 年有明显增长,对数据 科学领域的人才需求也因此而增加。相信在数据密集型时代中, 数据科学未来的发展前景将会更加广阔,这必将为国家现代化建 设做出新的、更大的贡献。 致谢:本文写作中得到黎建辉、刘广、刘洁、梁栋和姜昊等 同事的大力支持,特致谢意。 304 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 六 云计算及其在科研领域的 应用态势 朱近之 IBM 大中华区云计算中心总经理 1. 云计算的发展现状 云计算目前在国内发展很快,国内市场统计咨询机构赛迪顾 问不久前发布的《中国云计算产业发展白皮书》显示,2010 年中 国云计算市场规模将达到 167.31 亿元,比 2009 年的 92.23 亿元 同比增长 81.4%,预计到 2012 年将突破 600 亿元。另一方面,云 计算作为一种信息产业的发展趋势,其价值已经逐渐被大众认可。 在可预见的未来,云计算、高速互联网、物联网,这三者会进行 更紧密的整合,成为一个强劲的信息化平台,推动整个国家和社 会的经济发展。在这个理念的指引下,潜在的云计算服务提供商 和服务消费者,都已开始对云计算产生更多的关注,对云计算的 应用展开实践。 在服务提供方面,政府已认识到云计算的战略意义,开始对 云计算的进行政策上的推动。2010 年 10 月,工信部和国家发改 委联合发布通知,在北京、上海、深圳、杭州和无锡五个城市先 行开展云计算服务创新发展试点示范工作,主要工作包括,推动 国内信息服务骨干企业针对政府、大中小企业和个人等不同用户 需求,积极探索各类云计算服务模式;加强海量数据管理技术等 305 第六章 云计算及其在科研领域的应用态势 云计算核心技术研发和产业化;组建全国性云计算产业联盟。 在应用方面,云计算已经开始在一些行业取得了不错的应用 效果。在一些地区的软件园,比如无锡,软件外包企业已利用园 区提供的基础架构及服务开展其日常的软件开发测试工作。在电 信和互联网领域,中小企业已利用云服务提供商提供的虚拟机、 在线存储服务进行其网站和应用的托管,使用行业 SAAS 应用支 撑其日常运营。在消费者市场,大众已经每天使用各种各样的云 应用,比如邮件、协作、文档处理等。 2. 科研领域对计算的需求探讨 在科研领域,云计算同样有广泛的应用前景。随着信息技术 的发展,科研领域对于信息技术的应用也在逐步深化。从最初利 用计算机进行科研实验,到互联网出现后利用网络进行科研工作 的协同,我们发现信息化已经渗透到了日常科研工作的每一个环 节。对于任何一项科研工作来说,其工作的过程大致上都由选题、 收集数据、分析研究、验证、发表这一系列环节组成。在选题和 数据收集部分,以前的科研工作者往往花费大量时间通过图书馆 来查阅资料,而在信息化的时代下,大家通过搜索引擎和网上数 据库,可以快速找到自己的需要的数据和资料。在分析研究和验 证部分,计算机仿真与大规模计算已经成为许多科研工作的主要 手段。在成果发表部分,除了使用传统的论文手段之外,越来越 多的研究小组将研究成果直接以原型甚至是产品的形式运行在 互联网上,让其他的科研工作者和社会大众可以直接体验成果的 价值,同时也可以促进对成果的继续改进。 306 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 通过以上分析,我们不难发现科研领域对于信息化的几个大 的需求:大规模计算与模拟、信息共享、远程协同、科研成果社 会化。为了满足这些需求,一个关键的指标就是“量”。大规模 计算用户希望能够获得大量的资源来处理他的计算任务;信息共 享中,用户希望获得尽可能全面的数据;在协同和科研成果社会 化中,科研人员希望能让自己的成果覆盖到尽可能多的人。这种 量的需求,可以归结为:使用大量的资源,处理大量的数据,覆 盖大量的人。可见,排除了人的因素之后,是否可以使用足够的 信息化的能力已经成为科研力量强弱的决定性因素。对于每个科 研团队来说,要为自己的科研工作建立一套庞大的信息化基础设 施显然是不现实的,也是不经济的。而对这种信息化的基础设施 的共享使用,就成为一种经济的选择。这正是云计算的模式。 当云计算已经成为信息化的主要模式时,科研领域的信息化 手段自然而然也会向云计算转型。云计算在科研领域的应用,就 是把将计算、存储、数据处理的能力作为服务提供给科研用户使 用,让用户共享各种信息化资源,从而让用户可以在科研本身投 入更大的精力,而不是花费大量的项目经费在信息化基础设施的 建设上面。在以往的一些信息化基础设施的建设过程中,我们已 经看到许多成功的例子。比如,在过去几年,国家投资建设了一 些国家级和地区级的超算中心,为本地的科研用户和企业用户提 供计算服务,就是一种典型的基础设施即服务的应用场景,是云 计算的一种体现。随着云计算相关技术的成熟,以及各种云计算 服务的出现,我们看到在科研领域开始出现越来越多的应用场景。 307 第六章 云计算及其在科研领域的应用态势 3. 云计算与高性能计算 高性能计算在信息科学领域半个多世纪的发展历史中,一直 代表了当时技术的制高点,并成为理论科学和实验科学以后科技 创新的主要工具。在过去十年中,高性能计算技术正处于创新的 高峰期,其处理速度和总体计算能力的发展远高于摩尔定律描绘 的芯片技术的发展速度。在应用领域,一些传统领域和高性能计 算结合的新兴交叉学科不断涌现,如计算化学、计算物理、生物 信息学等,这也为我国计算技术的研究提供了跨越式发展的良好 机遇。 要把握机遇,高性能计算中心需要不断挑战和突破新的计算 能力。然而,在当前的经济危机影响下,中心更面临如何以更少 的资源投入提供更高计算性能的巨大挑战。新一代的高性能计算 中心建设不能仅仅考虑软硬件设备的选择,而是需要全面考虑中 心运作、应用效率、技术创新合作等多方面因素,充分考虑总体 架构的合理性和资源管理的高效性,具备长远的高性能运算科研 和供应能力。传统高性能计算机总是以追求更高的浮点性能为主 要目标,随着硬件设备性能的不断提升,用户更关心如何有效利 用海量资源,而管理人员则关心如何提升资源利用率、优化管理。 高性能计算的应用多种多样,有开源的、商用的,还有自己 研发的软件,每个软件对系统平台的需求不同。传统的高性能计 算中心在建立的时候,都是定制好的统一系统环境,无法满足个 性化需求,有的高性能计算中心,购买完成之后可能会搭建成多 个平台,但是建立完成之后也无法变更,成了一个个独立的高性 能计算环境,资源无法共享。 308 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 采用云计算的基础架构,搭建高性能计算中心,可以提供一 种新的高性能计算机的使用模式作为原有模式的有力补充。在这 种模式下,高性能计算机可以按照用户需求去动态定制、组装。 用户计算任务结束后,其资源会被自动回收。另外,利用云计算 的特性,高性能计算中心不仅仅能够提供科研所需要的高计算力, 同时还可以扩展计算中心的服务内容,做为一个数据中心服务于 其它的科研类应用,提高其整体价值。 一个可借鉴的案例是北工大的高性能计算中心。该中心建立 一套云计算平台,统一管理软硬件资源,以自动化技术动态部署 计算集群,提供集群服务(而非传统的作业计算服务)给用户。 首先,通过云计算平台将计算资源集中化管理,使得校内对 IT 资源的管理智能化,实现校内各个院系,各个专业的 IT 资源整合, 由云计算来进行集中的自动化调度、为各个用户进行动态分配、 回收计算资源。用户在提交高性能计算作业时,首先可以评估北 工大的主计算集群是否可以满足自己作业的环境需求,如果不满 足,用户可以通过云计算平台申请一套独占的集群,并按照自己 的要求部署指定版本的运行环境和软件。这种方式给用户提供了 充分的灵活性和个性化能力,大大拓展了高性能计算中心的用户 群体。 4. 云计算与海量数据存储分析 云计算的另一个主要优势是善于处理海量数据。科研领域信 息化的迅速发展产生了空前规模的海量数据,在互联网应用、遥 感监测、影像数字化以及生物研究等科研领域,数据的规模不断 309 第六章 云计算及其在科研领域的应用态势 扩大,往往以 TB(百万兆字节)、PB(十亿兆字节)甚至更快的 速度在迅速增长。如何存储这些海量数据并对其进行有效的分析 利用,成为科研信息化建设过程中的重要问题。 科研领域的海量数据包含空间数据、报表统计数据、文字、 声音、图像和超文本等,不仅数据量巨大,而且数据类型非常复 杂。同时,科研数据主要来自于实际案例的不断积累,其数据操 作通常是一次写入、多次读取的方式,采用传统的关系型数据模 型对海量科研数据进行处理主要存在如下问题: 难以支持高吞吐量的数据查询、检索和读取,系统的响应时 间较长; 缺乏可靠的数据容错、备份和恢复机制,容易因为局部的失 败而影响全局应用; 基于 MPI 等模型的并行算法无法适应大规模计算节点的可 扩展性要求,数据规模的扩大往往需要对计算模型进行重新设计 和开发; 无法对海量数据所需的大量存储和计算设备进行统一有效 的管理和利用,系统运维成本较高; 最近几年出现的一些分布式数据存储与处理技术,比如 Hadoop,可以有效解决海量数据存储分析过程中面临的上述问题。 Hadoop 是一种低通信密度的并行计算实现方法,适合于计算可按 数据切分的计算场景。与基于关系型数据模型的数据存储相比, Hadoop 框架可以更好地满足科研数据的存储要求:基于 HDFS 分布式文件系统的数据存储不受节点规模的限制,可以随着科研 数据规模的不断扩大而进行相应的扩展;同时,HDFS 的各数据 节点采用流水线的数据操作方式,允许支持对科研数据的高吞吐 310 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 量数据访问;此外,HDFS 在各数据节点上保存了多个数据副本, 使得整个文件系统不会因为某个节点的失败而崩溃,提高了数据 存储的稳定性和可靠性。 目前,Hadoop 已经在科研领域得到了一定程度的应用。普渡 大学(Purdue University)的 VoIP 和网络安全的研究项目中积累 了超过 190 G 的 VoIP 数据,其涉及的对象超过 14,000,000 个。 在此前的工作中,普渡大学的研究人员不仅需要维护数据存储集 群中的多个数据节点,而且需要人工完成计算任务的切分、执行 和聚合。通过在其研究工作中采用 Hadoop 框架,不仅减少了人 工运维工作,而且提高了并行计算应用设计和开发速度。同时, Hadoop 使得数据的平均查询响应时间由数分钟缩短为数秒,极大 改善了用户体验。 与高性能计算一样,由科研小组自己建立一套平台来完成自 己的科研任务是不现实的,而以云计算的形式提供这种 Hadoop 平台,共享给各科研机构使用,是一种趋势。美国的著名云计算 服务提供商亚马逊就已经在 EC2 上推出 Hadoop 服务,而纽约时 报使用该服务仅用时 24 小时就完成了其过去几十年所发行报纸 的数字化索引,花费仅 240 美元。 5. 云计算与协同创新 随着科学研究的不断进步,科研人员对于研究的广度和深度 都提出了更高的要求。今天的科学研究已经不是单纯依靠个人的 单打独斗就能完成,而是越来越要求团队合作。对深度研究来说, 各种科研工作都需要不断借鉴前人的研究成果,并在彼此交流中 311 第六章 云计算及其在科研领域的应用态势 相互促进,不断产生新的发现,获得进步;对于广度研究来说, 科学研究的对象超越了简单的孤立系统,向着大范围、多领域的 复杂系统工程进军,涉及到跨学科、跨领域的发展。传统的科研 方式具有较大的封闭性,一项科研任务的研究团队往往只来自于 一个实验室,其原因在于科研工作是一种脑力密集型劳动,需要 大量的时间进行信息的沟通和讨论。另一方面,传统模式下,科 研过程的信息化程度比较低,科研过程中产生的文档、材料等中 间成果,是以物理的形式存在的,没办法让不在一个地理位置的 科研人员很有效地一同工作。这种模式的结果,是研究的周期长, 同时存在大量的重复性研究,导致科研效率不高。在现实中,科 研的基本思想是创新,这个“新”是在一个全球的范围内比较的 结果,如果研究团队不能在最新成果的基础上进行研究,就很难 取得突破,从而永远落后于领先者。因此,今后的科学研究越来 越强调开放、协同,让各个领域的研究者可以强强联合,共同完 成一个研究课题,从而取得科研工作的跨越式发展。 协同创新是未来科研模式的一种发展方向,而互联网和云计 算是一种有力的工具。这一点可以从互联网的发展得到借鉴。在 传统行业,很难看到一些行业巨头被新兴企业通过技术创新的手 段进行超越。但是在互联网领域,这种超越在不断上演。比如,.com 热潮催生了雅虎、亚马逊等传统互联网巨头,但是这些巨头很快 被谷歌等企业超越,随后,FACEBOOK 异军突起,试图复制谷 歌的成功。这些例子证实了,在一个开放的环境下,最优秀的人 可以快速聚集在一起,产生新的想法,并给更多的人启发,从而 不断重复这个过程。 高效的协同创新,有两个层面的技术手段。基本的手段,是 312 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 让参与研究的成员可以随时随地通过网络分享信息、安排研究任 务、跟踪研究进度、讨论研究内容,共同完成研究课题。这一点 在今天的许多科研机构里面已经在实践。而高级的手段,是让研 究成员可以共同使用同样的研究工具和对象,从而彻底解除研究 人员之间的物理空间的限制。这种手段是把研究工具和对象信息 化,并以云计算服务的形式进行封装,其前提是研究工具和对象 可以进行信息化或数字化。 这里可以举一个 IBM 研究院的例子。IBM 研究院是一个全 球性的研究机构,由 8 个实验室组成,分布在美国纽约、硅谷、 中国北京、以色列海法等多个城市。IBM 研究院的每个研究课题, 许多都是由多个实验室的研究者共同研究的,从而早已实现了虚 拟研究团队这一理念,同时也避免了某个实验室闭门造车的情况。 为了实现这一目标,IBM 研究院内部建立了多种信息化平台,其 中,研究课题数据库记录了所有项目的项目描述、研究成员、研 究成果和最新进展;研发云计算平台(Research Compute Cloud) 为所有研究团队提供了一个全球共享的 IT 平台,可以让各个研究 团队按照自己的研发需要申请 IT 资源。每个研究团队可使用云计 算平台进行自己的研究工作,并在每周将研究进展以电子文档的 方式发布在课题数据库中,供其他团队和 IBM 销售部门参考,同 时,许多研究成果也会以云服务的形式运行在云计算平台上,将 研究成果直接转化为新服务,提供给全体 IBM 员工使用。 6. 总结 云计算的广泛应用改变了用户使用计算能力的习惯,创造了 313 第六章 云计算及其在科研领域的应用态势 许多新的应用场景。科研领域对于信息化长期以来一直有迫切的 需求,而且也一直在进行持续的投入。云计算可以以较大的经济 性推动科研领的信息化,同时能促进科研机构之间的协作,对于 我国未来科研的发展有重要的意义。 314 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 七 GPU 应用及发展态势 葛蔚 何险峰 王小伟 中国科学院过程工程研究所 GPU广泛应用于图像处理、计算流体力学、分子动力学、金 融分析、石油勘探、计算生物学等领域,并在有些应用中对CPU 获得了一到两个数量级的加速,取得了令人瞩目的成绩。相比CPU, GPU有高度的并行性;高密集的运算单元和位宽;超长图形流水 线。但存在着数据通讯慢、程序通用性差、双精度性能不高的缺 点 98。 1. GPU 简介 目前常用的 GPU 主要是 NVIDIA 公司的产品(Geforce, Quadro 和 Tesla 系列), 其中最新的 Tesla C2050 有 448 个处理器, 单精度计算峰值性能达到 1.03 Tflops, 双精度 515 GFlops;另一 家是 AMD 的产品(Firstream, ATI Radeon) ,高端的 GPU HD5870 有高达 1600 个流处理器,单精度理论峰值 2.72 Tflops。Intel 公司 也在原来规划的 Larrabee 的基础上,在 2010 发布了新的众核架 构 MICA (Many Integrated Core Architecture),并且已经推出了工 程样品 Knight Ferry,预计将在 2012 年推出正式产品。 早先的 GPU 编程语言是基于底层的高级着色器语言(如 Cg, HLSL)等开发的,由于编程复杂,开发难度大而没有获得大规 模应用。 2003 年, 斯坦福大学的 Ian Buck 等开发了 Brook 编译器, 315 第七章 GPU 应用及发展态势 大大简化了开发难度,但 Brook 编译效率低,限制条件多。之后 AMD/ATI 推出了 Brook+来改进其 Stream GPU 的效率,但 Brook+ 受限于体系结构和线程通讯约束,并没有获得成功。与之对应的 是,NVIDIA 在 2007 年推出的 CUDA 却因为效率高、编程相对 容易在产业界和学术界获得成功。目前包括 IBM、HP、联想、浪 潮等国内外著名企业都在推基于 CUDA 的产品。哈佛、伯克利、 中科院研究生院、清华等大批国内外高校也开设了相关课程。一 些商业化软件,如 Adobe、Autodesk、MATLAB 也都开发了基于 CUDA 的商业化产品。另外值得一提的是,开放标准的 OpenCL 编程接口已逐渐在 GPU 编程中推广,AMD 和 NVIDIA 也推出了 相应的编程工具。但 OpenCL 发展成象 OpenGL、DirectX 这样深 入人心的编程接口还有待时日。 2. GPU 在高性能计算中的应用 CUDA、Brook+等编程语言的推出,降低了 GPU 的应用门槛, 引起了 GPU 在通用计算领域的革命性发展,越来越多的原来基 于 CPU 的应用被移植到 GPU 上,GPU 由于其良好的性价比及运 营成本低等优势,在高性能计算领域也崭露头脚,出现了许多基 于 GPU 的大型计算集群,如中科院过程所在 2008 年初利用 NVIDIA 公司的第一代 GPU Tesla C870 构建了单精度峰值百万亿 次的计算系统,日本东京工业大学(Tokyo Tech)在 2008 底利用 NVIDIA 第二代 GPU 搭建了单精度 690 万亿次的 TSUBAME 超 级计算机。过程所 2009 年 4 月又将原来的系统升级至单精度超 过一千万亿次的 GPU 超级计算系统。2010 年,NVIDIA 发布了 第三代 GPU—Fermi,由于其双精度性能的大幅提升并且支持 316 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 ECC,又掀起了 GPU 计算系统的新高潮,过程所率先建成了国际 上首套基于 Fermi 的双精度 1000 万亿次的超算系统—Mole-8.5。 随后建设的超算系统如天河一号、曙光星云以及东京工业大学的 TSUBAME2.0 都采用了这种 GPU+CPU 的异构模式。该模式极大 地提升了超算系统的性能,目前在 TOP500 全球排名前 4 家的超 算系统中,有 3 家采用了这种结构,并且这种应用还有进一步扩 大的趋势,如美国橡树岭国家实验室正在建设的 10-20 千万亿次 的超级计算机,也是采用 GPU 作为主要加速部件。目前 GPU 集 群应用的主要问题是虽然系统的理论峰值很高,但实际能够使用 这些计算性能的应用却很少。 3. GPU在中科院研究所的典型应用 99 GPU 的应用领域十分广泛,特别是在图像处理(如 CT),流 体力学、天文、地球物理、信号处理、分子动力学、计算生物学 等方面。这里以中科院的几个典型应用为例简要说明。 (1)油田勘探(地质地球所) 地质地球所利用 GPU 实现叠前时间偏移(PSTM)地震成像 计算,并用来进行油气田勘探应用。与传统 CPU 群集相比,能够 以更低的成本在 PSTM 运算上实现 100-400 倍的速度提升,同时 将功耗降低 95%。 317 第七章 GPU 应用及发展态势 图表 128.某油田叠前时间偏移计算 (2)天体物理(天文台) 天文台在 GPU 系统上利用 Nbody 算法模拟了宇宙演化的过 程,计算星粒子数量超过 5 亿个。 图表 129.宇宙结构形成过程模拟 (3)高能粒子(高能所) 高能所利用 GPU 开发了分波分析软件 GPUPWA,软件已成 318 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 功在 GPGPU 超级计算环境上运行。并采用混合精度策略。与传 统 CPU 相比较,速度提高了 160 倍。 (4)材料科学(金属所、过程所) 金属所利用 GPU 系统模拟了外应力作用下金属发生缺陷和 裂纹过程。 图表 130.含晶界和位错的α-钛模拟晶胞在拉伸作用下裂纹形核的演化过程 过程所在 Mole-8.5 系统采用多体势分子动力学方法对硅纳米 线体系的大规模模拟,体系中模拟的原子数达到了 15 亿,最多 使用了 1,500 个 Tesla C2050,单精度计算性能达到了 227 Tflops, 计算效率达到了 17%。 (5)气固系统的多尺度模拟(过程所) 过程所在 Mole-8.5 上采用多尺度方法对中石化 MIP 工艺中的 气固系统进行了模拟,包括从全回路系统模拟到提升管段的二维 准实时模拟,再到提升管段局部气固系统的直接数值模拟,跨越 了多个不同的时空尺度。其中的气固系统直接数值模拟包含了 100 多万个固体颗粒,使用了 576 个 NVIDIA Tesla C2050 GPU 进 319 第七章 GPU 应用及发展态势 行大规模并行计算,单个 GPU 卡的计算速度约是普通 CPU 单核 心的 20-30 倍。 (a) 反应器整体模拟 (b) 提升管段准实时模拟 (c)气固系统直接数值模拟 图表 131.百万颗粒的气固系统的直接数值模拟 (6)H1N1 病毒颗粒的大规模模拟(过程所) 过程所基于现有研究进展,构建了流感病毒的三维原子结构, 如图 5 所示。通过在多尺度模拟计算系统上 Mole-8.5 上进行大规 模计算模拟其在细胞液中的动态结构, 体系中包含的原子个数约 3 亿,模拟使用了多达 1,728 个 Tesla C2050 GPU,是目前已知的 对该类型体系的最大规模的模拟。模拟结果可用于研究流感病毒 的结构及遗传复制等生命过程,探索抗流感药物同流感病毒间的 作用,并进一步用于新型抗流感病毒的研制。 320 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 132.H1N1 病毒颗粒体系的大规模分子动力学模拟 4. GPU 发展趋势 (1)硬件体系 在目前的体系结构中,GPU 中的 SIMD(单指令多数据)处 理器结构相对比较简单。 动态或分支控制仍然是对 GPU 的挑战。 虽然 NVIDIA 在其 GPU 内的顶点着色器流水线上使用 MIMD 方 式控制,但在逻辑运算上,GPU 还存在很大的劣势。要使 GPU 在更多商业领域应用,未来 GPU 需要更复杂的算术单元。GPU 在和 CPU 进行数据传输时,需要通过主板上的 PCI-E 来完成,但 目前 PCI-E 的带宽对 GPU-CPU 通讯常常是瓶颈,特别对大规模 数据传输。对离不开双精度浮点运算的科学计算来说,GPU 的双 精度性能常常是困扰研究人员的一个问题,虽然 NVIDIA 新发布 的 C2050 GPU 双精度计算能力超过 500GFlops,但其计算峰值仍 然只有单精度峰值的 50%,在实际算例中则更低。另外由于制造 321 第七章 GPU 应用及发展态势 工艺的限制,GPU 的缓存(Cache)相对较少,这也是未来的 GPU 中需要提高的。 伴随着硬件结构的改进及制造工艺的提高,GPU 的峰值能力 将不断增加,如 NVIDIA 已经发布了下两代的 GPU 产品,下一 代是“Kepler”,再往后就是“Maxwell”,制造工艺也将由现在 Fermi 的 40nm 分别升级为 28nm 和 20nm。其中“Kepler”的双精度浮 点性能提升到 Fermi 的至少四倍(预计单精度 4T,双精度 2T), 同时引入虚拟内存、非阻塞 I/O 等类似 CPU 的功能,Maxwell 将 在 2013 年发布,则会把每瓦双精度浮点性能提升到 Fermi 的十倍 (预计单精 10T,双精度 5T) 。同时,由于以后将要面向亿亿级 (Exascale)的计算,GPU 在提升峰值计算能力的同时,能耗也将会 显著降低。 (2)可视化 由于 GPU 天生就是用来进行图像处理的,GPU 在可视化上 必然发挥越来越大的作用。随着并行计算、高速网络通讯和大规 模存储技术的发展,原来多用 CPU 来完成的、耗时的 3D 渲染, 有望转移到 GPU 上来达到实时显示。目前一些电影特效已经在 开始尝试用 GPU 来加速渲染,如电影“阿凡达”[3]。同时,美国 桑第亚国家实验室(Sandia National Laboratory)的开源程序 ParaView 也正在被改造成能够在 GPU 上运行从而提高渲染速度 的版本。从某种角度说,随着 GPU 计算性能的不断提高,计算 会产生海量的数据结果,而时效性要求很高,如要求实时化,因 此数据的后处理包括可视化将越来越成为瓶颈。 322 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 图表 133.中科院过程所 Mole-8.5 上工业滚筒的大规模准实时模拟及可视化 (滚筒中运动的颗粒约有 960 万,直径 10mm,滚筒直径 1.5m,长 13.5m,转速 5 转/分,模拟采用了 270 个 Tesla C2050 GPU 并行计算) (3) 云计算 云计算的特点是:并行计算+数据中心。比较成功的 GPU 云 计算 (或称分布式计算) 例子是于 2000 年 10 月 1 日启动的 Folding @ Home ─ 用以研究蛋白质折叠、聚合等的分布式计算工程。 项目中主要贡献计算的是几十万个安装了后台客户端程序的个 人计算机。2008 年 8 月 26 日,根据斯坦福大学的统计数字,项 目中使用的 11370 颗 NVIDIA GPU 已经为 Folding@home 贡献了 超过 1Petaflop(每秒千万亿次浮点运算)计算能力。占到这一应 用项目总处理能力的 42%。可以说,对可分布并行的计算密集型 的应用,GPU 将发挥巨大的潜力。 (4)CPU 与 GPU 融合 出于 GPU 和 CPU 优势和劣势的综合考虑,目前包括 NVIDIA、 AMD 和 Intel 都在致力于开发 CPU 和 GPU 融合(Fusion)产品。 AMD 在 2011 年 1 月的 CES 大会上发布了其第一代 CPU+GPU 简 称 APU,代号为“Brazos”产品。Intel 则在其 i 系列产品中不断 323 第七章 GPU 应用及发展态势 提高 GPU 性能和传输带宽,发布了新一代的处理器 sandy bridge。 可以预计,未来 CPU+GPU 融合将是 GPU 或者 CPU 发展的重要 方向。 (5)应用牵引的全新计算模式及架构 目前 GPU 在高性能计算领域的一个主要问题是峰值能力与 实际计算性能的巨大差距,这主要是由于硬件结构与计算的问题、 模型、软件不匹配。以过程工程为例,过程工程从实验室研究到 工业装置,涉及了分子、分子聚集体、颗粒、聚团和反应器等, 跨越了多个时空尺度,其放大与调控十分困难,这成为解决能源、 资源、环境危机的瓶颈问题。GPU 的出现,为硬件与问题、模型 和软件三者的统一提供了契机,过程所建设的多尺度离散模拟系 统借用 GPU 实践了一种新的计算模式,体现了应用驱动、效率 优先、软件通用、硬件专用以及问题、模型、软件和硬件结构一 致等设计理念,使工业过程看到了在线模拟或实时模拟的希望。 但是,目前的 CPU+GPU 异构的超级计算系统还仅仅是多尺度离 散模拟系统的一种初步实现形式,如这种结构还未完全考虑多尺 度问题中核心的介尺度。因此还需要从应用出发,结合介尺度科 学认知方面的突破和新的多尺度计算模式,从底层元器件开始开 发更加优化的硬件体系结构,发展可称为 XPU(X=未知)的新 一代芯片,完全实现问题、模型、软件和硬件四者的有机统一, 这将有可能使计算的速度和效率实现新的飞跃,从而实现多尺度 实时模拟这一过程工程新里程。类似过程工程对硬件体系发展的 要求及牵引,也可推广到其它的工业领域,从而推动发展模式的 革命性变化。 324 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 八 物联网发展的机遇与挑战 叶甜春 冯 飞 田 静 封松林 中国科学院高技术局 中国科学院物联网研究发展中心 国务院发展研究中心产业经济部 1. 物联网的概念和特征 物联网是继个人计算机、互联网及移动通信网络之后的全球 信息化的第三次浪潮,是传感网、互联网(移动通信)、云计算, 以及智能信息处理等信息技术发展到一定阶段,在应用需求和供 给创新的双轮驱动下,通过水平分层与垂直整合产业链条而形成 的全球性信息系统。目前关于物联网的概念,尚无统一的定义, 本文把物联网的含义界定为:通过传感和标识,按约定的协议, 把物品与互联网等网络连接起来,进行信息交换、通讯、处理, 在实现智能化识别、定位、跟踪、监控、管理和服务的基础上, 深度应用于经济社会自然领域、提高人类生产生活管理水平的全 新信息系统。 回顾物联网的发展历史,大致经历了传感网、传感网与物联 网融合、物联网概念扩展深化三个过程。早期的传感网可以追溯 到二战时期的英国雷达网络、冷战时期的声纳监测系统,当时是 应用在军事国防上。上世纪九十年代后,在各个领域开始快速发 展,2005 年,国际电信联盟(ITU)发布了针对物联网的年度报 告,指出物联网时代即将来临,信息与通信技术的发展已经从任 325 第八章 物联网发展的机遇与挑战 何时间、任何地点连接任何人,发展到连接任何物体的阶段。 随着大量物品不断连接到网络中,从人到人通信的移动通信 网,机器到机器连接的互联网,发展到物与物、人与物连接互动 的物联网,物联网逐渐表现出“全面感知、无缝互联、高度智能” 的特征。 “全面感知”表现在:利用传感器、射频识别(RFID) 、 二维码、全球定位系统 GPS、摄像头等感知仪器设备,对各种客 观存在、可测量的物理实体所处位置、环境、状态进行实时精确 感知。“无缝互联”表现在:所有物品能够通过移动通信网络、 互联网连接在一起,以便彼此之间的协作和互动。“高度智能” 表现在:物与物之间根据其内在的本质联系,实现对生产、流通 和消费过程智能化的优化决策与高效实施。 物联网的崛起不仅在于其技术的先进性,更体现在它对人们 的生产生活方式,对各种应用领域的运营模式、业务模式、商业 模式所产生的深远影响。物联网通过感知、网络、计算实现跨行 业、跨地区、跨领域的实时信息联动,完成信息的深度渗透和智 慧融合,形成优化决策,进而大大提高全局资源调度与整合的效 率。物联网在市政管理、军事国防、安防反恐、节能环保、交通 管理、能源电力、物流零售、工业制造、精细农业、医疗健康、 金融服务和家居建筑等多种应用领域都将发挥重要作用,带动面 向这些行业应用的物联网系统集成产业,以及基于物联网系统集 成信息的增值服务产业,形成面向政府、企业和个人的物联网信 息服务,并催生崭新的商业模式和产业形式,最终形成巨大的产 业体系。 326 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 2. 国际物联网发展特点 2008 年,国际金融危机爆发后,为实现经济复苏,主要国家 均将培育新的经济增长点作为经济调整的重要战略举措。物联网 因其在生产生活中的极强渗透性、具备成为新经济增长点的巨大 潜能,引起了世界各主要经济体的高度重视。2009 年 1 月 28 日, 美国总统奥巴马对 IBM 提出的“智慧地球”做出积极回应,把“宽 带网络等新兴技术”定位为振兴经济、确立美国全球竞争优势的 关键战略,并在《经济复苏和再投资法》中加以落实,推动在能 源、宽带与医疗三大领域开展物联网技术的应用,相关投资高达 358 亿美元,其中 110 亿美元用于智能电网及相关项目。欧洲、 日本、韩国等发达国家和地区纷纷在国家战略层面上提出各自的 物联网发展规划。 由于经济发展、信息基础设施水平和文化制度差异,各国战 略着眼点是不同的。总的来说,美欧日等发达国家希望通过物联 网的发展来实现向全面信息社会迈进,利用其领先的信息化网络 水平,继续确保其在国际经济竞争的传统主导地位。而发展中国 家则希望利用物联网发展机遇提升信息化水平,进而提高工业化 水平和增强产业竞争力,并力图在未来全球技术竞争中,有较强 实力参与国际游戏规则的订立,加快本国经济和社会信息化进程。 与以往两次信息化浪潮不同的是,物联网尚无成熟的商业模式和 非常稳定成型的产业链,对于发展中国家可谓机遇与挑战并存。 在新一轮信息化浪潮面前,为抢占信息技术制高点和占领市 场,大型跨国设备制造商、信息网络公司、系统集成商等企业抓 327 第八章 物联网发展的机遇与挑战 住各国应对国际金融危机、振兴经济、加快产业结构调整的时机, 利用其先进的技术人才储备、强大的经济实力和成熟的运作模式 加快进入发展中国家市场,主导物联网产业的发展,这对发展中 国家推进物联网技术自主创新、提升产业竞争力构成了新的挑战。 在经济全球化背景下,“技术专利化,专利标准化,标准国 际化”已成为市场竞争的重要特征。目前,国际上已有多个物联 网技术制定组织和多个技术标准,彼此缺乏互联互通和合作。各 国都希望在核心技术标准这一关系到物联网产业发展主导权的 领域上抢得先机。发达国家往往通过控制国际标准的制定,来抢 占国际产业发展的制高点。跨国公司则通过技术专利演变成事实 标准,来保持其在市场竞争中的优势地位,以获得高额、稳定的 收益。发展中国家力图改变过去亦步亦趋的被动局面,把参与国 际标准制定作为跨越式发展的重要举措,大力推进。各国在发展 物联网过程中,高度重视信息安全的保护,注重加强国家间的磋 商与协调,维护本国的信息主权。“没有安全就没有应用,没有 应用就没有发展” 。当前物联网发展面临的一大挑战就是信息安 全和个人隐私问题。确保物联网时代信息的交流不触犯各国或各 地区法律法规,是物联网时代的重要特征。欧盟委员会 2009 年 6 月宣布的“物联网行动计划”,旨在帮助欧洲在构建物联网过程 中获益,其中,隐私与安全、个人数据保护等问题是计划的重要 内容。 3. 我国物联网产业的发展状况和面临的挑战 我国政府一直高度重视信息化建设,强调以信息化带动工业 328 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 化,通过全面提高我国信息化水平,实现产业升级和经济增长方 式转变。早在“十一五”规划中,国家就对宽带无线通信网络、传 感网、编码等物联网涵盖领域作出相关部署。 《国家中长期科学 与技术发展规划(2006‐2020 年)》、“新一代宽带移动无线通信网” 和“中国下一代互联网工程 CNGI”重大专项中都将传感网列入重 点研究领域和发展规划。 近年来,中央领导充分认识到新一代信息网络发展带来的重 要机遇,对物联网发展给予了高度重视。胡锦涛总书记明确提出 要加快发展物联网技术。温家宝总理提出“感知中国”的建设目 标,把物联网产业纳入国家战略性新兴产业重点领域。相关部门 积极开展研究和部署,启动了物联网产业发展规划、技术研发、 标准制定和应用推广工作。 2009 年底,国务院批准无锡作为“国家传感网创新示范区”, 开展“感知中国”中心建设,吸引了大批科研机构和大学到当地 建设物联网研发机构,其中,中国科学院和江苏省、无锡市共建 的“中国物联网研究发展中心”作为国家级核心创新基地建设取 得了重要进展。 同时应该看到,我国在发展战略和政策法规制定、核心技术 研发、标准规范、推广应用、产业链完善、信息安全保护和人才 队伍建设等方面还存在不少突出矛盾和问题: (1)各级政府高度重视,但盲目跟风、一哄而上情况突出 在中央政府和各部门的大力推动下,各地方政府积极响应, 江苏、北京、上海、深圳、杭州、广州等东部沿海城市纷纷开始 329 第八章 物联网发展的机遇与挑战 规划自己的物联网城市蓝图,大力推进物联网产业发展。目前物 联网发展缺乏国家层面的顶层设计和统筹规划,各地区、各部门 对物联网的定义、内涵、产业范围认识存在明显差异,盲目跟风、 一哄而上情况突出,一些城市对物联网发展规律和本质缺乏清晰 判断,将城市信息化、智能化建设的系统解决方案委托给跨国公 司全部承担,既挤占了我国物联网产业自主创新发展的空间和本 国企业的市场份额,也带来了国家和城市的信息安全问题。 (2)多方协作格局初步形成,但组织协调机制和法律政策支撑 体系有待完善 目前各部门根据自身职能分工,正在积极推进物联网技术研 发、标准制定、示范应用和产业化推广,初步形成了合力推进物 联网发展的格局。各地区也注重结合自身实际,努力实施错位发 展。为加快技术创新,在有关部门引导下,各种形式的物联网产 业联盟也正在酝酿组建。但总体上看,目前国家级组织协调机制 还不完善,缺乏跨行业、跨部门、跨领域的技术及产业发展协调 机制。行业垄断、条块分割、自成体系等体制障碍,制约了物联 网技术、产业和应用的结合和良性互动。 物联网发展不仅是一个技术问题,更涉及到政治法律和国家 安全问题,只有在法律法规和政策完善的情况下,物联网才可能 大规模深化发展。经过多年发展,我国已建立较完善的互联网法 律法规体系,对规范和促进互联网健康发展发挥了积极作用,但 由于物联网处于起步阶段,我国还没有完善的法律法规,不利于 从法律层面保障市场公平竞争和促进产业健康发展。相关配套政 策也不健全,对产业发展的宏观指导、统筹协调管理、市场监管、 330 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 公共服务的能力需要进一步提高,管理部门职能和扶持政策有待 明确,风险投资体制也没有完全建立,创新成果产业化机制不够 健全,以企业为主体的技术创新体系有待完善。 (3)产业和技术发展具备较好条件,但核心技术突破不够 我国物联网发展启动较早,1999 年中国科学院将传感网技术 列为重点发展方向,组织 20 多个研究所,先后投入数亿元,按 照材料、技术、器件、系统、网络进行了较为系统的研发布局, 集中力量攻克传感网关键技术,在微纳传感器、传感器网络通信 技术和应用示范等方面取得重大进展。北京邮电大学、清华大学、 北京大学、中国科技大学、东南大学、复旦大学、哈尔滨工业大 学等高校也在传感网和射频识别技术上进行了多年研发。电信营 运商与整机企业突破了一批关键技术,形成了一定产业规模。可 以说,我国在物联网技术研发、产业基础、市场主体及示范应用 等方面已具备推动产业跨越式发展的基本条件。 但总体来看,我国在物联网关键技术研发和应用上仍然存在 较大差距,核心技术突破不够,整体系统集成能力不强,具体表 现在:传感器产品设计与规模制造能力缺乏,自主核心芯片技术 不成熟,中间件、开发环境和应用软件等软件开发薄弱;应用层 研发起步晚,大部分分散于低端层次,尚处于跟踪阶段,缺乏核 心技术,整体解决方案能力不足,缺少具有自主知识产权的创新 企业;绝大部分知识产权和技术标准由国外企业掌控,一些核心 技术、产品和装备依赖进口。 331 第八章 物联网发展的机遇与挑战 (4)产业链初步形成,但存在龙头系统集成商缺乏等明显薄弱 环节 从产业链条看,我国在标准研究、识别芯片、传感器、识读 设备、传输网络、终端产品、应用服务等各个环节都有一定产业 基础,聚集了一批优秀企业,构成了较完整的产业链,但有待整 合和完善,特别是传感器及系统集成薄弱环节亟需突破;技术研 发与产业结合不够,产学研依然脱节,还没有形成良性的产学研 合作模式;产业融合能力弱、协同水平低;缺少拥有系统集成能 力和整体解决方案的实力雄厚、竞争力强的龙头企业及大型服务 商,以众多中小企业为群体的产业配套体系还不完善。 (5)网络安全管理不断加强,但信息安全形势令人担忧 近年来我国在维护网络安全上投入了大量资金和技术,颁布 了一系列与网络安全管理相关的法律法规,加强了网络信息安全 的管理力度,依法打击网络犯罪,反对网络黑客行为,以维护国 家安全和社会公共利益,保护个人、法人和其他组织的合法权益。 但网络安全形势依然严峻,网络安全事件频发,甚至出现一 些恶性网络安全事件,僵尸网络、蠕虫病毒、钓鱼网站等等一系 列安全问题威胁着网络的可生存能力和可信度。我国在信息管理 手段、网络安全基础设施建设、民众的网络安全意识培养等方面 跟不上信息网络发展的步伐,缺乏监管信息安全、隐私保护的法 规和技术上统一认可的手段,造成我国信息安全保护水平较低。 可以预见,随着物联网应用的推广,网络安全保障以及信息安全 保护等问题将会更加突出,个人隐私保护问题也将在物联网大规 332 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 模应用后被迅速放大,这也是不少社会大众对物联网应用缺少信 心和安全感的重要原因。 (6)标准建设不断加强,但缺乏统一完整体系 我国在物联网产业相关技术标准制定上启动较早。2005 年, 原信息产业部批准成立了“电子标签标准工作组”,联合社会力 量,开展电子标签标准的研究和制定,截至目前正在研制的国标 项目 24 项、行标 10 项。同年,由全国信息技术标准化技术委员 会组织成立了中国无线个域网标准项目组;2007 年,该项目组下 成立了超宽带标准项目组。为加快物联网发展,2009 年有关部门 又成立了中国传感器网络标准化工作组,开展组网、接口、标识、 安全等八个标准项目的研究和标准制定工作,力图制定适合我国 产业发展特点的物联网国家标准,并积极参与国际标准化组织的 物联网标准化研究,将物联网标准化体系框架、网络系统架构、 协同处理服务和接口标准体系等内容纳入国际物联网标准总体 报告。总体上看,我国在低速无线个域网国内标准、宽带无线多 媒体(BWM)标准、WLAN(无线局域网)国内标准、超宽带国 家标准、信息设备资源共享协同服务(IGRS)国家标准制定等方 面已取得积极进展,已成为国际标准制定的主导国之一。 但现有标准还很零散、缺失和不统一,标准制定与市场应用 结合不够,导致物联网市场分割,制造和服务成本偏高。与国际 标准融合也存在不小差距,技术标准上话语权还相对有限。 (7)示范应用有序开展,但商业盈利模式还不成熟 在 2008 年北京奥运会和 2010 年上海世博会期间,部分物联 333 第八章 物联网发展的机遇与挑战 网技术就开始服务于奥运会,城市网格管理、安全监控、智能交 通、食品溯源、大气检测、水质检测、IPv6 奥运网站等方面的成 功运用在国内外产生了很大影响。“感知中国”提出后,各级政 府积极推动物联网在政府管理、社会服务和企业应用等领域的示 范工程。目前,市政管理、节能环保、智能交通、工业生产自动 化、现代农业、智能电网等领域的示范应用已在北京、上海、江 苏、浙江、广东等地初步展开。 尽管各种物联网示范工程在各行业逐步展开,但这些示范应 用还具有明显的局限性,主要为政府推动,市场力量不足,缺乏 规模经济效应,在供给与需求之间尚未形成相互促进的良性机制, 制约了商业化盈利模式的形成。 (8)基础资源有一定基础,但地址缺乏和公共服务平台支撑不 足问题凸现 网络基础资源和公共服务平台是实现物联网全面感知和互 联互通的重要支撑。作为物联网应用的重要地址资源,我国拥有 IPV4 地址约 2.3 亿个,已成为世界第二大 IPV4 地址拥有国。在下 一代互联网发展上,我国已建成世界上最大的 IPV6 示范网络,提 出的有关域名国际化、IPv6 源地址认证等技术方案,成为国际标 准、协议的重要组成部分。我国 96%的乡镇接通了宽带,3G 网络 已基本覆盖全国。 但随着这一代互联网 IP 地址资源到 2012 年左右基本耗尽和 物联网发展对地址资源需求的迅猛上升,基础资源严重不足的矛 盾将日益凸现,需要加快向下一代互联网过渡。此外,由于行业 334 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 壁垒、部门利益保护等因素影响,资源共享机制缺乏,网络基础 资源服务平台、物联网信息交换平台、超级云计算中心和信息安 全保护平台等共性基础支持平台还很不完善,服务水平得不到保 障,公共服务平台的支撑作用明显不足,造成了资源的极大浪费, 制约了技术研发和产业化应用。 4. 物联网重点发展领域 物联网是信息技术在物理世界的深度应用,是一个技术跨学 科、行业跨领域、应用跨区域、管理跨部门的新兴产业。物联网 产业的发展应以市场需求和技术创新为驱动力,以经济发展和社 会进步为载体,分阶段、分层次逐步推进,形成较为完备的物联 网技术体系和产业体系。 (1)重点技术领域 物联网重点技术领域主要涉及基础资源管理与服务、信息获 取与识别、组网与传输、处理、安全、系统集成、共性支撑技术 等方面的核心技术和支撑技术。 z 物联网基础资源管理与服务技术 包括可信、可管、具有隐私保护机制的物联网基础资源管理 技术及其系统集成;高性能、安全的物联网基础资源服务技术及 其服务系统;物联网基础资源服务发现、信息分类和检索技术、 安全监控、攻击防范、数据关联分析和舆情预警技术。 z 物联网信息获取与识别技术 核心技术包括新型标签技术、微纳传感器及其加工与封装、 低功耗多处理器片上系统与片上网、识别定位芯片、低功耗射频 335 第八章 物联网发展的机遇与挑战 电路芯片、片上天线技术。支撑技术包括敏感材料、微能源与储 能技术、能量采集技术等。 z 物联网组网与传输技术 即不同应用场景下节点通信与组网技术。核心技术包括大规 模自组网与可靠信息交互、多感知信息的分布式融合技术,面向 国家安全与特定行业应用的网络隔离技术、保密、抗干扰、分级 信息传输技术等,实现节点之间有效、安全的信息交互与协同处 理。支撑技术包括服务管理与资源发现、物联网管理技术、多网 互联技术。 z 物联网信息处理技术 包括以信息感知和融合为基础、以知识生成为中心的物联网 多源数据的协同交互和数据融合技术,以及从信息感知、模式识 别、知识处理和决策与处置的安全感知体系架构、标准和技术解 决方案,到建立物联网流数据的存储与查询的数据库系统,挖掘 海量物体信息关系链。在物联网系统级软件开发上,重点发展信 息处理、智能控制、数据库软件、中间件等基础性软件。 z 物联网安全技术与政策 核心技术包括物联网安全架构,跨网络架构的实体认证技术, 支持对物联网中实体的远程操作进行多等级的访问控制和预警, 建立应急预警和处置机制。隐藏技术、匿名认证和信任传递、数 据加密和保护等技术。电子取证和证据认可等技术,为基于物联 网的承诺与违约等相关法律法规和政策的制定、为物联网的安全 使用和运行提供技术手段和依据。 z 物联网系统集成技术 包括结合微纳传感与微机电系统传感等技术进步,研制集感 336 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 知、传输、预处理等功能于一体的物联网节点设备。针对多业务、 多应用融合需求,加大应用管理和服务软件以及信息服务平台技 术的开发力度,推动物联网应用的快速发展。 z 共性支撑技术 包括可编程、测试、环境建模等共性技术,物联网节点专用 操作系统和综合软件开发环境,标准测试验证平台、物联网应用 技术规范和系统测试平台,以及现代信息通信、计算机及网络、 新材料、新能源等基础支撑技术。 (2)重点产业领域 物联网产业与国家和人民的日常社会经济活动关联度大,对 农业、工业制造、交通物流、信息产业等国家支柱产业具有很高 的渗透性。主要包括核心产业和支撑配套产业组成。应有重点和 区分地加以推动。 z 核心产业重点 以物联网核心技术进展为依托、以政府扶持和规模应用为驱 动、以产品配套与服务体系建设为支撑,增强物联网感知、处理 和传输等领域设计研发的自主创新能力以及加速物联网核心技 术产业化的生产制造认证能力,重点发展与物联网产业化、规模 化、系统化紧密关联的关键器件、硬件、软件及运营服务等核心 领域,着力打造传感器、物联网芯片、操作系统、中间件、安全、 智能信息处理软件、海量数据存储、物联网信息/内容服务、系统 集成管理服务以及测试认证等产业。 z 支撑配套产业重点 围绕物联网核心产业,以物联网应用需求为牵引、以支撑未 来物联网智能化、自治化发展方向为目标,带动和促进能源、材 337 第八章 物联网发展的机遇与挑战 料、生物等非信息技术领域的技术进步。依托物联网产业化过程 中形成的良好市场培育和投、融资环境,推动微纳器件、微能源、 纳米材料、生物芯片、精益制造等支撑性配套产业的发展和完善, 实现核心产业从需求和资金上牵引支撑配套产业、支撑配套产业 从技术上丰富核心产业内涵、扩展应用规模的良性循环,促进物 联网产业健康、持续发展。 5. 物联网发展措施与建议 对于物联网的发展,需加紧顶层设计,推动物联网实现自主 发展;加强核心技术研发,大力推进自主创新;完善产业链条, 大力培育龙头系统集成商;强化需求导向,科学选择示范应用领 域;加强政策引导,积极探索商业化盈利模式;统一标准体系, 突出抓好应用领域的标准规范工作;健全法律法规,加强隐私保 护及物联网安全;强化人才支撑,建设高素质人才队伍。 338 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 九 科研机构信息化指数 研究与思考 张玲玲 杜 澄 中国科学院研究生院 信息化是人类社会发展到一定阶段的产物,是随着信息技术 的广泛应用而出现的、以信息作为重要的生产和生活资源的一种 持续的社会改造和演进过程。上世纪 60 年代,日本学者TADAO UMESA在题为《论信息产业》的文章中首次提出信息化的概念。 他认为“信息化是指通信现代化、计算机化和行为合理化的总称”。 随着科学技术,特别是信息技术的迅猛发展和广泛应用,使得信 息资源有可能作为一种“新兴”的重要生产要素对世界和国家经 济、社会发展的支撑、引领作用和不可替代性日益显著。目前, 各种类型的信息网络更加普及并日趋融合,信息化与经济全球化 相互交织,加速全球范围的产业分工和经济结构调整,重塑全球 经济竞争格局;与此同时,互联网加剧了各种思想文化的激荡, 成为知识扩散和文明交汇与竞争的新载体……,云计算、物联网、 移动互联网、智慧地球等新技术、新趋势、新概念不断涌现并且 受到世界各国的普遍关注。 一个国家、地区或者机构的信息化程度决定着其今后生存和 发展的实力和地位,不仅代表着其综合竞争能力水平的一个重要 方面,而且也是反映其经济、社会、技术发展水平的晴雨表和警 示器。在这种形势下,发达国家信息化发展目标更加清晰,向信 339 第九章 科研机构信息化指数研究与思考 息社会转型的步伐明显加快,越来越多的发展中国家主动迎接信 息化发展带来的新机遇,力争跟上时代潮流。 信息化指数是对信息化建设水平的全面、系统、量化的衡量, 可以为科教、经济、产业等乃至全社会发展水平提供“全过程、 多视角”的视图:从历史角度,通过信息化指数,可以进行国家 或行业信息化进程的回顾与比较;从过程角度,可以跟踪信息化 建设水平,把握走向、调整重点;从管理角度,可以发现信息化 过程中的问题,防患于未然;从决策角度,可以为未来的信息化 建设提供决策依据。 科研机构,尤其是国立科研机构,是国家或地区创新能力的 重要源泉,科研机构信息化建设水平对其自身创新能力的提升具 有显著影响,因而直接关系到国家或地区的创新能力水平。可以 说,信息化建设初期各国从开始研究互联网到正式接入互联网, 均以科研为主要目的。在国家或地区间竞争日趋激烈的今天,加 大科研机构信息化建设力度,对其创新能力以及研究与管理水平 的提升具有非常重要的作用,具有重要的战略意义。 中国科学院作为我国最重要、最具代表性的科研力量,对于 国家创新能力的发展具有重要作用,有必要也有可能率先、示范 性地建立一套客观、适用、动态、可比的科研机构信息化指数评 价体系。它不仅对于中科院深入开展、协调推进信息化工作、提 升创新能力,实现与国际科研机构信息化的衔接与借鉴有重要作 用,甚至可以对国家和世界信息化指数的研究和应用发挥引领作 用,并且为国家相关重大科技决策提供理性参考。 340 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 1. 科研机构信息化指数研究的必要性 信息化评价研究领域的代表学者分别为日本学者小松崎清 介(1965)和美国学者波拉特(1977)。前者于 1965 年提出了信 息化指数模型,从生产和生活的信息功能方面选取信息量、信息 装备率、通信主体水平、信息消费系数四个方面来反映社会信息 化发展水平,并在这四个方面建立了 11 项二级指标。美国经济 学家马克·波拉特提出了 GNP 比重法或称为就业结构分析法。该 方法从经济角度来考察社会信息化程度。采用三个指标:一是信 息劳动者占整个社会就业的比重;二是信息产业增加值占国民生 产总值的比重;三是信息产业产值占国民生产总值的比重。通过 上述三个指标测定信息经济规模在一国国民经济的相对份额来 衡量社会信息化程度,应该说是比较科学、客观、可信的。但该 测算方法毕竟比较复杂,以及现行统计数据比较粗糙及统计数据 不全,难以对第二级信息产业进行准确测算。 目前,对于信息化发展的评价或衡量的研究比较多,信息化 指数的研究已经成为信息化评价研究领域中的一个重要研究方 向,可以分为国家或地区的信息化指数和产/行业以及机构的信息 化指数。 关于国家或地区的信息化指数,目前的研究工作及其应用主 要有以下方面: 联合国电子政务发展指数(EGDI):衡量一国政府在执行政府 职能时使用在线和移动技术的意愿和能力的一个综合指标。它包 含在线服务指数、电信基础设施指数以及人力资本指数。 信息社会指数(ISI) :国际数据公司(IDC)和《世界时代》 全球研究部在“97 全球知识发展大会”上共同提出的一个概念。 341 第九章 科研机构信息化指数研究与思考 ISI 变量分为三组:社会基础结构、信息基础结构、计算机基础结 构,并根据其得分区间将其分为:滑冰者、健行者、短跑者、缓 慢前进者。 信息化发展指数(IDI·ITU):由国际电信联盟(ITU)提出, 试图全面反映信息化发展水平的 11 个要素组成的复合指标体系。 该体系涉及信息化基础设施及使用、社会教育(知识)水平以及 信息消费等多个方面。 世界经济论坛和哈佛大学提出的网络化完备指数(NRI)。该 评价体系进一步将评价网络发展能力和评价网络使用情况的指 标分别测度,由四级要素构成,同时增加了制度、市场环境等考 察因素。 中国国家统计局的信息化发展指数(IDI·CHINA) :总指数由 5 个分类(基础设施指数、使用指数、知识指数、环境与效果指 数、信息消费指数)和 10 个具体指标构成,并提出对指标数据 标准化并进行加权平均计算总指数的方法。 其他还有制造业信息化发展指数以及地区的信息化指数等 等。 关于产/行业的信息化指数,比较典型的研究工作是: EIU(Economis Intelligent Unint)提出了 IT 产业竞争力指数, 包含 6 个类比的指标(整体商业环境、IT 基础设施、法律环境, R&D 环境、IT 产业发展的支持)和若干子指标,并在这些指标的 基础上给出了指数的计算方法。 阎慧(2004)设计了由教育信息化基础设施指数、教育信息 资源指数、教育网络建设指数、教育信息化主体水平指数和教育 信息消费水平指数构成的教育信息化测度指标体系,并且应用了 342 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 二次球面函数来计算教育信息化指数。 从当前已有的研究成果和应用看,我们不难发现如下问题: (1)非常缺乏针对科研机构特点的信息化评价和信息化指 数的研究 评价需要根据评价主体的特点和目标而设立。目前已有的研 究成果中,信息化评价和信息化指数研究的对象主要针对国家、 地区、企业,针对科研机构的非常少。 目前,中国科学院在这方面做了有益的探索。中科院的信息 化建设与发展始于上世纪 70 年代,历经 40 年的发展,已进入了 多层次推进的新阶段。在中国接入互联网、互联网域名管理、科 研管理与科研活动信息化等方面,不断开拓创新,不仅提升了中 国科学院科学研究与管理水平,而且为我国信息化发展作出了应 有的贡献。进入 21 世纪以来,伴随信息技术的飞速发展和信息 化趋势的显著加快,在缺乏针对科研机构的信息化测度的情况下, 为了对信息化的建设实现定量化的回顾、跟踪,及时了解目前信 息化建设的水平,分析现有信息化工作的不足,同时,为未来的 信息化建设提供理论依据,中科院率先意识到科研机构信息化评 价的重要性,在参考国内外信息化测评经验的基础上,于 2008 年提出了中科院信息化建设的评价指标体系,并运用该指标体系 开展了自身的信息化水平测评,为深入开展科研机构信息化评价 发挥了引领和示范作用。然而,该指标体系在理论性、客观性、 动态性等方面存在着一定的欠缺,有待补充完善;特别是和国家 宏观信息化评价的衔接方面还需要进一步开展工作。 (2)科研机构有着不同于其他组织形式的机构特点,已有 研究成果的可借鉴性有限 343 第九章 科研机构信息化指数研究与思考 科研机构的主要任务是进行科学研究,并且力争率先获得高 水平的研究成果,进而在可能的条件下对成果的前景作出评估。 科学研究的复杂特点使得科研机构对于信息化的需求也是复杂 的。例如,科学研究的对象不是简单孤立的系统,而是涵盖范围 广,甚至是跨学科的,科研工作者之间需要进行密切的合作与交 流,科研信息、数据需要实时获取与处理,这都需要借力信息化 从而提高科学研究的共享程度;然而,另一方面,科学研究需要 对知识产权进行保护的特点,在这个意义上,在其特定的阶段中 又是有悖于信息资源共享要求的。所以,测度信息化在科研机构 应该发挥的效用,首先需要对科研机构的科研活动特点进行研究。 科学研究可以从研究目的、研究内容、研究性质等不同的角 度进行分类,相应的,科研机构也被分为不同的类别。不同类别 的科研机构,信息化需求也不尽相同。例如,根据研究内容阶段 性,可以将科学研究分为基础研究和应用研究两种类型。基础研 究的主要任务是寻求各种事物发展变化的基本规律,发现新事实, 新原理,新规则,或是探索某一类实际问题的理论基础,相对于 信息化基础设施条件,其更需要研究人员具备信息素质,能够有 效地利用信息条件,从而更好地展开研究。 而已有的研究成果主要针对国家、地区和企业,没有考虑科 研机构及其特点,因此可借鉴性有限。 (3)已有的研究对科研机构信息化内涵及其动态发展规律 的分析薄弱,理论基础相对薄弱 在信息技术发展的不同阶段,人类对于信息化的要求和信息 化发展的重心也在不断变化,同时,软硬件的升级换代也对使用 人员的素质不断提出更高的要求。概览已有的信息化评价和信息 344 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 化指数研究,鲜有以系统梳理信息化理论、结合信息化内涵的动 态发展为基础而提出的,这样,将在指标的选取上存在随意性, 这将使得已有评价随着信息化的发展而逐渐失去评价价值。科研 机构有其自身特点所决定的信息化内涵和动态发展规律,这是建 立信息化指数的重要前提。 (4)已有的信息化指数的评价示范存在不足 首先,绝大多数信息化指数比较偏重硬件设施、IT 系统等“物” 的现实情况的评价,但是,面对当前信息技术与装备迅速普及, 人才及社会“软”环境的影响日益突出的现实和明显的发展趋势, 更加凸显其片面性。其次,现有的信息化指数的研究更多停留在 理论研究阶段,对于指标数据的获取,权重的确定,指标计算, 以及指数计算方法,基准时点的确定等还处于探讨阶段,对于科 研机构而言,就尤其缺乏。 2. 科研机构信息指数研究的定位与意义 与其他信息化评价指标相比,信息化指数具有如下特点。首 先,信息化指数是对信息化发展的综合衡量。它不仅重视信息化 效果的衡量,更是对信息化现状的全面反映,包括信息化环境、 政策等;其次,它更关注统一比较基准下的绝对比较,因此需要 寻找标杆对象,确定基准年等。相对而言,它更客观、更具有系 统性和可比性;第三,从形式上,用数字表示信息化的结果看起 来更简明,更能直观地体现综合水平;第四,从结果的分析和应 用上,横向看,可以比较不同主体的总指数所刻画的信息化发展 程度的差别,也可以将总指数打开,回溯到各分类指数,甚至子 指标进行比较分析;纵向看,可以从时间序列角度“历史性”地 345 第九章 科研机构信息化指数研究与思考 把握信息化发展趋势;第五,从与其他评价体系的衔接上,因为 是全局的、绝对层面的比较,因此需要与更高层面的相关指数在 标准、方法、基准年等方面进行衔接,如科研信息化指数、全社 会信息化指数等衔接才更有意义,才可能得到公认。我们认为, 在部署科研机构信息化指数研究之际,和宏观层面相关指数的衔 接应给予足够的重视,避免这项工作变成仅仅是科研机构“自说 自话”的独角戏。 因此,科研信息机构信息化指数研究应以理论研究为先导, 在充分借鉴现有研究成果的基础上,结合科研机构的特点,以全 社会信息化指数、科研领域信息化指数为前提,建立一套衡量科 研机构信息化发展水平的全面、客观、适用、动态、可比的信息 化总指数,用来衡量科研机构利用信息和通信技术获取、存储、 使用和分享以及创造信息和知识的能力,为分析现有建设水平的 不足、把握信息化的发展方向、调整重点、科学决策、合理资源 配置提供量化的参考依据。科研机构信息化指数的研究不仅对于 中国科学院,而且对于国家甚至国际科研机构都有其重要的指导 意义。 首先,从中国科学院的角度,建立的信息化指数、分类指数 (将指数打开,从分类指数及要素的角度进行详细分析)既可以 从时间序列角度纵向分析科学院、各学科领域(例如,管理上以 专业局划分)以及各个研究所信息化发展趋势,也可以横向比较 相应层面或领域之间的信息化发展的差别,(包括总指数和分类 指数所体现的差别) ,不仅可以了解科学院信息化发展综合水平, 发现现有建设水平的不足,把握信息化的发展方向,通过提升信 息化管理能力有助于科学决策和合理配置资源,还可以通过各指 346 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 标所反映的各所的业务状况实施现实预警和趋势导向,为制定相 关战略和科技政策提供量化的参考依据。 其次,从国家科研机构信息化建设的角度,第一,通过信息 化指数及分类指数的设定使社会各界对科研机构信息化有一个 更直观、更深刻的认识,有助于树立和倡导科学的信息化发展观; 第二,能为我国科研机构信息化发展水平的衡量提供一套比较成 熟而且是公众认可的信息化指数核算体系,有助于国家相关部门 了解我国科研机构信息化发展状况,并且可以进行纵向和横向的 综合比较,为相关科研信息化政策和决策制定提供量化的参考依 据;第三,有助于其他科研机构了解其信息化发展的综合水平, 减少其自身决策与资源配置的盲目性;第四,信息化指数不仅反 映信息化水平,而且是国家科研现状的综合体现,可以根据该指 数对我国的科研机构进行跟踪、预警与预测,提升国家科研机构 的管理水平。 再次,从世界科研机构信息化管理的角度,目前国际上针对 科研机构的信息化发展综合水平衡量的研究非常少。我们估计, 这种情况可能和科研机构运作的方式与特点的特殊性有关,存在 较大的难度。2005 年世界各国首脑在全球信息社会高峰会议呼吁, 国际社会需要确定一套共同的核心信息化指标,以便为制定有效 措施缩小数字鸿沟提供数据支持。科研机构信息化指数将很有可 能成为国际通用的标准或重要参考,利于进行国际科研机构信息 化发展水平的比较,以及为国际相关组织制定决策提供量化依据, 促进我国与世界科研机构的同步发展。 347 第九章 科研机构信息化指数研究与思考 3. 对科研机构信息指数研究及其相关重要科学问题的思考 完全可以将科研机构信息化指数的研究与实践工作理解为 一项系统工程。基于信息化指数的特点,在科研机构信息化指数 研究中有以下几点需要认真关注。 第一,科研机构信息化指数的确定应建立在对于信息化进程 对社会变化影响的深刻认识的基础上。林毅夫等指出:“所谓信 息化,是指建立在 IT 产业发展与 IT 在社会经济各部门扩散的基础 之上,运用 IT 改造传统的经济、社会结构的过程”。目前,信息 化已经渗透到人类社会、经济、科技、政治等方方面面,对社会 发展的影响速度和程度是巨大的,甚至是难以估量的。这种影响 迫切需要一个系统全面的指标来衡量(类似 GDP) ,而科研机构 信息化是其中一个非常重要的组成部分。 第二,信息化指数不应该仅仅是对信息化发展状况的衡量, 信息化中的信息和数据来自于具体行业和业务,因此这个指数应 该是对全社会发展状况的描写和映射(从这个角度讲,信息化指 数应比 GDP 更综合) ,它不仅回答“是什么,怎么样”的问题, 而且应能有助于解决“为什么,怎么办”的问题,通过该指数提 供的信息,可以对重大事件进行跟踪、预警,为国家重大决策提 供依据,发挥引领作用。 第三,科研机构信息化指数的研究应建立在对科研机构信息 化理论研究的基础上。目前,对科研活动信息化和科研管理信息 化的研究都很少,提出一套客观、可行而且有可能得到社会认同 的科研机构信息化指数的评价体系必需是建立在科研机构信息 化管理的坚实的理论基础上,否则难免会使指数的提出带有较明 显的随意性,甚至造成不同对象、不同时间段的信息化评价指数 348 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 分散或相同(无明显差异)不具备可比性,缺乏解释基础。 第四,要使提出的科研机构信息化指数得到认可,就必须与 国际、国内相关信息化指数和基准年保持一致并得到他们的认可, 如国家、社会信息化指数、科研领域信息化指数等。 第五,信息化指数更强调绝对比较,基准年(时间点)的确 定显得尤为重要。 综上所述,科研机构信息化指数的研究涉及到的重要科学问 题主要包括以下 6 个方面。 问题 1:科研机构信息化的内涵及演变 对科研机构信息化内涵的准确把握有助于我们建立一套更 有针对性的科研机构信息化指数核算体系。信息化概念虽然早在 上个世纪 60 年代就已经提出,但真正在全球范围内引起社会各 层面的广泛关注却是在 30 年之后。国际上,美国克林顿政府于 1993 年 9 月提出建设“国家信息基础设施” ( National Information Infrastructure,简称 NII), 俗称“信息高速公路”(Information Superhighway) ,并引起世界各国的积极反应。许多国家的政府相 继制定了本国的信息化发展计划。同年,我国部署建设金卡、金 桥、金关等重大国家信息化工程,标志信息化工作正式起步,很 快信息化的发展建设在各领域、各地区形成了强劲的潮流。信息 化实践的快速发展暴露了理论准备的不足和缺欠。事实上,长期 以来,对于信息化的概念和内涵一直缺乏科学的解释,这将影响 信息化评价工作的展开。开展对科研机构信息化的内涵及演变问 题的深入研究明显具有普遍的理论和实践意义。 问题 2:科研机构信息化发展路径及选择 国家的宏观环境、科研机构信息化发展阶段以及国际信息化 349 第九章 科研机构信息化指数研究与思考 发展趋势等影响、决定着我国科研机构信息化的发展方向和趋势, 这将直接指导未来的科研机构信息化工作。根据科研机构特点, 以国家宏观政策为背景,以中科院为例,充分结合中科院发展要 求,运用战略管理理论,探索中科院信息化发展路径问题,重点 研究科研机构信息化发展的阶段、阶段特征、关键影响要素以及 未来发展趋势 问题 3: 如何确定一套理论依据充分、针对性强、规范科学 的、公认的科研机构信息化指数的评价要素 已有的信息化指数缺乏对于信息化的理论思考,评价要素缺 乏理论依据,而且,针对科研机构的信息化指数的研究非常少。 因此,如何结合科研机构的特点,以全社会信息化指数、科研领 域信息化指数为重要参考,确定一套理论依据充分、针对性强、 更加规范的、公认的科研机构信息化指数评价要素是重点和难点 问题。 问题 4: 科研机构信息化指数基准年的研究 科学、可比的基准年的确定是科研机构信息化指数得到公认 和推行的前提,基准年的确定需要研究相关领域的演化问题,并 且要尽可能与国家、社会信息化指数、科研领域信息化指数基准 年保持一致或者给出换算准则及方法。基准年的确定是科研机构 信息化指数研究的基础,也是重点和难点问题。 问题 5:确定科研机构信息化指数计算模型 在指数评价要素确定的基础上,与全社会信息化指数、科研 领域信息化指数衔接,如何得到可比性强的科研机构信息化指数 模型,对于诸如指标权重、指数化模型、评判区间等核心问题, 需要通过反复、深入的问卷、访谈等形式对其进行论证和实证检 350 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 验。 问题 6:数据的获得和测算以及实证检验 指数模型中相关数据的获得是难点和重点问题,在相关数据 获得的基础上,如何确定评判标准,以中国科学院为对象验证和 修正研究结论也是非常重要和关键的问题,它关系到提出的信息 化指数的“生命力” 、最终认可度和宏观适用性。 4. 小结 目前,信息化已经渗透到人类社会的各个层面,正以前所未 有的速度在飞速发展,对经济、科技、政治、军事等产生着越来 越大的影响。随着人类信息化要求的提高,信息化的内涵和人们 对信息化的认识发生了显著变化,对于信息化的评价提出了新的 要求。 可以预见,随着信息化对于国民经济与社会发展的影响日益 深刻,信息化评价及其表征的结果(信息化指数)一定会像 GDP 指数那样普及与深入到全社会,成为一项在全球范围内得到认同 的,表征竞争实力的重要指标。因此,在各领域、各层面有效开 展信息化指数的研究与实践工作,对于实现国内信息化建设的可 持续发展,在国际不断提高我国对全球信息化导向的话语权都具 有重要的现实意义。 科研机构是国家或地区创新的基本力量,其信息化发展水平 直接影响到创新能力。深入开展科研机构信息化指数研究既是科 研领域自身发展的需要,也是强化国家宏观信息化评价的切入点 和发挥示范、引领作用的需要。因此,以科研机构信息化理论研 究为基础,分析科研机构信息化的内涵和特点,结合世界信息化 351 第九章 科研机构信息化指数研究与思考 指数、国家信息化指数等宏观背景,研究提出可信、可行、可比 的科研机构信息化指数的评价、核算体系是当前亟待开展的一项 重要的具有战略意义的工作。 352 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 后记 为全面反映中国科学院信息化建设进展情况,自 2007 年起, 中国科学院信息化工作领导小组办公室连续组织编辑出版《中国 科学院信息化发展报告》 ,至今已经是第三次出版。 本报告的编写工作得到了院领导的充分重视和全院上下的大 力支持。路甬祥院长亲自为报告作序,江绵恒副院长、施尔畏副 院长、谭铁牛副秘书长策划和指导了报告的编写工作,院办公厅 廖方宇副主任、丁二友同志指导并审阅了报告。中国科学院信息 化工作领导小组办公室负责报告的组织协调,委托中国科学院计 算机网络信息中心承担报告的编撰工作。中国科学院计算机网络 信息中心成立了由科技处、中国互联网络信息中心(CNNIC)、中 国科技网网络中心、科学数据中心、超级计算中心、ARP 运行支 持中心(包括院网站群)、协同工作环境研究中心、网络科普教 育中心等单位组成的联合项目组,由 CNNIC 副主任刘志江牵头, 与院信息办、研究生院、国家科学图书馆、国家科学图书馆成都 分馆等单位的同志一起承担了各章节的编写工作,具体执笔情况 如下:回顾篇:第一章(张娟、邓勇),第二章(刘阳、王常青) , 第三章(刘阳、王常青),第四章(陈炜、虞路清、金钟、王常 青),第五章(马永征、孙健英、吕秋培、刘振清、卢耀华、王 英、田喆、杜义华、刘阳、王常青,部分内容根据科研信息化应 用案例内容摘编),第六章(陈炜、虞路清、金钟、刘振清、卢 耀华、杜义华、王英、田喆、刘阳、王常青),第七章(刘阳、 353 后记 王常青),第八章(王英、田喆、虞路清、金钟、吕秋培);展望 篇:第一章(张娟、邓勇)。本报告由刘阳、王常青负责统稿, 陈锐、金雅芬、李建平、单志广、马俊才、宋俊虓、龚立武、吴 丽辉、马晓莉等同志提出修改意见。全体参加编写的同志兢兢业 业、一丝不苟,加班加点完成了报告的撰写。在此,向所有参与、 支持报告编撰工作,以及对报告提供资料支持或意见的各单位领 导、专家和同志们表示由衷的感谢! 信息化工作覆盖面广,与科研、管理、教育等业务工作结合 程度深。本报告编写过程中,由于工作周期短、掌握资料不全、 编辑人员自身水平有限等主、客观原因,可能无法反映中国科学 院信息化建设的所有层面工作及成效,特此致歉! 同时,欢迎广大读者对本报告提出宝贵意见和建议,提供信 息和稿件,以便进一步办好《中国科学院信息化发展报告》,不 断推进我国、我院信息化建设工作。 中国科学院信息化工作领导小组办公室 2011 年 1 月 13 日 354 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 附录一 缩略词表 AARNet(Australian Academic and Research Network) : 澳大利亚学术与研究网 ANDS(Australian National Data Service): 国家科学数据服务网络 APAN(Asia-Pacific Advanced Network) : 亚太地区先进网络 ARDC(Australian Research Data Commons) : 澳大利亚科研数据共享计划 ARP(Academia Resource Planning): 中国科学院资源规划项目 ASCR(Advanced Scientific Computing Research): 美国能源部先进科学计算研究计划 BEinGRID(Business Experiments in GRID): 欧盟网格商业实验 BI(Business Intelligence) : 商业智能 : BJOEP(Beijing Open Exchange Point) 北京开放交换节点 CAST-USA(Chinese Association for Science and Technology USA) : 中国旅美科技协会 355 附录一 缩略词表 CBI(Center for BioInformatics) : 北京大学生物信息中心 CDN(Content Delivery Network) : 内容分发网络 CERN(European Organization for Nuclear Research): 欧洲粒子物理研究所 CERNET(China Educational and Research Network) : 中国教育和科研计算机网 CF21 ( Science and Engineering for the 21st Century Network Infrastructure Framework) : 面向 21 世纪科学与工程的网络基础设施框架 CGSP(ChinaGrid Support Platform): 中国教育科研网络公共支撑平台 CHINAFLUX ( Chinese Terrestrial Ecosystem Flux Research Network) : 中国陆地生态系统通量观测研究网络 CNCERT/CC(National Computer network Emergency Response technical Team/Coordination Center of China): 国家计算机网络应急技术处理协调中心简称国家互联网应急中 心 CNGI(China Next Generation Internet): 中国下一代互联网 CNGrid(China National Grid) : 356 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 中国国家网格 CNNIC(China Internet Network Information Center): 中国互联网络信息中心 COAR(Confederation of Open Access Repositories): 国际数字资源开放保存联盟 CODATA(Committee on Data for Science and Technology) : 国际科学技术数据委员会 : CSTNet(China Science and Technology Net) 中国科技网 CTI(Computer Telecommunication Integration): 计算机电信集成技术 DAIF(Duckling Application Integration Framework): Duckling 应用集成框架 DataNet(Sustainable Digital Data Preservation and Access Network Partners) : 科学数据可持续保存与共享网络伙伴计划 DATASAT(Online Statistics Database System Resources) : 数据库资源量在线统计系统 DEISA ( Distributed European Infrastructure or Supercomputing Applications): 欧洲超级计算应用分布式架构计划 DEM(Data Elevation Database ): 数据高程数据库 357 附录一 缩略词表 DISC-UK (Data Information Specialists Committee – United Kingdom) : 英国数据共享项目 DMZ(Demilitarized Zone): 非安全系统与安全系统之间的缓冲隔离区 DNS(Domain Name System): 域名系统 EAST(Experimental Advanced Superconducting Tokmak): 全超导托克马克实验装置 EIF(Education Investment Fund): 澳大利亚高等教育投资基金 eIFL(Electronic Information Federation for Libraries): 国际图书馆电子信息联盟 EGEE(Enabling Grids for E-Science) : 欧洲科研信息化网格 EGI(European Grid Infrastructure) : 欧洲网格基础设施 EMBnet(European Molecular Biology Network) : 欧洲分子生物学网络组织 ESA-VO(European Space Agency Virtual Observatory) : 欧空局虚拟天文台 ESnet(Energy Sciences Network) : 美国能源科学网络 358 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 Euro-VO(European Virtual Observatory plans): 欧盟虚拟天文台计划 e-Science ( Electronic Science ): 科研信息化 e-Infrastructure(同 Cyber Infrastructure) : 科研信息化基础设施 e-IRG(e-Infrastructure Reflection Group) : 信息化基础设施咨询工作组 e-VLBI(Electronic Very Long Baseline Interferometry) : 甚长基线干涉测量技术 GÉANT: 高带宽泛欧科研教育骨干网 GLORIAD ( Global Ring Network for Advanced Applications Development) : 中美俄环球科教网络 HEI(Higher Education Institutions) : 高等教育机构 HKOEP(HongKong Open Exchange Point): 香港建立的开放交换节点 HNC(Hierarchical Network of Concepts): 概念层次网络 HPC (High Perfermance Computing): 高性能计算 359 附录一 缩略词表 IESP(International Exascale Software Project) : 美国 DOE 和 NSF 联合资助的支持 E 级计算机软件研发的先导性国 际合作项目。 INCITE(Innovative Computing Theory and Experiment) : 理论与实验创新计算项目 Internet2: 美国下一代互联网 IO(ITER International Organization): 国际热核聚变实验反应堆国际组织 ISMS(Information Security Management Systems) : 信息安全管理体系 ITER(International Thermonuclear Experimental Reactor) : 国际热核聚变实验反应堆 ITIL(Information Technology Infrastructure Library): 信息技术基础架构库 JISC(Joint Information Systems Committee): 英国联合信息系统委员会 JVO(Japanese Virtual Observatory): 日本虚拟天文台 LAMOST(the Large Sky Area Multi-Object Fiber Spectroscopic Telescope) : 郭守敬望远镜 LANDSAT(Land Satellite): 360 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 陆地资源卫星遥感影像库 LBA(Large Scale Biosphere-Atmosphere Experiment in Amazonia) : 亚马逊河生物圈-大气层大型实验项目 LCG(LHC Computing Grid) : 大型强子对撞机计算网格 LDAP(Lightweight Directory Access Protocol) : 轻量目录访问协议 LHC(Large Hadron Collider): 大型强子对撞机 MIN(Medical Information Network): 医疗卫生信息网络 MMI(maximally maintained inequality) : 多尺度数学行动计划 MMS(Modular Modeling System): 模块化建模系统 MODIS(Moderate resolution Imaging Spectroradiometer): 遥感影像数据库 MSIS(Monitoring and Statistics Integration System 简称 MSIS): 数据服务监控与统计系统 NASA(National Aeronautics and Space Administration): 美国航空航天局 NCAR(NationalCenterforAtmosphericResearch) : 361 附录一 缩略词表 美国国家大气研究中心 NCSA(National Center for Supercomputing Applications) : 美国国家超级计算应用中心 NERSC(National Energy Research Scientific Computing Center) : 美国国家能源研究计算中心 NREN(National Research and Education Network) : 国家科研教育网 NSF(National Science Foundation) : 美国国家科学基金会 NSFC(National Natural Science Foundation of China): 国家自然科学基金委员会 NSFCGrid(National Natural Science Foundation of China Grid): 国家自然科学基金委网格 NVO((National Virtual Observatory): 美国的国家虚拟天文台项目 OCI(Office of Cyberinfrastructure) : 美国国家科学基金会网络基础设施办公室 OSG(Open Science Grid) : 美国开放科学网格 PRACE(Partnership for Advanced Computing in Europe) : 欧洲先进计算合作伙伴 计划 RCUK(Research Councils UK): 英国研究理事会总会 362 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 RedCLARA(Cooperación Latino Americana de Redes Avanzadas): 拉美先进网络 RSR(Resources and Services Registry): 资源与服务注册系统 SCE(Super Computing Environment) 超级计算环境 SciDAC(Scientific Discovery Through Advanced Computing): 基于先进计算的科学发现项目 SCGRID(Scientific Computing Grid) 科学计算网格 SDSC(San Diego Supercomputer Center): 美国圣地亚哥超级计算机中心 SDSS(Sloan Digital Sky Survey): 斯隆数字天空调查 SINET3(Science Information NETwork 3): 日本学术信息网 SLA(SERVICE LEVEL AGREEMENT) : 解析服务承诺 SME(Spatial Modeling Environment): 空间建模环境 SNS(Social Networking Services) : 社会化网络 363 附录一 缩略词表 SQL(Structured Query Language) : 结构化查询语言 SRU(Search and Retrieve via Url) : 通过 URL 搜索和检索标准 SSH(Secure Shell) : 建立在应用层和传输层基础上的安全协议 SSL(Secure Sockets Layer) : 安全套接层 TeraGrid XD(eXtreme Digital) : 美国的 TeraGrid XD 项目 TLS(Transport Layer Security) : 安全传输层协议 USGS(United States Geological Survey): 美国地质勘探局 U.S.UCAN(U.S. Unified Community Anchor Network) : 美国统一社区锚点网 VAO(Virtual Astronomical Observatory): 美国的国家虚拟天文台项目 VisualDB(Visual Database Management & Publishing Tools): 可视化数据管理与发布系统 VLSI(Very Large Scale Integrated circuits) : 超大规模集成电路 VO (Virtual research Organization): 364 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 虚拟科研组织 VoIP(Voice Over IP) : 宽带语音系统,即网络电话 VPN(Virtual Private Network): 虚拟专用网络 W3C(World Wide Web Consortium): 万维网联盟 WDC(World Data Center): 世界数据中心 WLCG(Worldwide Lhc Computing Grid) : 全球大型强子对撞机计算网格 365 附录二 参考文献 附录二 参考文献 1 Dear Colleague Letter: Cyberinfrastructure Framework for 21st Century Science and Engineering (CF21). http://www.nsf.gov/pubs/2010/nsf10015/nsf10015.jsp?WT.mc_id=USNSF_25, 2009-12. 2 e-IRG White Paper 2009. http://www.e-irg.eu/images/stories/e-irg_white_paper_ii_web1.pdf, 2010-08-31. 3 e-IRG“Blue Paper”2010. http://www.e-irg.eu/images/stories/eirg_bluepaper2010_final.pdf, 2010-09. 4 RCUK Review of e-Science 2009. http://www.epsrc.ac.uk/SiteCollectionDocuments/Publications/reports/RCUKeScienceReviewReport.pdf. 2010-02. 5 Office of Cyberinfrastructure (OCI). http://www.nsf.gov/about/budget/fy2011/pdf/11-OCI_fy2011.pdf, 2010-02-01. 6 RCUK Action Plan in Response to the 2009 International Review of e-Science. http://www.epsrc.ac.uk/SiteCollectionDocuments/Publications/Other/eScience ReviewActionPlan.pdf, 2010-09. 7 The project. http://www.geant2.net/server/show/nav.749. 8 GÉANT homepage. http://www.geant.net/pages/home.aspx. 9 GÉANT Global Connectivity. http://www.geant.net/Media_Centre/Media_Library/Media%20Library/1142%2 0Global%20Connectivity%2008%2010_5.pdf, 2010-08-01. 截至 2010 年 8 月 10 Internet 2 介绍. http://sj.media.edu.cn/xiayidai/index2.php?IDx=23. 11 President Awards Money to Expand Broadband Access. http://chronicle.com/blogs/wiredcampus/president-awards-money-to-expand-br oadband-access/25285, 2010-07-02. 12 Internet2 Middleware Initiative awarded NSF grant to enhance research collaboration. https://lists.internet2.edu/sympa/arc/i2-news/2010-10/msg00000.html, 2010-10-25. 13 What is APAN. http://apan.net/home/aboutapan/what's.html. 14 黎建辉, 虞路清. 国际科学数据库现状与发展趋势分析. 科研信息化技术与应用. 2009 Vol.2(1):6-13. 15 孔丽华(编译). 美国国家科学基金会的 DataNet 计划. 科研信息化技术与应用. 2009 Vol.2(1):73-74. 366 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 16 Feature - Rethinking scientific data management. http://www.isgtw.org/?pid=1002815, 2010-10-27. 17 DISC-UK DataShare. http://ie-repository.jisc.ac.uk/336/1/DataSharefinalreport.pdf. 18 Australian Data Service. http://ands.org.au/ 19 ANDS attracts new funding. http://ands.org.au/ardc.html. 20 PRACE Research Infrastructure inaugurated: World-class Supercomputing Service for European Science. http://www.prace-project.eu/news/prace-research-infrastructure-inaugurated-w orld-class-supercomputing-service-for-european-science, 2010-06-09. 21 PRACE Research Infrastructure strengthened: a second Tier-0 system will be installed in France by the end of the year and fully available in 2011. http://www.prace-project.eu/news/prace-research-infrastructure-strengthened-asecond-tier-0-system-will-be-installed-in-france-by-the-end-of-the-year-and-ful ly-available-in-2011, 2010-10-06. 22 DEISA Concept and Objectives. http://www.deisa.eu/about. 23 ABOUT THE OFFICE OF ADVANCED SCIENTIFIC COMPUTING RESEARCH(ASCR). http://www.sc.doe.gov/ascr/About/about.html. 24 DOE Awards Over a Billion Supercomputing Hours to Address Scientific Challenges. http://www.hpcwire.com/offthewire/DOE-Awards-Over-a-Billion-Supercompu ting-Hours-to-Address-Scientific-Challenges-82705692.html, 2010-01-26. 25 次世代スーパーコンピュータ戦略分野(詳細). http://www.mext.go.jp/b_menu/houdou/21/07/attach/1282504.htm, 2009-07-22. 26 Digital Agenda: EU grid project unlocks processing power of 200,000 desktop computers for European researchers. http://europa.eu/rapid/pressReleasesAction.do?reference=IP/10/1119&format=HTML&a ged=0&language=EN&guiLanguage=en, 2010-09-14. 27 TeraGrid. http://www.teragrid.org/about/history.html. The NSF-OCI Introduces the Next Generation of Cyberinfrastructure: eXtreme Digital (XD). https://www.teragrid.org/web/about/xdtransition. 28 29 Learn About OSG. http://www.opensciencegrid.org/About/Learn_About_Us. 30 中国教育和科研计算机网简介. http://www.edu.cn/cernet_jian_jie_1327/20060323/t20060323_91159.shtml. 31 《以网络为基础的科学活动环境研究》2005 年项目指南. http://www.nsfc.gov.cn/nsfc/cen/02/htmlcreated/2004jh/2005_07_08.htm. 32 China Grabs Supercomputing Leadership Spot in Latest Ranking of 367 附录二 参考文献 World’s Top 500 Supercomputers. http://www.top500.org/lists/2010/11/press-release, 2010-11-11. 33 专家揭秘:GPU 用做高性能计算中国第一. http://tech.hexun.com/2010-11-12/125581562.html, 2010-11-12. 34 ChinaGrid 建设目标:最大 最先进 最实用. http://www.edu.cn/zhong_dian_ke_ti_5168/20060517/t20060517_178950.shtm l. 35 ChinaGrid 专家郑纬民:ChinaGrid 第二期更令人期待. http://server.zdnet.com.cn/server/2009/0826/1444792.shtml, 2009-08-26. 36 RCUK Review of e-Science in the United Kingdom Evidence to the Panel. http://www.epsrc.ac.uk/SiteCollectionDocuments/other/Sections_1-4_of_Evide nce_for_Panel.pdf, 2009-11. 37 Office of Cyberinfrastructure. http://www.nsf.gov/about/budget/fy2011/pdf/11-OCI_fy2011.pdf, 2010-02. 38 China Grabs Supercomputing Leadership Spot in Latest Ranking of World’s Top 500 Supercomputers. http://www.top500.org/lists/2010/11/press-release, 2010-11-11. 39 http://star-www.dur.ac.uk/~gao/all.jpg 40 http://star-www.dur.ac.uk/~gao/5mpc.jpg 41 The Fourth Paradigm: Data Intensive Scientific Discovery. http://research.microsoft.com/en-us/collaboration/fourthparadigm/4th_paradig m_book_complete_lr.pdf, 2009-10. 42 e-IRG Roadmap 2010. http://www.e-irg.eu/images/stories/eirg_roadmap_2010_layout_final.pdf, 2010-3-23. 43 Exascale Workshop Panel Meeting Report. http://www.sc.doe.gov/ascr/ProgramDocuments/Docs/TrivelpieceExascaleWor kshop.pdf, 2010-07. 44 U.S., EU, Russia set aside $13.6M for exascale software work. http://www.computerworld.com/s/article/9156478/U.S._EU_Russia_set_aside_ 13.6M_for_exascale_software_work, 2010-02-12. 45 International Exascale Roadmap 1.0 Software Project. http://www.exascale.org/mediawiki/images/4/42/IESP-roadmap-1.0.pdf. 46 New EU initiative puts social supercomputing in spotlight. http://cordis.europa.eu/search/index.cfm?fuseaction=news.document&N_RCN =32147, 2010-05-28. 47 Gannon Dennis. The Computational Data Center – A Science Cloud. http://www.extreme.indiana.edu/~gannon/science-data-center.pdf. 48 ICT Infrastructures for e-Science. http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=COM:2009:0108:FIN: 368 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 EN:PDF, 2009-03-05. 49 Virtual research environment collaborative landscape study. http://www.jisc.ac.uk/media/documents/publications/vrelandscapereport.pdf. 50 学科资源门户建设与个性化信息服务. http://teacher.eol.cn/www_6494/20080601/t20080601_299923.shtml, 2008-6-1. 51 DOE Labs to Build Science Clouds. http://www.hpcwire.com/features/DOE-Labs-to-Build-Science-Clouds-641898 72.html, 2009-10-13. 52 Microsoft and NSF Enable Research in the Cloud. http://www.nsf.gov/news/news_summ.jsp?cntn_id=116336&org=NSF&from=n ews, 2010-02-04. 53 NASA Looks to Move Science Apps Into the Cloud. http://www.hpcwire.com/features/NASA-Looks-to-Move-Science-Apps-Into-th e-Cloud-83470237.html. 54 From Computational Science to Science Discovery: The Next Computing Landscape. http://www.top500.org/files/HPC_Advisory_Council.pdf. 55 Research Management and Administrative System. http://as.exeter.ac.uk/rmas/index.htm. 56 Research information management: Towards a common standard for exchanging research information. http://www.jisc.ac.uk/publications/briefingpapers/2010/bpexriv1.aspx, 2010-3-30. 57 Kuali Coeus. http://www.kuali.org/kc. 58 国家自然科学基金信息系统项目规划与建设. http://www.cnic.cn/zcfw/kyglxxh/glxxhgh/dxal_arp01/200909/t20090909_247 0172.html. 59 中国科学院资源规划(ARP)项目二期工程规划与建设. http://www.cnic.cn/zcfw/kyglxxh/glxxhgh/dxal_arp01/200909/t20090909_247 0173.html. 60 成都文献情报中心. 教育信息化发展态势, 2010. 61 G. Bell, T. Hey, and A. Szalay, ‘Beyond the Data Deluge’, Science, vol. 323, no. 5919, pp. 1297–1298, 2009, doi: 10.1126/science.1170411. 62 T. Hey, S. Tansley, and K. Tolle, ‘The Fourth Paradigm: Data-Intensive Scientific Discovery’, Microsoft Research, 2009. 63 Jamie Shiers, ‘The Worldwide LHC Computing Grid (worldwide LCG)’, 369 附录二 参考文献 Comput. Phys. Commun. 177 (2007) 219-223. 64 I. Foster, C. Kesselman, and S. Tuecke, ‘The anatomy of the Grid: Enabling scalable virtual organizations’, International Journal of High Performance Computing Applications Fall 2001 15: P200-222. 65 ITU-T.Rec.Y.2002. Overview of ubiquitous networking and of its support in NGN [S]. ITU Publishing, 10-2009. 66 邬贺铨, 互联网以创新迎接挑战 [J], 中国教育网络 2007,No.7,pp.22-25. 67 http://www.jpix.ad.jp/jp/techncal/traffic.html; 68 http://www.akamai.com/dl/whitepapers/akamai_state_of_the_internet_q2_20 10.pdf 69 ITU-T TSB Circular 37: ANNEX 1 “Terms of Reference of ITU-T Focus Group on Future Networks.” [EB/OL], http://www.itu.int/md/dologin_md.asp?lang=en&id=T09-TSB-CIR...E,01-05 -2009. 70 Raj Jain ,Internet 3.0:The Next Generation Internet.US-Japan Workshop on Future Networks [EB/OL], Washington University in Saint Louis, October 31-November 1, 2008, http://www.cse.wustl.edu/~jain/talks/in3_uj.htm 71 http://www.pewinternet.org/Reports/2008/The-Future-of-the-Internet-III.aspx; http://www.pewinternet.org/Reports/2010/Future-of-the-Internet-IV.aspx 72 ITU-T, Rec.Y.2051, General overview of IPv6-based NGN [S]. ITU Publishing, 02-2008 73 GENI, An introduction, Exploring Networks of the Future [EB/OL], March 2010, http://groups.geni.net/geni/attachment/wiki/Gec8Agenda/GEC8%20Day%20 1%20-%20Newcomers.pdf 74 AOKI Tetsuo, NWGN Vision and Five Network Targets [EB/OL], http://ec.europa.eu/information_society/activities/foi/research/eu-japan/eujap an2/docs/day1stam/taoki.pdf 75 NICT: New Generation Network Architecture AKARI Conceptual Design (ver1.1) [EB/OL],October 2008. http://nag.nict.go.jp/.../AKARI_fulltext_e_translated_version_1_1.pdf 76 FIRE WHITE PAPER [EB/OL], 2009, http://www.ict-fireworks.eu/fileadmin/documents/FIRE_White_Paper_2009_ v3.1.pdf,Draft 8/5/09 77 Ved P. Kafle,ID/Locator Separation for Heterogeneous Networks [EB/OL], 2nd Japan EU Symposium on the “New-Generation Network” and “Future Internet”, Tokyo, 13 -14 Oct 2009. http://ec.europa.eu/information_society/activities/foi/research/eu.../vkafle.pdf 370 中国科学院信息化发展报告 2011 中国科学院信息化发展报告2011 78 Lixia Zhang, et. Named Data Networking (NDN) Project, NDN-0001,October.31.2010. http://www.named-data.net/ndn-proj.pdf 79 沈昌祥.加强信息安全保障体系的思考.信息网络安全,2002 年 11 期. 80 The Clinton Administration’s Policy on Critical Infrastructure Protection, Presidential Decision Directive 63,May,22,1998. 81 National Security Agency. IATF: Information Assurance Technical Framework, version 2.0. Aug, 31, 1999. 82 President's Critical Infrastructure Protection Board (PCIPB). http://www.whi-tehouse.gov/pcipb/. 83 D. Safford. Clarifying misinformation on TCPA. White paper, IBM Research, Oct. 2002. 84 D. Safford. The need for TCPA. White paper, IBM Research, Oct, 2002. 85 Intel. Trusted Execution Technology. http://www.intel.com/technology/security/. 86 Microsoft. Trusted Platform Module Services in Windows Longhorn [EB/OL]. [2005-4-25]. http: //www. microsoft. com/resources/ngscb /. 87 Microsoft Corporation. Building a secure platform for trustworthy computing. White paper, Microsoft Corporation, Dec, 2002. 88 Trusted Computing Group, http://www.trustedcomputinggroup.org. 89 Trusted Computing Group. TCG Specification Architecture Overview. reversion 1.4, aug,2007. 90 Trusted Computing Group. TPM main specification. http://www.trustedcomputinggroup.org, Nov. 2003. Version 1.2. 91 Trusted Computing Group. TCG Software Stack (TSS) Specification, Version 1.2. http://www.trustedcomputinggroup.org/resources/tcg_software_stack_tss_speci fication. 92 沈昌祥. 构建积极防御综合防范的防护体系. 船舶电子工程,2006 年 1 期. 93 信息安全等级保护管理办 法.http://www.atmb.net.cn/web/UploadFile/2010- 111094513690.pdf. 94 计算机信息系统安全保护等级划分准则. http://www.moe.gov.cn/de -ngbao/dengbao/2.pdf 95 Riding the wave-How Europe can gain from the rising tide of scientific data, European High Level Expert Group on Scientific Data,2010. 96 人类基因组计划:http://baike.baidu.com/view/22966.htm 97 Geoss:http://www.earthobservations.org/geoss.shtml 98 张舒、褚艳利等,GPU 高性能运算之 CUDA,中国水利水电出版社,北 371 附录二 参考文献 京,2009. 99 高效能低成本多尺度离散模拟超级计算应用系统─用户报告,中科院过 程所内部报告 372

中国科学院信息化发展报告 2011.pdf 




