古籍如何兼顾“藏”与“用”******
古籍如何兼顾“藏”与“用”
——来自古籍数字资源联合发布会的专家观点
光明日报记者 陈雪
“古籍具有特殊性,作为文物必须保护,作为文献必须为读者所用,二者存在矛盾。”——解决“藏”与“用”之间的矛盾一直是古籍工作的重点,山东大学文学院院长、教授杜泽逊说:“数字化是目前最好的办法”。
1月4日,国家图书馆(国家古籍保护中心)、天津图书馆、南京图书馆、云南省图书馆、苏州图书馆、中山大学图书馆等6家单位,在线召开了古籍数字资源联合发布会,发布了6786部(件)古籍资源,可在线免费阅览全文影像。会上,多位古籍专家学者围绕古籍数字资源建设进行了深入讨论。
古籍数字化有何迫切性?未来趋势是什么?专家学者展开了深入探讨。
数字化平衡“文物性”与“文献性”
20世纪90年代初,上海图书馆把内部使用的古籍目录卡片摆在图书馆的走廊里,为了完成“四库全书存目丛书”的版本调查,杜泽逊跑到上图,查阅了十几天卡片。夏天高温,他就到馆外买一根绿豆冰糕含在嘴里,再回到馆内查卡片——为查阅古籍文献,要出差到各地,克服各种困难,这是一代古籍研究者的集体记忆。
“从内部使用到目录卡片放在走廊,再到数字资源挂在网上,这个进步是非常快的。”杜泽逊说,国家图书馆为首的几十家图书馆把古籍数字资源放在网上,读者不必直接使用古籍原件,这是很重要的一条保护措施。此外,在线阅览不知道节省了多少人的时间、体力、财力,对推进新时代古籍工作有重大贡献。
兼顾“藏”与“用”,古籍数字化刻不容缓。“国家图书馆从2000年起开始有计划地将古籍进行数字化,并陆续建成数字方志、碑帖精华等专题库,面向社会公众发布。”国家古籍保护中心办公室负责人王红蕾介绍了古籍数字资源发布的整体情况。2016年,国家图书馆搭建“中华古籍资源库”平台,发布了国图馆藏善本和普通古籍、甲骨、敦煌文献、碑帖拓片、家谱、老照片等数字资源,以及天津图书馆、哈佛燕京图书馆等许多馆外古籍和海外征集古籍资源。2021年疫情期间,读者远程访问需求增长,为回应读者的“急难愁盼”,“中华古籍资源库”实现了免登录阅览。资源库上线、免登录阅览被学者称为惠及学林的两个重要节点。
2007年以来,随着“中华古籍保护计划”的深入开展,各地图书馆陆续投入人力物力,大力推进古籍数字化。苏州图书馆党委书记、馆长接晔介绍,截至目前,苏州图书馆已完成数字化古籍1496部,容量达16.12TB。
据了解,国家图书馆(国家古籍保护中心)先后联合39家单位发布古籍资源2.8万部(件),此次是第七次联合发布,6家收藏单位新增发布古籍资源6786部(件),不仅有明清版刻、稿抄本古籍,还有碑帖拓本等特色资源:新增国家图书馆藏古籍数字资源1075部19.2万叶,主要为年谱类、目录类古籍;天津图书馆发布馆藏稿抄本文献165种655册;南京图书馆发布了“清人文集数据库”,共收录清人文集399种,以全本彩色扫描的方式制作成数字影像;云南省图书馆发布馆藏善本63部381册,图像50604拍;苏州图书馆发布馆藏古籍数字资源888部;中山大学图书馆发布了一批颇具该馆特色的碑帖文献数字资源。
本次资源发布后,全国累计发布古籍及特藏文献影像资源达到13万部(件),其中,国图建设的“中华古籍资源库”发布超过10.2万部(件)。王红蕾说,“中华古籍资源库”已成为全国古籍资源类型和品种最多、体量最大的综合性资源共享发布平台。
北京大学中文系古典文献学教研室主任、教授杨海峥感叹,从2016年到现在,陆续推出了13万部(件)古籍数字资源,对于学者来说是非常重要的一件事情。在线查阅免去了往返奔波各家图书馆的时间,缓解了古籍“藏”和“用”之间的矛盾,平衡了古籍的文物性与文献性。
古籍资源既要“用得上”,还要“用得好”
2022年10月,全国古籍整理出版规划领导小组印发实施《2021—2035年国家古籍工作规划》,“国家古籍数字化工程”正是四项重点实施工程之一。近年来,全国古籍登记工作让3000万册件古籍有了“身份证”,未来,让更多古籍“上线”与读者见面,将是我国古籍工作的一大重点。
“古籍数字化资源的制作与发布,其实是回归到古籍作为书籍文献本来的性质。”清华大学科学技术史暨古文献研究所研究员刘蔷说,以往,人们说学术的繁荣与学术资料的新发现有关,这种说法是忽视了存世的大量古籍,存世古籍是一个巨大的资源库。可以预见,连续的古籍资源发布,将带来宏阔的学术气象。
古籍数字化平衡了“藏”与“用”的矛盾,让古籍资源“用得上”,未来,更要“用得好”。学者们对古籍数字资源的深度利用提出了许多有益建议。
浙江大学图书馆研究馆员黄晨认为,古籍数字资源联合发布可以更好地呈现资源的利用价值,接下来,可以进一步就已发布的资源进行深度揭示,进一步打通资源和发布平台,提供一站式检索,将资源聚合起来,这样的利用效果会更好。刘蔷也表示,期待能有一个与古籍数字化资源相匹配的古籍数字目录,以便实现一站式检索。
杨海峥认为,目前古籍数字化发展迅速,百花齐放,各类数据库和古籍数字化平台纷纷涌现,多样化的发展一方面带来了很大便利,另一方面也应进行协调统一,建立更加规范的数据规范标准,使得古籍数字化的资源有保证,达到方便使用的学术水准。杨海峥说,2022年中办、国办印发的《关于推进新时代古籍工作的意见》,专门强调要“加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享”,国图联合全国古籍存藏单位把古籍数字资源进行统一与整合,形成公益性平台,奠定了非常好的基础,是未来古籍数字化的发展趋势。
汇聚、开放、共享,古籍数字化的步伐不断加快。杜泽逊说,“期待发布更多的数字资源,最终达到除少数特殊情况外,全部数字化。”
《光明日报》( 2023年01月06日 09版)
【法治护我心】划定深度合成服务“底线”“红线”******
【法治护我心——《互联网信息服务深度合成管理规定》系列解读】
光明网记者 陈畅、李政葳
“雾里看花,水中望月,你能分辨这变幻莫测的世界……”如果把上个世纪九十年代这首“315”晚会歌曲,用来描述当下互联网时代的“云”上生活,在技术发展与风险伴生之下,“虚”“实”之间让人颇有迷幻之感。
“再也不敢相信自己的眼睛和耳朵。”当换脸换声、三维重建、智能对话等逐渐应用开来,人们时常发出这样的感叹。这类深度合成服务催生了美颜美妆、智能客服、虚拟主播等一系列应用形态,但其被恶意利用制作虚假信息内容,进而带来了政策干扰、谣言泛滥、低俗内容等。因此,我们也在呼吁——“借我一双慧眼,把这纷扰看个清清楚楚明明白白……”
纵观互联网发展历程,技术治理本身就是一场攻防对抗博弈,也是技术从创新应用到规范发展的必经之路。近日,这项深度合成技术被套上了“紧箍咒”——国家互联网信息办公室、工业和信息化部、公安部联合发布《互联网信息服务深度合成管理规定》(以下简称《规定》),自2023年1月10日起施行。
法立于上则俗成于下。《规定》出台划定了深度合成服务的“底线”和“红线”, 迈出我国新技术新应用立法的重要一步,也将有效维护网络空间良好生态。
明确义务要求,强化主体责任
事实上,深度合成技术由来已久。随着深度学习技术、特别是对抗式生成网络技术的发展,深度合成技术门槛大幅降低。2017年11月,Reddit网站的用户“deepfakes”发布伪造视频,曾一度将这项技术推至风口浪尖,其“以假乱真”的信息内容严重威胁国家安全、干扰社会秩序。
何为“深度合成技术”?《规定》中给出了明确表述——指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。
具体包括:篇章生成、文本风格转换、问答对话等生成或者编辑文本内容的技术,文本转语音、语音转换、语音属性编辑等生成或者编辑语音内容的技术,音乐生成、场景声编辑等生成或者编辑非语音内容的技术,人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等生成或者编辑图像、视频内容中生物特征的技术,图像生成、图像增强、图像修复等生成或者编辑图像、视频内容中非生物特征的技术,三维重建、数字仿真等生成或者编辑数字人物、虚拟场景的技术等。
诚然,从技术进步的角度看,深度合成技术应用的初衷是让生成合成内容更逼真,但技术在愈趋“智能”的同时,也不可避免地带来更多风险。对此,中国科学院信息工程研究所所长孟丹介绍,除深度伪造风险外,还包括生成合成信息内容带来的个人信息泄漏、侵犯人格权和知识产权等他人合法权益等风险。
深度合成服务提供者和技术支持者既是新技术、新应用的创造者、受益者,也应该是控制技术风险、引导技术向善的责任践行者。记者梳理发现,《规定》明确了深度合成技术定义和服务范围,提出了服务提供者落实信息安全主体责任,指出了服务提供者和技术支持者备案义务,并对服务提供者履行安全评估和配合监督检查义务提出具体要求。
中国科学院自动化研究所所长徐波这样评价:《规定》分析梳理了深度合成活动边界,对深度合成服务提供者、技术支持者和使用者以及应用程序分发平台等主体应履行的责任义务作出规定。比如,服务提供者应履行建立健全管理制度、对使用者真实身份信息认证、加强深度合成信息内容管理等义务,服务提供者和技术支持者应履行加强训练数据管理、加强深度合成技术管理等义务。
健全技术支撑体系,促进科技向上向善
从此起彼伏的社会案件中可以看出,深度合成信息内容制作和传播数量正在高速增长,尤其伴随“元宇宙”等新模式、新场景不断落地,深度合成技术将为智能化、视觉化、场景化、虚拟化的互联网信息服务发展提供更多技术方案。孟丹认为,《规定》的出台是网络内容治理由结果管理迈向行为管理的重要一步,标志着我国网络空间治理能力进一步优化提升。
时间倒回到两年前。在2021年12月,国家互联网信息办公室发布《互联网信息服务算法推荐管理规定》,对包括生成合成类在内的五类算法推荐服务进行规范。本次出台的新规在之前算法规定的基础上,加强对深度合成服务全过程管理,也深化了备案与评估标本兼治。
然而,从技术发展阶段看,深度合成技术与应用管理仍处于起步阶段,在技术支撑和能力建设方面还有待进一步加强。“加快推进深度合成治理技术支撑体系建设,是切实保障深度合成服务治理工作有力有序推进的关键。”孟丹说。
《规定》的字里行间,凸显了“以技术管技术”的逻辑,也必将促进深度合成服务的规范治理。“其确立了我国对深度合成服务的治理框架,提出了明确的数据和技术管理规范,为促进深度合成技术向上向善,引导相关产业健康发展,确保互联网信息内容安全提供了有力的制度保障。”中国政法大学副校长时建中说。
“《规定》以促进技术在规范中发展为价值取向,在明确‘红线’的同时,为技术发展留足空间。”中国信息通信研究院副院长王志勤这样认为。比如,《规定》要求深度合成服务提供者应当建立算法机制机理审核、科技伦理审查等管理制度。
孟丹也建议,从深度合成信息内容源头上,解决其衍生的内容安全风险,利用技术创新、技术对抗等方式持续提升和迭代检测技术的能力,不仅着眼于管理好、使用好、发展好深度合成技术及相关服务,也致力于深度合成技术的合法合理合规使用,促进深度合成技术及相关服务健康有序的发展。
引导多方参与,推动治理走深向实
随着数字化、智能化进程不断加快,互联网信息服务综合治理不断细化,规范深度合成活动对营造健康安全的网络空间有着重要意义。国家互联网信息办公室有关负责人表示,深度合成服务治理需要政府、企业、社会、网民等多方主体参与,推动深度合成技术的依法、合理、有效使用,积极防范化解深度合成技术带来的风险,促进互联网信息服务健康发展。
《规定》明确提到,国家和地方网信部门统筹协调深度合成服务的治理和相关监督管理职责,国务院电信主管部门、公安部门以及地方相关部门的监督管理职责。
王志勤认为,《规定》构建了统筹协调、多方参与的监管体制;《规定》鼓励相关行业加强行业自律,搭建齐抓共管、协同共治的治理机制;《规定》通过系统化的制度安排,进一步构建完善了我国网络综合治理法治体系。
孟丹也提到,《规定》在生成合成类算法服务范围、深度合成技术具体范围、深度合成服务业务分类、显式标识条件与标识方式、隐式标识方法与识别等诸多具体方面,仍亟需行业内部进一步细化相关配套标准规范。在实际落地过程中,建议业内推进产业联盟建立,以产业自治、多方共治的方式,不断推进深度合成技术应用高质量发展。
为推动深度合成治理走深向实,徐波建议,强化智能监管平台支撑。比如,深入研究深度合成类算法内生安全机理和深度合成鉴别等关键技术,推动深度合成管理技术能力建设;加强人机混合的智能监管技术,研究深度合成服务提供者的安全可控技术保障方案,把监管规范转化为评估标准,建设面向网络全域监管的监测管理平台;研发深度合成与鉴别对抗机制,鼓励新兴科技企业与研究机构开展技术演练,共同推动深度合成服务健康发展。
(文图:赵筱尘 巫邓炎)