字节跳动与北大合作搭建古籍“智能化数字图书馆”

林月
2022-03-18 09:53

3月18日消息,据字节跳动消息,日前,字节跳动向北大教育基金会提供捐赠,全面支持“北京大学-字节跳动数字人文开放实验室”的工作,研发古籍数字化平台,搭建一座古籍“智能化数字图书馆”。

双方将携手合作,优势互补,通过古籍数字化,保护、整理珍贵的中华文化资源,并推动这些资源向公众开放。

format-jpg

据了解,我国现存古籍约20万种。据不完全统计,其中已经数字化扫描影像的有8万种,而以文本方式存储,能进行归类、检索的仅有3-4万种。因此,大量中国典籍瑰宝在网上找不到,更无法通过关键词进行检索。

基于此,北京大学-字节跳动数字人文开放实验室推动搭建开放、共享、高质量的古籍数字化平台。

format-jpg

据介绍,该平台将分成两部分:面向读者的数字化古籍阅读工具、开放的古籍数字化智能整理平台。

字节跳动表示,北京大学-字节跳动数字人文开放实验室将调动国内外的相关力量,在三年内完成一万种精选古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录,为读者提供开放的古籍“数字图书馆”。另外,通过文本数字化,这些古籍将能够进行全文检索,不再需要一页页从头看起。

如用户有收藏的古籍,平台能够帮用户把纸页变成可查找的电脑文本。通过智能平台的文字识别、校对工具,学者和爱好者可以在线上平台一站式完成古籍的整理工作。

另外,平台还将在迅速数字化大量古籍的基础上,对重点文本进行精校,满足专家学者对常用资料的准确度要求。

format-jpg

值得一提的是,2021年6月17日,字节跳动联合中国文物保护基金会,在国家图书馆成立古籍保护专项基金,初期启动资金人民币1000万元,用于修复《永乐大典》“湖”字册等105册(件)珍贵古籍、培养100名修复人才等项目。

如今,当初进行修复的古籍也将逐步通过平台进行数字化。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
3月18日消息,近日,字节跳动向北大教育基金提供捐赠,全面支持“北京大学-字节跳动数字人文开放实验室”的工作,研发古籍数字化平台,搭建一座古籍智能化数字图书馆”。字节跳动和北大将合作搭建开放、共享、高质量的古籍数字化平台,在保护整理中华文化资源的同时,推动这些资源向大众开放。该平台可以是读者的数字化古籍阅读工具,也可以是学者、爱好者的一站式古籍数字化智能整理平台
10月11日消息,由“北京大学字节跳动数字人文开放实验室”研发的古籍数字化平台“识典古籍”测试版正式上线。上述实验室系今年3月北京大学字节跳动合作成立,将人工智能技术应用于古籍资源的智能化整理。“识典古籍平台上线,即是双方合作的最新进展。同时,“识典古籍”书目将持续更新,后续将上线手机移动版。
由“北京大学字节跳动数字人文开放实验室”研发的古籍数字化平台“识典古籍”测试版正式上线。
12月10日消息,北京字节跳动公益基金会宣布向北京大学教育基金会捐赠人民币2500万元,支持北京大学开展《儒藏》编纂与研究工作,并通过“识典古籍”智能整理平台,支持《儒藏》数字化工程,相关成果也将在“识典古籍”面向公众永久性开放。
2月24日消息,在字节跳动北京大学的合作之下,识典古籍官网现已上线了685部古籍,包括双方参与设计与研发的《永乐大典》高清影像数据库,用户可以登录官网或者在今日头条古籍频道查看已上线古籍。据了解,古籍数字化业务的研发复杂度很高,例如古籍的格式里,大字是正文,小字是注解,单独一列的大字是标题。为了把这些复杂的结构区分开,字节方面定义了一套古籍的元数据协议。
11月26日,字节跳动宣布,中国文物保护基金会字节跳动古籍保护专项基金定向资助修复书目已经确定,共有105册(件)古籍入选。
字节跳动公益宣布,字节跳动古籍保护专项基金资助修复的104册件古籍已全部完成修复。
8月21日消息,中国文物保护基金会、国家图书馆 、字节跳动公益正式启动第二期古籍保护与利用公益项目。字节跳动将继续提供捐赠,支持国家图书馆、陕西省图书馆等多家图书馆开展珍贵古籍修复。
三方将通过此次为期3年的合作,开展故宫古籍抢救性保护及资源转化利用。