1. 首页
  2. > 资质代办 >

北京字节跳动(北京字节跳动公司工资待遇怎么样)


双方将携手合作,优势互补,通过古籍数字化,保护、整理珍贵的中华文化资源,并推动这些资源向公众开放。


最方便的穿越方式是什么?


但即便在科技发达的今天,对普通人而言,工资查找、阅览、研究古籍,仍不够方便。


我国现存古籍跳动约20万种。据不完全统计,其中已经数字化扫描影像的有8万种,而以文本方式存储,能进行归类、检索的仅有3-4万种。待遇


因此,大量中国典籍瑰宝在网上找不到,更无法通过关键词进行检索。要进行研究,只能先从头到尾看一遍。


有没有可能,让古籍能够“上网”、能分门别北京类地展示、支持查找检索,不再需要一页页公司翻看呢?


这正是“北京大学-字节跳动数字人文开放实验室”工资正在推动的事情:搭建开放、共享、高质量的古籍数字化平台。


这个平台将分成两部分:


(1)面向读者的数字化古籍阅读工具


“北京大学-字节跳动数字人文开放实跳动验室”将调动国内外的相关力量,在三年内完成一万种精选古籍的智能化整理工作,基本覆盖儒家道家佛学的核心典籍目录,为北京读者提供开放的古籍“数怎么样字图书馆”。另外,通过文本数字化,这些古籍将能够进行全文检索,不再需要一页页从头看起。


(2)开放的古籍数字化智能整理平台


如果你有收藏的古籍,这个平台能够帮你把纸页变成可查找的电脑文本。通过智待遇能平台的文字识别、校对工具,学者和爱好者可以在线上平台一站式完成古籍的整理工作。


另外,平台还将在迅速数字化大量古籍的基础上,对重点文本进行精校,满足专家学者对常用资料的准确度要求。


通过古籍数字化实现“穿越”的背后,离不开科技的支持。


让古籍变成可检索的文本一直面临诸多难题。古籍常常字迹不清,存在许多生僻字和异体字,语法、书写规律等也都与现代书籍不同。


在“北京大学-字节跳动数字人文开放实验室”中,多种先进技术正逐步解决这怎么样些困难:


  • OCR(光学字符识别)技术类似于一种智能扫描仪,先用电子设备检查纸上每个字的形状,再用字符识别方法,把这些字一个个“认”出来,并转换公司为电脑能够处理的文本。
  • 句读对于古籍数字化也十分必要。古籍的“标点符号”——句读,与现代汉语差异很大,有的版本甚至没有句读,要靠算法帮忙断句。这需要数字化平台更智能,具有更高的语言处理能力。
  • 实体识别是另一种重要字节的技术。古籍中存在大量的人名、地名、物品名等“实体”词汇,地方志、中医著作等类别的古籍,也常常具备自己的“专属词库”。要实现古籍搜索,这些实体就会成为检索的关键词,平台将通过算法把这些实体识别出来。

当然,这些技术的实现基础,是庞大的古籍修复与整理工作。这项工作仍然需要通过人工,用一张张纸、一支支板刷来完成。


2021年6月17日,字节跳字节动联合中国文物保护基金会,在国家图书馆成立古籍保护专项基金,初期启动资金人民币1000万元,用于修复《永乐大典》“湖”字册等105册(件)珍贵古籍、培养100名修复人才等项目。


如今,当初进行修复的古籍也将逐步通过平台进行数字化。


我们相信,在不久的将来,越来越多的古籍将在互联网上获得新生,越来越多的人将共同参与进来,守护珍贵的文明记忆。


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至123456@qq.com 举报,一经查实,本站将立刻删除。

联系我们

工作日:9:30-18:30,节假日休息