上海图书馆2018开放数据应用开发竞赛奖项揭晓 十余项创新作品挖掘历史人文开放数据新价值

为期5个月的上海图书馆2018开放数据应用开发竞赛于近日收官。所有提交作品通过评审最终产生一等奖1名、二等奖2名、三等奖3名、优秀奖4名、最佳人气奖1名以及人气奖7名。

上海图书馆开放数据应用开发竞赛由上海图书馆(上海科学情报研究所)、文化部公共文化研究上海图书馆基地主办,自2016年起已举办三届。今年的竞赛数据依旧聚焦历史人文,除上图开放数据种类大幅增加以外,还首次联合CADAL项目管理中心、哈佛大学计量社会学系、复旦大学图书馆、广州搜韵文化发展有限公司四家单位,为竞赛提供600万种历史人文数据。上海图书馆在原有5万余种家谱元数据、24万余种名人手稿及档案元数据、以及开放数据平台中的姓氏、人、地、时、机构等数据的基础上,新增63万余种古籍元数据,“人名规范库”的数据从6万余人增加到84万余人,另提供1万5千余种藏印数据,涉及到著名藏书家近400人;CADAL 项目管理中心开放数据为17万条民国图书元数据、8千条墓志元数据;哈佛大学计量社会学系开放数据为中国历代人物传记资料库(CBDB)中近42万条人物信息;复旦大学图书馆开放数据为其民国期刊数据库的8万余条元数据;广州搜韵文化发展有限公司开放数据为75万首历代诗词、30余万条相关词条用韵参考、100余万条古人诗例用韵参考以及约150万条对仗词汇参考。

竞赛向全社会开放,吸引了大批对历史人文数据感兴趣的高等院校、科研院所、IT企业及数据爱好者。今年,竞赛共收到了来自全国17个省、自治区、直辖市的110支团队共324人报名,有13支团队曾报名参加过往届竞赛。相比较2017年竞赛,报名团队数量增加了55%、参赛人数更是增长了66%,年龄最小的参赛者仅有13岁。参赛者中,在校生占48%,除计算机专业外,还涉及情报学、金融统计、地理信息、城市设计、数学、艺术等专业,研究生占比40%,较去年有大幅上升,并首次有初中生组队参赛。非在校生占52%,有IT人员、图情工作者、研究人员、设计师、教师、自由职业者等等。

入围获奖的10支团队分别来自上海、北京、河南、山西四省(直辖市),五分之三来自大学、科研机构及图书馆,并有2支团队连续两年获得奖项。

“医科数据共享”团队的《寻踪遇见》获得本次竞赛一等奖。该团队由来自中国医学科学院医学信息研究所的6名成员组成,致力于医学科学数据汇聚、管理和共享。该作品以“寻踪雪泥鸿爪印迹,遇见千古风流人物”为寓意,以旅游、学习、图书馆三大应用场景为切入点,利用OCR识别、实体识别、语音播放、可视化等技术,关联多个外部数据源,形成追踪和探寻名家足迹的知识探索平台,全方位解读和呈现历史人文知识。

而来自上海大学“SHU_VIZ_GROUP”团队的《民国百花》则是将民国人物与其手稿档案数据与近年来在年轻群体中较为流行的“语C”(语言Cosplay、语言角色扮演)相结合,让用户通过语言角色扮演的方式了解民国人物,融合了人文知识与娱乐社交

来自北京师范大学图书馆的“北师木铎金声”团队获得了最佳人气奖。他们的作品《树人者——二十世纪中华教育名家精粹》选取了20世纪50多名有影响的教育家,对人物生平、思想、贡献、社会关系、故居等内容进行了立体化、可视化的展示,有助于用户更为系统地观察和了解这些教育家,对教育史研究有很强的参考价值。

三年来,上海图书馆开放数据应用开发竞赛成功地吸引了一批热情饱满的数据创客,他们或是钟情历史人文,或是痴迷计算机技术,又或是饱含创意、充满理想,为历史人文开放数据注入了新时代的灵魂与思想。未来,上海图书馆将形成更加广泛的开放数据平台,丰富数据内容、种类和数量,并进一步形成数据开放、数据应用、公益孵化三位一体的开放数据服务模式,不断挖掘图书馆及其他文化机构历史人文开放数据背后所蕴藏的巨大价值。

二零一八年九月十六日

您可能还会对下面的文章感兴趣: