面向多源异构丝路文化遗产数据的智能挖掘方法

TS141.8; 为了进一步弘扬丝路文化遗产价值,有必要对丝路文化遗产数据进行深入分析与探究.然而,目前丝路文化遗产数据呈现多源异构的特性,包括不同来源的数据和不同模态的数据,导致了对多维度海量数据进行深层次的处理较为困难.文章首先通过对互联网数据的垂直搜索,高效采集丝绸之路相关信息;接着利用支持向量机自动快速、精确地完成文本分类工作;然后利用文本聚类技术对数据信息进行去重、去噪等清洗作业;最后,评选出影响力较大的事件,形成《丝绸之路文化遗产年报》对全球公开发布.文章为丝路文化遗产数据的分析与挖掘提供了经验与借鉴....

Full description

Saved in:
Bibliographic Details
Published in丝绸 Vol. 60; no. 1; pp. 9 - 15
Main Authors 杨寒淋, 周娅鹃, 赵丰, 徐蓉, 安薇竹, 翁正秋, 宁灵舰, 金宇
Format Journal Article
LanguageChinese
Published 中国丝绸博物馆 国际交流部,杭州310002%温州职业技术学院 人工智能学院,浙江 温州325006%浙江理工大学 纺织科学与工程(国际丝绸学院),杭州310018%同方知网(北京)技术有限公司 浙江分公司,杭州310018 2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:TS141.8; 为了进一步弘扬丝路文化遗产价值,有必要对丝路文化遗产数据进行深入分析与探究.然而,目前丝路文化遗产数据呈现多源异构的特性,包括不同来源的数据和不同模态的数据,导致了对多维度海量数据进行深层次的处理较为困难.文章首先通过对互联网数据的垂直搜索,高效采集丝绸之路相关信息;接着利用支持向量机自动快速、精确地完成文本分类工作;然后利用文本聚类技术对数据信息进行去重、去噪等清洗作业;最后,评选出影响力较大的事件,形成《丝绸之路文化遗产年报》对全球公开发布.文章为丝路文化遗产数据的分析与挖掘提供了经验与借鉴.
ISSN:1001-7003
DOI:10.3969/j.issn.1001-7003.2023.01.002