登录我的图书馆
首页
概况
图书馆简介
馆舍风貌
组织机构
规章制度
图书馆黄页
交流平台
开放时间
常见问题
资源
校外访问
中文数据库
外文数据库
试用数据库
自建数据库
网络资源
资源培训
馆藏目录
读者荐购
工大文库
版权公告
科研
科技情报研究
科技智库咨询
创新战略
数据+智能
多模态数据分析
服务
情报研究服务
智库咨询服务
信息素养讲堂
信息化系统
学 科 服 务
学科服务平台
ESI高被引
学术指南
阅读推广
校长推荐书目
校长推荐书目
校长推荐书目导读
校长推荐书目征文
毕业生推荐书目
新生推荐书目
图管会
章程
机构
成员
活动
寄语
悦读沙龙
好书推荐
校园阅读活动
工大读书节
新生专栏
借阅服务
馆藏分布
借阅权限
借阅证
借阅规定
违章处理
借阅排行
自助服务
中图分类法
馆际互借
科研服务
原文传递
检索认证
工具软件
论文服务
文献查重
读者咨询
图书捐赠
参考咨询
检索认证
ESI往期数据汇总
期刊
山东科学
齐鲁工业大学学报
党建
组织机构
政策法规
学习园地
工作动态
研究生培养
工作动态
招生信息
师资力量
学术活动
科研
科技情报研究
科技智库咨询
创新战略
数据+智能
多模态数据分析
当前位置:
首页
科研
多模态数据分析
多模态数据分析
2025-10-31
多模态数据分析
多模态数据分析多模态知识服务平台架构图如下所示:图1服务平台架构树状图由上图可知,具体实现步骤可分为三步,首先是数据准备,其次是数据挖掘,最后是结果展示。(1)数据准备首先对领域内的相关数据进行批量采集,将不同来源的数据资源进行收集、清洗、标准化等处理,完成对数据的噪声去除、重复过滤、类型转换形成结构统一的基础元数据库。数据准备阶段主要对知识发现的对象进行ID标识整理、粒度分析、关联呈现,如:主题词词典——利用卡方检验、词频筛选方法,在符合主题词增词原则(文献增量与主题词增量比)的基础上构建主题词表,综合利用马尔科夫模型、信息熵、互信息、潜在语义分析、模式识别、复述等方法完成错词通用词识别与词间关系的计算(共现相关、同义、上下位、相似等)。人物词典——从文献中提取作者,并构建作者特征(机构、主题、合作者、传媒、基金等),利用机器学习算法(朴素贝叶斯、近邻传播等)完成作者合并,实现重名消歧。机构词典——利用模式匹配、机构实体识别等方法结合数据编辑人工处理,完成机构标准名称规范、层级关系构建、机构变更关联等。(2)数据挖掘以领域为核心对元数据库中的数据进行整合,形成专题数据库。同时构建一个