共 69 条
金融学文本大数据挖掘方法与研究进展
被引:36
|作者:
姚加权
[1
]
张锟澎
[1
]
罗平
[2
,3
,4
]
机构:
[1] 暨南大学管理学院
[2] 中国科学院计算所
[3] 中国科学院大学
[4] 中国科学院智能信息处理重点实验室
来源:
基金:
国家重点研发计划;
关键词:
文本大数据;
文本分析;
机器学习;
深度学习;
数据挖掘;
D O I:
暂无
中图分类号:
F830 [金融、银行理论];
TP391.1 [文字信息处理];
学科分类号:
020204 ;
081203 ;
0835 ;
1201 ;
摘要:
在金融学领域的传统实证研究中,所用数据多局限于财务报表和股票市场数据等结构化数据。而在大数据时代,计算机技术的进步使得数据类型不断丰富,研究者开始将非结构化的文本大数据引入到金融学领域的研究中,其主要包括上市公司披露文本、财经媒体报道、社交网络文本、网络搜索指数以及P2P网络借贷文本等,并对文本的可读性、语气语调、相似性以及语义特征展开研究。本文首先介绍了金融学领域文本大数据挖掘步骤和方法,描述了语料获取、预处理过程、文档表示以及文档的特征抽取;然后根据不同的文本信息来源,梳理了金融学文本大数据的研究进展;最后对未来金融学文本大数据的研究方法和研究内容进行了展望。
引用
收藏
页码:143 / 158
页数:16
相关论文