融合新闻文本和时序信息的上市公司财务欺诈预警 |
| |
引用本文: | 陈朝焰,韩冬梅,吴馨一.融合新闻文本和时序信息的上市公司财务欺诈预警[J].财会月刊,2023(12):30-39. |
| |
作者姓名: | 陈朝焰 韩冬梅 吴馨一 |
| |
作者单位: | 1. 上海商学院商务信息学院;2. 上海财经大学信息管理与工程学院;3. 上海市金融信息技术研究重点实验室;4. 中国工商银行网络融资中心 |
| |
基金项目: | 中央高校基本科研业务费专项资金资助项目“基于深度学习的上市公司财务欺诈识别新方法研究”(项目编号:2022110095); |
| |
摘 要: | 本文针对资本市场中普遍存在的上市公司财务欺诈问题,在财报数据中融入财经新闻文本特征,并提取时序信息,为上市公司财务欺诈预警提供新途径。以结构化的财报数据和非结构化的新闻文本数据为对象,在结构化数据特征中融入新闻文本的主题特征、观点特征、情绪特征和欺诈特征,然后提取时序信息,并基于树集成的方法实现上市公司财务欺诈预警。本文融合预警欺诈行为的方法在CSMAR财报数据集和爬取的新浪财经数据集上达到了86.1%的准确率和86.5%的召回率,融入新闻特征和时序信息后比单纯地采用财报数据特征的准确率提高了8%。新闻文本特征可以作为财报数据的有效补充,且在财报数据和新闻文本数据中引入时序信息有利于提高上市公司财务欺诈的预警性能。
|
关 键 词: | 上市公司 财务欺诈 新闻文本 时序信息 欺诈预警 |
|
|