共查询到20条相似文献,搜索用时 0 毫秒
1.
基于2019—2020年武汉市“城市留言板”信息,利用文本挖掘技术筛选包含地理信息的交通类网络留言数据,结合社会网络分析法对武汉市交通问题总体特征和分区交通问题特征进行了识别。结果表明:武汉市交通问题的时空分布具有非均衡性和季节性特点,在主城区形成多个双中心高热度组团,远城区的高热度区域呈离散状分布。跨江道路是交通运行的重要冲突点,舆情热点道路位于通勤走廊和产业新区与主城区的连接处。主城区市民反馈的交通问题聚焦于机动车停放问题,远城区市民更加关注公交线路配置问题,产业新区市民的留言则侧重于交通拥堵问题。“市民出行”“城市建设”和“违章处理”是各辖区存在的共性交通问题。最后,结合武汉市的区位差异性提出交通治理对策。 相似文献
2.
3.
《会计之友》2019,(1)
近年来,财务报告附注的篇幅越来越长、信息越来越庞杂,这无疑增加了财务报告使用者的阅读难度。文本挖掘技术可以视为提炼文本中有用信息的工具,对提取财务报表附注中披露的关键信息具有很大的帮助。以文本挖掘为工具研究财务报表附注信息披露的特征,使用ROST CM软件对财务报表附注文本内容进行分词处理,经过词频统计、关键词共现分析、文本内容语义网络分析等过程发现财务报表附注披露内容的特征,探究了文本挖掘在附注研究中可以使用的技术。基于文本挖掘技术的相关研究在国内刚刚起步,财务报表附注方面更是鲜有研究,文章尝试使用文本挖掘技术来研究财务报表附注,对未来此方向的研究提供了一个可供借鉴的方法。 相似文献
4.
为合理评价电商平台物流客户满意度情况,提出一种基于评论大数据的物流客户满意度测算方法.首先,以生鲜电商为研究对象爬取大量在线评论,进行分词等操作并基于TF-IDF算法得出生鲜电商物流满意度的关键因素及其权重,随后构建物流属性词向量模型,结合词语权重和其与物流关键因素之间的相似性,区分每句话中的物流属性,确定用户重点关注... 相似文献
5.
朱军涛苗蕾胡晓红邓仁 《企业技术开发》2018,(12):125-127
当前,科技期刊面临融合出版的挑战,截至2017年底,全国拥有科技期刊2 052种,在此现状下,科技期刊评价能促使期刊行业的健康发展。文章对文本挖掘在期刊评价的应用进行了深入探究,针对基于分类词典的文本相似度量等方法,进行了详细的分析。 相似文献
6.
利用Python采集京东国际个护产品消费者的在线评论,通过文本特征分析得出“物流”、“效果”、“包装”等是影响进口跨境电商消费者满意度的关键要素。随后利用LDA主题聚类模型,结合困惑度和主题可视化,得到反映进口跨境电商服务质量的4类关键因素,包括物流效率、产品功效、感知价值和产品体验。基于此,提出改善进口跨境电商服务质量的策略。 相似文献
8.
9.
对股票市场信息的文本挖掘 总被引:1,自引:0,他引:1
面对股票市场上海量的信息,本文提出使用文本挖掘技术,在快速得到初步挖掘结果的基础上,应用上市公司财务评价指标体系和数据挖掘中的聚类的方法对其分析。文章结合股票市场信息的特征建立了文本挖掘的框架和挖掘流程,并举用22家上市公司的年报进行文本挖掘和聚类分析,给出了一种综合分析与评价上市公司财务状况和经营状况的方法。 相似文献
10.
《会计之友》2017,(16)
大数据的浪潮推动着审计技术的变革,给审计模式和审计方法都带来了巨大的改变。传统的审计数据分析方法不能对半结构化以及非结构化数据进行分析,也无法满足大数据环境下审计信息化发展的要求,亟须提出新的审计数据分析思路和方法。在此背景下,文章提出了基于文本挖掘的审计数据分析框架,并阐述了采集与存储、挖掘与分析、总结与发布详细的审计数据分析流程。通过利用文本挖掘技术对采集的非结构化原始审计数据进行挖掘,根据明确的审计需求建立不同的文本挖掘模型,对审计数据进行分析,进而发现审计疑点,最终形成可理解的审计证据和审计线索。该框架的构建旨在为大数据审计提供新的思路,以降低大数据审计风险,提高审计质量。 相似文献
11.
统计挖掘技术与舆情分析预警 总被引:1,自引:0,他引:1
互联网是把“双刃剑”,既提供了大量进步、健康、有益的正面信息,也有不少反动、迷信、低级的误导性信息,这样就需要进行舆情监测预警,为构建和谐社会保驾护航。 相似文献
12.
以北京市现行1906条标准文本为研究对象,从多个维度统计分析北京市地方标准发展现状,依据标准三维空间理论构建北京市地方标准体系,运用文本挖掘方法探究北京市地方标准存在的问题。研究发现,北京市地方标准主要集中于安全、方法、管理等方面,体系维度内行业领域分布不均衡。城市基础建设及民生建设主题领域标准覆盖范围大,绿色环保、社会服务保障及数字化发展领域标准覆盖范围较小。工程、施工、交通等标准是关注的重点,绿色、智能化、养老等标准建设仍处薄弱环节。应当以法规为依托,多元主体共同参与标准制定,以滞后标准领域为导向,明确标准制定的方向。 相似文献
13.
文章针对水利工程施工安全隐患文本的智能分类、挖掘和排查方法进行研究,提出基于机器学习和自然语言处理的方法,实现安全隐患文本的自动分类和排查线索挖掘。首先,对安全隐患文本进行预处理,提取文本特征并采用随机森林模型将文本分类为10个类别;其次,利用词云图和词频统计方法展现安全隐患的管理要点;最后,利用序列相似度匹配算法和隐含狄利克雷分布模型,从原始隐患数据中找出包含高频安全隐患核心词的代表性隐患数据,作为隐患排查线索,指导安全管理实践。文章提出的方法可以有效地提高水利工程施工安全隐患文本的分类准确率,挖掘隐患文本中有价值的信息,缩小隐患排查的范围,提高水利工程安全管理的效率和水平。 相似文献
14.
以南京为例,介绍如何对交通物流系统进行规划,详细分析物流基地体系布局格局,服务体系主要内容,信息平台总体构架和功能等。 相似文献
15.
16.
17.
研究目标:构建反映行业股价走势的基于社交网络文本挖掘算法的行业投资者情绪指标,并改善嵌入行业投资者情绪指标的Black-Litterman模型对资产的配置结果。研究方法:基于社交网络文本挖掘算法度量投资者情绪,运用主成分分析法构建行业投资者情绪指标,并嵌入Black-Litterman模型中构建投资者观点矩阵,确定行业资产配置比。研究发现:基于行业投资者情绪的BL模型有效提高了资产配置的日均收益率和夏普比率。实证结果在样本外验证(除受新冠疫情影响阶段)、暴涨暴跌阶段以及经过允许卖空和交易成本调整后仍稳健,进而证实了投资者情绪对资产组合有显著影响。研究创新:基于社交网络文本挖掘算法构建投资者情绪指数,解决了仅依赖于预期收益或历史数据的预测模型无法直观揭示投资者心理认知和行为的局限性问题,从一个崭新的视角科学地解决Black-Litterman模型中投资者观点的生成问题。研究价值:扩展了Black-Litterman模型理论体系研究,并推动了行为金融理论在资产配置中的应用。 相似文献
18.
19.
文章在分析国内城市交通体系的形式和特点的基础上,结合国内的实际情况,提出我国在特大城市发展大、中运量型轨道交通,建立完善的交通体系,以及快速轨道交通和其他交通方式比较的优势、轨道交通系统对于一个城市或地区所带来的利益。 相似文献
20.
文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文首先对基于空间向量模型的文本聚类过程做了较深入的讨论和总结。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20Newsgroup文本语料库,针对向量空间表示模型,在开源的数据挖掘平台WEKA上实现了文本预处理和k-means聚类算法,并根据实际聚类效果,就文本表示、特征选择、特征降维等方面提出优化方案。 相似文献