首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
随着Internet技术的迅速发展,Web信息日益膨胀,人们不得不花费大量的时间去搜索自己需要的信息.如何从大量的网络信息中挖掘出针对不同用户的个性化资源已经成为研究的热点.本文针对用户访问兴趣和访问频度的特点,重点研究Web文本挖掘中的关键技术,着重分析了文本自动分类技术,从海量的数据信息中挖掘出有用的知识,加快发现数据中存在的关系和规则,进行潜在的"配对"预测,满足用户个性化查询的需求.  相似文献   

2.
正有统计表明,一个组织80%的信息是以文本的形式存放的,这些文本通常包括同领域的技术文档、Internet上的博客、论坛帖子等Web页面以及日常联系的电子邮件等。传统基于数据库的数据挖掘技术遇到了难以回避的问题,人们必须探求从大量的文本集合中发现新的知识。如何从庞大的非结构化文本信息中获取人们所感兴趣和需要的信息,成为数据挖掘以及智能信息处理领域的热点问题。文本挖掘技术就是为了解决这一问题而产生的。  相似文献   

3.
随着互联网产业的高速发展,用户对于Web应用访问速度的要求越来越高,用户体验也逐渐成为了企业生存和发展的重要阵地。然而由于Web应用瘦客户端的特点,用户在访问网站时需要从服务器端下载大量的数据,这些数据的反复交互使得互联网丢包和延时等因素直接影响了应用的访问质量;与此同时,云计算成为新的发展趋势,计算资源的调度更多地需要跨越企业内网完成,  相似文献   

4.
金融是现代经济的核心,如何防范和化解金融风险成为重要课题。文章针对互联网海量文本数据,基于RDFS方法进行金融风险识别的研究,并构建了基于RDFS的互联网金融文本数据风险识别模型。第一步是对互联网数据源的金融文本数据进行数据预处理;第二步是对文本数据进行信息抽取,并将抽取的信息进行有效的RDFS数据表示;第三步是基于RDFS数据表示对文本数据进行有效的分析预警。  相似文献   

5.
网络服务的负载均衡探究   总被引:1,自引:0,他引:1  
瞿威 《中国金融电脑》2009,(1):59-61,65
随着电子商务、网上银行等网络业务的快速发展,大量的用户并发访问Web服务器。当用户访问量达到一定阈值时,单Web服务结构已无法进行正常的响应,于是多服务器网络负载均衡成为技术发展的新方向。  相似文献   

6.
随着金融市场竞争的加剧和信息社会需求的发展,从大量数据中提取(检索、查询等)制定策略的信息就显得越来越重要。这种需求既要求联机服务,又涉及大量用于决策的数据,而传统的数据访问已无法满足这种需求。其具体体现在三个方面:历史数据量很大;辅助决策信息涉及许多部门的数据,而不同系统的数据难以集成;由于访问数据的能力不足,它对大量数据的访问性能明显下降。随着数据仓库技术的发展,信息处理技术的发展趋势是从大量的业务系统中抽取数据,并将其清理、转换为新的存储格式,并进行数据分析和数据挖掘。  相似文献   

7.
本文采用文本分析技术提取年报研发文本信息,并从分析师预测角度解读其信息价值.研究发现:(1)R&D文本信息显著降低了分析师预测偏差及分歧度,而且信息透明度发挥了中介效应.(2)R&D文本信息披露越多,未来三年的创新产出以及政府研发补助越多,说明企业倾向于选择性披露有利于企业的研发信息.(3)企业披露动机越强,分析师获取私有信息的能力越弱,R&D文本信息对分析师预测偏差和分歧度的降低作用越显著.以上结论说明我国年报R&D文本信息具有一定信息含量,对分析师来讲“多说有益”.本文从研发文本视角以及分析师预测角度验证了我国年报文本信息的积极效应,有助于丰富R&D以及分析师预测文献.  相似文献   

8.
数据仓库中的联机分析处理技术与元数据机制   总被引:4,自引:0,他引:4  
数据仓库中的联机分析处理技术与元数据机制北京大学唐世渭裴健数据仓库技术是为了解决大型企业虽然拥有大量业务数据,但却很难及时有效地提取经营管理决策所需要的信息这一问题而产生的。如何有效地组织大量的数据,维护数据的一致性,方便用户访问,这只是数据仓库技术...  相似文献   

9.
自动分类技术研究   总被引:1,自引:0,他引:1  
随着网络的迅猛发展,海量文本信息正在以几何级数不断增长,自动分类技术已成为文本信息分类的主导关键技术。自动分类技术可分为自动聚类和自动归类两种类型,现有的文本分类技术主要采用基于连接、基于规则和基于统计等三种方法。随着数据挖掘领域和机器学习理论、技术研究的不断深入,解决不同实际应用和数据特征的问题将成为文本分类相关研究及其应用的主要突破方向和攻克难点。  相似文献   

10.
在开发Web应用程序中,遇到要将《金融统计监测信息系统》导出的文本文件,通过客户端上传文件方式,将文本信息导入到服务器SQL Server 2000数据库,以实现Web按权限共享查询。笔者利用FSO(File System Object)对象模型实现了上述要求。  相似文献   

11.
在web应用程序中,大量从数据库中提取出来的要被重复使用的数据一般不会频繁改变,但是,将其从数据库搜索并提取出来要花费大量时间.针对这种频繁访问数据库势必降低数据访问性能的情况,本文提出利用缓存机制将数据在内存中缓存起来,以减少频繁访问数据库的次数,从而提高数据访问性能和效率.  相似文献   

12.
杨辉 《中国金融电脑》2002,(3):14-15,35
一、信贷分析系统总体目标 随着市场竞争的加剧和信息社会需求的发展,从大量数据中提取(检索、查询等)制定市场策略的信息就越来越重要了,这种需求既要求联机服务,又涉及大量用于决策的数据.而传统的数据库系统已无法满足这种需求,体现在几个方面:历史数据量很大;辅助决策信息涉及许多部门的数据,而不同系统的数据难以集成;由于访问数据的能力不足,对大量数据的访问性能明显下降.新的需求要求信息处理技术能从大量的事务型数据库中抽取数据,并将其清理、转换为新的存储格式,为决策目标把数据聚合在一种特殊的格式中.  相似文献   

13.
互联网技术的蓬勃发展使人们获取信息的方式发生了深刻的变革,同时也使得互联网上的信息出现爆炸式增长。如何快速、准确地获得有用的信息及隐藏在信息中的知识,是当下人们的迫切需求。文本是互联网信息中最重要的数据类型之一,因此,文本挖掘已经成为数据挖掘中一个极为重要和繁荣的子领域。本文研究了通过文本卷积神经网络模型实现的互联网短文本多分类,对比了卷积神经网络模型与统计学模型朴素贝叶斯的效果差异,比较了不同词向量化方式对模型效果的影响,以及不同文本预处理方式对模型效果的影响。  相似文献   

14.
姜富伟  胡逸驰  黄楠 《金融研究》2021,492(6):95-113
本文利用金融情感词典和文本分析技术,分析中国人民银行货币政策执行报告的文本情绪、文本相似度和文本可读性等多维文本信息,刻画央行货币政策执行报告的文本特征,探究货币政策报告的文本信息与宏观经济和股票市场的关系。实证研究发现,货币政策报告的文本情绪的改善会引起显著为正的股票市场价格反应,报告文本相似度的增加会引起股票市场波动性的显著降低,报告可读性对公布后股票市场的波动性影响不显著。货币政策报告文本情绪还与诸多宏观经济指标显著相关。进一步研究发现,引起股票市场显著反应的是报告文本情绪中反映货币政策指引的部分,而反映宏观经济历史状态的部分对股票市场的影响不显著。本文从文本大数据分析角度证明了我国央行沟通的有效性,对国内央行沟通相关研究形成了有益补充。  相似文献   

15.
银行业务数据库和数据仓库中数据量非常大,从这些数据中找出相关的有价值的信息,提取出这些信息的关联,从而获得有利于商业运作、能够提高企业竞争力的知识,就需要对数据库和数据仓库中大量的数据进行深层的分析。数据挖掘是从大量的,不完全的、模糊的,随机的数据中,抽取出潜在的、有价值的知识、模型或规则,挖掘出更有价值的信息的一个过程。  相似文献   

16.
人行天津分行是一个管辖三省一市的大区行,金融监管信息系统的用户涉及35个中支、311个县支和3个监管办事处的监管业务人员.由于服务的地域广,人员多,信息安全性要求高,因此,如何安全有效地将金融监管信息在天津分行的广域网上发布,是一个严峻的课题.金融监管信息系统使用集中的Web服务器,运行在天津分行,各类监管用户使用浏览器就可以访问系统的Web站点,从而获取其权限范围内的监管数据.  相似文献   

17.
邹作基:SAP HANA这一突破性的创新技术能够帮助用户以快10万倍的速度高速访问和发布信息。同时,它还帮助用户以一种全新方式驾驭大数据,助力企业运营。企业互联网化,推动了大数据的爆发性增长。在逐步电商化的过程中,企业除了分析收集到的传统关系型结构化数据外,还会收集到大量类似网页、XML日志等半结构化、非结构化的日志。有调查报告指出,估计未来5年,企  相似文献   

18.
李军 《金融电子化》2001,(12):34-36
目前,国内许多银行已经建好了业务系统,并且在各部门都积累了大量数据。如何从这些数据中分析、挖掘出对银行业务、客户关系管理以及决策支持有用的信息,便成为这些银行所面临的一大问题。BI  相似文献   

19.
侯冬青 《理财》2024,(2):74-76
<正>随着人工智能和机器学习等技术的不断发展,计算广告中的用户画像技术也得到了极大的提升。通过分析大量的用户数据,可以挖掘出用户的兴趣爱好、消费习惯、社交关系等特征,从而更好地理解用户需求和行为模式。本文通过探讨计算广告中用户画像的技术使用与对策,介绍计算广告中用户画像的现状、用户画像的构建包括数据收集、清洗和特征提取等流程,让用户画像在计算广告中的应用更加清晰。用户画像的应用导致广告投放模式的转变,使广告效果评估更加可视化,同时也促进了广告内容的私密化。本文还尝试分析计算广告的发展困境,包括技术挑战和用户需求变化等因素。  相似文献   

20.
PowerBuilder利用数据窗口对象可以很方便地实现对数据库的访问,生成用户需要的各种类型的报表。然而,在数据窗口的打印中,用户可能经常会遇到需要重新调整数据窗口打印属性(如页边距等)的情况。如果能在程序中为用户增加一些功能,由用户自行调整打印参数,那么将会给用户带来极  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号