共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
随着信息技术的快速发展,各行各业已进入大数据时代。审计作为一个数据密集型行业,如何运用科学的工具对大数据进行抽丝剥茧,以高效获取审计证据已经成为近期国内的热点。文章首先阐述了在大数据的影响下审计过程中各环节的变化,在此基础上,分析了网络爬虫技术在审计证据挖掘与分析过程中的原理。最后,以金正大审计为例,分析爬虫技术是否可实现高效获取和分析审计证据。研究结果表明,爬虫技术可运用于大数据审计中,有效帮助审计人员,提高审计效率。 相似文献
4.
5.
针对网络大量重复页面,本文研究基于Bloom Filter的网络爬虫URL地址消重算法。首先,本文对Bloom Filter算法进行了分析研究;其次,本文应用Bloom Filter算法设计并实现了网络爬虫的URL消重;最后,论文采用URL消重率和爬虫爬取某类网站所用时间等性能指标,对基于遍历法和基于MD5算法的URL消重性能与基于Bloom Filter的消重性能做了对比。实验证明,基于Bloom Filter的网络爬虫URL地址消重算法效率较高。 相似文献
6.
7.
针对当前网络零售业在线商品品种繁多、同质化严重、竞争情报收集困难的现状,利用当前流行的主题爬虫技术,建立网络零售竞争情报系统。系统能自动搜集指定竞争对手和指定领域内在线商品的实时信息,并能智能扩展或缩小收集范围。系统为商家提供及时准确的竞争情报,并起到很好的辅助决策作用。 相似文献
8.
随着网络零售市场的发展与新冠肺炎疫情的不间断流行,粮油网络零售市场已成为居民购买粮油商品的新渠道。通过对淘宝平台的粮油商品零售数据进行爬虫抓取,进而再引入朴素贝叶斯算法建立分类模型对网络粮油商品进行分类,从而提出一种粮油网络零售价格指数构建方案,其可为其他电商平台的各类商品零售数据抓取、价格指数构建和监控提供应用基础。通过淘宝平台的粮油网络零售价格指数构建结果可知,粮油网络零售价格指数与其类目下的大米、面粉、杂粮和食用油网络零售价格指数在各期的价格走势并不相同,因此若电商平台的供需双方想要更加精细地了解网络粮油商品的价格走势,则需对网络粮油类目下的二级类目商品独立研究。 相似文献
9.
10.
生鲜农产品小批量、保质期短等特性和拥堵的城市交通对配送效率提出更高的要求。文章针对生鲜农产品配送路径优化问题,以HFZ便民直销店为例,首先利用Selenium工具进行网络爬虫,在百度地图里查找63个便利店和1个配送中心之间的最短路线,然后设计考虑时间窗因素的生鲜农产品配送路径优化模型。最后通过对比分析,表明基于Selenium和遗传算法得出的结果具有显著优势。 相似文献
11.
12.
13.
计算机技术和网络技术的迅速发展和普及对图书馆的发展造成了巨大挑战,图书馆用户的类型、用户意识和对信息资源和服务的要求等都与过去有很大不同。本文分析了网络环境下图书馆用户的新变化,提出了应对措施即提倡以人为本的服务理念,加强用户研究、优化资源、开拓服务、扩展用户。 相似文献
14.
15.
随着当前经济的不断发展,财务管理已经被越来越多的人所重视,在网络迅猛发展的前提下,网上财务管理已经进入到个人、家庭等领域。文章所实现的网络记账系统,在于不同阶层的用户能够更加方便、快捷地管理自己的财务状况。该系统从用户的角度出发,以快速流水账、分别记账等多种记账方式来方便用户管理,实现图文并茂、购物计划等功能,极大地方便了用户,节省了用户的时间,进而促进了经济的快速发展。 相似文献
16.
随着计算机网络技术的不断发展,电子出版物的应用也越来越广,它从根本上改变了图书馆的组织结构和服务模式,图书馆可以利用网络更方便地为用户提供信息资源。本文简单介绍了图书馆电子的信息资源,并对其管理工作提供了一些参考意见。 相似文献
17.
18.
本文提出了基于本体的气象领域聚焦爬虫,首先利用Protégé工具构建气象领域本体,将本体作为领域知识库引入到聚焦爬虫中,然后,利用本体中的概念和概念关系判断所抓取的网页是否与气象领域相关,大大提高了抓取相关网页的准确度。最后,通过实验对整个爬虫进行验证。实验结果表明,本文所提出的实现方法在抓取气象领域网页信息方面是有效的。 相似文献
19.
随着经济飞速发展,我国快递业务量逐年上升,快递业的发展水平成为衡量区域经济和社会发展的重要指标。文章通过爬虫技术获取2016年1月—2022年11月江苏省的快递业数据,通过Anaconda平台使用季节性差分自回归滑动平均模型(Seasonal Autoregressive Integrated Moving Average,简称SARIMA)对获取的数据进行分析。考虑到原始数据为非平稳时间序列,进行差分处理和参数分析,最终确定模型为SARIMA(1,1,1)(0,1,2)12,结果表明该模型的数据拟合较好。通过模型对2022年12月—2023年5月的快递量进行预测。文章认为,预测模型的数据能更好地助力快递业解决可能发生的风险和不确定因素,为今后区域经济和区域快递业务发展提供重要参考。 相似文献
20.
文章使用网络爬虫工具,从电商网站上抓取了5种生鲜食品的顾客评价信息4 480条,通过EXCEL工具结合手工梳理分析,厘清了影响生鲜宅配顾客感知服务质量的三大因素,即货物的完好程度、物流包装及物流时效。通过数据分析得出结论:针对不同类型的生鲜食品,顾客关注的配送质量侧重点差异比较明显;另外,三大因素之间是相互影响的,货物的完好程度与运输时效以及运输包装形式直接相关,包装的完好程度、包装方式以及安全环保性在很大程度上影响了货物的完好程度,物流时效在一定程度上影响了货物的完好程度,货物的完好程度也影响了顾客对时效的评价。 相似文献