百度的大数据实践期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

百度的大数据实践

引用本文：	李敏,陈尚义,林仕鼎.百度的大数据实践[J].金融电子化,2013(6):35-36.

作者姓名：	李敏陈尚义林仕鼎

作者单位：	百度公司

摘要：	互联网搜索引擎从第一天开始就是大数据应用，互联网产生了海量数据，如何从中找到需要的信息就是一个大数据的命题。搜索引擎正好解决这一问题，网络爬虫首先从数以千亿级的网页中搜集信息，建立网页数据库。当用户以关键词查找信息时，搜索引擎会在数据库中进行搜寻，如果找到与用户查询语句相符的网站，便采用排序算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量综合计算出各网页的相关度及排名等级，然后根据关联度高低，按顺序将这些网页链接返回给用户。
关键词：	网页链接百度搜索引擎数据应用海量数据网络爬虫查询语句匹配程度
本文献已被维普等数据库收录！