《Web数据分析关键技术及解决方案》_范春晓_北京邮电大学_PDF电子书 扫描版 下载

admin 2022年9月27日00:00:11计算机类5,398阅读模式

文章目录[隐藏]

《Web数据分析关键技术及解决方案》_范春晓_北京邮电大学_PDF电子书 扫描版 下载文章源自书行天下-https://www.sxpdf.com/2014.html

内容介绍:

本书着重于Web数据自动分析的关键技术-Web数据自动获取,特征提取,表达建模和Web挖掘以及其他相关的理论和方法。在此基础上,分析了几种典型的Web数据分析需求,提出并提出了针对性的解决方案和方法。主要解决方案包括:基于Web的舆论自动分析和预警方案,基于语义的Web信息自动聚合方法以及多源电子商务数据挖掘。文章源自书行天下-https://www.sxpdf.com/2014.html

本书选择了当前网络数据分析中的热点问题,总结了实际科学研究工作的研究成果,将理论与实际相结合,适合于大学,电子信息学,计算机等相关专业的师生读书。文章源自书行天下-https://www.sxpdf.com/2014.html

目录介绍:

第1章 Web大数据挖掘概述1文章源自书行天下-https://www.sxpdf.com/2014.html

1.1 大数据与网络大数据1文章源自书行天下-https://www.sxpdf.com/2014.html

1.2 Web大数据应用及特点2文章源自书行天下-https://www.sxpdf.com/2014.html

1.2.1 Web大数据2文章源自书行天下-https://www.sxpdf.com/2014.html

1.2.2 Web大数据特点3文章源自书行天下-https://www.sxpdf.com/2014.html

1.3 Web挖掘及Web挖掘类型4文章源自书行天下-https://www.sxpdf.com/2014.html

1.3.1 Web挖掘及Web挖掘类型4文章源自书行天下-https://www.sxpdf.com/2014.html

1.3.2 Web内容挖掘5文章源自书行天下-https://www.sxpdf.com/2014.html

1.3.3 Web结构挖掘6文章源自书行天下-https://www.sxpdf.com/2014.html

1.3.4 Web使用挖掘6文章源自书行天下-https://www.sxpdf.com/2014.html

1.4 Web挖掘过程7文章源自书行天下-https://www.sxpdf.com/2014.html

1.4.1 Web内容挖掘过程7文章源自书行天下-https://www.sxpdf.com/2014.html

1.4.2 Web结构挖掘过程7文章源自书行天下-https://www.sxpdf.com/2014.html

1.4.3 Web使用挖掘过程8文章源自书行天下-https://www.sxpdf.com/2014.html

参考文献10文章源自书行天下-https://www.sxpdf.com/2014.html

第2章 Web数据挖掘基础12文章源自书行天下-https://www.sxpdf.com/2014.html

2.1 Web信息程序获取方式12文章源自书行天下-https://www.sxpdf.com/2014.html

2.1.1 网络爬虫12文章源自书行天下-https://www.sxpdf.com/2014.html

2.1.2 其他Web信息程序获取方式15文章源自书行天下-https://www.sxpdf.com/2014.html

2.2 Web信息数据抽取16文章源自书行天下-https://www.sxpdf.com/2014.html

2.2.1 Web网页信息抽取16文章源自书行天下-https://www.sxpdf.com/2014.html

2.2.2 自然语言文本结构化信息抽取17文章源自书行天下-https://www.sxpdf.com/2014.html

2.3 Web信息文本模型的文本特征表示19文章源自书行天下-https://www.sxpdf.com/2014.html

2.3.1 文本模型与文本特征19文章源自书行天下-https://www.sxpdf.com/2014.html

2.3.2 VSM向量空间模型20文章源自书行天下-https://www.sxpdf.com/2014.html

2.3.3 布尔模型21文章源自书行天下-https://www.sxpdf.com/2014.html

2.3.4 概率主题模型 21文章源自书行天下-https://www.sxpdf.com/2014.html

2.4 模式发现常用方法24文章源自书行天下-https://www.sxpdf.com/2014.html

2.4.1 统计分析24文章源自书行天下-https://www.sxpdf.com/2014.html

2.4.2 关联分析24文章源自书行天下-https://www.sxpdf.com/2014.html

2.4.3 分类分析25文章源自书行天下-https://www.sxpdf.com/2014.html

2.4.4 聚类分析27文章源自书行天下-https://www.sxpdf.com/2014.html

参考文献28文章源自书行天下-https://www.sxpdf.com/2014.html

第3章 Web内容及结构挖掘应用案例1:基于Web公共舆情自动分析及预警30文章源自书行天下-https://www.sxpdf.com/2014.html

3.1 概述30文章源自书行天下-https://www.sxpdf.com/2014.html

3.1.1 基于Web的公共舆情30文章源自书行天下-https://www.sxpdf.com/2014.html

3.1.2 网络舆情研究现状31文章源自书行天下-https://www.sxpdf.com/2014.html

3.2 基于Web意见的舆情分析预测模型32文章源自书行天下-https://www.sxpdf.com/2014.html

3.2.1 舆情分析预测模型概述32文章源自书行天下-https://www.sxpdf.com/2014.html

3.2.2 热点舆情发现模型研究33文章源自书行天下-https://www.sxpdf.com/2014.html

3.2.3 热点舆情发展趋势预测模型35文章源自书行天下-https://www.sxpdf.com/2014.html

3.3 基于意见挖掘的热点舆情发现模型37文章源自书行天下-https://www.sxpdf.com/2014.html

3.3.1 改进的热点舆情发现模型38文章源自书行天下-https://www.sxpdf.com/2014.html

3.3.2 基于Web意见挖掘的报道特征表示38文章源自书行天下-https://www.sxpdf.com/2014.html

3.4 来源加权的舆情分析模型43文章源自书行天下-https://www.sxpdf.com/2014.html

3.4.1 舆情来源量化分析指标43文章源自书行天下-https://www.sxpdf.com/2014.html

3.4.2 PageRank算法拓展44文章源自书行天下-https://www.sxpdf.com/2014.html

3.4.3 构建来源加权的舆情分析模型45文章源自书行天下-https://www.sxpdf.com/2014.html

3.5 热点舆情识别46文章源自书行天下-https://www.sxpdf.com/2014.html

3.5.1 话题热度特征描述46文章源自书行天下-https://www.sxpdf.com/2014.html

3.5.2 话题热度计算函数47文章源自书行天下-https://www.sxpdf.com/2014.html

3.6 实验及评估48文章源自书行天下-https://www.sxpdf.com/2014.html

3.6.1 网络新闻数据的抓取48文章源自书行天下-https://www.sxpdf.com/2014.html

3.6.2 中文分词及文本表示51文章源自书行天下-https://www.sxpdf.com/2014.html

3.6.3 模型改进效果分析52文章源自书行天下-https://www.sxpdf.com/2014.html

3.7 C5.0和BP神经网络结合的舆情预测模型53文章源自书行天下-https://www.sxpdf.com/2014.html

3.7.1 基于C5.0的意见分类53文章源自书行天下-https://www.sxpdf.com/2014.html

3.7.2 基于BP神经网络预测模型56文章源自书行天下-https://www.sxpdf.com/2014.html

3.7.3 实验及评估57文章源自书行天下-https://www.sxpdf.com/2014.html

3.8 小结60文章源自书行天下-https://www.sxpdf.com/2014.html

参考文献60文章源自书行天下-https://www.sxpdf.com/2014.html

第4章 Web内容挖掘应用案例2:文章源自书行天下-https://www.sxpdf.com/2014.html

基于语义的Web信息自动聚合系统的文章源自书行天下-https://www.sxpdf.com/2014.html

关键技术研究62文章源自书行天下-https://www.sxpdf.com/2014.html

4.1 信息聚合及相关技术62文章源自书行天下-https://www.sxpdf.com/2014.html

4.1.1 信息聚合62文章源自书行天下-https://www.sxpdf.com/2014.html

4.1.2 信息聚合问题研究现状63文章源自书行天下-https://www.sxpdf.com/2014.html

4.1.3 简易信息聚合技术RSS64文章源自书行天下-https://www.sxpdf.com/2014.html

4.1.4 数字签名算法Simhash65文章源自书行天下-https://www.sxpdf.com/2014.html

4.2 一种基于主题的Web信息自动聚合方案66文章源自书行天下-https://www.sxpdf.com/2014.html

4.2.1 方案架构66文章源自书行天下-https://www.sxpdf.com/2014.html

4.2.2 信息获取67文章源自书行天下-https://www.sxpdf.com/2014.html

4.2.3 信息预处理69文章源自书行天下-https://www.sxpdf.com/2014.html

4.2.4 按主题聚合72文章源自书行天下-https://www.sxpdf.com/2014.html

4.3 基于标点符号及标签相似度的正文抽取方法73文章源自书行天下-https://www.sxpdf.com/2014.html

4.3.1 网页类型及结构73文章源自书行天下-https://www.sxpdf.com/2014.html

4.3.2 常用网页正文抽取方法分析74文章源自书行天下-https://www.sxpdf.com/2014.html

4.3.3 基于标点分布的网页正文抽取算法74文章源自书行天下-https://www.sxpdf.com/2014.html

4.3.4 基于标签相似度的多正文网页抽取技术77文章源自书行天下-https://www.sxpdf.com/2014.html

4.3.5 算法设计及实验80文章源自书行天下-https://www.sxpdf.com/2014.html

4.4 基于潜在语义的Web信息聚合80文章源自书行天下-https://www.sxpdf.com/2014.html

4.4.1 概率主题模型与潜在语义分析模型81文章源自书行天下-https://www.sxpdf.com/2014.html

4.4.2 LDA模型84文章源自书行天下-https://www.sxpdf.com/2014.html

4.4.3 面向Web信息的LDA模型改进方法87文章源自书行天下-https://www.sxpdf.com/2014.html

4.4.4 实验结果分析91文章源自书行天下-https://www.sxpdf.com/2014.html

4.5 本章小结94文章源自书行天下-https://www.sxpdf.com/2014.html

参考文献94文章源自书行天下-https://www.sxpdf.com/2014.html

第5章 分布式多源电商数据挖掘96文章源自书行天下-https://www.sxpdf.com/2014.html

5.1 电子商务及电商数据分析96文章源自书行天下-https://www.sxpdf.com/2014.html

5.2 电商数据分析挖掘98文章源自书行天下-https://www.sxpdf.com/2014.html

5.2.1 引言98文章源自书行天下-https://www.sxpdf.com/2014.html

5.2.2 电商数据定义98文章源自书行天下-https://www.sxpdf.com/2014.html

5.2.3 电商数据采集101文章源自书行天下-https://www.sxpdf.com/2014.html

5.2.4 数据分析挖掘103文章源自书行天下-https://www.sxpdf.com/2014.html

5.3 多源电商数据融合114文章源自书行天下-https://www.sxpdf.com/2014.html

5.3.1 引言114文章源自书行天下-https://www.sxpdf.com/2014.html

5.3.2 数据融合114文章源自书行天下-https://www.sxpdf.com/2014.html

5.3.3 多源电商数据的特点115文章源自书行天下-https://www.sxpdf.com/2014.html

5.3.4 多数据源电商数据融合总体解决方案116文章源自书行天下-https://www.sxpdf.com/2014.html

5.3.5 多数据源电商数据融合方案117文章源自书行天下-https://www.sxpdf.com/2014.html

5.3.6 多数据源电商数据融合的具体实现119文章源自书行天下-https://www.sxpdf.com/2014.html

5.3.7 实验结果与分析120文章源自书行天下-https://www.sxpdf.com/2014.html

5.4 分布式电商数据分析挖掘系统121文章源自书行天下-https://www.sxpdf.com/2014.html

5.4.1 引言121文章源自书行天下-https://www.sxpdf.com/2014.html

5.4.2 基于Hadoop的分布式电商数据分析挖掘系统122文章源自书行天下-https://www.sxpdf.com/2014.html

5.4.3 基于 Hadoop平台的层次聚类124文章源自书行天下-https://www.sxpdf.com/2014.html

5.4.4 电商数据的层次聚类分析132文章源自书行天下-https://www.sxpdf.com/2014.html

参考文献136文章源自书行天下-https://www.sxpdf.com/2014.html

《Web数据分析关键技术及解决方案》_范春晓_北京邮电大学_PDF电子书 扫描版 下载

《Web数据分析关键技术及解决方案》_范春晓_北京邮电大学_PDF电子书 扫描版 下载

下载信息
下载地址
文章源自书行天下-https://www.sxpdf.com/2014.html
admin
  • 本文由 发表于 2022年9月27日00:00:11