| 网站首页 | 毕业设计中心 | 下载中心 | 图片中心 | 论坛 | 
您现在的位置: 毕业设计吧 >> 毕业设计中心 >> 毕业设计 >> java >> 正文 用户登录 新用户注册
[组图]基于用户访问模式的Web日志挖掘(c++)            【字体:
基于用户访问模式的Web日志挖掘(c++)
作者:admin    毕业设计来源:本站原创    点击数:    更新时间:2007-11-8    

摘  要:

Internet是一个全球的、分布的、动态的信息仓库,它存储着大量的数字化信息。随着因特网用

户的不断增加,为了改善它的系统设计和服务质量,对用户行为规律和网络结构的挖掘研究成了当务之急

。Web数据挖掘是一个新兴研究领域,它将传统的数据挖掘技术和理论应用于对WWW 资源进行挖掘。Web挖

掘包含Web内容挖掘、Web结构挖掘和Web访问记录挖掘。尽管Internet是一个半结构化的系统,很难对它

进行处理,但是Web服务器日志记录具有良好的结构,非常有利于数据挖掘的进行。
而Web日志挖掘作为Web挖掘的一个重要组成部分,有其独特的理论和实践意义。作为在众多数据挖掘方法

中的一种重要的技术,Web日志挖掘有着特殊的学术和应用意义。Web日志挖掘是从Web浏览信息中找到用

户偏爱网页和访问特征的有效方法同时它也对Web用户的访问提供了推荐。
在这篇论文中详细介绍了Web日志挖掘的整个流程, 它主要包含数据预处理和关联规则挖掘。数据预处理

在Web 日志挖掘过程中起着至关重要的作用,它包含数据清洗和过滤、用户识别和会话识别。文中深入探

讨了数据预处理环节的主要任务。关联规则挖掘是Web日志挖掘的重要技术,它发现出了Web日志记录之间

的隐含关系。生成关联规则的过程是在每个频繁大项集中逐一匹配满足一定支持度和置信度的规则。

Apriori算法可以产生大量的侯选集。在许多数据挖掘应用中,挖掘最大的频繁项集是关键。
这个日志分析系统是基于学校Web服务器日志的。通过对Web服务器日志文件的挖掘,一个数据挖掘系统就

建立了,它有助于网站的管理、网站设计的改善和网络的安全。最后提到了web日志挖掘的发展方向和工

作。


关键词: Web挖掘    Web访问记录挖掘    Web日志挖掘   数据预处理   关联规则
数据挖掘


目录

1  引言 1
1.1  课题研究背景和意义 1
1.2  本课题的研究现状分析 1
1.3  可行性分析 2
1.4  论文工作 3
1.5  论文的组织结构 3
2  数据挖掘 5
2.1  数据挖掘的来源和定义 5
2.2  数据挖掘的主要过程 6
2.3  数据挖掘的体系结构 6
2.4  数据挖掘的应用 7
3  Web日志挖掘 8
3.1  Web日志挖掘定义 8
3.2  Web日志挖掘相关术语 8
3.3  Web日志挖掘步骤 8
3.4  Web日志挖掘的特点及难点 9
3.5  Web挖掘的分类 10
3.5.1  Web内容挖掘 10
3.5.2  Web结构挖掘 10
3.5.3  Web使用挖掘 11
3.6  Web日志挖掘的应用 12
4  Web日志系统的原理 15
4.1  Web服务器记录日志的原理 15
4.2  Web日志的分析功能 15
5  数据预处理 17
5.1  数据预处理技术 17
5.2  数据净化与过滤 17
5.3  用户识别 18
5.4  会话识别 19
5.5  预处理模型 20
6  初步统计分析 21
6.1  用户统计分析 21
6.2  页面统计分析 22
7  关联规则挖掘 23
7.1  关联规则概述 23
7.2  关联规则的形式描述 24
7.3  关联规则挖掘的分类 24
7.4  关联规则挖掘的步骤 25
7.5  Apriori算法 25
7.6  挖掘过程 26
8  Web日志分析系统的模式分析与模式表达 28
8.1  Web日志系统的设计思路 28
8.2  用户功能模块 29
8.2.1  数据预处理模块 30
8.2.2  统计分析模块 32
8.2.3  关联规则分析模块 34
8.3  系统设计环境 35
8.4  实验与结论 35
总结与展望 38
致  谢 40
参 考 文 献 41






 


毕业设计录入:admin    责任编辑:admin 
  • 上一篇毕业设计:

  • 下一篇毕业设计:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    最新热点 最新推荐 相关毕业设计
    没有相关毕业设计
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)