网络读者访问流量统计分析系统的研究与实现

时间:2020-11-01 11:14:04 经济管理毕业论文 我要投稿

网络读者访问流量统计分析系统的研究与实现

1 前言

网络读者访问流量统计分析系统的研究与实现

    随着数字图书馆的建设,图书馆馆藏资源数字化的快速发展,图书馆以网站的形式向读者提供信息资源的服务越来越多,这些服务有图书馆门户、馆藏资源检索、光盘数据镜像、电子书刊、网络数据库、自建数据库和虚拟参考咨询等等,为了揭示网络环境下读者对这些信息资源的浏览情况、阅读情况以及访问变化趋势,准确了解读者需求分布和需求增长等情况,从而对网络读者的信息资源寻求行为模式进行研究,以便能为读者提供更好的服务,图书馆须了解以下几个问题:网络读者是如何访问网站的,这些信息资源是如何被访问使用的,如何评价这些信息资源的利用情况等等。为了回答这些问题,我们通过本系统对图书馆多个信息资源发布网站进行读者访问流量统计、热点网页访问统计、读者访问来源统计析及各项专题访问统计等研究,并根据统计结果反映的读者需求分布和需求增长等数据对信启、资源网站的架构、界面的设计、发布的内容加以修改和调整,以满足读者需求为目标,吸引了读者的目光,提高了图书馆信息资源建设和服务水平。
    本系统通过对信息资源的访问记录进行统计分析来了解读者的信息需求,这种量化的方法具有客观和经济的优点,还可配合调查研究法得到更实际的结果,并以此探讨网络信息计量学在对信息资源使用成效进行评估的应用,包括所遭遇的困难及应对之道,以期为信息资源的访问评估与改进寻找可行的方法

      2 系统的实现

    访问量的多少是衡量网站是否成功的重要标准,但对于图书馆网站是远远不够的,图书馆需要获取完整的读者访问流量统计数据,来对图书馆信息资源的使用情况进行分析,网络信息计量学方法是目前网络界普遍采用的网站绩效评估计量法,被认为是可以用科学的方法检验网站访问数据的一种工具。它的目的包括了解网络读者的行为、确定网站是否吸引适当的读者来访、评定网站建设策略是否得当。其实施步骤可分为三个阶段:
    (1)记录网站的访问数据;
    (2)分析记录数据;
    (3)为网站建设策略的改进提供依据。
    2.1 系统原理
    由于网络发布站点和数据库本身具备了访问计量功能,各自的信息资源收藏状况便于人们掌握,并且能自动记录读者访问的登录情况,如登录名、登录时间、浏览文件、读者的来源地址等,这些数据资料能够准确反映读者访问信息和来源分布等情况,所以依据图书馆网络读者访问统计的工作内容,制定相应的分析指标,并收集网络读者访问图书馆信息资源发布站点形成的日志文件,然后利用日志统计工作软件定时对日志文件进行处理,得到统计数据,并动态生成各种表达形式的能满足图书馆各项统计分析工作的报表。最后把生成的分析报表导入到发布数据库中发布出去。
    图书馆各个网络资源站点建设人员可通过浏览网络读者访问流量统计分析报告,分析和了解读者的访问需求,从而做好网络信息资源的建设工作。
    读者行为分析研究则可通过对分析报告进行质化研究,并结合一般调查法、咨询研究法对读者的信息寻求行为进行研究。
    本系统还可利用统计分析的结果来对系统自身工作进行评估和调整。
    2.2 分析指标
    传统图书馆的分析指标和计量方法,虽然和数字化图书馆有很多不同,但使用的目的及计量的准则并没有太大实质性差异[4]。
    参考传统图书馆的分析指标以及国内外类似的研究结果选定了下列10个分析指标:
    (1)读者到访人数和潜在读者人数的百分比;
    (2)到访读者表现了阅读的兴趣的百分比(采取明显的阅读行动);
    (3)可能的读者转为经常的读者的百分比(经常阅读、下载资料);
    (4)读者的持续度(重复到访读者);
    (5)读者的忠诚度(网页浏览次数、再度到访的次数及时间长度);
    (6)读者停止阅读行为的百分比(阅读行为半途中止);
    (7)读者耗损率(现有读者中停止阅读行为者的百分比);
    (8)读者动摇率(耗损的读者/到访读者的总数);
    (9)读者最近到访时间(据上次到访的间隔时间);
    (10)读者到访频率(多久到访一次)。
    就此参数,我们可以从一个客观的角度来观察和评估图书馆网络读者访问情况。
    2.3 系统框图
    网络读者流量统计分析系统功能框图
    2.4 工作方法
    本系统工作方法主要是采集网络读者访问过程日志进行量化分析法,它的优缺点见表1。
      读者访问过程日志分析法优缺点
    量化分析法重视量的分析,本系统通过对访问过程日志以量的方法加以统计分析,首先根据为了研究读者需求分布和需求增长情况这一目的将研究内容归类成若干分析单元,接着将分析单元以数量的方式加以表达,进而以此为解释读者信息寻求行为的依据。
    2.5 技术实现
    (1)系统结构
    本系统是以浏览器/服务器/数据库体系结构作为基本架构,通过ASP方式实现交互式、动态的读者访问日志统计分析系统。系统结构框架如图2所示:
   读者访问日志统计分析系统结构框图
    (2)系统组成模块
    本系统有六个模块组成:访问日志入库、访问流量分析、被访页面分析、来访读者分析和统计分析图表。
    (3)系统运行环境与开发平台
    本系统运行环境和开发平台如表2。

    读者访问日志统计分析系统模块
      表2 系统运行环境及开发平台一览表
软件类别          软件名称
数据库         SQL Server 2000+FastTrends Database