基于SVM的P2P流量的识别系统

时间:2021-04-22 12:35:47 开题报告 我要投稿

基于SVM的P2P流量的识别系统

    一、 对指导教师下达的课题任务的学习与理解
   Ø   P2P流量识别的意义
   自1999年起,随着共享工具Napster[1]的出现,Peer-to-Peer(P2P)技术作为一种全新的互联网应用模式开始风靡全球。P2P是指在网络上起相同作用的对等用户之间进行相互通信的技术。目前P2P应用技术主要有P2P文件共享、P2P即时通信、P2P协同计算、P2P流媒体传输技术。P2P利用网络互联特性,为大数据交换提供了一种充分使用网络资源的方法。
      但P2P的广泛应用一方面在提高网络资源利用率的同时,另一方面却因过量占用带宽资源而饱受争议。随着网络的发展,近几年来P2P的应用已占ISP业务总量的60%-80%,严重影响了正常的网络业务,甚至引起网络拥塞。
     其次,通过P2P资源共享获得的软件和其他资源,由于缺少必要的安全机制而有可能成为攻击者传播虫、病毒和恶意代码的工具。
因此,如何准确、快速、有效地识别和控制P2P流量是一个急需解决的问题。
    Ø   对课题任务的初步理解
本课题将分析并总结P2P流量的`统计特征,研究统计特征与可以描述这些特征的流量原始信息之间的关系。在此基础上,为每个P2P流量统计特性建立基于时间的滑动窗口的量化模型,从而获取各个P2P流量统计特性的模型参数。同时,运用SVM技术在流量识别中的阶段性研究结果,对SVM技术进行优化,分析P2P流量统计特性之间的关系,研究统计特性与SVM技术的融合点,将二者应用到P2P流量识别技术中,建立基于SVM的P2P流量识别与分类模型,并通过MFC设计完成相应的演示界面。
     二、阅读文献资料进行调研的综述
     2.1 传统的P2P流量检测技术
    目前,针对P2P的流量检测技术大致有以下几种:
     Ø  基于固定端口的P2P识别
     端口识别法[2]是根据TCP数据包或UDP数据包首部的源端口号或目的端口号识别一些常见网络应用的流量,如HTTP、SMTP、Telnet等。在P2P应用兴起的早期,大多数应用使用的都是固定端口,特征端口识别技术采用固定的服务端口的特点来识别第一代P2P系统。现有P2P系统所采用的常用服务端口[3]如表 2-1所示。
     在这种情况下,对其流量的识别方式与识别普通应用分组的方式完全相同。在需要监测的网络中被动收集分组,然后检查分组的运输层首部信息,如果端口号与某些特定的端口号匹配,则说明该分组即为P2P流量分组,可以按照预设的动作对其进行处理。

请继续阅读相关推荐:毕业论文