迅雷(XUNLEI)的工作原理揭密

2023-02-16 23:34 作者: 来源: 本站 浏览: 我要评论迅雷(XUNLEI)的工作原理揭密已关闭评论 字号:

摘要: 我们的福雷要做同迅雷差不多的事读下文时可以暂将福字替换成迅。 谈了这么多还没有谈到一点技术性的内容线; 福雷做法的关键在哪里在于当用户要下载一个资源时如何去找在其它服务器上的完全相同的资源 回顾一下普通搜索引擎的做法用Crawler没日没夜的下载网页然后存储索...

我们的福雷要做同迅雷差不多的事读下文时可以暂将福字替换成迅。

谈了这么多还没有谈到一点技术性的内容线;

福雷做法的关键在哪里在于当用户要下载一个资源时如何去找在其它服务器上的完全相同的资源

回顾一下普通搜索引擎的做法用Crawler没日没夜的下载网页然后存储索引倒排表是很常用的做法用户搜索时它会根据索引找到符合的页面排序后在本地服务器截取结果片段返回到客户端。PDF/WORD等文档的搜索也差不多它们有个共同的特点是文件不太大而且基本不太涉及版权问题因而所有内容在自己服务器上都有快照。

但对于视频/音频等较大的文件动则几十兆上百兆到G级如果按上述方式处理则会有一些问题首先要爬完一个资源所消耗的代价太大其次即使下来了也没有太大的用处你不能直接供用户下载这可能会遭遇诉讼看看百度音乐搜索以前搜出来的结果直接指向资源位置现在还非得出一个对线c;将位置明示生怕被人抓住把柄个人认为完全没有必要也许是为了应付部分什么也不懂的官员却让使用者感到不便。

假如Crawler在工作的过程中标识出了所有视频文件的链接并交于特殊的处理程序处理接下来的问题如何存储和索引这些信息刚才已经说了要下载整个视频文件并不现实而有一些内容是很容易得到的资源链接文件名/文件类型扩展名大小存储这些信息是简单且必要的

3、下载部分内容计划摘要听起来线c;又是一个中庸的想法我现在越来越喜欢中庸了没错就是它但下载哪部分内容呢我们可以根据文件大小利用一些简单的散列算法生成散列值根据这些值在文件的不同部分读取一定量的数据总数据量控制在K级别同网页差不多大小然后将这些数据拼装成整体存储并生成其摘要。这种方法是可行的。首先它的下载量不大其次根据该方法判文件的等价性同基准方法根据所有数据算摘要比准确率几乎相同证明过程我就不说了实践才是最好的标谁

利用摘要判断文件等价性的方法有一个好处是可以忽略一些次要信息比如文件名创建时间修改时间等但文件类型长度和摘要则是需要考虑的成份。也就是说如果这三者一样则我们认为文件是一样的。

存储完上述信息至于如何索引考虑的因素可能会多一些最简单的就以摘要索引就行这样等价资源会被聚类到一起但作为一个资源聚集点资源的描述信息也是要考虑进去的等下我们会专门谈到这个问题。

上面已经讲完了主要内容我们看看当我们利用福雷下载时它做了一些什么事情。

b)福雷客户端将该连接发到福雷服务器同时客户端也不闲着它会去该链接获取文件的基本信息大小等并按上面所述的算法下载部分内容并计算摘要。

c)服务端根据链接找自己服务器看是否已被系统Crawler处理过如果已被处理过很简单通过其摘要找到所有含有该资源的服务器链接发到客户端。

d)客户端为了保险起见会对比一下服务端的摘要和自己算出的摘要避免文件在近期发生变动如果一至OK可以从服务端发过来的多服务器下载了。

e)如果不一样的线c;客户端需将该信息发到服务端告诉它文件有变服务端会去更新该文件的相关信息包括等价文件链接这个过程可以短也可能长由此同时客户端会通过原始链接开始下载服务端更新后会陆续将确认后的链接发到客户端客户端从而可又可从新增的链接下载。

f)接c)如果服务端未找到原始链接呢是不是意味着服务端就没有其它链接呢并不一定此时客户端将信息及摘要发到服务端服务端可根据摘要数据去搜索如果搜索到结果则将这些结果链接发到客户端并将该原始链接加入到服务器索引中从而同样实现多服务器下载如果没搜索到则只能从原始链接下载资源了。

g)在上一步中如果服务器没找到原始链接也没找到等价文件服务端会存储该并索引该链接信息。

h)在上述过程中对于福雷服务器没有的原始链接用户可以在门户去发布该资源此时用户就可以填入一些该资源的描述信息这一步要都由公司人员去做几乎是不可能的成千上万的网民这样做门户内容就丰富了不仅有视频还有视频的描述信息等其它一些元数据前面提到索引方式如果加上这部分内容的索引又进一步实现在基于关键字的搜索这本身又有点WEB2.0的概念由网友自发来聚集和编辑视频信息。

对于这类链接其实相当于一个映射而已比如在上一节的h)步骤中用户发布了一些资源这个资源在福雷服务器中找到了一系列等价资源这个搜索等价资源的过程是需要消耗服务器资源的这个资源是指CPU/内存等机器资源这样可以专为该资源生成一个URL该URL就对应上述链接信息的索引以及用户输入的视频元数据信息这样用户可以很容易通过关键字搜到该视频同时使用这类URL下载时没有一个搜索等价资源的过程直接就可以返回一系列服务器链接到客户端直接实现多服务器下载。

说了这么多本来应该画个框架图流程图什么的但愿说清楚了有什么好的想法可以多交流。

迅雷(XUNLEI)如何搜索一个资源的多服务器版本?——-实现一个类似迅雷的系统“福雷(FULEI)”摘要:当你用迅雷下载东西时,无论你是从迅雷资源页点下载,还是从其它普通页面点下载,你会发现它并不只用你的原始链接下载,它还搜索了一些其它服务器的相同资源,比起网络蚂蚁/网际快车之类的下载工具(这些都是纯客户端工具,而迅雷则有着服务器支持),大大增加成功下载的可能性和下载的速度,

收集互联网上的服务器的下载地址,很多软件都会这样做.如网际快车等,但网际快车不会收集在下载地址里包涵了用户名和

的程序员可不理你,一样收集,然后供其它人使用.说白了,就是我们站长最恨的盗链.

专用链接不用我去解释相信大家都明白(别告诉我你不懂~汗),现在就链接的编码

下载快车、旋风专用地址的软件啦。 首先要明白Base64编码是怎么一回事,不懂的先去百度一下再回来。 Base64编码是一种加

算法,Email的原始信息就是由Base64编码构成的。 而这些专用链接都是通过Base64编码加工转换而成的。

,能够将网络上存在的服务器和计算机资源进行有效的整合”。实际上还是传统的下载技术,只不过这种下载技术综合应用HTTP、FTP传输协议将文件的文件进行分块、分片下载;而且还可以将文件等分,然后去不同地址下载;并且在这些传统下载的过程中穿插P2P技术,也就是一种新的盗链技术。总体来说,

是一款新型的基于P2SP技术的下载软件,这里的S指的是SERVER,就是在P2P的基础上增加了对SERVER的资源下载,也就是说P2SP是一种能够同时从多个服务器和多个节点进行下载的技术,因此

的下载速度会比只能从服务器下载(P2S)或只能从节点下载(P2P)的软件速度要更快。简单说一下上面的东西,都说BT伤硬盘,其实从上面可以看出现在的

之前首先你得具备BitTorrent(简称BT)协议的一些基本知识。BT协议其实是一个协议簇,BEP-3 是其基本协议内容,其他的大部分都是围绕这个来进行扩展或补充,区别于点对点(point-to-point),它是用户群对用户群(peer-to-peer)要想从BT网络中下载一个资源,必须具备以下部分: 种子文件(也就是我们常说的种子,后缀是 .torrent,本质上是一个由be…

(续)—为何遭封杀及如何应对 一文预告的成文,由于最近较忙,很难有时间将自己的想法很好的整理出来,难免题目也就前后不一致了。这编文章基本不涉及技术,权当作是我对搜索领域的一编随笔。不难想象,类似

的企业在开始时比较容易起来,但一旦做大,则难免树大招风,被各种有利害关系的人拿来说事。其中最大的莫过到版权问题的纠葛,下面是一些场景:1、对

不及掩耳盗铃之势如破竹。P2SP的道理不复杂,就是指:如果多个服务器上有某个相同的文件,当某个用户下载其中一个服务器上的这一文件时,

比较流氓,在用户没有得到任何提示毫不知情的情况下,偷偷上传用户的本地文件,在所有网络流量的统计中…

是一个多协议的的P2SP下载管理器,除了支持基本的HTTP、FTP下载,还支持同一个资源的多种P2P协议下载,例如BT和电驴协议。当然,最大的特点是,还是资源服务器S,这个S上保存了很多网络资源的分布下载点,因此,在客户端网络带宽的允许下,下载某个比较热点的资源时,会达到网络资源利用最大化。 在P2P出来之前,通常使用的是H

,就要了解到什么是P2SP。我想大多数人对P2P并不陌生,P2P的下载概念,简单点说,就是下载不再象传统方式那样只能依赖服务器,内容的传递可以在网络上的各个终端机器中进行。P2SP除了包含P2P以外,P2SP的“S

应如何调整技术和商业模式来获取更多的支持呢?本文将主要从技术视角来讨论相关问题。

的电脑的资料,在系统背后,启动两个线程,Thunder.exe和Issue.exe,共享其硬盘上的文件,让其它人下载(这是我今天才意识到的,原来一直蒙在鼓里) 总之,

采用的是P2SP机制,简言之,就是BT的升级,像BT一样,共享用户硬盘上的文件供他人下载。

今天,老逛推荐一款可边下边播磁力链接下载器:WebTorrent,该开源项目是第一个运行在浏览器的 Torrent 客户端,截止目前在 GitHub 上已经获得近 25k 的 Star。该…

记录下载地址并将其存在自己的服务器,以后下载同样的资源时自动从所有可用的下载地址连接,保证用户在下载链接甚至是死链接的情况下,也可以从镜像服务器下载成功。站在网站的角度,会导致网站的点击率降低,访问流量减少。

解决死链问题(死链是服务器地址发生变化,无法找到当前地址包括:协议死链和内容

最绝的我觉得还是多资源下载!多资源下载是什么?就是多个下载地址,多个下载地址从那来的?我的想法是

记住了下载文件的大小,把这个相同大小的资源叫做同一资源,每当有不同的人通过

BitTorrent协议。BT全名为BitTorrent,是一个p2p软件,你在下载download的同时,也在为其他用户提供上传upload,因为大家是“互相帮助”,所以不会随着用户数的增加而降低下载速度。 下面是一般用ftp,http等分享流程:下面是用BitTorrent分

有关于微软的IWebBrowser2::Navigate2/Navigate方法

迅雷会员25天/4.5元,独享1天0.7元,请点本站上边链接购买

2023年02月16日 23:33:53

 

随机账号密码机器码:
20L JS06gx956
44DZ964ukC79n RV65dv761Lsjm1
97WI138kkU GI83bn834Kja
41LP WO71vg069T
12LT57 TH00rd82
84BZ120rcP1 HN85o
03FD393pd OO94di428
44R VJ02pu820Sbc
67BR061xaO06 CN56
24TW56 SG73
70QF286lrE YO19cu549Mpfs
33DK542mkS32t FJ80fp109Ppn

Comments are closed.

会员登录关闭

记住我 忘记密码

注册会员关闭

小提示: 您的密码会通过填写的"电子邮箱"发送给您.