传百度服务器硬盘损坏致收录大幅下降
22日下午,vermin一行20余人受广大站长委托,特意前往百度总部探访近日来百度收录减少的原因。 百度公关小组的张工程师热情接待并介绍了此次百度收录大幅度减少的原因。
会谈中,vermin对百度数据中心表示出浓厚的兴趣,张工程师对此作了重点介绍。
张工程师说,百度的数据中心主要有三大核心元素:baidu文件系统(BFS);baidu索引表(souyin Table:是baidu一种对于半结构化数据进行分布存储与访问的接口或服务);MapBeduce算法(它是baidu开发的C++编程工具,用于大于1TB数据的大规模数据集并行运算)。
而对索引数据影响最大的就是baidu文件系统。baidu文件系统处于这三个元素的最底层,它负责许多服务器、机器的数据存储工作。很多baidu文件系统的体积都异常庞大,有好几个petabyte规模(1 petabyte相当于1百万gigabytes)。
由于公司的服务器硬件设施跟不上baidu全球化战略的发展,已有200多个服务器集群上的baidu文件系统遭到损坏,其中很多集群内的上千台服务器使用的磁盘遭遇物理损坏,数据大量丢失,所以造成了对中文站的收录反反复复或是K站的现象。
谈到此次事件对中文站长的影响,张冠西工程师表达出了很大的歉意。
对于百度此次服务器故障,vermin询问张工程师是否需要广大站长们的捐助时,张工程师摇了摇头道:“你们少做几个垃圾站我们就省心了。再说,我们的竞价排名盈利模式相当强大,虽然坏了些硬盘,公司多做几个竞价客户就可以了。”
转载保留链接!网址:https://80920140.com/post/699.html
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源; 2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任; 3.作者投稿可能会经我们编辑修改或补充。