您现在的位置是:安心SEO > 网站优化 > 竞价推广 > 竞价推广

Google是通过哪些方面来判定原创文章与伪原创

安心seo 2021-03-05 05:57:08 网站优化 人已围观

简介很多站长在做站群的时候生成大量的内容来填充网站,由于时间和精力的局限,绝大多数站长一般都会借助采集软件采集+伪原创,对于原创和伪原创Google是怎么判断的呢?其实Google对于

很多站长在做站群的时候生成大量的内容来填充网站,由于时间和精力的局限,绝大多数站长一般都会借助采集软件采集+伪原创,对于原创和伪原创Google是怎么判断的呢?其实Google对于伪原创的判别要比百度来的准的多,现在我们就来看下Google是通过哪几方面判定原创与伪原创的。

1.内容相似度
内容相似度是搜索引擎去重用的最多的算法,用的比较多的一种是TF/IDF算法,这个也是计算相关性的算法,TF-IDF的主要意思是说:如果某个词或短语在一篇文章中出现的频率高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。

TF词频(Term Frequency)指的是某一个给定的词语在该文件中出现的次数。

IDF反文档频率(Inverse Document Frequency)指的是:如果包含词条的文档越少,IDF越大,则说明词条具有很好的类别区分能力。

当一篇文章根据TF/IDF进行计算后,形成了一个多维的向量,这个向量就是这篇文章的内容特征向量,当两篇文章的特征向量趋于一致的时候,我们认为这两篇文章的内容接近,如果一致则说明是重复的。

关于TF/IDF与向量算法的详细请参看Google黑板报的数学之美12-余弦定理与新闻分类

2.数据指纹
当搜索引擎通过相似度把文章收集起来后,要判别一下是否是重复文章,经常用的就是数据指纹,数据指纹有很多种算法,常见的比如讲文章的标点符号提出,进行对比,你很难想象有两篇不同的文章,标点符合是一致的。还有对向量进行对比,也就是TF词频(关键词密度)等等来判断。

这时候你可以想象出,现在很多伪原创工具,只是把关键词进行了替换,你想关键词替换后,标点符号指纹是不变的,甚至连TF词频都不变。还有对文章进行段落的重拍,这个的确是打乱了标点符号,但是向量和词频问题依然存在。那么这样的伪原创工具有没有价值你就可想而知了。(可能对于百度还是有作用的)

3.代码噪音
前面说的这些,都是基于一个条件的,就是搜索引擎要知道文章是什么,因为每个网站的模板都不同,代码也不同,各种信息混合在一起,如果能找到正文就是搜索引擎第一要处理的。

一般Google都会通过对代码的布局和噪音比例进行区分,哪些是导航,哪些是正文,并可以对一些典型的代码进行忽略。那么我们在做模板的时候,就要注意了。这里有个纠结点,就是整页面降噪,方便搜索引擎进行正文的确认,但是正文区要适当的加燥,增加搜索引擎识别重复性的难度。


Google是通过哪些方面来判定原创文章与伪原创的相关文章

Google最近更新了排名计算方法
最近Google对其算法进行了改进,以前谷歌只考虑到网站中所有的平均排名,现在已经将网站链接中的最高排名计算在内。这种排名方法意味着对于用户的一些查询,在谷歌确定某一网站在搜索结果的平均位置时,只有排名最靠前的结果会被考虑到。 例如用户A在搜索某词时从网站A得到的链接排名在3,6和12,用户B在搜索同一词时,在网站A得到的链接排名为5和9。按照以往的计算...

没有组织原创内容能力,SEO优化该从何谈起
网站运营、设计美工、文案编辑,三者在SEO优化之中谁是主角?这问题问的够绝,让我无言以对了;这是进入领域以来首次答不出来的提问。谁都知道,不管是做自媒体营销还是网站排名优化都离不开原创内容,然而原创内容不但需要严谨的文字组织能力,同时还需要匹配完美的图片才能给予读者留下眷恋,得到读者喜爱之外还需要符合搜索引擎收录的准则才会达到预期想要的...

Google左侧排名对Google Adwords广告的影响
Google左侧排名对Google Adwords广告的影响 我们知道Google左侧自然排名和竞价广告(Google Adwords)是严格分离的,这样看来Google(谷歌)左侧的自然排名结果和右侧的Google(谷歌)竞价广告似乎是毫不相干的。但其实通过正规的搜索引擎优化方法提高Google左侧排名对提高Google右侧广告位置的排名有很大帮助的。为什么这么说?Google优化研究中心那我们就要来了解一下google右侧广告...

很赞哦! ()

根据您查看的Google是通过哪些方面来判定原创文章与伪原创猜你喜欢

站点信息

  • 建站时间:2019年05月06日
  • 网站名称:安心SEO
  • 服务内容:网站优化、店铺运营
  • 文章统计:1274 篇
  • 工具分享:5 篇
  • 您是本站第:2438920位客人!