文章相似度,又称内容相似度,指的是文字和语句在不同文章之间的相同或相似程度。当两篇文章之间有更多共同点时,它们的相似度也会更高。
文章相似度可分为狭义和广义。狭义指在同一个网站内两篇文章之间具有较高的相似性;而广义则指你网站内一篇与互联网中某篇其他文章之间存在较高的相似性。
有两种情况会导致出现较高的文本相似度:
一是词汇限制。一个人使用词汇是有限制因素存在,并且思维方式往往也容易导致他们写出类别接近、表达方式类比以及具备更多共通点之文本。
二是涉及到了虚假原创和盗版等问题。段文杰极力反对大家使用虚假原创工具就因为其中一重要问题就体现其中。
那么,过高程度上提卫了斯天来说经以上?
首先,“过于类别化”的文章将越难被纳入搜索引擎索引范围中甚至根本进入不了索引范围;
其次,“过于接近”的设计将拖低排名水准甚至从排名列表中消失。
而“过度的相似性”还会负面影响信誉。毕竟,对于搜索引擎和用户来说,这样的文章简直就是垃圾作品啊!