基本上有四种类型的重复内容会被百度过滤掉
1.网站具有相同的网页
这些网页被认为是重复的以及网站中有相同的另一网站在互联网上也被视为SPAM。联盟网站以同样的外观和感觉其中包含相同的内容例如特别容易受到重复的内容过滤器。另一个例子是一个网站与入口网页。然而这些目标网页是相同的其他目标网页。一般而言入口网页的目的是用于垃圾邮件的搜索引擎以操纵搜索引擎结果。
2.抄袭内容
抄袭内容是内容从一个网站和包装使其看起来不同但在本质上它只不过是重复的网页。随着人气的博客在互联网上和联合这些博客越来越成为一个问题的搜索引擎。不仅博客论坛如此,基本大多数网站都是如此,新闻源网站则不在这一列!
3.电子商务产品说明
许多电子商务网站有使用制造商的说明的产品其中数百或数千的其他电子商务商店在同一个竞争激烈的市场上使用的是太多。 这重复的内容而难以发现仍然被视为SPAM。
4.发布的文章
如果你发布的文章得到很好的转载这是很好的对不对不一定所有的网站功能相同的文章。这种类型的重复的内容可棘手的因为尽管雅虎和MSN确定来源的原始文件并认为它最相关的搜索结果中其他搜索引擎像谷歌可能不会根据一些专家。 因此如何搜索引擎的重复内容过滤器的工作从本质上讲当一个搜索引擎机器人抓取的网站它的网页内容并存储的信息在其数据库。然后比较其结果的其他资料已在其数据库。这取决于几个因素如整体评分的相关网站然后确定哪些是重复的内容然后过滤掉的网页或网站SPAM。不幸的是如果您的网页是不是SPAM但有足够的类似内容他们仍然可能被视为SPAM。