拒绝互联网内容垃圾,不要为内容农场提供收入

前言

现在科技与互联网航行的时代,大多数上班族我猜起床的第一件事应该都是拿起手机并关闭闹钟。
然后看看一下现在几点?看看有没有什么新消息。

当我们在这生活中遇到问题的时候,
第一件想起的事情如今不像以前先问问长辈啊,或者朋友死党啊什么的。

也许更倾向与使用搜索引擎来直接找到答案,
然而在这茫茫信息海洋中要找到确切又真实的答案呢原本并不是这么简单。

全靠现在大数据的泛滥,结合所谓智能算法的加持。
让大多数人觉得自己找的答案就是对的,你永远看到你想看到的东西。


在这种时代,一个能一棒子打晕各类搜索引擎并且靠着无敌的SEO光环内容农场在就在这场乱世中诞生。

什么是内容农场?

内容农场就是一个将所有有用无用的信息统统收集起来的一个网页版全自动化内容收集器。你平时见到的那些什么每日头条、Buzzhand均属于内容农场的一种,当然其运作形式各有不同。

而内容垃圾通俗来说就是,经常看见Whatsapp转发或者微信某某公众号中的一些带有震撼标题的“假新闻”。这些都是无数内容海洋中的垃圾。

这里引用一下中文Wiki对内容农场其特征的定义:

以下是内容农场的常见特征:

  • 大量剽窃:大量盗用他人原创内容,包括但不限于如下方式:[7]
    • 有些内容农场会从其他网站盗用图文放入自己的网站,并移除原作者的名称及文章来源,甚至宣告为自行创作或在图片加上自己的水印。[8][9]
    • 台湾香港澳门的一些内容农场会以人工或自动化程序大量盗用中国大陆社群服务(如微信公众号)的文章。由于这些网络社区较为封闭,其中很多文章也未曾出现在公开网络,即使用搜索引擎搜索关键词也不易发现此种剽窃行为。[10]但是这些文章经常只做简单的自动化简转繁处理,因此可看到大量中国大陆惯用语及简体字转繁体字的错误。
    • 内容农场会用自动化程序大量查找国外网站的热门文章,经简单机器翻译后张贴在自家网站。另一些则是由写手在未经作者授权下翻译(或夹带改写)国外热门文章、图片,且隐蔽来源,令读者以为是原创。[11]
  • 二手转载:大量从其他内容农场转载文章。无论是否获得另一家内容农场的授权,由于未获原作者授权,因而仍属侵权行为。[12]
  • 垃圾内容:以人工或自动化程序堆砌大量关键词,以达营销目的。这些堆砌的内容多为罐头文字且不通顺、不连贯、与上下文无关。[13]例如Pixnet、Xuite、Udn等平台可看到大量的“假开箱文”博客。[14]
  • 劣质内容:不做内容管理[15],任由非专业写手挑选吸睛主题抄袭、改写、拼凑、杜撰文章[16],因而内容多无可靠来源且常有错误。
  • 免洗网站:在不同网域创建大量网站复本,这些复本可能使用相似的标题或图标,共享Google分析追踪ID或Adsense发布商ID,或者用相同的身份注册网域[17]。网站本身多半缺乏文章列表、网站地图、RSS、留言板等一般内容网站会提供的功能,也没有“关于我们”、“联系我们”等页面交代网站背景、营运有关的信息、联系方法等,一旦被发现或被屏蔽就立即抛弃。[18][19][20]
  • 社群导流:大量雇用“导流者”在社交网站转贴自产内容。[21][22]
  • 夸大标题:使用夸大耸动的标题或吸睛的图片引诱读者点阅[23][24],但与内容关系性甚低,因而常被称作“骗点阅”。但由于读者已逐渐对夸大标题反感,此种标题操作手法已逐渐减少[21]
  • 匿名作者:作者通常全为匿名或免洗网名(与作者的真实姓名或常用笔名、网名无关),也缺乏作者的个人信息。[25]
  • 广告营销:夹杂大量广告或营销内容,甚至有虚假宣传。

也许又有人要说了,这些网站收集了大量的内容。不管有的没有第一时间能在搜索引擎找到它,这不香吗?

“真正相关的资源的制造者得到较少的现金报酬(因为点阅率较低),而垃圾的制造者得到较多现金。”

海洋中的垃圾所带来的危害不仅仅是美观问题,更是破坏大自然导致无数生物死亡的元凶。这便是污染。

而内容海洋中的垃圾大同小异,垃圾制造者们为了自己的利益将自己的SEO打造成能够只手遮天,让搜索引擎们对其爱不释手。

正如少数派对头条新闻的描述:“ 在 Google 等搜索引擎看来,每日头条的文章均属原创,而且量大管饱,精品频出,不排第一简直对不起作者。”

真正的原创作者得不到相应的回报,大部分流量实际上均被垃圾制造者给截获。

上图来自 - 少数派

这行为其实可以说就是营销号,只不过其手法更为高明。

我们有什么可以做?

透过浏览器扩展进行过滤。

为浏览器安装搜索引擎过滤扩展是一个好选择。

例如uBlacklist浏览器扩展,一个能够在搜索过程中减少你看到内容农场的几率的浏览器扩展,仅对Google、Bing、DuckDuckGo、Ecosia、Startpage搜索引擎有效。百度我就不介绍了,就算有过滤也会窒息。

配合上GitHub上的“中文搜索结果黑名单”项目食用效果更佳。

效果图:

可以看见连图片搜索都可以过滤掉。

实在想看也可以点显示查看,带有红色底色的便是隐藏掉的搜索结果。(果不其然含有kknews

 

安装AdGuard过滤扩展。

AdGuard可谓是一个强大的简易版内容筛选器,可以帮你过滤一些已知且存在威胁或垃圾广告剽窃隐私的网站域名。

安装AdGuard浏览器扩展,将不需要的网站或网站中的某个元素直接拦截。

配合GitHub上的anti-AD项目食用更加

扩展界面:

 

拦截元素的效果图:

 

ADGuardHome DNS过滤服务器

ADGuardHome也是AdGuard的产品,完全免费。适用于Windows/Linux服务器,Openwrt路由器。

如果家里有搭建服务器或者使用Openwrt路由器不妨可以尝试一下。

功能与AdGuard扩展相当,更进一步可以全面接管家里所有设备的DNS,全面过滤广告、保护隐私及屏蔽危险网站。

如果设置得当,可以杜绝家中所有设备上网中遇到的任何Analytics脚本,直接断掉广告投放人的财路(不是)

安装完后将路由器DNS修改为ADGuardHome服务器的IP即可。

原理也很简单粗暴,对照指定列表反馈DNS。遇到需要筛选的域名则直接反馈NXDOMAIN直接丑拒

管理界面:

 

同样支援AdGuard的anit-AD项目的规则

点赞

发表评论

电子邮件地址不会被公开。必填项已用 * 标注