读者网不得不说的事情–网络安全和隐身衣
故事背景
读者网建立于零七年的四月,提供新语丝的文章检索。网站的程序先是在新语丝论坛里小范围公开测试,基本没有问题之后便正式发布。发布之前自然询问了方舟子的意见,被告知“不改动文章内容”;后来方舟子对“改动文章内容”有类似于武汉法院“国际期刊”的搞笑演绎,则是后话。当时考虑到这个网站完全是为新语丝服务的,网站若被“国安”盯梢的话,我是要被请去喝茶的,心想就让新语丝出钱并管理“xys-reader.org”这个域名吧,于是给方舟子发信让他去申请域名,可是他置之不理,无奈,我只有自己掏钱搞定。
网站发布之时,我心里也是七上八下、忐忑不安的,因为新语丝在国内树敌众多,又被国家安全部门屏蔽,我这样建立一个网站提供新语丝的文章阅读,很是担心受到报复打击。正因为如此,网站上没有保留新语丝的任何文章,用户在读者网上打开连接时,是直接跳到相应的镜像站点去阅读文章的。这虽然是掩耳盗铃之举,但这么做,有如下两点好处:
一)新语丝的文章不在我的网站上,文章若有问题的话,我的“责任”也会相应少一些。
二)GFW对用户打开的新语丝的文章进行敏感词汇过滤时,即使出现链接短时间内不能访问的现象,GFW记录的相关信息也都和“xys-reader.org”无关。简单的说,这样可以减少读者网被“盯梢”的机会。
读者网的文章更新是非常及时地;网站通过cron每小时两次派出“机器人”登陆新语丝主站,察看文章是否更新,随时更新数据库。可是新语丝镜像站点的更新总是相对较晚,有的站点一两天之后才更新文章,结果往往读者网上有了最新的文章的标题和链接,但相应的镜像网站上的文章却是空的。网站建立了一段时间后,建站之初的新鲜和兴奋已经没有了,我需要升级程序来找点乐趣了。于是乎,下面的问题成了play programming的目标:
“避开敏感词汇过滤,直接提供新语丝的文章。”
网络的明文传输和不安全性
有人会问,为什么网络上传输的文字可以被过滤进而链接被屏蔽呢?
实际上,网络上传输的数据大都是明文的,就好比邮递员送信时信封都是敞开的一样,看不看信的内容完全取决于邮递员。这种不安全性是显而易见的,比如你在网吧上网,如果网吧的网管愿意的话,他可以用程序察看你的所有的聊天信息、浏览的网页内容还有你EMAIL中的情书。如果你是“偷”邻居家的无线信号悄悄上网的话,那么你在网络上的悄悄话就有可能被邻居“偷听”去。正是考虑到网络的这种不安全性,MSN等在线聊天的软件都提示:
“不要在聊天时输入信用卡帐号等信息。”
网络的如此不安全,那么如何才能保护个人隐私等重要信息呢?
最直接而有效的解决方案是在网络传输时启用安全加密协议;经过加密的信息即使被窃听了,窃听者也是一无所获。加密方法的本身下面会提,这里不多说。网络的安全加密协议是非常必要的,几乎所有的在线支付系统的网页都是以https开头对用户数据的传输进行加密,反之,提醒大家绝对不要在一个“http”开头的网页上填写信用卡信息!
网页的加密传输虽然会减缓慢网络速度,但是很有用处。比如你在国内阅读GMAIL的信件时可能会被莫名其妙的屏蔽网络,这个时候,只要把地址http://www.gmail.com/xxxxx 手动替换为 https://www.gmail.com/xxxxx 就可以了。(据说有快捷键切换。谁来告诉我?)
对聊天通信加密的软件也是有的,比如Skype,它采用256位的AES加密协议对语音通话和聊天内容进行加密[1]。因为这种加密方式可以轻松穿透GFW,海外一些被屏蔽的网站甚至用Skype来发布新闻。但是据说中国国内TOM版的Skype是做了手脚的,所以在使用TOM版的Skype聊天时可不要太反动哟。从逻辑上来讲,如果你的聊天对象是用的是TOM般的Skype,你本身也是不安全的。
简单的介绍了网络的安全常识,大家自然会想,把http://www.xys-reader.org替换为https://www.xys-reader.org 不就完事了吗? 阁下有所不知,使用https加密协议是要另外掏银子的。并且“共享服务器”这种商业服务模式一般不提供HTTPS协议的。 逼上梁山,我只有自己来写在线加密程序了,接下来就让“隐身衣”登场!
欲知“隐身衣”是何模样? 且听下回慢慢道来。
[1] http://support.skype.com/en_US/faq/FA145/What-type-...
相关文章预告:
- 读者网与开源程序
- 读者网与Google

alpha000001 said,
12月 16, 2008 @ 11:58 pm
你一提,才注意到,使用的网上银行还真是https开头的。
gmail也在“设置”里把https开启了,使用段时间看看速度怎么样。(不过我的邮件应该没有什么反动的!)
听说不止是tom版的skype有问题,好像国内的im软件都存在这样的事,以前xys上不还登过qq的“过滤”的词库吗。
可能也是因为skype原身是在国外吧,要不是国外报了,一时半会儿还是捅不出来!(有点儿像“三鹿”)
vps said,
12月 17, 2008 @ 1:43 am
请问日本的VPS哪家的plan比较好,50G以上的空间,5000-10000日元都可以。
xfliu said,
12月 17, 2008 @ 1:50 am
当初建立读者网时,比较了一下,sakura在当时是很优惠的。它现在提供的服务似乎也满足你的要求:
http://server.sakura.ad.jp/dedicated/index.html
Yush said,
12月 17, 2008 @ 2:24 am
说新语丝被屏蔽原因是“新语丝在国内树敌众多”没错,但除很早之前的法0功外,跟“国家安全部门”、“敏感词汇过滤”无关,而是跟具体的人和事有关。例如,新语丝主站被屏蔽至今是因纳米水李正孝借其国务院新闻办网络局的同学姚非公报私仇;教育网镜像关闭是院士候选人陈家骅的功绩。见:http://www.xys.org/forum/messages/60000/68610.html
...(All)
曾子后 said,
12月 17, 2008 @ 2:34 am
xfliu辛苦了,,赞一个。。
ironman said,
12月 17, 2008 @ 7:24 am
学习了,敬候下文。
faif said,
12月 17, 2008 @ 7:39 am
>>预知“隐身衣”是何模样,且听下回分解。
关键时候打住了,吊人胃口呀。
疯和尚 said,
12月 17, 2008 @ 10:00 am
YUSH的辩解不免让人往歪了想……
金陵客人 said,
12月 17, 2008 @ 10:23 am
一点不歪,新语丝早已“告别革命”。还有政治正确的支持者如司马。
vps said,
12月 17, 2008 @ 11:08 am
谢了。不过sakura的网站好像被GFW了。
疯和尚 said,
12月 17, 2008 @ 12:48 pm
聚异堂改了忠义堂,呵呵
疯和尚 said,
12月 17, 2008 @ 12:50 pm
xfliu:
核心技术问题还是不要讲得太透,不然某些小人拿去贪天功为己有,或者干脆交给负责网络封锁的部门做针对性处理就不好玩了。
北极星 said,
12月 17, 2008 @ 1:05 pm
我想,如果GFW发现那个博文或其中留贴有敏感词汇,博文就会被封。如果经常被封,网站就有可能被封。”隐身衣”的作用就是当博文或者留贴有敏感词汇,GFW察觉不到,这是xfliu的解决方法吧。
但如果德赛网人气上去了,即使没有敏感词汇,也难逃被封的可能。GFW还是比不上人眼的。
xfliu said,
12月 17, 2008 @ 1:09 pm
“隐身衣”是用来保护“新语丝读者网”的。德赛公园洁身自好,不必使用的:-)
北极星 said,
12月 17, 2008 @ 1:23 pm
奥,是这样。难道已经成为历史了?就是那个百花园吗?
那么如果这里德赛公园有博文或者留贴有敏感词汇怎么办呢?
jjs said,
12月 17, 2008 @ 6:04 pm
辛苦了,谢谢!
Y.X. said,
12月 18, 2008 @ 6:45 am
我是非常期待这个系列的文章的.
疯和尚不要担心这一点, 我相信基于VPN的技术对于防火墙来说是 fundamentally 的不能封杀.
另外, 北极星你说的是对的, 但是 xys.org 本来连域名都是关键词的, 所以根本无法从国内发起一个连接(不管文章是不是有敏感词). 隐身衣技术我也不知道怎么回事, 但是我猜想, 想必是一个很聪明的加密和境外代理技术的组合.
期待这个系列的文章. 利国利民.
Ben said,
12月 19, 2008 @ 2:38 am
“隐身衣”没有那么复杂,只是在服务器端乱序,客户端收到乱序的字符后,用javascrip排顺过来而已。在传输过程中监测软件所看到的是乱序的字符,没有犯禁词语,就会失去警惕。
Javascript是明文的,所以任一个程序员都可以解开来。
本质上,这也就是https的原理,只是用简单的算法,减轻一些服务器和客户端的负担。
xfliu said,
12月 19, 2008 @ 2:52 am
Ben说得不错,“隐身衣”没有那么复杂。不过讲讲故事满有意思的,下一篇里,我会详细提及如何具体实现。
“Javascript是明文的“,不过要把javascript的解析集成到GFW中,不知有多大的难度阿 :-)