【注】这篇文档是好些年前写的,现在反垃圾都往人工智能方向走,传统的一些技术已经过时了。
- RBL:实时黑名单,包括诸如IP黑名单、URL黑名单,常用的有Spamhaus、Spamcop、Sorbs、NJABL等。
- SPF:检查发送者IP是否在发送域的授权网络范围内,本博其他文档有提及。
- 频率控制:限制发送频率,单纯根据发送频率进行流控是愚昧做法,QQ邮箱多这样干。
- 信誉系统(reputation):对Sender的IP或domain建立信誉评分机制。
- DomainKey:采用数字签名对发送域进行验证。
- 灰名单(greylist):对可疑邮件返回临时失败,拒绝对方一段时间。
- 指纹(fingerprint):对垃圾邮件建立指纹样本库。
- 蜜罐(honeypot):设立蜜罐邮箱,用来采集垃圾邮件样本。
- 贝叶斯(Bayes):对邮件内容进行分词和采用Bayes算法进行概率统计。
- 关键字:内容关键字过滤。
- 渐进式规则评分系统(启发式过滤):SpamAssassin。
- 基于上下文的系统:对邮件内容、邮件组织方式、发送者信誉进行关联统计,如IronPot。
- 基于行为分析的系统:从垃圾邮件起源的全球地理位置角度统计垃圾邮件行为和特征,如CommTouch。
通常是各个技术措施综合起来对垃圾邮件进行识别和过滤。例如基于规则的反垃圾方法,可以准确的识别已知垃圾邮件,但对于新出现的垃圾邮件则无能为力。而基于统计的方法(如Bayes),则可以较准确的预防新垃圾邮件。还有基于内容的方法(如关键字)与基于行为的方法结合起来,才能发挥更好的效果。