其他没有实施的方案,包括iframe、css content、生成pdf、不显示元素、css图片拼接等。
使用nginx屏蔽掉可疑的user agent。使用iptables屏蔽爬虫ip段。
除了直接http请求抓取页面之外,还有使用headless浏览器的方式,通常用于动态页面爬取。
之前静态博客已经被爬了文章的图片链接。全量重命名图片,断开新的访问。
默认的hexo图片title属性上浮在图片底部,导致看不清楚。修改image-caption的css配置,使其下浮在图片下面。修改alt,默认使用title属性。
保护图片的方式:1. 水印; 2. cdn referer防盗链; 3. hexo-lazyload-image懒加载图片插件
字体反爬,把部分字符映射到uft8的自定义字符区间,并且生成一个字体文件,可以正常显示这些区间的字符。利用字符映射表,把原来的字符替换成新字符编码。自定义字体字符数量不能太多。
LongAdder继承了Striped64,是高效的计数器。