本采集器为网站自用采集器。采用C#开发,支持关键词搜索采集、列表采集、PDF文件入库采集等。本程序完全脱离网站本身运行,也可以采集后对内容进行AI处理,可自动采集自动入库。因本人非计算机专业出身,编程仅为业余爱好,有不方便的地方请谅解。
一、使用指南:
1.1、邮件方式入库:
安装jetpack插件,这个插件有个功能就是通过发邮件到某个邮箱实现发贴功能(免费)。生成一个独一无二的邮箱,发邮件即为发文章。具体的邮件前缀设置请详见https://jetpack.com/support/post-by-email/?site=xycost.com,可决定你发文的类别、草稿箱、时间、标签、签名等:
本程序图片本地化功能,但发布速度会比较慢。需要图片本地化的同学也可以安装IMGspider插件(免费),可以批量或单个文章图片本地化。比如一个类别的所有未本地化图片一键本地化,强烈推荐。
1.2、REST API入库方式:
安装WordPress REST API Authentication插件,并在基础授权中测试通过。否则可能会导致授权问题无法文章入库。
二、PDF采集文章并发送网站
直接得到PDF首页截图及内容形成文章,首页截图默认为压缩处理,体积比原图减少60%以上。发到网站后考虑到一般PDF均需要收费,并未直接给出文件下载地址。
三、历史更新:
2023-8-23,支持某网站自动采集自动入库。优化其他小细节。支持Chatgpt对内容进行AI改写。
2023-8-7,支持网站REST API直接入库,除PDF采集外,其他均支持邮件方式或REST方式切换发文章。发文章入库支持多线程异步模式。
2023-7-27,支持www.bzfxw.com列表采集。优化了部分界面。新增了微信公众号采集,新增图片本地化功能。
本采集器完全免费。如果你需要自己的采集规则,可告诉站长(需要有具体的采集地址,采集内容要求),免费帮你增加,条件是在你的网站上帮本网做三个文章的宣传即可。网站上下载的可能不是最新版本,需要最新版的可直接联系站长,无需VIP。
评论0