1.前端纯HTML+JS+JSON(链接统计除外),后端python生成标准JSON
2.自带30几个常用网站采集规则
3.多线程抓取,30+网站5秒内采集完毕
4.相同网站放在一个框架内,可局部刷新和滚动
5.更新时间显示(按采集页的自带更新时间或按时间排序的第一条时间采集,没有的为采集完成时间)
6.内容链接防盗链,链接通过base64+字符逆序+大小写反转+base64实现加密(更换大小写转换顺序或增加数字替换可实现不同密码加密)
7.内容链接点击统计
8.部分内容鼠标悬停提示(如appstore排行有更新内容、时间、版本号)
安装教程:
1.python3 caiji.py采集(保持后台运行请用screen或nohup)
2.打开首页访问
注意事项:
caiji.py为后端采集程序,其余为前端需在同一目录
相应设置修改请查看源码中的注释
admin.php为第三方数据库管理程序,用于内容链接统计查看(默认密码admin,请在文件中修改)
点击统计数据库log.db会在首次访问内容链接时生成,如未建立请保证主目录可写
为了安全,后端程序caiji.py和数据库查看程序admin.php请改为复杂文件名,或移动到非web目录(需同时修改文件内的生成json保存目录为网站根目录,默认为当前目录)
默认使用多线程抓取,如有问题请改用单线程
今日头条的采集请更换为自己的cookie,头条短时间采集内容相同的太多(目前1分钟采一次合并10次数据),相同cookie分段采集后几乎不会有重复的,但采集一段时间后推荐的都是杂七杂八无关的垃圾内容(请定期更换cookie或自行加入随机的头条cookie生成规则)
采集站的logo大部分已修改为透明图层png,在非白色背景下可能会很难看
根据二〇〇二年一月一日《计算机软件保护条例》第十七条规定:为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。
本网站所有发布的源码、软件和资料,均为作者提供或网友推荐收集各大资源网站整理而来,仅供功能验证和学习研究使用。
所有资源的文字介绍均为网络转载,本站不保证相关内容真实可信,同时不保证所有资源100%无错可用,也不提供相应的技术支持,介意勿下。
您必须在下载后24小时内删除,不得用于非法商业用途,不得违反国家法律,一切关于该资源的商业行为与本站无关。
如果您喜欢该程序,请支持正版源码,得到更好的正版服务。、如有侵犯你的版合法权益,请邮件与我们联系处理(邮箱:2959411445@qq.com),本站将立即改正。
本声明为本站所有资源最终声明,所有与本声明不符的表述均以本声明内容为准。
完美源码 » 全新热搜热门榜内容系统聚合源码