谷姐:我们都是谷歌迷
We are all Google fans

小说采集站搭建之94采集器安装+配置(图文)教程

众所周知,小说站来流量快,而采集器可以全天候进行内容创作… 这是一个神奇的领域,博主出于学习目的,花费好几天时间,研究了一番小说采集站…

本篇是关于倒腾采集器的。94采集器的官网 so94.xyz 打不开了,但是不得不说94采集器挺好用。这里记录下94采集器的安装和配置教程。

系统环境
1. CentOS Linux release 7.9.2009 (Core)
2. 船说CMS小说网站

一、安装宝塔面板

yum install -y wget && wget -O btinstall.sh http://download.bt.cn/install/install_6.0.sh && sh btinstall.sh
rm -f /www/server/panel/data/bind.pl

安装LNMP环境
宝塔面板安装LNMP环境
安装Redis
宝塔面板安装Redis
安装Python项目管理器
宝塔面板安装Python项目管理器

安装完成
宝塔面板环境安装完成

二、安装94采集器

安装程序:

注意:本段内容须成功“回复本文”后“刷新本页”方可查看!
将安装程序上传并解压
上传并解压94采集器程序
打开Python项目管理器设置,安装Python 3.7.0版本
Python项目管理器安装Python 3.7.0版本
利用phpMyAdmin打开船说网站的MySql数据库,并将“九四日志表(完整版)表”导入数据库
将“九四日志表(完整版)表”导入数据库
成功导入
“九四日志表(完整版)表”导入成功
修改redis密码,并重启redis服务
修改redis密码
重启redis服务
修改94采集器的配置文件 /www/wwwroot/Tools/app/config/config.py
修改94采集器的配置文件

REDIS_PWD = 'REDIS密码'
数据库名称 = '数据库名称'
数据库用户 = '数据库用户'
数据库密码 = '数据库密码'
数据库编码 = 'utf8'
数据库前缀 = 'jieqi_'

至此环境已经搭建好,可以运行Python项目管理器运行94采集器
Python项目管理器运行94采集器
提示“正在安装项目所需要的依赖,请稍后…”,等待即可。
94采集器完成安装
宝塔面板安全栏,放行9001端口后可以可以用IP:9001访问94采集器!
宝塔面板放行9001端口
宝塔面板放行9001端口
94采集器账号和密码登陆
94采集器账号和密码登陆
94采集器账号和密码登陆成功
94采集器账号和密码登陆成功

三、配置94采集器

很多地方需要和小说站(传奇CMS或者船说CMS)一起配置。

1. 基础信息设置

配置94采集器

2. 一级分类设置

1=玄幻小说,玄幻魔法,玄幻,玄幻奇幻,玄幻魔法,异陆,魔法,异能,玄幻小说,东方玄幻,异界大陆,玄幻仙侠,魔法奇幻,魔幻,玄幻,魔法,玄幻魔法,异陆,奇幻,奇幻-异界幻想,奇幻-仙侠情缘,奇幻-妖精灵怪,奇幻-西方魔幻,奇幻-吸血家族,玄幻小说,重生文学,奇幻小说,玄幻异界,奇幻魔法,东方玄幻,异世大陆,王朝争霸,高武世界
2=修真小说,武侠修真,武侠,武侠仙侠,武侠修真,修真,仙侠,仙侠修真,武侠小说,仙侠小说,远古神话,修真小说,古典仙侠,洪荒封神,女生武侠,恩怨情仇,仙侠,修真文明,幻想修仙,现代修真,神话修真
3=都市小说,都市言情,都市,都市小说,都市言情,都市生活,言情,言情小说,台湾言情,都市异能,都市激战,官场风云,青青校园,都市官场,爱情婚姻,都市生活,都市异能,异术超能,青春校园,娱乐明星,都市娱乐
4=穿越小说,历史,军事,历史军事,战争,战争小说,历史小说,军事小说,历史穿越,战史风云,谍战特工,架空历史,军史传奇,前世今生,家宅布衣,穿越,架空,古言,历史,历史古代,穿越小说,历史军事
5=网游小说,游戏,游戏竞技,网游竞技,网游,游戏小说,网游动漫,网游小说,竞技小说,动漫小说,游戏异界,虚拟网游,动漫,网游,电子竞技,虚拟网游,游戏异界,游戏主播
6=科幻小说,科幻,科幻小说,科幻-未来世界,科幻小说,科幻灵异,古武机甲,未来世界,星际文明,超级科技,时空穿梭,进化变异,末世危机,科幻末日,科幻空间
7=女频小说,豪门世家,恩怨情仇,婚恋爱情,职场丽人,婚恋爱情,言情耽美,女生频道,女生,女频小说,女生频道,纯爱,情感,校园,耽美言情,现言,爱情,同人,女生言情,耽美百合,幻想言情,浪漫青春
8=灵异小说,恐怖小说,惊悚小说,恐怖,惊悚,灵异小说,灵异,悬疑灵异
9=次元小说,N次元,同人动漫,主角小说
10=其他类型,其他,其它,其他小说,其它小说,其他类型,其它类型,综合其他

就是一些1对多的映射关系,等号左边参考船说网站的分类id,等号右边可以根据目标网站进行调整。

3. 二级分类设置

可同上。

4. 频道设置

1=男
2=女

同样,左边根据你自己网站进行设置,等号右边可以根据目标网站进行调整。

5. 连载状态设置

0=连载中
1=已完结

同样,左边根据你自己网站进行设置,等号右边可以根据目标网站进行调整。

6. User-Agent设置

Mozilla/5.0 (iPhone; CPU iPhone OS 12_4_4 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 MicroMessenger/7.0.10(0x17000a21) NetType/4G Language/zh_CN

四、新建94采集器规则和任务

新建或者导入规则
94采集器新建或者导入规则
新建采集任务
94采集器新建采集任务

当前内容只有购买了 【94采集器规则和任务设置】 产品的用户才能查看,点击  前往购买,如果您已经购买,请登录

五、一些数据库维护操作

采集规则有时候写的有问题,就会导致各种小问题,这时候如果想做点什么的话,只能利用数据库操作
将类别11下的书籍连载状态,全部修改为“已完结”

UPDATE `jieqi_article_article` SET `fullflag`=1 WHERE sortid=11

将类别11下的书籍作者“作者:名字”全部修改为“名字”

UPDATE `jieqi_article_article` SET author=SUBSTRING_INDEX(author,':',-1) WHERE sortid=11

将类别11下的书籍,从数据库中删除(不建议这样,因为封面和对应的书籍文本还在硬盘,彻底删除需要去网站的小说管理界面手动删除,但是如果量太大的话,也只能这样图快捷或者写一个脚本操作数据库同时删除封面和书籍文本信息)

DELETE FROM jieqi_article_article WHERE sortid=7

将类别2下的书籍,书名中的书名号《》删除

UPDATE `jieqi_article_article` SET articlename=REPLACE(REPLACE(articlename,'《',''),'》','') WHERE sortid=2

将类别9下的书籍,书名中的“最新章节”删除

UPDATE `jieqi_article_article` SET articlename=REPLACE(articlename,'最新章节','') WHERE sortid=9
未经谷姐允许不得转载:谷姐靓号网 » 小说采集站搭建之94采集器安装+配置(图文)教程
分享到: 生成海报

评论 1

评论前必须登录!

立即登录   注册

买Google Voice认准【谷姐靓号网】

Google Voice靓号列表Google Voice自助购买
切换注册

登录

忘记密码 ?

切换登录

注册

我们将发送一封验证邮件至你的邮箱, 请正确填写以完成账号注册和激活