mirror of
https://github.com/YGGverse/YGGo.git
synced 2025-01-26 06:25:25 +00:00
implement 'hostPage add' CLI method
This commit is contained in:
parent
56c376474f
commit
a8ffe14349
@ -49,6 +49,7 @@ sphinxsearch
|
|||||||
* Configuration examples presented at `/config` folder
|
* Configuration examples presented at `/config` folder
|
||||||
* Make sure `/src/storage/cache`, `/src/storage/tmp`, `/src/storage/snap` folders are writable
|
* Make sure `/src/storage/cache`, `/src/storage/tmp`, `/src/storage/snap` folders are writable
|
||||||
* Set up the `/src/crontab` by following [example](https://github.com/YGGverse/YGGo/blob/main/config/crontab.txt)
|
* Set up the `/src/crontab` by following [example](https://github.com/YGGverse/YGGo/blob/main/config/crontab.txt)
|
||||||
|
* To start crawler, add at least one initial URL using search form or CLI
|
||||||
|
|
||||||
#### JSON API
|
#### JSON API
|
||||||
|
|
||||||
@ -241,6 +242,7 @@ _*CLI interface still under construction, use it for your own risk!_
|
|||||||
+ [ ] delete
|
+ [ ] delete
|
||||||
+ [ ] flush
|
+ [ ] flush
|
||||||
* [x] hostPage
|
* [x] hostPage
|
||||||
|
+ [x] add
|
||||||
+ [x] rank
|
+ [x] rank
|
||||||
+ [x] reindex
|
+ [x] reindex
|
||||||
* [x] hostPageSnap
|
* [x] hostPageSnap
|
||||||
|
@ -6,6 +6,7 @@ require_once(__DIR__ . '/../library/cli.php');
|
|||||||
require_once(__DIR__ . '/../library/mysql.php');
|
require_once(__DIR__ . '/../library/mysql.php');
|
||||||
require_once(__DIR__ . '/../library/filter.php');
|
require_once(__DIR__ . '/../library/filter.php');
|
||||||
require_once(__DIR__ . '/../library/ftp.php');
|
require_once(__DIR__ . '/../library/ftp.php');
|
||||||
|
require_once(__DIR__ . '/../library/helper.php');
|
||||||
require_once __DIR__ . '/../../vendor/autoload.php';
|
require_once __DIR__ . '/../../vendor/autoload.php';
|
||||||
|
|
||||||
// CLI only to prevent https server connection timeout
|
// CLI only to prevent https server connection timeout
|
||||||
@ -42,8 +43,29 @@ if (false === sem_acquire($semaphore, true)) {
|
|||||||
exit;
|
exit;
|
||||||
}
|
}
|
||||||
|
|
||||||
// Connect database
|
// Connect DB
|
||||||
$db = new MySQL(DB_HOST, DB_PORT, DB_NAME, DB_USERNAME, DB_PASSWORD);
|
try {
|
||||||
|
|
||||||
|
$db = new MySQL(DB_HOST, DB_PORT, DB_NAME, DB_USERNAME, DB_PASSWORD);
|
||||||
|
|
||||||
|
} catch(Exception $e) {
|
||||||
|
|
||||||
|
var_dump($e);
|
||||||
|
|
||||||
|
exit;
|
||||||
|
}
|
||||||
|
|
||||||
|
// Connect Yggverse\Cache\Memory
|
||||||
|
try {
|
||||||
|
|
||||||
|
$memory = new Yggverse\Cache\Memory(MEMCACHED_HOST, MEMCACHED_PORT, MEMCACHED_NAMESPACE, MEMCACHED_TIMEOUT + time());
|
||||||
|
|
||||||
|
} catch(Exception $e) {
|
||||||
|
|
||||||
|
var_dump($e);
|
||||||
|
|
||||||
|
exit;
|
||||||
|
}
|
||||||
|
|
||||||
// CLI begin
|
// CLI begin
|
||||||
if (!empty($argv[1])) {
|
if (!empty($argv[1])) {
|
||||||
@ -401,6 +423,65 @@ if (!empty($argv[1])) {
|
|||||||
|
|
||||||
switch ($argv[2]) {
|
switch ($argv[2]) {
|
||||||
|
|
||||||
|
case 'add':
|
||||||
|
|
||||||
|
if (empty($argv[3])) {
|
||||||
|
|
||||||
|
CLI::danger('URL required');
|
||||||
|
|
||||||
|
exit;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (false === Yggverse\Parser\Url::is($argv[3])) {
|
||||||
|
|
||||||
|
CLI::danger('URL address invalid');
|
||||||
|
|
||||||
|
exit;
|
||||||
|
}
|
||||||
|
|
||||||
|
try {
|
||||||
|
|
||||||
|
$db->beginTransaction();
|
||||||
|
|
||||||
|
if ($linkToDBresult = Helper::addLinkToDB($db, $memory, $argv[3])) {
|
||||||
|
|
||||||
|
if (count($linkToDBresult->new->hostPageId)) {
|
||||||
|
|
||||||
|
CLI::success('URL successfully registered in the crawler queue!');
|
||||||
|
|
||||||
|
$db->commit();
|
||||||
|
|
||||||
|
exit;
|
||||||
|
|
||||||
|
} else {
|
||||||
|
|
||||||
|
CLI::warning('URL already registered in the crawler queue!');
|
||||||
|
|
||||||
|
$db->rollBack();
|
||||||
|
|
||||||
|
exit;
|
||||||
|
}
|
||||||
|
|
||||||
|
} else {
|
||||||
|
|
||||||
|
CLI::danger('URL address not supported by this host rules!');
|
||||||
|
|
||||||
|
$db->rollBack();
|
||||||
|
|
||||||
|
exit;
|
||||||
|
}
|
||||||
|
|
||||||
|
} catch(Exception $e){
|
||||||
|
|
||||||
|
var_dump($e);
|
||||||
|
|
||||||
|
$db->rollBack();
|
||||||
|
|
||||||
|
exit;
|
||||||
|
}
|
||||||
|
|
||||||
|
break;
|
||||||
|
|
||||||
case 'rank':
|
case 'rank':
|
||||||
|
|
||||||
if (!empty($argv[3])) {
|
if (!empty($argv[3])) {
|
||||||
@ -675,6 +756,7 @@ CLI::default(' crawl - execute step in crawler queue')
|
|||||||
CLI::default(' clean - execute step in cleaner queue');
|
CLI::default(' clean - execute step in cleaner queue');
|
||||||
CLI::break();
|
CLI::break();
|
||||||
CLI::default(' hostPage ');
|
CLI::default(' hostPage ');
|
||||||
|
CLI::default(' add [URL] - register new address in the crawl queue');
|
||||||
CLI::default(' rank ');
|
CLI::default(' rank ');
|
||||||
CLI::default(' reindex - reindex hostPage.rank fields');
|
CLI::default(' reindex - reindex hostPage.rank fields');
|
||||||
CLI::break();
|
CLI::break();
|
||||||
|
Loading…
x
Reference in New Issue
Block a user