forked from KEMT/zpwiki
Delete 'pages/students/2016/jan_holp/dp2021/dp2021 zdrojove subory/cassandra.js'
This commit is contained in:
parent
557890d3d9
commit
7dd72f0760
@ -1,111 +0,0 @@
|
|||||||
//Jan Holp, DP 2021
|
|
||||||
|
|
||||||
|
|
||||||
//client2 = cassandra
|
|
||||||
//client1 = elasticsearch
|
|
||||||
//-----------------------------------------------------------------
|
|
||||||
|
|
||||||
//require the Elasticsearch librray
|
|
||||||
const elasticsearch = require('elasticsearch');
|
|
||||||
const client1 = new elasticsearch.Client({
|
|
||||||
hosts: [ 'localhost:9200']
|
|
||||||
});
|
|
||||||
client1.ping({
|
|
||||||
requestTimeout: 30000,
|
|
||||||
}, function(error) {
|
|
||||||
// at this point, eastic search is down, please check your Elasticsearch service
|
|
||||||
if (error) {
|
|
||||||
console.error('Elasticsearch cluster is down!');
|
|
||||||
} else {
|
|
||||||
console.log('ELasticSearch is ok');
|
|
||||||
}
|
|
||||||
});
|
|
||||||
|
|
||||||
//create new index skweb2
|
|
||||||
client1.indices.create({
|
|
||||||
index: 'skweb2'
|
|
||||||
}, function(error, response, status) {
|
|
||||||
if (error) {
|
|
||||||
console.log(error);
|
|
||||||
} else {
|
|
||||||
console.log("created a new index", response);
|
|
||||||
}
|
|
||||||
});
|
|
||||||
|
|
||||||
//indexing method
|
|
||||||
const bulkIndex = function bulkIndex(index, type, data) {
|
|
||||||
let bulkBody = [];
|
|
||||||
id = 1;
|
|
||||||
const errorCount = 0;
|
|
||||||
/// dsdgfdhdhgdjd
|
|
||||||
data.forEach(item => {
|
|
||||||
bulkBody.push({
|
|
||||||
index: {
|
|
||||||
_index: index,
|
|
||||||
_type: type,
|
|
||||||
_id : id++, // id zmenit na url
|
|
||||||
}
|
|
||||||
});
|
|
||||||
bulkBody.push(item);
|
|
||||||
});
|
|
||||||
// console.log(bulkBody);
|
|
||||||
client1.bulk({body: bulkBody})
|
|
||||||
.then(response => {
|
|
||||||
|
|
||||||
response.items.forEach(item => {
|
|
||||||
if (item.index && item.index.error) {
|
|
||||||
console.log(++errorCount, item.index.error);
|
|
||||||
}
|
|
||||||
});
|
|
||||||
console.log(
|
|
||||||
`Successfully indexed ${data.length - errorCount}
|
|
||||||
out of ${data.length} items`
|
|
||||||
);
|
|
||||||
})
|
|
||||||
.catch(console.err);
|
|
||||||
};
|
|
||||||
|
|
||||||
|
|
||||||
const cassandra = require('cassandra-driver');
|
|
||||||
const client2 = new cassandra.Client({ contactPoints: ['localhost:9042'], localDataCenter: 'datacenter1', keyspace: 'websucker' });
|
|
||||||
const query1 = 'SELECT domain_name FROM websucker.domain_quality WHERE good_count > 0 ALLOW FILTERING';
|
|
||||||
//const query2 = 'SELECT * from websucker.content WHERE domain_name = ' + domain_name[i] + 'ALLOW FILTERING'; // body_size > 0
|
|
||||||
|
|
||||||
//-------------------------------------------------------------------------
|
|
||||||
|
|
||||||
var domain_name = [];
|
|
||||||
var object_list = [];
|
|
||||||
|
|
||||||
|
|
||||||
client2.execute(query1)
|
|
||||||
.then(result => {
|
|
||||||
let pole = result.rows.map(r => {
|
|
||||||
domain_name.push(r.domain_name)
|
|
||||||
});
|
|
||||||
console.log("Vsetky domenove mena : " , domain_name);
|
|
||||||
domain_name.forEach(name => {
|
|
||||||
let query = 'SELECT * from websucker.content WHERE domain_name = ' + "'" + name + "'" + ' and body_size > 0 ALLOW FILTERING';
|
|
||||||
client2.execute(query).then( res => {
|
|
||||||
res.rows.map(rr => {
|
|
||||||
object_list.push({
|
|
||||||
domain_name: rr.domain_name,
|
|
||||||
title: rr.title,
|
|
||||||
body: rr.body,
|
|
||||||
target_link : rr.target_link,
|
|
||||||
id : rr.target_link
|
|
||||||
});
|
|
||||||
//console.log(object_list);
|
|
||||||
bulkIndex('skweb2', 'web_page', object_list);
|
|
||||||
//console.log(object_list);
|
|
||||||
});
|
|
||||||
|
|
||||||
}).catch(error => console.log(error));
|
|
||||||
})
|
|
||||||
|
|
||||||
}).catch(err => console.log(err));
|
|
||||||
|
|
||||||
setTimeout(() => console.log(object_list, 15000));
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
Loading…
Reference in New Issue
Block a user