-
Notifications
You must be signed in to change notification settings - Fork 0
/
CrawlerTask.java
69 lines (53 loc) · 2.19 KB
/
CrawlerTask.java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
import java.io.IOException;
import java.util.LinkedList;
import java.util.logging.Level;
import java.util.logging.Logger;
/**
* CrawlerTask реализует интерфейс Runnable. Каждый экземпляр имеет ссылку на
* экземпляр класса URLPool. Получает пару <URL, глубина> из пула (ждёт если
* недоступно), извлекает веб-страницу, получает все URL-адреса со страницы и
* добавляет новую пару URLDepth в пул URL для каждого найденного URL.
* @author sergeychaika
*/
public class CrawlerTask implements Runnable {
public URLDepthPair depthPair;
public URLPool pool;
/**
* Конструктор для инициализации пула.
* @param newPool
*/
public CrawlerTask (URLPool newPool) {
pool = newPool;
}
/**
* Метод для запуска задач в CrawlerTask.
*/
@Override
public void run() {
/**
* Достаём из пула следующую пару.
*/
depthPair = pool.get();
int depth = depthPair.getDepth();
/**
* Поиск всех ссылок на рассматриваемом сайте и сохранение их в
* список linksList.
*/
LinkedList<String> linksList = null;
try {
linksList = Crawler.getSites(depthPair);
}
catch (IOException ex) {
Logger.getLogger(CrawlerTask.class.getName()).log(Level.SEVERE,
null, ex);
}
for (int counter = 0; counter < linksList.size(); ++counter) {
String newURL = linksList.get(counter);
/**
* Создание новой пары для каждой ссылки и добавление её в пул.
*/
URLDepthPair newDepthPair = new URLDepthPair(newURL, depth + 1);
pool.put(newDepthPair);
}
}
}