diff --git a/weibospider/spiders/search.py b/weibospider/spiders/search.py index 19bfab98..a8fbcfdf 100644 --- a/weibospider/spiders/search.py +++ b/weibospider/spiders/search.py @@ -26,11 +26,14 @@ def start_requests(self): start_time = "2022-10-01-0" # 格式为 年-月-日-小时, 2022-10-01-0 表示2022年10月1日0时 end_time = "2022-10-07-23" # 格式为 年-月-日-小时, 2022-10-07-23 表示2022年10月7日23时 is_search_with_specific_time_scope = True # 是否在指定的时间区间进行推文搜索 + is_sort_by_hot = True # 是否按照热度排序,默认按照时间排序 for keyword in keywords: if is_search_with_specific_time_scope: url = f"https://s.weibo.com/weibo?q={keyword}×cope=custom%3A{start_time}%3A{end_time}&page=1" else: url = f"https://s.weibo.com/weibo?q={keyword}&page=1" + if is_sort_by_hot: + url += "&xsort=hot" yield Request(url, callback=self.parse, meta={'keyword': keyword}) def parse(self, response, **kwargs):