diff --git a/2023-1-27/README.md b/2023-1-27/README.md index 0458bce..7d1e85e 100644 --- a/2023-1-27/README.md +++ b/2023-1-27/README.md @@ -2,6 +2,8 @@ 本目录存储了基于2023年1月27日采集的tid(topic id)而进行爬取的豆瓣魂组数据。 +下载地址:https://github.com/ASOUL-DoubanGroup-Mirror/Data/releases/tag/2023-01-27 + 处理部分数据所使用的sql脚本请见 `./processing_sql` 目录。 各文件说明如下: diff --git a/2023-1_4/README.md b/2023-1_4/README.md new file mode 100644 index 0000000..93be006 --- /dev/null +++ b/2023-1_4/README.md @@ -0,0 +1,17 @@ +# 豆瓣魂组2023年1月-4月组内回复数据 + +应该是我个人最后统计出来的数据了。之后我应该就走了,这回是真的走了。 + + + +该数据下载链接:https://github.com/ASOUL-DoubanGroup-Mirror/Data/files/11365503/ASOUL-Douban-2023.1-2023.4.zip + + + +Release页面:https://github.com/ASOUL-DoubanGroup-Mirror/Data/releases/tag/2023-01_04 + + + +数据格式与先前镜像数据规格一致。 + +唯一多的是`topic_comments_table`多了一张名为`Statistic`的表,该表存储了库内的所有数据。 \ No newline at end of file diff --git a/README.md b/README.md index b6e91cb..0f6cfce 100644 --- a/README.md +++ b/README.md @@ -14,20 +14,24 @@ 接下来是关于该仓库的详细使用说明。 -### 2.0 数据说明 +### 2.0 数据列表 + +- 2023-1-27:魂组2023-1-27之前的全部回帖数据。 +- 2023-1_4:魂组2023年1月至4月的全部回帖数据。 + +### 3.0 数据说明 该仓库的数据按照以下目录结构存放: ``` └── RecordTime 以存档的年月日期命名的对应存档数据 ├── processing_sql 该文件夹存放用到的处理数据的sql语句 - ├── README.md 该存档数据的详细说明 - └── ....数据文件 + └── README.md 该存档数据的详细说明,提供下载链接。 ``` 所有数据文件皆采用sqlite存储。您可以使用诸如 SQLiteStudio 之类的工具查看这些数据。 -### 3.0 数据下载链接 +### 4.0 数据下载链接 除了直接从[Github的Release](https://github.com/ASOUL-DoubanGroup-Mirror/Data/releases)上下载这些数据以外,还有以下下载数据的方式: