Skip to content

Commit

Permalink
添加了2023年魂组1月至4月回复数据,修缮了文档。
Browse files Browse the repository at this point in the history
  • Loading branch information
WendaoLee committed May 1, 2023
1 parent 3febf2e commit 0068264
Show file tree
Hide file tree
Showing 3 changed files with 27 additions and 4 deletions.
2 changes: 2 additions & 0 deletions 2023-1-27/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,6 +2,8 @@

本目录存储了基于2023年1月27日采集的tid(topic id)而进行爬取的豆瓣魂组数据。

下载地址:https://github.com/ASOUL-DoubanGroup-Mirror/Data/releases/tag/2023-01-27

处理部分数据所使用的sql脚本请见 `./processing_sql` 目录。

各文件说明如下:
Expand Down
17 changes: 17 additions & 0 deletions 2023-1_4/README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,17 @@
# 豆瓣魂组2023年1月-4月组内回复数据

应该是我个人最后统计出来的数据了。之后我应该就走了,这回是真的走了。



该数据下载链接:https://github.com/ASOUL-DoubanGroup-Mirror/Data/files/11365503/ASOUL-Douban-2023.1-2023.4.zip



Release页面:https://github.com/ASOUL-DoubanGroup-Mirror/Data/releases/tag/2023-01_04



数据格式与先前镜像数据规格一致。

唯一多的是`topic_comments_table`多了一张名为`Statistic`的表,该表存储了库内的所有数据。
12 changes: 8 additions & 4 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -14,20 +14,24 @@

接下来是关于该仓库的详细使用说明。

### 2.0 数据说明
### 2.0 数据列表

- 2023-1-27:魂组2023-1-27之前的全部回帖数据。
- 2023-1_4:魂组2023年1月至4月的全部回帖数据。

### 3.0 数据说明

该仓库的数据按照以下目录结构存放:

```
└── RecordTime 以存档的年月日期命名的对应存档数据
├── processing_sql 该文件夹存放用到的处理数据的sql语句
├── README.md 该存档数据的详细说明
└── ....数据文件
└── README.md 该存档数据的详细说明,提供下载链接。
```

所有数据文件皆采用sqlite存储。您可以使用诸如 SQLiteStudio 之类的工具查看这些数据。

### 3.0 数据下载链接
### 4.0 数据下载链接

除了直接从[Github的Release](https://github.com/ASOUL-DoubanGroup-Mirror/Data/releases)上下载这些数据以外,还有以下下载数据的方式:

Expand Down

0 comments on commit 0068264

Please sign in to comment.