Curiosity

Our civilization is built on curiosity. Curiosity recommender system's object is suggesting perfect list after reading documents.

Processing

Notion.so raw data generation
Nosion.so raw data to markdown

1~2 processings are done by texonom/notion-node

Markdown to Huggingface dataset

git clone https://github.com/texonom/texonom-md
python hf_upload.py chroma

Extracted dataset to embedding

Run chroma server

pm2 start conf/chroma.json

Run embedding server

volume=data
model=thenlper/gte-small
docker run -d --name tei --gpus all -p 8080:80 -v $volume:/data --pull always ghcr.io/huggingface/text-embeddings-inference:0.3.0 --model-id $model

python index_to.py pgvector

Use embedding for recommendation

Plan

from dictionary dataset without id duplicating (prefer recent one)
dataset tagging with date

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
conf		conf
curiosity		curiosity
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
index_to.py		index_to.py
pyproject.toml		pyproject.toml
requirements-dev.lock		requirements-dev.lock
requirements.lock		requirements.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Curiosity

Processing

Plan

About

Releases

Packages

Languages

texonom/curiosity

Folders and files

Latest commit

History

Repository files navigation

Curiosity

Processing

Plan

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages