persian-longformer

This project use Longformer's attention mechanism to alireza7/ARMAN-MSR-persian-base in order to perform abstractive summarization on long documents. so new model can accept 8K tokens (rather than 512 tokens).

fine-tuned model is available in huggingface

⚡️ Quickstart

from transformers import AutoTokenizer
from transformers import pipeline

summarizer = pipeline("summarization", model="zedfum/arman-longformer-8k-finetuned-ensani", tokenizer="zedfum/arman-longformer-8k-finetuned-ensani" , device=0)
text_to_summarize=""
summarizer(text_to_summarize, min_length=5, max_length=512,truncation=True)

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
evaluation		evaluation
README.md		README.md
convert_to_LED.ipynb		convert_to_LED.ipynb
evaluation.py		evaluation.py
finetune.ipynb		finetune.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

persian-longformer

⚡️ Quickstart

About

Releases

Packages

Languages

amirhosein-darmani/persian-longformer

Folders and files

Latest commit

History

Repository files navigation

persian-longformer

⚡️ Quickstart

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages