此頁面列出了註冊在 Haggingface 的專用於日本NLP的模型和數據集。目前,列出了{num_model}個模型和{num_dataset}個數據集。
English | 日本語 (Japanese) | 繁體中文 (Chinese) | 简体中文 (Chinese)
Models 17 models have been added.
- mmnga/DeepSeek-R1-Distill-Qwen-14B-gguf
- mmnga/DeepSeek-R1-Distill-Llama-8B-gguf
- mmnga/DeepSeek-R1-Distill-Qwen-7B-gguf
- mmnga/DeepSeek-R1-Distill-Qwen-32B-gguf
- mmnga/DeepSeek-R1-Distill-Qwen-1.5B-gguf
- mmnga/AXCXEPT-EZO-phi-4-v2_900-gguf
- mmnga/karakuri-lm-32b-thinking-2501-exp-gguf
- mradermacher/Japanese-Starling-ChatV-7B-i1-GGUF
- mradermacher/Japanese-Starling-ChatV-7B-GGUF
- p1atdev/kakuyomu-genre-bert
- tensorblock/Mistral-Nemo-Japanese-Instruct-2408-GGUF
- c299m/japanese_stock_sentiment
- TomokiFujihara/luke-japanese-large-lite-offensiveness-estimation
- Miwa-Keita/zenz-v2.5-medium
- Miwa-Keita/zenz-v2.5-xsmall
- Miwa-Keita/zenz-v2.5-small
- espnet/kan-bayashi_jsut_full_band_vits_prosody
Datasets 9 datasets have been added.
- hotchpotch/sentence_transformer_japanese
- JunSotohigashi/JapaneseWikipediaTypoDataset_kanji
- numad/yuho-text-2023
- JunSotohigashi/JapaneseWikipediaTypoDataset
- Aratako/magpie-reasoning-llama-nemotron-70b-100k-filtered
- Sunbread/SyosetuNames-3.5M
- davidstap/kanji_definitions
- oshizo/japanese-text-image-retrieval-train
- kurogane/DSR1D-qwen-2.5-32B-aya-ja-1k-generated
This list is sorted by downloads as of January 28, 2025. 1150 models are listed.
- tohoku-nlp/bert-base-japanese
- BERT基本日本語(IPA字典)這是一個在日文文本上預訓練的BERT模型。
- Downloads: 3,140,585
- jonatasgrosman/wav2vec2-large-xlsr-53-japanese
- 對於日語語音識別進行了微調的 XLSR-53 大型模型在日文上使用了 Common Voice 6.1、CSS10 和 JSUT 的訓練和驗證數據集來微調 facebook/wav2vec2-large-xlsr-53。使用這個模型時,確保您的語音輸入的採樣率為 16kHz。
- Downloads: 2,126,758
- tsmatz/xlm-roberta-ner-japanese
- 這個模型是 xlm-roberta-base 的微調版本(預先訓練的跨語言 RobertaModel),專門訓練以進行命名實體識別(NER)標記分類的工作。
- Downloads: 1,229,684
- sonoisa/sentence-bert-base-ja-mean-tokens-v2
- 這是一個日文句子-BERT模型。
- Downloads: 490,837
- globis-university/deberta-v3-japanese-large
- 這是什麼?
- Downloads: 374,359
- tohoku-nlp/bert-base-japanese-v3
- BERT基本版日語模型(使用unidic-lite進行全詞遮罩、CC-100和jawiki-20230102)這是一個在日本語文本上預先訓練的BERT模型。
- Downloads: 264,244
- tohoku-nlp/bert-base-japanese-whole-word-masking
- BERT基本版日語(具有IPA字典,啟用完整詞掩蔽功能)這是一個在日語文本上預先訓練的BERT模型。
- Downloads: 235,309
- ku-nlp/deberta-v2-base-japanese
- 日本DeBERTa V2 baseModel的模型說明書
- Downloads: 178,635
- rinna/japanese-cloob-vit-b-16
- 這是由 rinna 公司訓練的日本 CLOOB(對比留一出提升)模型。
- Downloads: 163,264
- augmxnt/shisa-gamma-7b-v1
- shisa-gamma-7b-v1更多資訊請參閱我們主要的Shisa 7B模型。我們將我們的微調資料集應用到日文穩定LM基礎Gamma 7B上,效果相當不錯,只是分享一下,因為這可能會引起興趣。
- Downloads: 153,600
- ku-nlp/deberta-v2-base-japanese-char-wwm
- 用於日文角色級別的 DeBERTa V2 baseModel 模型卡
- Downloads: 137,008
- tohoku-nlp/bert-base-japanese-char-v2
- BERT base日文(採用字元級別分詞並進行全詞遮罩,擁有jawiki-20200831模型)這是一個在日文文本上預先訓練的BERT模型。
- Downloads: 134,610
- tohoku-nlp/bert-base-japanese-char-v3
- BERT基底日文(使用字元級標記並進行整詞遮罩處理,CC-100和jawiki-20230102)這是一個在日文文本上預先訓練的BERT模型。
- Downloads: 108,285
- tohoku-nlp/bert-base-japanese-char
- 這是一個在日文文本上預先訓練的 BERT 基礎模型(採用字元分詞)。
- Downloads: 107,133
- elyza/Llama-3-ELYZA-JP-8B
- Llama-3-ELYZA-JP-8B模型描述Llama-3-ELYZA-JP-8B是由ELYZA公司訓練的大型語言模型。基於meta-llama/Meta-Llama-3-8B-Instruct,它經過額外的預訓練和指導調整,以增強日語使用能力。
- Downloads: 101,610
- kha-white/manga-ocr-base
- Manga OCR 日文文本的光學字符識別,主要專注於日本漫畫。
- Downloads: 81,650
- sonoisa/sentence-bert-base-ja-mean-tokens
- 這是一個日本句子-BERT模型。
- Downloads: 73,349
- rinna/japanese-gpt-neox-3.6b-instruction-sft-v2
- 本儲存庫提供了一個擁有36億參數的日文GPT-NeoX模型。
- Downloads: 72,564
- llm-book/bert-base-japanese-v3-ner-wikipedia-dataset
- 「大規模言語模型入門」第6章介紹的是固有表現識別模型。
- Downloads: 65,688
- staka/fugumt-en-ja
- FuguMT -> 河豚MT
- Downloads: 54,655
- staka/fugumt-ja-en
- FuguMT -> 河豚MT
- Downloads: 53,965
- studio-ousia/luke-japanese-large
- luke-japanese 是 LUKE(具有基於知識的嵌入的語言理解)的日文版本,它是一種預訓練的知識增強內容化表示方式,用於單詞和實體。
- Downloads: 47,836
- pkshatech/GLuCoSE-base-ja
- GLuCoSE(基於General Luke對比句子嵌入)-基於日語的README/GLuCoSE(General LUke-based Contrastive Sentence Embedding, "glucose")是一個基於LUKE的日語文本嵌入模型。
- Downloads: 38,918
- tohoku-nlp/bert-base-japanese-v2
- BERT基本日語模型(使用unidic-lite與整詞遮蔽功能,jawiki-20200831)這是在日語文本上預訓練的BERT模型。
- Downloads: 36,760
- christian-phu/bert-finetuned-japanese-sentiment
- 這個模型是在 cl-tohoku/bert-base-japanese-v2 的基礎上對日本亞馬遜評論數據集進行微調的版本。
- Downloads: 31,731
- tokyotech-llm/Llama-3-Swallow-8B-Instruct-v0.1
- 我們的Swallow模型經過了來自Llama 3家族持續的預訓練,主要新增了日語資料。
- Downloads: 31,562
- reazon-research/reazonspeech-nemo-v2
- reazonspeech-nemo-v2 是一个在 ReazonSpeech v2.0 语料库上训练的自动语音识别模型。
- Downloads: 28,960
- rinna/japanese-clip-vit-b-16
- 這是由rinna Co.訓練的日文CLIP(對比語言-圖像預訓練)模型。
- Downloads: 27,861
- setu4993/LaBSE
- LaBSE 模型描述LaBSE(Language-agnostic BERT Sentence Encoder)是一種基於 BERT 的模型,用於 109 種語言的句子嵌入訓練。
- Downloads: 26,778
- cyberagent/open-calm-7b
- OpenCALM-7B模型描述OpenCALM是由CyberAgent, Inc. 開發的一組僅解碼器的語言模型套件,預先在日本數據集上進行訓練。
- Downloads: 23,653
- line-corporation/line-distilbert-base-japanese
- LINE DistilBERTLINE DistilBERT
- Downloads: 21,652
- alabnii/jmedroberta-base-sentencepiece-vocab50000
- 模型描述這是一個日本 RoBERTa 基礎模型,是在由日本科學技術機構(JST)收集的醫學科學學術文章上預訓練的。
- Downloads: 21,147
- ku-nlp/deberta-v2-large-japanese
- 日文 DeBERTa V2 大型模型的模型卡片模型描述此為在日文維基百科、CC-100 日文部分以及 OSCAR 日文部分上預訓練的日文 DeBERTa V2 大型模型。如何使用您可以像下面這樣使用此模型進行遮蔽語言建模:from transformers import AutoTokenizer, AutoModelForMaskedLMtokenizer = AutoTokenizer.from_pretrained('ku-nlp/de
- Downloads: 19,639
- llm-jp/llm-jp-3-13b-instruct
- 這個資料庫提供了由日本國立情報學研究所大型語言模型研發中心開發的大型語言模型。
- Downloads: 17,321
- tokyotech-llm/Llama-3.1-Swallow-8B-Instruct-v0.1
- Llama 3.1 Swallow - 由Llama构建,Llama 3.1 Swallow是一系列大型语言模型(8B, 70B),通过对Meta Llama 3.1模型进行持续预训练而构建。
- Downloads: 16,758
- ku-nlp/deberta-v2-large-japanese-char-wwm
- 日語角色級別 DeBERTa V2 大型模型模型描述這是一個在日本維基百科、CC-100的日語部分以及OSCAR的日語部分上預訓練的 DeBERTa V2 大型模型。該模型使用字符級別的分詞和整詞遮罩進行訓練。
- Downloads: 16,163
- megagonlabs/transformers-ud-japanese-electra-base-ginza-510
- 這是在 mC4 中提取的約 2 億日文句子上進行預訓練的 ELECTRA 模型,並在 UD_Japanese_BCCWJ r2.8 上由 spaCy v3 進行了微調。基礎預訓練模型為 megagonlabs/transformers-ud-japanese-electra-base-discriminator。
- Downloads: 15,964
- rinna/japanese-gpt2-medium
- 這個資料庫提供了一個中等大小的日本語 GPT-2 模型。
- Downloads: 15,700
- jarvisx17/japanese-sentiment-analysis
- 這個模型是從頭開始在chABSA數據集上訓練的。
- Downloads: 15,026
- pkshatech/GLuCoSE-base-ja-v2
- 葡萄糖 v2
- Downloads: 14,613
- line-corporation/clip-japanese-base
- 這是由LY Corporation 開發的日本 CLIP (Contrastive Language-Image Pre-training) 模型。
- Downloads: 13,769
- sonoisa/sentence-luke-japanese-base-lite
- 這是一個日語句子-LUKE模型。
- Downloads: 12,809
- tohoku-nlp/bert-large-japanese-v2
- BERT large 日文(unidic-lite with whole word masking, CC-100 和 jawiki-20230102)這是一個在日文文本上預訓練的 BERT 模型。
- Downloads: 11,230
- sonoisa/t5-base-japanese
- 這是一個在日本語語料庫上預訓練的T5(Text-to-Text Transfer Transformer)模型。
- Downloads: 10,707
- tokyotech-llm/Llama-3.1-Swallow-8B-Instruct-v0.3
- 大草原3.1燕子 - 建立在大草原3.1的基础上,大草原3.1燕子是一系列大型語言模型(8B、70B),通過對Meta大草原3.1模型進行持續預訓練而建立。
- Downloads: 10,555
- rinna/japanese-roberta-base
- 這個存儲庫提供了一個基礎尺寸的日語 RoBERTa 模型。
- Downloads: 10,256
- cl-nagoya/ruri-large
- 瑠璃:日本將軍文本嵌入的使用方法(Sentence Transformers)
- Downloads: 7,969
- KoichiYasuoka/bert-base-japanese-upos
- 這是一個在日文維基百科文本上預訓練的BERT模型,用於詞性標註和依存分析,源自於bert-base-japanese-char-extended模型。
- Downloads: 7,776
- oshizo/sbert-jsnli-luke-japanese-base-lite
- sbert-jsnli-luke-japanese-base-lite這是一個句子轉換模型:它將句子和段落映射到一個768維度的密集向量空間,可用於聚類或語義搜索等任務。
- Downloads: 6,825
- pfnet/plamo-13b
- PLaMo-13B 模型描述 PLaMo-13B 是一個基於 LLaMA 的 13B 模型,預先在英語和日語開放數據集上進行了訓練,由 Preferred Networks, Inc. 開發。
- Downloads: 6,592
- sazyou-roukaku/BracingEvoMix
- 授權:CreativeML 開放RAIL-M 附加版權:sazyou_roukaku(TwitterID @sazyou_roukaku)截至2023年5月31日。此模型在「CreativeML 開放RAIL-M」下的授權並未更改。
- Downloads: 6,410
- mmnga/Vecteus-v1-gguf
- Vecteus-v1-ggufLocal-Novel-LLM-project 在 Vecteus-v1 中公開的 gguf 格式轉換版本。
- Downloads: 5,901
- ku-nlp/deberta-v2-tiny-japanese
- 這是一個日語 DeBERTa V2 迷你模型卡,預先在日本維基百科、CC-100 的日本部分以及 OSCAR 的日本部分上進行了預訓練。使用方法:您可以通過以下方式使用這個模型進行遮罩語言建模:from transformers import AutoTokenizer, AutoModelForMaskedLMtokenizer = AutoTokenizer.from_pretrained('ku-nlp/deberta-v2-tiny-japanese
- Downloads: 5,811
- cl-nagoya/ruri-small
- Ruri: 日文一般文本嵌入用法直接使用(句子轉換器)
- Downloads: 5,761
- hotchpotch/japanese-reranker-cross-encoder-xsmall-v1
- hotchpotch/japanese-reranker-cross-encoder-xsmall-v1是一個以日語訓練的Reranker(CrossEncoder)系列模型。
- Downloads: 5,681
- tokyotech-llm/Llama-3-Swallow-8B-v0.1
- Swallow 我們的 Swallow 模型經過了持續的訓練,主要是從Llama 3家族中加入了日語數據。
- Downloads: 5,608
- line-corporation/japanese-large-lm-1.7b
- 這個存儲庫提供了由 LINE 公司訓練的一個擁有 17 億個參數的日語語言模型。
- Downloads: 5,377
- elyza/ELYZA-japanese-Llama-2-7b-instruct
- ELYZA-日本-美洲驼-2-7b 模型描述 ELYZA-日本-美洲驼-2-7b
- Downloads: 5,322
- rinna/japanese-gpt-neox-3.6b
- 這個存儲庫提供了一個擁有36億個參數的日文GPT-NeoX模型。
- Downloads: 5,091
- sbintuitions/sarashina-embedding-v1-1b
- "Sarashina-Embedding-v1-1B" 是一個基於擁有 1.2B 參數的日語 LLM 「Sarashina2.1-1B」的日語文本嵌入模型。
- Downloads: 4,952
- kotoba-tech/kotoba-whisper-v2.0
- 言語耳語(v2.0)
- Downloads: 4,817
- llm-book/bert-base-japanese-v3-jsts
- "bert-base-japanese-v3-jsts" 是在《大規模言語モデル入門》第5章中介紹的(意義相似度計算)模型。
- Downloads: 4,562
- OrionStarAI/Orion-14B-Chat
- Orion-14B🌐英文 | 🇨🇳中文 | 🇯🇵日文 | 🇰🇷韓文🤗
- Downloads: 4,524
- patrickramos/bert-base-japanese-v2-wrime-fine-tune
- WRIME微調BERT基本版日文這個模型是在WRIME數據集上微調的日文BERT基本版。
- Downloads: 4,382
- cl-nagoya/ruri-base
- 瑠璃:日文一般文本嵌入的使用方法(句子轉換器)
- Downloads: 4,139
- rinna/japanese-gpt2-small
- 這個資料庫提供了一個小型的日文 GPT-2 模型。
- Downloads: 4,106
- rinna/japanese-hubert-base
- 這是由 rinna 公司訓練的日文 HuBERT 基礎模型。
- Downloads: 3,936
- elyza/Llama-3-ELYZA-JP-8B-GGUF
- Llama-3-ELYZA-JP-8B-GGUF模型描述Llama-3-ELYZA-JP-8B是由ELYZA公司訓練的大型語言模型。基於meta-llama/Meta-Llama-3-8B-Instruct,通過額外的預訓練和指導調整進行了進一步的強化,以供日文使用。
- Downloads: 3,924
- rinna/japanese-wav2vec2-base
- rinna/japanese-wav2vec2-base簡介:這是由 rinna Co. 訓練的日文 wav2vec 2.0 基礎模型。
- Downloads: 3,777
- sazyou-roukaku/chilled_remix
- 【通知】chilled_remix和reversemix已於2023年5月21日進行了版本更改,升級至v2。
- Downloads: 3,630
- kotoba-tech/kotoba-whisper-v2.2
- Kotoba-Whisper-v2.2是一款基於kotoba-tech/kotoba-whisper-v2.0的日文ASR模型,並將額外的後處理堆棧集成為流水線。
- Downloads: 3,628
- mmnga/Llama-3-70B-japanese-suzume-vector-v0.1
- 模型ID實驗模型的模型卡片。
- Downloads: 3,452
- Bagus/wav2vec2-xlsr-japanese-speech-emotion-recognition
- 這僅限(私人)演示使用。
- Downloads: 3,409
- cyberagent/open-calm-small
- OpenCALM-SmallModel 说明OpenCALM 是一组仅解码器的语言模型套件,预先在日本数据集上进行预训练,由... 开发。
- Downloads: 3,395
- line-corporation/japanese-large-lm-3.6b-instruction-sft
- 該存儲庫提供了由 LINE 公司微調和訓練的 36 億參數日語語言模型。
- Downloads: 3,189
- Mizuiro-sakura/luke-japanese-large-sentiment-analysis-wrime
- 這個模型是以Luke-japanese-large-lite進行微調。
- Downloads: 3,090
- hotchpotch/japanese-reranker-cross-encoder-small-v1
- hotchpotch/japanese-reranker-cross-encoder-small-v1是使用日文進行訓練的重新排名器(CrossEncoder)系列。
- Downloads: 3,010
- ku-nlp/deberta-v3-base-japanese
- 日文DeBERTa V3 baseModel的模型卡
- Downloads: 2,975
- weblab-GENIAC/Tanuki-8B-dpo-v1.0
- 狸-8B-dpo-v1.0 模型資訊:狸-8B是一個大型語言模型,使用約8B個參數進行了約1.3T令牌的全面自學習。
- Downloads: 2,955
- rinna/japanese-gpt-1b
- 這個存儲庫提供了一個擁有 13 億參數的日文 GPT 模型。
- Downloads: 2,908
- FINGU-AI/FinguAI-Chat-v1
- FINGU-AI / FinguAI-Chat-v1概述FINGU-AI / FinguAI-Chat-v1 模型提供了針對對金融、投資和法律框架感興趣的英語、韓語和日語使用者的專門課程。
- Downloads: 2,857
- mmnga/Ninja-v1-NSFW-128k-gguf
- Ninja-v1-NSFW-128k-ggufLocal-Novel-LLM-project 公開了 Ninja-v1-NSFW-128k 的 gguf 格式轉換版本。
- Downloads: 2,825
- hotchpotch/japanese-bge-reranker-v2-m3-v1
- hotchpotch/japanese-bge-reranker-v2-m3-v1是使用日語進行訓練的Reranker(CrossEncoder)系列。
- Downloads: 2,758
- mmnga/aibuncho-japanese-novel-gpt-j-6b-gguf
- AIBunCho 所公開的 Japanese-novel-gpt-j-6b 是经過 GPT-3 轉換的版本。
- Downloads: 2,753
- cyberagent/Mistral-Nemo-Japanese-Instruct-2408
- Mistral-Nemo-Japanese-Instruct-2408 模型描述
- Downloads: 2,752
- jurabi/bert-ner-japanese
- 利用BERT的日文固有表現抽取模型BertForTokenClassification,從日文文本中抽取固有表現。
- Downloads: 2,691
- mmnga/ELYZA-japanese-Llama-2-7b-fast-instruct-gguf
- ELYZA-japanese-Llama-2-7b-fast-instruct-gguf是ELYZA小姐所发布的ELYZA-japanese-Llama-2-7b-fast-instruct的gguf格式转换版本。
- Downloads: 2,672
- pkshatech/simcse-ja-bert-base-clcmlp
- 日本 SimCSE(基於 BERT)
- Downloads: 2,657
- studio-ousia/luke-japanese-base-lite
- luke-japaneseluke-japanese 是 LUKE(Language Understanding with Knowledge-based Embeddings)的日本版本,是一种预先训练的、基于知识增强的上下文化词汇和实体表示。
- Downloads: 2,619
- QuantFactory/Mistral-Nemo-Japanese-Instruct-2408-GGUF
- QuantFactory/Mistral-Nemo-Japanese-Instruct-2408-GGUF 這是使用 llama.cpp 創建的 cyberagent/Mistral-Nemo-Japanese-Instruct-2408 的量子化版本。原始模型卡 Mistral-Nemo-Japanese-Instruct-2408 模型描述。
- Downloads: 2,608
- tokyotech-llm/Swallow-7b-hf
- 燕子 我們的燕子模型一直在進行持續的預訓練,主要是通過添加日語數據,從Llama 2家族進行的。
- Downloads: 2,579
- bclavie/JaColBERT
- 這份文件的日文版本仍在製作中。
- Downloads: 2,563
- cyberagent/llava-calm2-siglip
- 模型描述:llava-calm2-siglip 是一個實驗性的視覺語言模型,可以回答關於圖片的日文問題。
- Downloads: 2,521
- rinna/bilingual-gpt-neox-4b
- 這個存儲庫提供了一個擁有38億參數的英日雙語GPT-NeoX模型。
- Downloads: 2,482
- rinna/japanese-gpt-neox-3.6b-instruction-ppo
- 這個資料庫提供了一個擁有36億參數的日語GPT-NeoX模型。
- Downloads: 2,468
- OrionStarAI/Orion-14B-Base
- 獵戶座14B🌐英文 | 🇨🇳中文 | 🇯🇵日文 | 🇰🇷韓文🤗
- Downloads: 2,446
- tohoku-nlp/bert-base-japanese-char-whole-word-masking
- 這是在日文文字上預先訓練的BERT基礎模型(使用字符分詞,啟用了全詞遮罩)。
- Downloads: 2,394
- mmnga/DeepSeek-V3-slice-jp64
- DeepSeek-V3-slice-jp64 是一個實驗模型。該模型是以 DeepSeek-V3 為基礎,根據日語例句精選MoE(專家組合)模型中每個層級的專家,重新構建而成。
- Downloads: 2,390
- tokyotech-llm/Swallow-7b-instruct-v0.1
- 燕子 我們的燕子模型一直在接受來自Llama 2家族的持續預訓練,主要是增加了日語數據。
- Downloads: 2,294
- rinna/japanese-gpt2-xsmall
- 這個存儲庫提供了一個極小型的日文 GPT-2 模型。
- Downloads: 2,275
- llm-book/bert-base-japanese-v3-marc_ja
- 「bert-base-japanese-v3-marc_ja」是第5章「大規模言語模型入門」中介紹的(情感分析)模型。
- Downloads: 2,245
- tohoku-nlp/bert-large-japanese-char-v2
- BERT大型日語模型(字級別的標記化與整詞遮蔽,包含CC-100和jawiki-20230102)這是一個在日語文本上預先訓練的BERT模型。
- Downloads: 2,226
- studio-ousia/luke-japanese-large-lite
- LUKE-Japanese(盧克日文)是LUKE(具有基於知識的嵌入式的語言理解)的日本版本,它是一種預先訓練的知識增強的語境化單詞和實體表示。
- Downloads: 2,204
- stabilityai/japanese-stablelm-base-gamma-7b
- 日本穩定的LM基地Gamma 7B型
- Downloads: 2,181
- hotchpotch/japanese-reranker-cross-encoder-large-v1
- hotchpotch/japanese-reranker-cross-encoder-large-v1是一個使用日文進行訓練的Reranker(CrossEncoder)系列模型。
- Downloads: 2,035
- weblab-GENIAC/Tanuki-8x8B-dpo-v1.0
- 狸-8x8B-dpo-v1.0 模型說明:狸-8x8B是一個大規模的語言模型,是通過全新的方式預先訓練了約1.7T token的8x8B參數(總參數約47B,活躍參數約13B)。
- Downloads: 1,997
- rinna/japanese-hubert-large
- 這是由 rinna 公司訓練的日文 HuBERT Large 模型。
- Downloads: 1,962
- elyza/ELYZA-japanese-Llama-2-7b
- ELYZA-日本-大羊-2-7b模型描述ELYZA-日本-大羊-2-7b
- Downloads: 1,932
- mmnga/lightblue-suzume-llama-3-8B-japanese-gguf
- lightblue-suzume-llama-3-8B-japanese-gguflightblue 公開的 suzume-llama-3-8B-japanese 的 gguf 格式轉換版本。
- Downloads: 1,862
- tokyotech-llm/Swallow-13b-instruct-hf
- 燕子 我們的燕子模型持續接受來自Llama 2家族的預訓練,主要增加了日語資料。
- Downloads: 1,835
- llm-jp/llm-jp-3-172b-instruct3
- llm-jp-3-172b-instruct3llm-jp-3-172b-instruct3
- Downloads: 1,830
- litagin/anime-whisper
- 動漫吟唱 🤗🎤📝
- Downloads: 1,823
- elyza/ELYZA-japanese-Llama-2-7b-fast-instruct
- ELYZA-日本-羊駝-2-7b模型描述ELYZA-日本-羊駝-2-7b
- Downloads: 1,759
- nvidia/parakeet-tdt_ctc-0.6b-ja
- Parakeet TDT-CTC 0.6B (ja)||parakeet-tdt_ctc-0.6b-ja 是一個能夠在日語演講中加入標點符號的ASR模型。
- Downloads: 1,754
- rinna/youri-7b
- 我們對 llama2-7b 不斷進行預訓練,使用了包含日語和英語資料集混合的 40B tokens。
- Downloads: 1,703
- retrieva-jp/t5-large-medium
- 模型卡片的模型 ID:這是一個 T5 v1.1 模型,使用預訓練技術在一個日文語料庫上進行訓練。
- Downloads: 1,699
- mmnga/ELYZA-japanese-Llama-2-7b-fast-gguf
- ELYZA-japanese-Llama-2-7b-fast-gguf是由ELYZAさん发布的ELYZA-japanese-Llama-2-7b-fast的gguf格式转换版。
- Downloads: 1,699
- retrieva-jp/t5-base-long
- 模型 ID 的模型卡片這是一個 T5 v1.1 模型,已在日語語料庫上預訓練。
- Downloads: 1,676
- mmnga/DeepSeek-R1-Distill-Qwen-14B-gguf
- DeepSeek-R1-Distill-Qwen-14B-gguf是由deepseek-ai發布的DeepSeek-R1-Distill-Qwen-14B的gguf格式轉換版本。
- Downloads: 1,649
- abeja/gpt-neox-japanese-2.7b
- 這個開放的 PR 在 2022 年 9 月 14 日被合併。您可以通過以下方式使用這個模型與 4.23 及更高版本的 transformers:pip install transformers。這個存儲庫提供了一個基於 2.7B 參數的日語 GPT-NeoX 模型。
- Downloads: 1,591
- nlp-waseda/roberta-large-japanese-seq512-with-auto-jumanpp
- 這是一個在日本維基百科和CC-100的日文部分上進行預訓練的日文RoBERTa大型模型,序列長度最大為512。如何使用:您可以按照以下方式將此模型用於遮罩語言建模:from transformers import AutoTokenizer, AutoModelForMaskedLMtokenizer = AutoTokenizer.from_pretrained("nlp-waseda/roberta-large-japanese-seq512-with-auto-juman
- Downloads: 1,588
- cyberagent/open-calm-1b
- OpenCALM-1B模型描述OpenCALM是由CyberAgent, Inc.开发的一系列仅解码器语言模型,预先在日本数据集上进行训练。
- Downloads: 1,581
- mmnga/DeepSeek-R1-Distill-Llama-8B-gguf
- DeepSeek-R1-Distill-Llama-8B-gguf 是 DeepSeek AI 公開的 DeepSeek-R1-Distill-Llama-8B 的 gguf 格式轉換版本。
- Downloads: 1,581
- kotoba-tech/kotoba-whisper-v2.1
- Kotoba-Whisper-v2.1是一個基於kotoba-tech/kotoba-whisper-v2.0的日本語認識系統模型,並加入了額外的後處理程序集成為流程。
- Downloads: 1,578
- mmnga/DeepSeek-R1-Distill-Qwen-7B-gguf
- DeepSeek-R1-Distill-Qwen-7B-gguf是由deepseek-ai公開的DeepSeek-R1-Distill-Qwen-7B的gguf格式轉換版本。
- Downloads: 1,562
- izumi-lab/deberta-v2-small-japanese
- 這是一個在日本文本上預訓練的 DeBERTaV2 模型。
- Downloads: 1,560
- lmg-anon/vntl-llama3-8b-v2-gguf
- 總結:這是一個使用新版本的VNTL數據集創建的LLaMA 3 Youko qlora精調。
- Downloads: 1,556
- mmnga/lightblue-suzume-llama-3-8B-multilingual-gguf
- lightblue-suzume-llama-3-8B-multilingual-gguflightblue提供的suzume-llama-3-8B-multilingual的gguf格式轉換版本。
- Downloads: 1,495
- KoichiYasuoka/roberta-small-japanese-luw-upos
- 羅伯塔-小-日文-盧瓦-Universal Part-of-Speech 模型
- Downloads: 1,488
- aken12/splade-japanese-v3
- 對 MIRACL 日文版的評估顯示,這些模型並未使用 MIRACL 的訓練數據進行訓練。
- Downloads: 1,476
- nlp-waseda/roberta-large-japanese-with-auto-jumanpp
- nlp-waseda/roberta-large-japanese-with-auto-jumanpp模型描述這是一個在日文維基百科和CC-100日文部分預訓練的日文RoBERTa大型模型。如何使用您可以按照以下方式使用此模型進行遮罩語言建模:from transformers import AutoTokenizer, AutoModelForMaskedLMtokenizer = AutoTokenizer.from_pretrained("nlp-waseda/roberta-large-japanese-with-auto-jumanpp")
- Downloads: 1,472
- line-corporation/japanese-large-lm-3.6b
- 這個資料庫提供一個由LINE公司訓練的擁有3.6B參數的日文語言模型。
- Downloads: 1,458
- mmnga/DeepSeek-R1-Distill-Qwen-32B-gguf
- DeepSeek-R1-Distill-Qwen-32B-gguf是由deepseek-ai發布的DeepSeek-R1-Distill-Qwen-32B的gguf格式轉換版本。
- Downloads: 1,455
- mmnga/ELYZA-japanese-Llama-2-13b-fast-instruct-gguf
- ELYZA-japanese-Llama-2-13b-fast-instruct-gguf 是 ELYZA 公開的 ELYZA-japanese-Llama-2-13b-fast-instruct 的 gguf 格式轉換版。
- Downloads: 1,430
- stabilityai/japanese-stablelm-base-alpha-7b
- 「能說日語的鸚鵡,浮世繪,江戶時代」——穩定擴散 XL型描述。日本穩定 LM基底 Alpha-7B是一個 7B-參數的僅解碼器語言模型,預先在多元的日本和英文數據集上進行了預訓練,專注於最大化日語語言建模表
- Downloads: 1,430
- mmnga/pfnet-nekomata-14b-pfn-qfin-inst-merge-gguf
- pfnet-nekomata-14b-pfn-qfin-inst-merge-ggufpfnet is releasing a gguf format conversion version of nekomata-14b-pfn-qfin-inst-merge.
- Downloads: 1,425
- llm-book/bert-base-japanese-v3-jnli
- bert-base-japanese-v3-jnli是「大規模言語模型入門」第5章介紹的(自然語言推論)模型。
- Downloads: 1,413
- tokyotech-llm/Swallow-13b-instruct-v0.1
- 我們的燕子模型經過了持續的預訓練,主要是加入了日語的數據,這些數據都來自Llama 2家族。
- Downloads: 1,409
- retrieva-jp/bert-1.3b
- RetrievaBERT 模型是使用 Megatron-LM 预训练的 Transformer 编码器,专为日语设计。
- Downloads: 1,407
- sarulab-speech/hubert-base-jtube
- 此存儲庫提供了在JTubeSpeech語料庫上訓練的hubert-base模型的模型權重。往下滾動查看模型使用FAQ。
- Downloads: 1,391
- elyza/ELYZA-japanese-Llama-2-7b-fast
- ELYZA-日本-羊駱駝-2-7b模型描述ELYZA-日本-羊駱駝-2-7b
- Downloads: 1,390
- mmnga/ELYZA-japanese-Llama-2-7b-instruct-gguf
- ELYZA日文Llama-2-7b指令gguf格式轉換版。
- Downloads: 1,378
- globis-university/deberta-v3-japanese-base
- 這是什麼?
- Downloads: 1,376
- Ultralytics/YOLO11
- Ultralytics YOLOv5 是一種尖端的先進模型,基於之前 YOLO 版本的成功,引入了新功能和改進,以進一步提高性能和靈活性。
- Downloads: 1,370
- FunAudioLLM/SenseVoiceSmall
- (简体中文|英语|日语)简介Github资料库:https://github.com/FunAudioLLM/SenseVoiceSenseVoice是一个具有多种语音理解能力的语音基础模型,包括自动语音识别(ASR)、口语语言识别(LID)、语音情感识别(SER)和音频事件检测(AED)。
- Downloads: 1,352
- tokyotech-llm/Swallow-13b-hf
- 燕子 我們的燕子模型一直受到來自Llama 2家族的持續預訓練,主要是通過添加日語數據。
- Downloads: 1,350
- mmnga/DeepSeek-V3-slice-jp64-gguf
- DeepSeek-V3-slice-jp64 這個模型是以 DeepSeek-V3 為基礎,根據日本語例句中常見的 MoE(專家混合)每層專家進行精心挑選並重新構建的模型版本。
- Downloads: 1,323
- KoichiYasuoka/modernbert-base-japanese-wikipedia
- modernbert-base-japanese-wikipedia 模型描述
- Downloads: 1,303
- globis-university/deberta-v3-japanese-xsmall
- 這是什麼?
- Downloads: 1,286
- tsmatz/mt5_summarize_japanese
- 這個模型是針對日本語摘要訓練的 google/mt5-small 的微調版本。
- Downloads: 1,262
- mmnga/Fugaku-LLM-13B-instruct-gguf
- 富岳-LLM-13B-指導-gguf這是富岳-LLM上傳的富岳-LLM-13B-指導的gguf格式轉換版。
- Downloads: 1,253
- tokyotech-llm/Swallow-70b-instruct-hf
- 燕子 我們的燕子模型已經不斷從Llama 2家族中接受預訓練,主要是通過添加日語數據。
- Downloads: 1,249
- retrieva-jp/t5-large-short
- 模型ID的模型卡片這是一個T5 v1.1模型,是在一個日語語料庫上預訓練的。
- Downloads: 1,247
- mmnga/japanese-stablelm-2-instruct-1_6b-gguf
- AI大家族的 japanese-stablelm-2-instruct-1_6b 譯者所公開的 gguf 格式轉換版本。
- Downloads: 1,241
- stockmark/stockmark-13b
- Stockmark-13b是一個具有130億個參數的LLM,是基於約2200億個標記的日文語料庫從頭訓練而成的。
- Downloads: 1,220
- mmnga/ELYZA-japanese-CodeLlama-7b-instruct-gguf
- ELYZA-japanese-CodeLlama-7b-instruct-gguf是ELYZA小姐公開的gguf格式轉換版ELYZA-japanese-CodeLlama-7b-instruct。
- Downloads: 1,200
- izumi-lab/deberta-v2-base-japanese
- 這是一個在日本文本上預訓練的DeBERTaV2模型。
- Downloads: 1,186
- elyza/ELYZA-japanese-Llama-2-13b-instruct
- ELYZA-japanese-Llama-2-13b模型說明ELYZA-japanese-Llama-2-13b 是基於Llama 2模型,進行了額外的預先學習以擴展日語能力的模型。
- Downloads: 1,184
- cyberagent/calm2-7b
- CyberAgentLM2-7B (CALM2-7B) -> 數位代理商LM2-7B (CALM2-7B)
- Downloads: 1,154
- mmnga/umiyuki-Japanese-Chat-Umievo-itr001-7b-gguf
- 海雪-Japanese-Chat-Umievo-itr001-7b-ggufumiyuki 先生公開了日本聊天室-Umievo-itr001-7b 的 gguf 格式轉換版。
- Downloads: 1,143
- cyberagent/open-calm-large
- OpenCALM-Large模型介紹OpenCALM是一套僅解碼器的語言模型套件,是在日本數據集上預先訓練的,由開發。
- Downloads: 1,137
- hotchpotch/japanese-reranker-cross-encoder-base-v1
- 雜亂無章/japanese-reranker-cross-encoder-base-v1 是一個以日語訓練的重新排序器(CrossEncoder)系列。
- Downloads: 1,134
- rinna/llama-3-youko-8b
- Llama 3 Youko 8B (rinna/llama-3-youko-8b) -> 加拉馬 3 妖狐 8B (rinna/llama-3-youko-8b)
- Downloads: 1,130
- tohoku-nlp/bert-large-japanese
- BERT 大型日語模型(採用unidic-lite全詞遮罩,jawiki-20200831)這是一個在日語文本上預先訓練的BERT模型。
- Downloads: 1,130
- llm-jp/llm-jp-3-3.7b
- llm-jp-3-3.7bLLM-JP-3-3.7b
- Downloads: 1,127
- tokyotech-llm/Llama-3.1-Swallow-70B-Instruct-v0.3
- Llama 3.1 Swallow - 以Llama构建 Llama 3.1 Swallow 是一系列大型语言模型(8B,70B),通过在Meta Llama 3.1模型上持续预训练而构建。
- Downloads: 1,118
- nlp-waseda/roberta-base-japanese
- 這是一個在日文維基百科和CC-100日文部分預訓練的日語RoBERTa基本模型。如何使用:您可以按照以下步驟使用這個模型進行遮罩語言建模:pythonfrom transformers import AutoTokenizer, AutoModelForMaskedLMtokenizer = AutoTokenizer.from_pretrained("nlp-waseda/roberta-base-japanese")
- Downloads: 1,117
- ku-nlp/bart-base-japanese
- 日本BART基礎模型的模型卡
- Downloads: 1,117
- mmnga/DeepSeek-R1-Distill-Qwen-1.5B-gguf
- DeepSeek-R1-Distill-Qwen-1.5B-gguf 是由 deepseek-ai 公開的 DeepSeek-R1-Distill-Qwen-1.5B 的 gguf 格式轉換版。
- Downloads: 1,113
- mmnga/DataPilot-ArrowPro-7B-KUJIRA-gguf
- DataPilot-ArrowPro-7B-KUJIRA-gguf 是 DataPilot 先生公開的 ArrowPro-7B-KUJIRA 的 gguf 格式轉換版本。
- Downloads: 1,111
- alfredplpl/gemma-2-2b-jpn-it-gguf
- 模型卡 - gemma-2-2b-jpn-it-gguf 這是Google公司的gemma-2-2b-jpn-it量子化版本。
- Downloads: 1,108
- mmnga/tokyotech-llm-Swallow-7b-instruct-v0.1-gguf
- 東工大-硏-燕-7b-指導-v0.1-gguf東工大-硏公開的Swallow-7b-指導-v0.1的gguf格式轉換版。
- Downloads: 1,101
- izumi-lab/bert-small-japanese
- 這是一個在日語文本上預訓練的小型 BERT 模型。
- Downloads: 1,078
- mmnga/tokyotech-llm-Swallow-13b-instruct-v0.1-gguf
- 東工大-LLM-Swallow-13b-instruct-v0.1-gguf東工大-LLM先生公開了Swallow-13b-instruct-v0.1的gguf格式轉換版。
- Downloads: 1,057
- llm-book/bert-base-japanese-v3-unsup-simcse-jawiki
- 在「大規模言語模型入門」的第8章中介紹的無監督SimCSE模型是指bert-base-japanese-v3-unsup-simcse-jawiki。
- Downloads: 1,040
- mmnga/tokyotech-llm-Swallow-MS-7b-instruct-v0.1-gguf
- 東京工業大學LLM的Swallow-MS-7b-instruct-v0.1指導版本的gguf格式轉換版,由tokyotech-llm發佈。
- Downloads: 1,038
- kotoba-tech/kotoba-whisper-v1.1
- Kotoba-Whisper-v1.1是一個基於kotoba-tech/kotoba-whisper-v1.0的日語ASR模型,並集成額外的後處理堆棧作為管道。
- Downloads: 1,004
- mmnga/line-corp-japanese-large-lm-1.7b-gguf
- line-corporation/japanese-large-lm-1.7b 是 line-corporation 公開的 japanese-large-lm-1.7b 的 gguf 轉換版。
- Downloads: 982
- turing-motors/heron-chat-blip-ja-stablelm-base-7b-v1
- Heron BLIP Japanese StableLM 轉換為繁體中文為:「蜆鳥BLIP日本穩定LM」
- Downloads: 969
- mmnga/haqishen-Llama-3-8B-Japanese-Instruct-gguf
- 哈奇神-Llama-3-8B-日文指南-ggufhaqishen 公開了 Llama-3-8B-日文指南 的 gguf 格式轉換版本。
- Downloads: 952
- ThePioneer/CoolerWaifuDiffusion
- 模型說明(model explanation):將CoolJapanDiffusion 2.1.1和WaifuDiffusion 1.4的anime epoch2合併。
- Downloads: 950
- stabilityai/japanese-stablelm-instruct-gamma-7b
- 日本穩定的LM指令Gamma 7B模型
- Downloads: 948
- stabilityai/japanese-stablelm-instruct-beta-70b
- 日本-StableLM-Instruct-Beta-70B這個可愛的機器人穿著和服,用一支筆書寫書法——Stable Diffusion XLModel 說明japanese-stablelm-instruct-beta-70b 是一個具有 70B 個參數的僅解碼語言模型,基於日本-StableLM-Base-Beta-70B,並在 Databricks Dolly-15k、Anthropic HH 和其他
- Downloads: 944
- mmnga/Ninja-v1-NSFW-gguf
- Ninja-v1-NSFW-ggufLocal-Novel-LLM-project先生發布的Ninja-v1-NSFW的gguf格式轉換版本。
- Downloads: 941
- mmnga/aixsatoshi-Llama-3-8b-Cosmopedia-japanese-gguf
- aixsatoshi-Llama-3-8b-Cosmopedia-japanese-ggu是由aixsatoshi分享的Llama-3-8b-Cosmopedia-japanese的gguf格式轉換版。
- Downloads: 919
- mmnga/line-corp-japanese-large-lm-1.7b-instruction-sft-gguf
- line-corporation 公司釋出的 japanese-large-lm-1.7b-instruction-sft 的 gguf 轉換版本。
- Downloads: 917
- abeja/gpt2-large-japanese
- 這個存儲庫提供了一個大型的日文GPT-2模型。
- Downloads: 913
- stabilityai/japanese-stablelm-base-beta-70b
- 日本穩定語言模型基礎版Beta-70B一隻穿着和服的可愛機器人以一支筆書寫書法 — 穩定擴散XL模型描述japanese-stablelm-base-beta-70b 是一個擁有70億參數的僅解碼語言模型,以Llama-2-70b為基礎,在各種日語資料上
- Downloads: 912
- tokyotech-llm/Swallow-7b-instruct-hf
- Swallow我們的Swallow模型已經在Llama 2家族的持續預訓練中進行改進,主要是添加了日語數據。
- Downloads: 911
- mmnga/alfredplpl-Llama-3-8B-Instruct-Ja-gguf
- alfredplpl 公開的 Llama-3-8B-Instruct-Ja 的 gguf 格式轉換版本。
- Downloads: 900
- llm-book/t5-base-long-livedoor-news-corpus
- 「大規模語言模型入門」第7章介紹的是摘要生成模型。
- Downloads: 891
- augmxnt/shisa-base-7b-v1
- shisa-base-7b-v1是基於Mistral 7B的模型,並添加了主要是日本預訓練的額外8B tokens。
- Downloads: 887
- augmxnt/shisa-7b-v1
- 石獅子 7B(shisa-7b-v1)
- Downloads: 882
- mmnga/YuisekinAIEvol-Mistral-7B-ja-math-v0.1.1-gguf
- YuisekinAIEvol-Mistral-7B-ja-math-v0.1.1-ggufyuiseki先生所公開的YuisekinAIEvol-Mistral-7B-ja-math-v0.1.1的gguf格式轉換版。
- Downloads: 859
- dahara1/weblab-10b-instruction-sft-GPTQ
- weblab-10b-instruction-sft-GPTQ原始模型weblab-10b-instruction-sft, 是由松尾研究室的小島剛創建的日本中心的多語言GPT-NeoX模型,擁有100億個參數。
- Downloads: 856
- elyza/ELYZA-japanese-Llama-2-13b-fast-instruct
- ELYZA-japanese-Llama-2-13b 快速说明模型描述:ELYZA-japanese-Llama-2-13b 是基于 Llama 2,并进行了额外的预训练以扩展其日语能力的模型。
- Downloads: 852
- elyza/ELYZA-japanese-Llama-2-13b
- ELYZA-japanese-Llama-2-13b 模型描述ELYZA-japanese-Llama-2-13b 是在 Llama 2 模型基础上执行额外的预设学习以扩展日语能力而创建的模型。
- Downloads: 840
- tokyotech-llm/Swallow-MX-8x7b-NVE-v0.1
- 燕-MX-8x7b-NVE-v0.1我們的燕-MX-8x7b-NVE-v0.1模型已經從Mixtral-8x7B-Instruct-v0.1經歷過持續的預訓練,主要增加了日語語料。
- Downloads: 836
- dahara1/ELYZA-japanese-Llama-2-7b-fast-instruct-GPTQ
- 模型 ID 為 elyza/ELYZA-japanese-Llama-2-7b-fast-instruct 的模型卡,基於 Meta 的 "Llama 2" 模型,進行了進一步在日語上的預訓練以及原始的後訓練和速度調優。
- Downloads: 831
- elyza/ELYZA-japanese-Llama-2-13b-fast
- ELYZA-japanese-Llama-2-13b-fastModel 描述ELYZA-japanese-Llama-2-13b 是基於 Llama 2 進行了額外的預訓練以擴展日語能力的模型。
- Downloads: 827
- alfredplpl/gemma-2-baku-2b-it-gguf
- gemma-2-2b-jpn-it-gguf的模型卡是,對rinna的gemma-2-baku-2b-it進行了量子化。
- Downloads: 816
- mmnga/stockmark-gpt-neox-japanese-1.4b-gguf
- stockmark-gpt-neox-japanese-1.4b-ggufstockmark先生所公開的gpt-neox-japanese-1.4b版本的gguf格式轉換版。
- Downloads: 812
- mmnga/ryota39-Phi-3-mini-4k-instruct-dpo-gguf
- ryota39-Phi-3-mini-4k-instruct-dpo-gguf這是ryota39先生公開的Phi-3-mini-4k-instruct-dpo的gguf格式轉換版本。
- Downloads: 812
- macadeliccc/polyglot-math-4x7b
- Polyglot-math-4x7b-24bPolyglot-4x7b 是一種多語言模型的專家混合方法。
- Downloads: 810
- mmnga/ELYZA-japanese-Llama-2-7b-gguf
- ELYZA-japanese-Llama-2-7b-gguf 是 ELYZA 公開的 ELYZA-japanese-Llama-2-7b 的 gguf 格式轉換版。
- Downloads: 810
- rinna/japanese-gpt-neox-3.6b-instruction-sft
- 這個存儲庫提供了一個擁有36億參數的日語GPT-NeoX模型。
- Downloads: 805
- sonoisa/clip-vit-b-32-japanese-v1
- 這是一個針對日文的CLIP文字/圖像編碼器模型。
- Downloads: 792
- recruit-jp/japanese-typo-detector-roberta-base
- recruit-jp/japanese-typo-detector-roberta-base模型概述輸入日文文章後,將根據每個字元的錯字率輸出。各標籤意義如下:idlabelmeaning0OK沒有錯字1deletion遺漏一個字元2insertion_a多餘的一個字元3insertion_b與前一個字串相同且超過兩個字元多
- Downloads: 792
- mmnga/rinna-llama-3-youko-8b-gguf
- rinna-llama-3-youko-8b-ggufrinna 君所公開的 llama-3-youko-8b 的 gguf 格式轉換版。
- Downloads: 788
- mmnga/tokyotech-llm-Llama-3.1-Swallow-8B-Instruct-v0.3-gguf
- 東工大-llm-Llama-3.1-Swallow-8B-Instruct-v0.3-gguf 是東工大-llm 公開的 Llama-3.1-Swallow-8B-Instruct-v0.3 的 gguf 格式轉換版。
- Downloads: 785
- hotchpotch/japanese-splade-v2
- 稀疏词汇和扩展模型 (SPLADE) 是一种高性能的日语模型。
- Downloads: 780
- alabnii/jmedroberta-base-manbyo-wordpiece
- 這是一個日本 RoBERTa 基礎模型,是在日本科學技術振興機構(JST)收集的醫學科學學術文章上進行預訓練的。
- Downloads: 776
- lmg-anon/vntl-llama3-8b-gguf
- 這個資料庫包含了一些 GGUF 對 VNTL LLaMA 3 8B qlora 合併的量化。
- Downloads: 765
- mmnga/tokyotech-llm-Swallow-70b-instruct-v0.1-gguf
- 東京工業大学-碩士專業法律學位- Swallow-70b-instruct-v0.1-指導-v0.1-gguftokyotech-llm先生公開的Swallow-70b-instruct-v0.1的gguf格式轉換版本。
- Downloads: 732
- tokyotech-llm/Swallow-70b-hf
- 燕子 我們的燕子模型接受了來自Llama 2家族的持續預訓練,主要是加入了日語數據。
- Downloads: 716
- rinna/japanese-gpt-neox-small
- 這個資料庫提供了一個小型的日文 GPT-NeoX 模型。
- Downloads: 712
- mmnga/ELYZA-japanese-Llama-2-13b-fast-gguf
- ELYZA-japanese-Llama-2-13b-fast-gguf是ELYZA提供的ELYZA-japanese-Llama-2-13b-fast的gguf格式轉換版本。
- Downloads: 708
- mmnga/Phi-3-mini-128k-instruct-gguf
- Phi-3-mini-128k-instruct-ggufmicrosoft has made available the gguf format conversion version of Phi-3-mini-128k-instruct.
- Downloads: 701
- sonoisa/t5-base-japanese-v1.1
- 這是一個在日本語語料庫上預先訓練的T5(文字轉換器)模型。
- Downloads: 685
- Lasorco/lametta
- 這個模型是什麼?
- Downloads: 682
- mmnga/pfnet-nekomata-14b-pfn-qfin-gguf
- pfnet-nekomata-14b-pfn-qfin-ggufpfnet所公開的nekomata-14b-pfn-qfin的gguf格式轉換版。
- Downloads: 679
- cyberagent/open-calm-3b
- OpenCALM-3B模型描述OpenCALM是一套僅解碼器的語言模型套件,它是由CyberAgent, Inc. 在日本數據集上預先訓練而開發的。
- Downloads: 675
- mmnga/DataPilot-ArrowPro-7B-RobinHood-gguf
- DataPilot-ArrowPro-7B-RobinHood-gguf這是DataPilot發布的ArrowPro-7B-RobinHood的gguf格式轉換版本。
- Downloads: 672
- TheBloke/japanese-stablelm-instruct-gamma-7B-GGUF
- 聊天與支援:TheBloke 的 Discord 伺服器。想要貢獻嗎?
- Downloads: 657
- mradermacher/japanese-llama-3-8b-instruct-v2-i1-GGUF
- 關於 https://huggingface.co/owner203/japanese-llama-3-8b-instruct-v2 的加權/矩陣量化,可在 https://huggingface.co/mradermacher/japanese-llama-3-8b-instruct-v2-GGUF 找到靜態量化選項。用法
- Downloads: 651
- mmnga/Ninja-v1-gguf
- Ninja-v1-ggufLocal-Novel-LLM-project 先生所公開的Ninja-v1 gguf 格式轉換版。
- Downloads: 628
- TheBloke/japanese-stablelm-instruct-beta-70B-GGUF
- 即時通訊與支援:TheBloke 的 Discord 伺服器 想貢獻嗎?
- Downloads: 622
- mmnga/Meta-Llama-3-8B-Instruct-gguf
- Meta-Llama-3-8B-Instruct-ggufmeta-llama公開的Meta-Llama-3-8B-Instruct的gguf格式轉換版本。
- Downloads: 602
- mmnga/c4ai-command-r-plus-gguf
- CohereForAI 公開的 c4ai-command-r-plus 裡的 gguf 格式轉換版。
- Downloads: 588
- skytnt/gpt2-japanese-lyric-small
- 日本語 GPT2 歌詞モデルモデルの説明このモデルは日本語の歌詞を生成するために使用されています。
- Downloads: 586
- stabilityai/japanese-stablelm-3b-4e1t-base
- 日语 StableLM-3B-4E1T BaseModel 说明这是一个以最大化日语语言建模性能和日语下游任务性能为重点的3B参数仅解码器语言模型。
- Downloads: 573
- retrieva-jp/t5-large-long
- 模型ID的模型卡片這是一個T5 v1.1模型,是在一個日文語料庫上預訓練的。
- Downloads: 566
- mmnga/AXCXEPT-EZO-phi-4-v2_900-gguf
- AXCXEPT-EZO-phi-4-v2_900-gguf是由AXCXEPT先生提供的EZO-phi-4-v2_900的gguf格式轉換版本。
- Downloads: 546
- mmnga/Qwen1.5-110B-Chat-gguf
- Qwen1.5-110B-Chat-gguf 是 Qwen 公開的 gguf 格式轉換版Qwen1.5-110B-Chat。
- Downloads: 543
- izumi-lab/bert-base-japanese-fin-additional
- 額外預訓練的 BERT 基礎版日文金融模型。這是一個在日語文本上預訓練的 BERT 模型。
- Downloads: 523
- elyza/ELYZA-japanese-CodeLlama-7b-instruct
- ELYZA-japanese-CodeLlama-7b 模型描述ELYZA-japanese-CodeLlama-7b 是在基於 Code Llama 模型的基礎上進行了額外的預先訓練,以擴展日本語能力的模型。
- Downloads: 519
- vumichien/wav2vec2-large-xlsr-japanese-hiragana
- 使用了Saruwatari-lab、東京大學 JSUT 的 Common Voice 和日語語音資料庫,對 facebook/wav2vec2-large-xlsr-53 進行了日語微調。使用此模型時,請確保您的語音輸入採樣頻率為16kHz。
- Downloads: 510
- second-state/ELYZA-japanese-Llama-2-13b-fast-instruct-GGUF
- ELYZA-日本-鬼-2-13b-迅速指示-GGUF原型elyza/ELYZA-日本-鬼-2-13b-迅速指示與駱馬一起運行LlamaEdgeLlamaEdge版本:v0.2.8 及以上提示範本提示類型:駱馬-2-聊天提示字串<s>[INST] <<SYS>>{{ system_prompt }}<</
- Downloads: 494
- TKU410410103/hubert-base-japanese-asr
- hubert-base-asr這個模型是針對自動語音識別任務在common_voice_11_0數據集上對rinna/japanese-hubert-base進行微調的版本。
- Downloads: 486
- stabilityai/japanese-stablelm-3b-4e1t-instruct
- 這是一個在指示遵循數據集上微調的僅解碼器的3B參數日語語言模型,建立在基礎模型日本 StableLM-3B-4E1T Base 之上。
- Downloads: 481
- colorfulscoop/sbert-base-ja
- 這個資料庫包含了一個針對日文的基礎句子BERT模型。
- Downloads: 459
- kit-nlp/bert-base-japanese-sentiment-irony
- 這是一個針對日本語進行情感分析的 BERT Base 模型,此外還進行了微調以自動檢測諷刺。
- Downloads: 458
- mmnga/karakuri-lm-32b-thinking-2501-exp-gguf
- karakuri-lm-32b-thinking-2501-exp-gguf是由karakuri-ai發佈的,這是經過格式轉換的karakuri-lm-32b-thinking-2501-exp的gguf版本。
- Downloads: 456
- ku-nlp/roberta-base-japanese-char-wwm
- 這是基於日文Wikipedia和日文CC-100預訓練的日文RoBERTa基本模型。此模型是使用字符級別的標記和整詞遮罩進行訓練的。
- Downloads: 448
- TFMC/Japanese-Starling-ChatV-7B-GGUF
- "Japanese-Starling-ChatV-7B-GGUFGGUF" 譯作 "日本寿带鸟-聊天V-7B"。"Japanese-Starling-ChatV-7B" 是一款日本聊天模型,建立在 "chatntq-ja-7b-v1.0" 之上,最初基于 Mistral-7B-v0.1。我將從 "Starling-LM-7B-beta" 的權重中減去 Mistral-7B-v0.
- Downloads: 441
- nlp-waseda/roberta-base-japanese-with-auto-jumanpp
- nlp-waseda/roberta-base-japanese-with-auto-jumanpp 模型描述這是在日文維基百科和CC-100的日文部分上預訓練的日文 RoBERTa 基本模型如何使用您可以按以下方式將此模型用於遮罩語言建模:from transformers import AutoTokenizer, AutoModelForMaskedLMtokenizer = AutoTokenizer.from_pretrained("nlp-waseda/roberta-base-japanese-with-auto-jumanpp")
- Downloads: 441
- beomi/gemma-mling-7b
- Gemma-Mling:多語言 Gemma 更新@ 2024.04.15:Gemma-Mling 7B 模型首次發布原始 Gemma 模型頁面:Gemma 該模型卡對應於 Gemma-Mling 模型的 7B 基本版本,主要預先訓練於韓文/英文/中文/日文+500 多語言語料庫。
- Downloads: 419
- mmnga/Ninja-v1-128k-gguf
- Ninja-v1-128k-ggufLocal-Novel-LLM-project先生公開的Ninja-v1-128k的gguf格式轉換版本。
- Downloads: 408
- retrieva-jp/t5-xl
- 模型 ID 的模型卡片這是一個 T5 v1.1 模型,在日文語料庫上預先訓練過。
- Downloads: 405
- line-corporation/japanese-large-lm-1.7b-instruction-sft
- 這個存儲庫提供了一個由 LINE 公司進行微調和訓練的包含 17 億參數的日語語言模型。
- Downloads: 400
- alabnii/jmedroberta-base-sentencepiece
- 這是一個日語RoBERTa基本模型,是在由日本科學技術局(JST)收集的醫學科學學術文章中預先訓練的。
- Downloads: 400
- esnya/japanese_speecht5_tts
- SpeechT5(TTS 任務)的日語模型 SpeechT5 經過日語語音合成(文本轉語音)微調。
- Downloads: 395
- mmnga/SakanaAI-EvoLLM-JP-A-v1-7B-gguf
- SakanaAI-EvoLLM-JP-A-v1-7B-gguf 是由 SakanaAI 公開的 EvoLLM-JP-A-v1-7B 的 gguf 格式轉換版本。
- Downloads: 395
- ku-nlp/bart-large-japanese
- 日语 BART 大型模型的模型卡片模型描述这是一个在日语维基百科上预训练的日语 BART 大型模型。
- Downloads: 391
- AkitoP/whisper-large-v3-japense-phone_accent
- 耳語大V3日本手機口音
- Downloads: 383
- mmnga/SakanaAI-EvoLLM-JP-v1-7B-gguf
- SakanaAI 公開的 EvoLLM-JP-v1-7B gguf 格式轉換版。
- Downloads: 382
- stabilityai/japanese-stablelm-base-beta-7b
- 日文-StableLM-基礎-Beta-7B穿著和服的可愛機器人用單一筆寫書法 — Stable Diffusion XLModel描述japanese-stablelm-基礎-beta-7b 是一個7B參數解碼器的語言模型,基於Llama-2-7b,經由在各種日本數據上微調,旨在最大化在日語任務上
- Downloads: 379
- NTQAI/wav2vec2-large-japanese
- Wav2Vec2-Large-JapaneseFine-tuned facebook/wav2vec2-large-xlsr-53 在Common Voice、JSUT、TEDxJP和其他一些數據上對日語進行了微調。
- Downloads: 368
- stabilityai/japanese-stable-clip-vit-l-16
- 通過下載、使用或分發此模型的任何部分或元素,您同意受到 LICENSE 文件中描述的協議的約束。
- Downloads: 363
- retrieva-jp/t5-base-medium
- 模型卡片 - 模型ID這是一個T5 v1.1模型,是在日本語語料庫上預訓練的。
- Downloads: 361
- vumichien/wav2vec2-large-xlsr-japanese
- 將 facebook/wav2vec2-large-xlsr-53 以 Common Voice 及 University of Tokyo JSUT 的 Saruwatari-lab 日文語音語料庫進行微調,獲得 Wav2Vec2-Large-XLSR-53-JapaneseFine-tuned 模型。請使用此模型時,確保輸入的語音樣本採樣頻率為 16kHz。
- Downloads: 353
- mradermacher/Japanese-Starling-ChatV-7B-i1-GGUF
- ken11/albert-base-japanese-v1
- albert-base-japanese-v1是預先訓練過的ALBERT模型,用於日語。如何使用微調這個模型這個模型是預先訓練過的模型,基本上預期用於針對各種任務進行微調。填充掩碼在這個模型中,Tokenizer使用了Sentencepiece,所以在使用時,必須處理[MASK]
- Downloads: 351
- Aratako/calm3-22b-RP-v2-GGUF
- calm3-22b-RP-v2-GGUF 概要 Aratako/calm3-22b-RP-v2的量子化完成GGUF版。
- Downloads: 349
- mmnga/rinna-japanese-gpt-neox-3.6b-instruction-ppo-gguf
- rinna/japanese-gpt-neox-3.6b-instruction-ppo是rinna发布的japanese-gpt-neox-3.6b-instruction-ppo的gguf转换版本。
- Downloads: 348
- akiFQC/bert-base-japanese-v3_nli-jsnli
- 考虑到 JNLI 评估结果,我们建议在日语自然语言推理中使用 akiFQC/bert-base-japanese-v3_nli-jsnli-jnli-jsick。
- Downloads: 346
- stabilityai/japanese-instructblip-alpha
- Japanese InstructBLIP Alpha模型詳細Japanese InstructBLIP Alpha是一個視覺語言指示跟隨模型,可以為輸入圖像生成日語描述,並可選擇性地加入輸入文本,例如問題。
- Downloads: 345
- llm-book/bert-base-japanese-v3-jcommonsenseqa
- bert-base-japanese-v3-jcommonsenseqa是「大规模语言模型入门」第5章介绍的(多项选择式问答)模型。
- Downloads: 339
- mradermacher/japanese-llama-3-8b-instruct-v2-GGUF
- 關於 https://huggingface.co/owner203/japanese-llama-3-8b-instruct-v2 加權/矩陣量子化的靜態統計資料,請參考 https://huggingface.co/mradermacher/japanese-llama-3-8b-instruct-v2-i1-GGUF 使用方法。
- Downloads: 339
- nlp-waseda/bigbird-base-japanese
- nlp-waseda/bigbird-base-japanese 模型描述這是一個在日文維基百科、CC-100 日文部分和 OSACR 日文部分預訓練的日文 BigBird 基底模型。如何使用您可以按照以下方式為遮蔽語言建模使用此模型:from transformers import AutoTokenizer, AutoModelForMaskedLMtokenizer = AutoTokenizer.from_pretrained("nlp-waseda/bigbird-base-japanese")
- Downloads: 319
- stabilityai/japanese-stable-vlm
- 請您同意遵守在授權檔案中描述的協議,方可下載、使用或分發此模型的任何部分或要素。
- Downloads: 313
- KoichiYasuoka/deberta-base-japanese-aozora-ud-head
- 德伯特基礎日語青空文庫UD頭模型
- Downloads: 311
- mmnga/ELYZA-japanese-CodeLlama-7b-gguf
- ELYZA-japanese-CodeLlama-7b-gguf是ELYZA出版的ELYZA-japanese-CodeLlama-7b-instruct的gguf格式轉換版本。
- Downloads: 306
- alter-wang/bert-base-japanese-emotion-lily
- 這是一個 BERT Base 模型,用於日語情感分析,經過額外微調以進行情感檢測和分類。
- Downloads: 305
- tokyotech-llm/Swallow-7b-NVE-hf
- 我們的Swallow模型已經經歷了持續的預訓練,來自Llama 2家族,主要增加了日語數據。
- Downloads: 304
- hajime9652/xlnet-japanese
- XLNet-japaneseModel描述该模型需要Mecab和senetencepiece结合XLNetTokenizer一起使用。
- Downloads: 303
- mmnga/QwQ-32B-Preview-gguf
- QwQ-32B-Preview-gguf這是Qwen先生公開的QwQ-32B-Preview的gguf格式轉換版。
- Downloads: 301
- Lasorco/lametta_old
- 老?
- Downloads: 298
- zh-plus/faster-whisper-large-v2-japanese-5k-steps
- 從「clu-ling/whisper-large-v2-japanese-5k-steps」轉換而來,使用 CTranslate2。使用方法:安裝 pip install faster-whisper(查看 faster-whisper 的詳細指示)。
- Downloads: 291
- mmnga/rinna-japanese-gpt-neox-3.6b-gguf
- Rinna / Japanese-GPT-NeoX-3.6B 是由 Rinna 公開的日文 GPT-NeoX-3.6B 的 gguf 轉換版本。
- Downloads: 288
- sappho192/aihub-ja-ko-translator
- 基於 EncoderDecoderModel(bert-japanese+kogpt2)的日語到韓語翻譯模型
- Downloads: 280
- nlp-waseda/comet-t5-base-japanese
- COMET-T5 和 Finetuned T5 是基於 ATOMIC 並使用文本到文本語言建模目標的模型。
- Downloads: 265
- TareHimself/manga-ocr-base
- 原始模型:用於日文文本的光學字符識別,主要聚焦於日本漫畫。
- Downloads: 255
- sonoisa/t5-base-japanese-question-generation
- 回答和回答將出現的段落提供給模型,它將生成問題https://github.com/sonoisa/deep-question-generation。這個模型的製作步驟概述將SQuAD 1.1翻譯成日語,並進行數據清理(有效數據約一半)。
- Downloads: 255
- nlp-waseda/roberta-large-japanese-seq512
- nlp-waseda/roberta-large-japanese-seq512模型描述這是一個在日本維基百科和CC-100的日語部分上預訓練的日本 RoBERTa 大型模型,最大序列長度為512。如何使用您可以按照以下方式使用此模型進行遮罩語言建模:from transformers import AutoTokenizer, AutoModelForMaskedLMtokenizer = AutoTokenizer.from_pretrained("nlp-waseda
- Downloads: 251
- Ivydata/whisper-small-japanese
- 使用whisper-small 微調日語低語模型進行語音識別,透過 Common Voice、JVS 和 JSUT 進行微調 openai/whisper-small。在使用此模型時,請確保您的語音輸入採樣率為 16kHz。
- Downloads: 251
- alfredplpl/Llama-3-8B-Instruct-Ja
- 這個存儲庫是為了將 Llama 3 翻譯為日語而建立的模型存儲庫。
- Downloads: 247
- megagonlabs/t5-base-japanese-web
- t5-base-japanese-web(带有Byte-fallback,32K)描述megagonlabs/t5-base-japanese-web是预先在日本网络文本上进行训练的T5(文本到文本转换转换器)模型。
- Downloads: 246
- ku-nlp/deberta-v2-tiny-japanese-char-wwm
- 這是一個日文 DeBERTa V2 迷你模型,使用日本維基百科、CC-100 的日文部分以及 OSCAR 的日文部分進行預訓練。此模型使用字符級切詞和整詞遮罩進行訓練。
- Downloads: 245
- sociocom/MedNERN-CR-JA
- 這是用於日本醫學文件命名實體識別的模型。
- Downloads: 240
- cyberagent/open-calm-medium
- OpenCALM-Medium 模型描述OpenCALM 是一套僅解碼器的語言模型套件,它在日本數據集上進行了預訓練,由...
- Downloads: 240
- den2nova/FlexDreamHK
- 🎈 FlexDreamHK 是儘可能降低風險的模型,而不包含被洩漏的 NovelAI 模型。
- Downloads: 238
- elyza/ELYZA-japanese-CodeLlama-7b
- ELYZA-japanese-CodeLlama-7b 模型描述ELYZA-japanese-CodeLlama-7b 是基於 Code Llama 模型,為了擴展日語能力而進行了額外的預訓練的模型。
- Downloads: 235
- sonoisa/t5-base-japanese-mC4-Wikipedia
- 這是一個在日本語語料庫上預訓練的T5(文本對文本轉換轉換器)模型。
- Downloads: 234
- mmnga/shisa-7b-v1-gguf
- shisa-7b-v1-ggufaugmxnt所公開的shisa-7b-v1的gguf格式轉換版本。
- Downloads: 232
- OrionStarAI/Orion-14B-Chat-Int4
- 獵戶座-14B🌐英文 | 🇨🇳中文 | 🇯🇵日本語 | 🇰🇷韓文🤗
- Downloads: 229
- rinna/bilingual-gpt-neox-4b-instruction-ppo
- 這個存儲庫提供了一個擁有38億參數的英日雙語GPT-NeoX模型。
- Downloads: 229
- sonoisa/t5-base-japanese-adapt
- 日本語T5 前綴語言模型。這是一個 T5(文本到文本轉換轉換器)。
- Downloads: 229
- ku-nlp/gpt2-medium-japanese-char
- 日文字符級模型卡
- Downloads: 226
- stabilityai/japanese-stablelm-instruct-ja_vocab-beta-7b
- 一個穿着和服的可愛機器人用單只筆寫書法 — Stable Diffusion XLModel 說明japanese-stablelm-instruct-ja_vocab-beta-7b 是基於 japanese-stablelm-ja_vocab-beta-7b 的 7B 參數解碼器語言模型,並在 Databricks Dolly-15k、Anthropic HH 和其他公共數據上進行進一步微調。
- Downloads: 226
- watashiha/watashiha-gpt-6b
- 使用AWS的trn1实例开发的大喜剧语言模型。
- Downloads: 224
- nlp-waseda/roberta_jtruthfulqa
- 對Waseda RoBERTa進行微調,以評估在JTruthfulQA上生成的答案。
- Downloads: 224
- rinna/japanese-stable-diffusion
- 在獲得這個模型之前還有一個步驟。
- Downloads: 222
- stanfordnlp/stanza-ja
- Stanza 是一組用於語言分析的精確高效工具的集合,支援多種人類語言。
- Downloads: 219
- karakuri-ai/karakuri-lm-70b-v0.1
- KARAKURI LM是一個預訓練語言模型,它是基於Llama 2而建立的。我們的模型通過納入額外的日語詞彙以及在日語和多語文本語料庫上進一步進行預訓練,來增強Llama 2的功能。
- Downloads: 217
- sonoisa/t5-base-english-japanese
- 這是一個在英文和日文均衡語料庫上預訓練的 T5(文本到文本轉換變壓器)模型。
- Downloads: 213
- mmnga/lightblue-Karasu-Mixtral-8x22B-v0.1-gguf
- 淺藍色-Karasu-Mixtral-8x22B-v0.1-gguflightblue 公開的 Karasu-Mixtral-8x22B-v0.1 的 gguf 格式轉換版本。
- Downloads: 211
- sazyou-roukaku/LittleStepMix
- 許可證:CreativeML Open RAIL-M 附加版權:sazyou_roukaku(TwitterID @sazyou_roukaku)截至2023年6月25日。 這個模型在『CreativeML Open RAIL-M』中,其許可證並未改變。
- Downloads: 211
- stockmark/stockmark-13b-instruct
- Stockmark-13b-instruct 是 Stockmark-13b 的指令調整版,是一個擁有 130 億個參數的日本語大型語言模型。
- Downloads: 207
- mradermacher/Japanese-Starling-ChatV-7B-GGUF
- inu-ai/dolly-japanese-gpt-1b
- 2023年5月7日更新紀錄:已新增「oasst1-89k-ja」資料集以支援對話系統。
- Downloads: 196
- sonoisa/sentence-t5-base-ja-mean-tokens
- 這是一個日文字-T5模型。
- Downloads: 193
- Local-Novel-LLM-project/Vecteus-v1
- 我們的模型VecTeusNinja-v1Ninja-v1-NSFWNinja-v1-128kNinja-v1-NSFW-128kVecTeus-v1.0的模型卡Mistral-7B基於大型語言模型(LLM)的新版本為Mistral-7B-v0.1的數據集進行了微調。VecTeus相比於Mistral-7B-v0.1有以下變化。128k上下文
- Downloads: 187
- KoichiYasuoka/bert-base-japanese-wikipedia-ud-head
- bert-base-japanese-wikipedia-ud-headModelbert-base-japanese-wikipedia-ud-headModel
- Downloads: 187
- cyberagent/xlm-roberta-large-jnli-jsick
- 這個模型是使用SentenceTransformers Cross-Encoder類別、梯度累積 PR,以及由CyberAgentAILab/japanese-nli-model提供的程式碼進行訓練的。
- Downloads: 185
- ken11/albert-base-japanese-v1-with-japanese-tokenizer
- 此為使用日本語事前訓練的ALBERT模型,使用了名為BertJapaneseTokenizer的Tokenizer。與albert-base-japanese-v1相比,此模型的分詞處理更為方便。如何使用Fine-Tuning:該模型為預訓練模型,基本上預計用於不同任務的Fine-Tuning。對於PyTorch的Fill-Mask:從transformers中導入
- Downloads: 185
- hitachi-nlp/bert-base-japanese_sudachi-unigram
- 日本語 BERT-base(Sudachi + Unigram)如何載入分詞器。請從我們的 GitHub 存儲庫下載 Sudachi + Unigram 的字典文件。
- Downloads: 181
- studio-ousia/luke-japanese-base
- luke-japaneseluke-japanese 是 LUKE(具有知識增強嵌入的語言理解)的日本版本,它是預先訓練的知識增強情境化字詞和實體表示。
- Downloads: 181
- Local-Novel-LLM-project/Ocuteus-v1-gguf
- 這是Ocuteus的GGUF版本。
- Downloads: 179
- hitachi-nlp/bert-base-japanese_jumanpp-wordpiece
- 日文 BERT-base(Juman++ + WordPiece)如何載入分詞器請下載 Juman++ + 的詞典檔案
- Downloads: 179
- knosing/japanese_ner_model
- 模型描述:這個模型是 tohoku-nlp/bert-base-japanese-v3 的微調版本,專門針對命名實體識別(NER)任務進行了優化。
- Downloads: 178
- TKU410410103/hubert-large-japanese-asr
- 這個模型是 rinna/japanese-hubert-large ASR 的微調版本。
- Downloads: 178
- hitachi-nlp/bert-base-japanese_sudachi-wordpiece
- 使用日文 BERT-base (Sudachi + WordPiece)模型時如何加載分詞器請從我們的 GitHub 存儲庫下載 Sudachi + WordPiece 的詞典文件。
- Downloads: 178
- line-corporation/japanese-large-lm-1.7b-instruction-sft-4bit-128g-actorder_False
- 這個資料庫提供了一個由LINE Corporation 進行微調和訓練的包含1.7B個參數的日文語言量化模型。
- Downloads: 175
- retrieva-jp/t5-small-short
- 模型卡片 (Model Card) - 模型ID這是一個 T5 v1.1 模型,在日文語料庫上預訓練。
- Downloads: 174
- stabilityai/japanese-stablelm-instruct-alpha-7b-v2
- 日文-StableLM-指引-Alpha-7B-v2“能夠說日文、浮世繪、江戶時期的鸚鵡” — Stable Diffusion XLModel 說明japanese-stablelm-instruct-alpha-7b-v2 是在日文-StableLM-Base-Alpha-7B 模型基礎上進一步微調於各種指引遵循數據集的 7 億參數解碼器
- Downloads: 174
- Mizuiro-sakura/luke-japanese-base-marcja
- 這個模型是通過對luke-japanese-base模型進行微調,使其適用於MARC-ja(正面或負面的二元分類)的產物。
- Downloads: 172
- Mizuiro-sakura/t5-CAMERA-title-generation
- 這是通過對sonoisa/t5-base-japanese模型進行微調,使其適用於標題生成的模型。
- Downloads: 172
- TheBloke/japanese-stablelm-instruct-beta-7B-GGUF
- 聊天與支援:TheBloke 的 Discord 伺服器想要貢獻嗎?
- Downloads: 171
- Ivydata/whisper-base-japanese
- 使用 whisper-base 微語音模型進行語音識別的日語微語音調校模型,在 Common Voice、JVS 和 JSUT 資料集上進行 fine-tuned。使用此模型時,請確保您的語音輸入採樣率為 16kHz。
- Downloads: 170
- llm-jp/llm-jp-13b-instruct-full-dolly_en-dolly_ja-ichikara_003_001-oasst_en-oasst_ja-v1.1
- llm-jp-13b-instruct-full-dolly_en-dolly_ja-ichikara_003_001-oasst_en-oasst_ja-v1.1翻譯為:llm-jp-13b-instruct-full-dolly_en-dolly_ja-ichikara_003_001-oasst_en-oasst_ja-v1.1
- Downloads: 168
- karakuri-ai/karakuri-lm-70b-chat-v0.1
- KARAKURI LM是一個預訓練語言模型,它基於Llama 2進行構建。我們的模型通過將額外的日語詞彙納入其中,並在日語和多語文集的基礎上進行進一步的預訓練,增強了Llama 2的能力。
- Downloads: 168
- p1atdev/kakuyomu-genre-bert
- kakuyomu-genre-bert是一個基於東北大的cl-tohoku/bert-base-japanese-char-v3進行微調的模型,可以根據小說的標題和介紹文本來分類其類型。
- Downloads: 167
- turing-motors/heron-chat-git-ja-stablelm-base-7b-v1
- Heron GIT 日本穩定LM
- Downloads: 167
- toshi456/llava-jp-1.3b-v1.0
- LLaVA-JP 模型卡片模型詳情模型類型: LLaVA-JP 是一個視覺語言模型,可以就輸入的圖像進行對話。
- Downloads: 167
- line-corporation/japanese-large-lm-1.7b-instruction-sft-8bit-1g-actorder_True
- 這個倉庫提供了由 LINE 公司精調和訓練的擁有 17 億參數的日語語言量化模型。
- Downloads: 165
- hitachi-nlp/bert-base-japanese_vaporetto-unigram
- 日文 BERT-base(Vaporetto + Unigram)
- Downloads: 164
- hitachi-nlp/bert-base-japanese_mecab-unigram
- 日本語 BERT-base(MeCab + Unigram)如何加載分詞器請從我們的 GitHub 儲存庫下載 MeCab + Unigram 的詞典文件。
- Downloads: 163
- line-corporation/japanese-large-lm-1.7b-instruction-sft-4bit-32g-actorder_False
- 日文大型語言模型1.7B指令SFT-4位元-32G-不啟用動作排序
- Downloads: 163
- hitachi-nlp/bert-base-japanese_nothing-wordpiece
- 日文 BERT-base 模型(Nothing + WordPiece)如何載入分詞器?請從我們的 GitHub 存儲庫下載 Nothing + WordPiece 的詞典文件。
- Downloads: 163
- hitachi-nlp/bert-base-japanese_nothing-bpe
- 日本語BERT-base(Nothing + BPE)如何載入分詞器請從我們的GitHub存儲庫下載Nothing + BPE的字典文件。
- Downloads: 163
- hitachi-nlp/bert-base-japanese_nothing-unigram
- 日本 BERT-base (Nothing + Unigram) 如何加载分词器請從我們的 GitHub 存儲庫下載 Nothing + Unigram 的字典檔。
- Downloads: 162
- hitachi-nlp/bert-base-japanese_vaporetto-bpe
- 日文BERT-base(Vaporetto + BPE)如何加載分詞器請從我們的GitHub存儲庫下載Vaporetto + BPE的詞典文件。
- Downloads: 162
- hitachi-nlp/bert-base-japanese_jumanpp-unigram
- 日文 BERT-base (Juman++ + Unigram)如何加載分詞器?請從我們的 GitHub 存儲庫下載 Juman++ + Unigram 的詞典文件。
- Downloads: 161
- stabilityai/japanese-stablelm-base-ja_vocab-beta-7b
- 日本穩定LM基本JA詞彙Bets-7B一個穿着和服的可愛機器人用一支筆書寫書法——穩定擴散XLModel描述日本穩定LM基本JA詞彙Bets-7B是一個基於Llama-2-7B的7B參數解碼器-僅語言模型,經過在日本各種數
- Downloads: 161
- hitachi-nlp/bert-base-japanese_sudachi-bpe
- 日本語BERT-base(Sudachi + BPE)如何加載分詞器請從我們的 GitHub 存儲庫下載Sudachi + BPE 的字典文件。
- Downloads: 161
- tsmatz/roberta_qa_japanese
- 這個模型是 rinna/japanese-roberta-base 的微調版本(由rinna公司提供的預訓練RoBERTa模型,日語標題:日本語の(抽出型)質問応答のモデル)。
- Downloads: 160
- hitachi-nlp/bert-base-japanese_jumanpp-bpe
- 日本語BERT-base(Juman++ + BPE)載入分詞器的方法。請從我們的 GitHub 存儲庫下載 Juman++ + BPE 的詞典文件。
- Downloads: 160
- hitachi-nlp/bert-base-japanese_mecab-bpe
- 日文 BERT-base(MeCab + BPE)如何加載分詞器?請從我們的 GitHub 倉庫下載 MeCab + BPE 的詞典文件。
- Downloads: 160
- hitachi-nlp/bert-base-japanese_vaporetto-wordpiece
- 日語 BERT-base (Vaporetto + WordPiece)如何加載分詞器請從我們的 GitHub 存儲庫下載 Vaporetto + WordPiece 字典文件。
- Downloads: 160
- hitachi-nlp/bert-base-japanese_mecab-wordpiece
- 日文 BERT-base(MeCab + WordPiece)如何載入分詞器。請從我們的 GitHub 存儲庫下載 MeCab + WordPiece 的詞典文件。
- Downloads: 159
- ybelkada/japanese-roberta-question-answering
- RoBERTa基本版日文 - JaQuAD描述一個在JaQuAD上微調過的日文問答模型。有關預訓練模型的詳細資訊,請參考RoBERTa基本版日文。
- Downloads: 154
- cameltech/japanese-gpt-1b-PII-masking
- 日本GPT-1B個資料遮蔽模型描述:日本GPT-1B個資料遮蔽 是以經過預先學習的1B GPT模型為基礎,學習如何從日文文章中遮蔽個人資訊的模型。
- Downloads: 151
- TKU410410103/wav2vec2-base-japanese-asr
- wav2vec2-base-asr 這個模型是在 common_voice_11_0 數據集上對 rinna/japanese-wav2vec2-base 進行了微調,用於語音辨識任務。
- Downloads: 150
- Kendamarron/Tokara-0.5B-Chat-v0.1
- 關於這個模型,它是在採用日英對照的5B標記的基礎上持續預訓練了Qwen/Qwen1.5-0.5B模型,得到了Tokara-0.5B-v0.1模型,並並加入了對話能力的chat vector。
- Downloads: 150
- offtoung/tsukuyomi-chan-calm2-7b
- 使用了Tsukuyomi-chan数据集,对calm-2-7b-chat模型进行Fine-tuning的模型。
- Downloads: 150
- retrieva-jp/t5-small-medium
- 模型 ID 的模型卡片這是T5 v1.1 模型,預先在一個日文語料庫上進行了訓練。
- Downloads: 149
- tokyotech-llm/Swallow-70b-instruct-v0.1
- 燕子 我們的燕子模型一直在進行來自Llama 2家族的持續預訓練,主要增加了日語數據。
- Downloads: 149
- rinna/nekomata-14b
- rinna/nekomata-14b概述我們對qwen-14b進行持續的預訓練,使用了來自日本和英語數據集的660億個標記。
- Downloads: 148
- haqishen/Llama-3-8B-Japanese-Instruct
- 簡介 我是:启深哈
- Downloads: 147
- tokyotech-llm/Swallow-70b-NVE-instruct-hf
- 燕子 我們的燕子模型已經接受了來自Llama 2家族的持續預訓練,主要增加了日語資料。
- Downloads: 147
- tokyotech-llm/Swallow-13b-NVE-hf
- 燕子我們的燕子模型一直在進行持續的預訓練,主要是從Llama 2家族中獲取的日語數據。
- Downloads: 147
- sonoisa/t5-base-japanese-title-generation
- 從文章生成標題的模型SEE: https://qiita.com/sonoisa/items/a9af64ff641f0bbfed44
- Downloads: 147
- tokyotech-llm/Swallow-70b-NVE-hf
- 燕子我們的燕子模型已經經歷了持續的預訓練,來自Llama 2家族,主要是加入了日語數據。
- Downloads: 145
- sonoisa/t5-base-japanese-article-generation
- 從標題生成文章內容的模型連結: https://qiita.com/sonoisa/items/a9af64ff641f0bbfed44
- Downloads: 145
- owner203/japanese-llama-3-8b-instruct-v2
- Japanese-LLaMA-3-8B-Instruct-v2 是指示执行模型、全模型。
- Downloads: 144
- Mizuiro-sakura/luke-japanese-base-finetuned-QA
- 這個模型是基於luke-japanese-base-lite進行微調,以用於問答任務。
- Downloads: 143
- llm-book/bert-base-japanese-v3-crf-ner-wikipedia-dataset
- llm-book/bert-base-japanese-v3-crf-ner-wikipedia-dataset這是在「大規模言語模型入門」第6章介紹的專有實體識別模型。
- Downloads: 143
- tokyotech-llm/Swallow-7b-NVE-instruct-hf
- 燕子我們的燕子模型已經接受了來自羊駝2家族的持續預訓練,主要包括添加了日語數據。
- Downloads: 143
- stockmark/gpt-neox-japanese-1.4b
- 這個存儲庫提供了一個基於 GPT-NeoX 的模型,該模型有 14 億個參數,在約 200 億標記的日文語料庫上進行了預訓練。
- Downloads: 141
- TomokiFujihara/luke-japanese-base-lite-offensiveness-estimation
- 這個模型是通過對 sonoisa/sentence-luke-japanese-base-lite 模型在社交網站上的評論上進行手動攻擊性評估數據集的調優,創建出來的。
- Downloads: 141
- eliashasnat/phi-3
- 模型基礎模型:microsoft/Phi-3-mini-4k-instruct 學習數據集:llm-jp/hh-rlhf-12k-ja 學習方式:全參數調整 範例 import torch from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained( "ryota39/Phi-3-mini-4k-instruct-dpo", trust_remote_code=True, ) model = AutoModelForCausalLM.from_pretrained( "ryota39/Phi
- Downloads: 141
- Aratako/c4ai-command-r-v01-japanese-instruct
- c4ai-command-r-v01-japanese-instruct GGUF 版在這裡/點擊這裡查看GGUF版本概要:這是使用ichikara-instruction進行調整後的CohereForAI/c4ai-command-r-v01模型,添加了額外的日語指令調整。
- Downloads: 141
- tokyotech-llm/Swallow-7b-plus-hf
- 燕子我们的燕子模型已经经历了持续的Llama 2家族的预训练,主要是通过添加日语数据。
- Downloads: 140
- HPLT/hplt_bert_base_ja
- HPLT Bert是為日文訓練的編碼器模型之一,這是HPLT項目的首個版本之一。
- Downloads: 140
- stabilityai/japanese-stablelm-instruct-beta-7b
- 日本穩定 LM 指令 Beta-7B 是穿著和服的可愛機器人用一支筆書法的模型 — 穩定擴散 XL 模型描述。japanese-stablelm-instruct-beta-7b 是基於 7B 參數且僅為解碼器的語言模型。
- Downloads: 140
- llm-book/bert-base-japanese-v3-bpr-passage-aio
- bert-base-japanese-v3-bpr-passage-aio是第9章介紹的文件檢索模型BPR的段落編碼器。
- Downloads: 140
- Kendamarron/Tokara-0.5B-Chat-dolly-jimba
- 關於模型:Qwen/Qwen1.5-0.5B在日英文本5B令牌上進行了持續預訓練,接著使用Tokara-0.5B-v0.1模型在日本語instruction數據集上進行微調調整。
- Downloads: 139
- staka/takomt
- TakoMT -> 八爪MT
- Downloads: 139
- akiFQC/bert-base-japanese-v3_nli-jsnli-jnli-jsick
- Cross-Encoder 用於日語自然語言推理(NLI)這個模型是使用 SentenceTransformers 的 Cross-Encoder 類別訓練的。
- Downloads: 138
- sonoisa/byt5-small-japanese
- 這是一個在日文語料庫上預先訓練過的 ByT5(一種無需分詞的文本對文本轉換 Transformer 模型)。
- Downloads: 138
- Mizuiro-sakura/luke-japanese-base-finetuned-ner
- 這個模型是通過微調luke-japanese-base模型而成,專門用於實體識別(NER)。
- Downloads: 137
- rinna/nekomata-7b
- 我們對來自混合日語和英語數據集的30億令牌持續進行qwen-7b的預訓練。
- Downloads: 137
- Kendamarron/Tokara-0.5B-v0.1
- 這是一個通過對Qwen/Qwen1.5-0.5B模型使用5B日英語數據進行持續預訓練的模型。
- Downloads: 136
- AIBunCho/japanese-novel-gpt-j-6b
- AIBunCho/japanese-novel-gpt-j-6b 是所使用的模型。
- Downloads: 134
- Mizuiro-sakura/luke-japanese-large-finetuned-QA
- 這個模型是通過對luke-japanese-large-lite進行微調來用於問答任務的產物。
- Downloads: 133
- maddes8cht/stabilityai-japanese-stablelm-3b-4e1t-instruct-gguf
- 我不斷增強這些模型描述以為您提供最相關和全面的信息。日文-stablelm-3b-4e1t-instruct - GGUF模型創建者:stabilityai 原始模型:日文-stablelm-3b-4e1t-instruct StableLM這是一個基於StableLM的模型。Stablelm是由Stability AI開發的語言模型系列。注意:截至2023年11月
- Downloads: 131
- sonoisa/t5-qiita-title-generation
- 從文章生成標題的模型參考:https://qiita.com/sonoisa/items/30876467ad5a8a81821f
- Downloads: 130
- eepj/wstcg-mt-ja-en
- WS TCG 卡牌文本翻譯機器翻譯一個專門用於從Weiss Schwarz(WS)交易卡遊戲翻譯卡牌文本的日語-英語模型,並在Helsinki-NLP/opus-mt-ja-en上進行了微調。
- Downloads: 130
- rinna/bilingual-gpt-neox-4b-8k
- bilingual-gpt-neox-4b-8k概觀通知:此模型需要transformers>=4.31.0才能正常工作。
- Downloads: 129
- aerner/lm-v1
- Aerner LM-v1是一個經過事前學習,並完全使用日語進行學習的模型。
- Downloads: 126
- tensorblock/Mistral-Nemo-Japanese-Instruct-2408-GGUF
- 反饋與支持:TensorBlock 的 Twitter/X、Telegram 群組以及 Discord 伺服器 cyberagent/Mistral-Nemo-Japanese-Instruct-2408 - GGUF.
- Downloads: 125
- ku-nlp/gpt2-small-japanese-char
- 日語字符級 GPT-2 Small 的模型卡模型描述這是一個日語字符級 GPT-2 Small(90M 參數)語言模型,預先在日本維基百科、CC-100 的日語部分以及 OSCAR 的日語部分上進行了預訓練。如何使用您可以直接使用這個模型進行文本生成管道。
- Downloads: 125
- MCZK/Assistance-7B-GGUF
- Local-Novel-LLM-project様的Assistance已轉換為GGUF格式的資料。
- Downloads: 122
- Ryoma0302/gpt_0.76B_global_step3000_japanese
- 模型卡 ID 為模型詳情的模型說明
- Downloads: 120
- huranokuma/es2
- 使用日文GPT-2寫作的人工智慧模型
- Downloads: 119
- TheBloke/japanese-stablelm-base-beta-70B-GGUF
- 聊天和支援:TheBloke 的 Discord 伺服器想貢獻一份力嗎?
- Downloads: 118
- Aratako/Oumuamua-7b-RP-GGUF
- 忍者-v1-RP-表現-GGUF概述Aratako/Oumuamua-7b-RP 的量子化版本。
- Downloads: 117
- nlp-waseda/gpt2-xl-japanese
- nlp-waseda/gpt2-xl-japanese這是具有約 15 億個參數的日語 GPT2,預訓練於日語維基百科和 CC-100。模型結構基於 Radford+ 2019。預期用途和限制您可以使用原始模型進行文本生成,或對其進行微調以應用到下游任務中。
- Downloads: 117
- izumi-lab/bert-small-japanese-fin
- 這是一個在日文文本上預訓練過的 BERT 模型。
- Downloads: 116
- wolf4032/bert-japanese-token-classification-search-local-cuisine
- 為模型ID為料理查詢提問文,提取關鍵字作為查找用固有表達式的模型卡明細模型描述,例如輸入"東京的肉料理,春季食用,使用雞肉做的料理"一文將提取"東京 → 都道府県/地區(AREA)"、"肉料理 → 種類(TYPE)"、"春
- Downloads: 116
- recruit-jp/japanese-clip-vit-b-32-roberta-base
- Recruit Co.開發的recruit-jp/japanese-clip-vit-b-32-roberta-base簡介。
- Downloads: 115
- Mizuiro-sakura/luke-japanese-base-finetuned-jnli
- 這個模型是從luke-japanese-base進行微調來對JNLI(句子關係判斷)進行使用的。
- Downloads: 114
- umiyuki/Japanese-WizardLM2-ChatV-7B-GGUF
- 日本-巫師LM2-對話V-7B-GGUFGGUF。這個模型,日本-巫師LM2-對話V-7B,基於 "chatntq-ja-7b-v1.0",並通過從 "Mistral-7B-v0.1" 中減去 "WizardLM-2-7b" 來創建。 ChatVector 被添加了 1.0 的因素。我們的目標
- Downloads: 114
- llm-book/bert-base-japanese-v3-bpr-question-aio
- 「大規模言語模型入門」第9章介紹的文檔檢索模型BPR的問題編碼器。
- Downloads: 113
- TFMC/Japanese-Starling-ChatV-7B
- 這款模型是基於"chatntq-ja-7b-v1.0"開發的7B參數的日文聊天模型。
- Downloads: 112
- tarudesu/gendec-with-distilmbert
- 輸入: 羅馬拼音形式的日本名稱.
- Downloads: 112
- stabilityai/japanese-stablelm-instruct-alpha-7b
- 這個存儲庫是公開訪問的,但您必須接受條件才能訪問其中的文件和內容。
- Downloads: 112
- Mizuiro-sakura/luke-japanese-base-lite-jsquad
- 這個模型是基於luke-japanese-base-lite進行微調,使其適用於問答任務。
- Downloads: 111
- ganchengguang/Yoko-7B-Japanese-v0
- 這個模型是使用 guanaco 資料集訓練的。
- Downloads: 110
- mmnga/line-corp-japanese-large-lm-3.6b-instruction-sft-gguf
- line-corporation發佈的japanese-large-lm-3.6b-instruction-sft是gguf轉換版本。
- Downloads: 109
- bardsai/finance-sentiment-ja-base
- Finance Sentiment JA (base)是一個基於bert-base-japanese模型的金融情感分析工具,用於分析日本金融新聞的情緒。
- Downloads: 109
- sambanovasystems/SambaLingo-Japanese-Chat
- SambaLingo-Japanese-Chat 是一個以日語和英語訓練的人類對齊聊天模型。
- Downloads: 109
- Mizuiro-sakura/deberta-v2-japanese-base-finetuned-commonsenseqa
- 這個模型是以deberta-v2-base-japanese進行微調,以便應用於CommonsenseQA(選擇式問題)。
- Downloads: 108
- Mizuiro-sakura/deberta-v2-japanese-tiny-finetuned-commonsenseqa
- 這個模型是通過對deberta-v2-tiny-japanese進行微調來適應CommonsenseQA(選擇題型問題)。
- Downloads: 108
- maddes8cht/stabilityai-japanese-stablelm-3b-4e1t-base-gguf
- 我不斷增強這些模型描述,以為您提供最相關和全面的信息。日語穩定LM-3b-4e1t-base - GGUF模型創建者:stabilityai原始模型:日語穩定LM-3b-4e1t-baseStableLM這是一個基於StableLM的模型。StableLM是由Stability AI開發的語言模型系列。注意:截至2023-
- Downloads: 108
- owner203/japanese-alpaca-2-13b
- Japanese-Alpaca-2-13B是一個指示執行模型,也是一個完整模型。
- Downloads: 108
- G-Root/deberta-v2-base-japanese
- 日本DeBERTa V2基礎模型模型卡說明:這是在日本維基百科、CC-100的日文部分以及OSCAR的日文部分上預訓練的日本DeBERTa V2基礎模型。
- Downloads: 107
- Mizuiro-sakura/bert-large-japanese-v2-finetuned-ner
- 這個模型是通過對cl-tohoku/bert-large-japanese-v2進行微調,使其適用於命名實體識別(NER)的版本。
- Downloads: 107
- Mizuiro-sakura/deberta-v2-large-japanese-finetuned-ner
- 這個模型是以deberta-v2-large-japanese為基礎進行微調,用於專有名詞識別(NER)。
- Downloads: 106
- OrionStarAI/Orion-14B-Chat-Plugin
- Orion-14B🌐 英语 | 🇨🇳 中文 | 🇯🇵 日本语 | 🇰🇷 韩语🤗
- Downloads: 106
- c299m/japanese_stock_sentiment
- 日本股票評論情感模型這個模型是一個專門訓練的情感分析工具,用於分析與日本股票相關的評論和討論。
- Downloads: 105
- TomokiFujihara/twhin-bert-large-japanese-offensiveness-estimation
- 模型摘要:這個模型是通過對 SNS 上的評論進行手動攻擊性評估數據集 Twitter/twhin-bert-large 進行Fine-tuning 而創建的。
- Downloads: 104
- ku-nlp/gpt2-large-japanese-char
- 用於日語角色級GPT-2 Large的模型卡模型描述這是一個日語角色級GPT-2 Large(717M參數)語言模型,預先在日本維基百科、CC-100的日語部分以及OSCAR的日語部分上進行了預訓練。如何使用您可以將此模型直接與文本生成的流水線一
- Downloads: 104
- owner203/japanese-llama-2-13b
- Japanese-LLaMA-2-13B是基礎模型,是一個完整模型。
- Downloads: 104
- Mizuiro-sakura/deberta-v2-base-juman-finetuned-commonsenseqa
- 這個模型是通過微調deberta-v2-base-japanese來用於CommonsenseQA(選擇性問題)的版本。
- Downloads: 103
- Mizuiro-sakura/bert-large-japanese-v2-finetuned-commonsenseQA
- 這個模型是將cl-tohoku/bert-large-japanese-v2進行微調,以便應用於CommonsenseQA(選擇式問題)。
- Downloads: 103
- TomokiFujihara/twhin-bert-base-japanese-offensiveness-estimation
- 這個模型是通過對 Twitter/twhin-bert-base 模型進行Fine-tuning,利用人工攻擊性評估的數據集中的社交媒體評論進行Fine-tuning 後創建的。
- Downloads: 103
- TomokiFujihara/luke-japanese-large-lite-offensiveness-estimation
- 這個模型是通過對 studio-ousia/luke-japanese-large-lite 模型使用手工攻擊性評價的社交媒體評論數據集進行Fine-tuning而創建的。
- Downloads: 103
- sosoai/Orion-14B-Chat-RAG-safetensors
- 獵戶座-14B🌐英文 | 🇨🇳中文 | 🇯🇵日文 | 🇰🇷韓文🤗
- Downloads: 102
- MaziyarPanahi/japanese-stablelm-instruct-gamma-7b-Mistral-7B-Instruct-v0.1-GGUF
- MaziyarPanahi/japanese-stablelm-instruct-gamma-7b-Mistral-7B-Instruct-v0.1-GGUF作者:MaziyarPanahi原始模型:MaziyarPanahi/japanese-stablelm-instruct-gamma-7b-Mistral-7B-Instruct-v0.1描述MaziyarPanahi/japanese-stablelm-instruct-gamma-7b-Mistral-7B-Instruct-v0.1-GGUF包含了MaziyarPanahi/japanese-stablelm-instruct-gamma
- Downloads: 99
- pfnet/plamo-13b-instruct
- PLaMo-13B-Instruct模型描述PLaMo-13B-Instruct是一個經過微調的教育模型,建立在PLaMo-13B文本生成模型的8192字元上下文長度版本之上。
- Downloads: 99
- uzabase/luke-japanese-wordpiece-base
- studio-ousia/luke-japanese-base 是經過以下變更的模型。
- Downloads: 98
- Fugaku-LLM/Fugaku-LLM-13B-instruct-gguf
- Fugaku-LLM 使用條款這些使用條款(以下稱為「本條款」)由富士通株式會社、國立研究開發法人理化學研究所、國立大學法人東京工業大學、國立大學法人東北大學、株式會社CyberAgent、國立大學法人東海國立
- Downloads: 95
- Mizuiro-sakura/luke-japanese-base-commonsenseqa
- 這個模型是通過對luke-japanese-base進行微調,使其適用於JCommonsenseQA(選擇式回答)。
- Downloads: 94
- sociocom/MedNER-CR-JA
- 這是一個用於日本醫療文件命名實體識別的模型。
- Downloads: 94
- stabilityai/japanese-stable-diffusion-xl
- 通過下載、使用或分發此模型的任何部分或元素,您同意受《許可協議》文件中描述的協議限制。
- Downloads: 94
- cheonboy/sentence_embedding_japanese
- 這是一個日本語句子 - LUKE 模型。
- Downloads: 93
- nk2t/Llama-3-8B-Instruct-japanese-nk2t-v0.2
- Llama-3-8B-Instruct-JP-nk2t-v0.2模型詳情:基於Meta Llama 3建立。這是一個在非常小的數據集(約1k)上經過微調(使用QLora)的模型,基於Meta的llama-3-8b-instruct。
- Downloads: 91
- rinna/japanese-data2vec-audio-base
- 這是由rinna Co. 訓練的日文 data2vec 音頻基礎模型。
- Downloads: 90
- leia-llm/Leia-Swallow-7b
- Leia-Swallow-7BLEIA是一種訓練技術,專門用於自回歸LLM,通過增強從英語到目標語言的跨語言知識轉移,有效地提高它們在非英語語言中的性能。
- Downloads: 88
- abhishek/autonlp-japanese-sentiment-59362
- 使用AutoNLP訓練的模型問題類型: 二元分類模型ID: 59362驗證指標損失:0.13092292845249176精確度:0.9527127414314258準確率:0.9634070704982427召回率:0.9842171959602166AUC:0.9667289746092403F1:
- Downloads: 88
- umiyuki/Umievo-itr012-Gleipnir-7B
- 這款模型是透過進化算法演化合併了四個強大的日語模型而成。
- Downloads: 87
- stockmark/bart-base-japanese-news
- 這個倉庫提供了一個日文 BART 模型。
- Downloads: 86
- Fugaku-LLM/Fugaku-LLM-13B-instruct
- Fugaku-LLM 使用條款:本使用條款(以下稱為「本條款」)由富士通株式會社、國立研究發展法人理化學研究所、國立大學法人東京工業大學、國立大學法人東北大學、株式會社CyberAgent、國立大學法人東海國立大
- Downloads: 85
- KoichiYasuoka/bert-large-japanese-upos
- 這是一個在日文維基百科文本上進行_POS標記和依存分析預訓練的BERT模型,源自於bert-large-japanese-char-extended。
- Downloads: 85
- colorfulscoop/gpt2-small-ja
- GPT-2小型日文模型這個存儲庫包含了在日文維基百科數據集上訓練的GPT2-small模型。
- Downloads: 85
- leia-llm/Leia-Swallow-13b
- Leia-Swallow-13B是一种用于自回归LLM的训练技术,通过加强从英语到目标语言的跨语言知识转移,有效提高它们在非英语语言中的性能。
- Downloads: 84
- Kendamarron/LongWriter-llm-jp-3-3.7b-instruct
- Kendamarron/LongWriter-llm-jp-3-3.7b-instruct是一個經過SFT調教,可以輸出長文的模型。
- Downloads: 82
- line-corporation/japanese-large-lm-3.6b-instruction-sft-8bit-1g-actorder_True
- 這個存儲庫提供了由LINE公司微調並訓練的具有3.6B個參數的日語語言量化模型。
- Downloads: 81
- line-corporation/japanese-large-lm-3.6b-instruction-sft-4bit-128g-actorder_False
- 這個儲存庫提供了一個由LINE Corporation微調和訓練的3.6B參數的日語語言量化模型。
- Downloads: 80
- MaziyarPanahi/japanese-stablelm-base-gamma-7b-Mistral-7B-Instruct-v0.1-GGUF
- MaziyarPanahi/japanese-stablelm-base-gamma-7b-Mistral-7B-Instruct-v0.1-GGUF 模型創建者:MaziyarPanahi原始模型:MaziyarPanahi/japanese-stablelm-base-gamma-7b-Mistral-7B-Instruct-v0.1描述MaziyarPanahi/japanese-stablelm-base-gamma-7b-Mistral-7B-Instruct-v0.1-GGUF 包含 MaziyarPanahi/japanese-stablelm-base-g
- Downloads: 80
- MCZK/ArrowPro-7B-KUJIRA-GGUF
- DataPilot 公司的 ArrowPro-7B-KUJIRA 已轉換成 GGUF 格式的文件。
- Downloads: 80
- KoichiYasuoka/bert-base-japanese-luw-upos
- bert-base-japanese-luw-uposModel 表示 BERT 日本語語境下的大型統一模型。
- Downloads: 80
- line-corporation/japanese-large-lm-3.6b-instruction-sft-4bit-32g-actorder_False
- 這個資料庫提供了由LINE Corporation 調整和訓練的一個包含 3.6B 個參數的日語語言量化模型。
- Downloads: 78
- kotoba-tech/kotoba-speech-v0.1
- Kotoba-Speech v0.1是一個基於1.2B Transformer的語音生成模型。
- Downloads: 72
- minutillamolinara/bert-japanese_finetuned-sentiment-analysis
- 這個模型是從零開始在日本情感極性詞典數據集上進行訓練的。
- Downloads: 70
- mmnga/line-corp-japanese-large-lm-3.6b-gguf
- line-corporation/japanese-large-lm-3.6bline-corporation 公開的 japanese-large-lm-3.6b 的 gguf 轉換版。
- Downloads: 70
- aerner/lm-v2
- Aerner LM-v2 是從預先學習中全程以日語學習的第二版模型。
- Downloads: 70
- stabilityai/japanese-stablelm-2-instruct-1_6b
- 通過點擊“同意”,您同意許可協議並認可 Stability AI 的隱私政策。
- Downloads: 67
- oshizo/donut-base-japanese-visual-novel
- 這是在視覺小說風格的合成資料集上微調過的 Donut(基礎尺寸模型)模型,已經使用naver-clova-ix/donut-base進行訓練。
- Downloads: 67
- sakuraumi/Sakura-13B-Galgame
- SakuraLLM Sakura:SFT 與 RLHF 模型利用對通用角色和關係屬性知識進行日語至中文輕小說和視覺小說翻譯。
- Downloads: 64
- nold/Orion-14B-Base-GGUF
- 獵戶座-14B🌐英文 | 🇨🇳中文 | 🇯🇵日文 | 🇰🇷韓文🤗
- Downloads: 64
- pfnet/plamo-13b-instruct-nc
- PLaMo-13B-Instruct-NC模型描述PLaMo-13B-Instruct-NC是一個非商業指示微調模型,建立在PLaMo-13B文本生成模型的8192上下文長度版本之上。
- Downloads: 63
- kubota/luke-large-defamation-detection-japanese
- 這個模型是 studio-ousia/luke-japanese-large 的一個微調版本,針對日文進行了微調,用於自動檢測誹謗中傷。
- Downloads: 63
- kit-nlp/bert-base-japanese-sentiment-cyberbullying
- 這是針對日語進行微調以自動檢測網路霸凌的 BERT Base 模型。
- Downloads: 63
- Aratako/Ninja-v1-RP-expressive
- Ninja-v1-RP-expressiveGGUF版是這裡/點擊這裡以獲得GGUF版本總覽。這是使用mergekit創建的預訓練語言模型的合併。
- Downloads: 62
- ptaszynski/yacis-electra-small-japanese-cyberbullying
- 這是一個針對自動檢測網絡霸凌而進行微調的日語ELECTRA Small模型。
- Downloads: 61
- reazon-research/reazonspeech-espnet-next
- ReazonSpeech 是一個項目,旨在維護免費提供的日語音頻數據集和機器學習模型。reazonspeech-espnet-next 是一個「最前沿」的存儲庫,其中包含ReazonSpeech 團隊培訓的最新自動語音識別模型。
- Downloads: 61
- SkelterLabsInc/bert-base-japanese-jaquad
- 基於JaQuAD微調的日文問答模型。關於預訓練模型的詳細資訊,請參考BERT base Japanese。
- Downloads: 59
- lmg-anon/vntl-llama3-8b-v2-hf
- 概要 這是一個使用新版本的VNTL數據集創建的LLaMA 3 Youko qlora微調。
- Downloads: 58
- Ivydata/wav2vec2-large-xlsr-53-japanese
- 使用 XLSR-53 大型 fine-tuned Japanese Wav2Vec2 模型進行語音識別,採用 Common Voice、JVS 和 JSUT 資料集對 facebook/wav2vec2-large-xlsr-53 進行 fine-tuned。在使用此模型時,請確保您的語音輸入是以 16kHz 進行取樣。
- Downloads: 57
- taishi-i/nagisa_bert
- 針對nagisa的BERT模型。
- Downloads: 56
- dddump/Japanese-TextGen-Kage-v0.1-2x7B-gguf
- 這是使用Mergekit-Evolve的合併模型。
- Downloads: 55
- retrieva-jp/t5-small-long
- 模型卡片的模型ID 这是一个T5 v1.1模型,预训练于一个日语语料库。
- Downloads: 54
- Mizuiro-sakura/luke-japanese-base-finetuned-jsts
- 這個模型是將luke-japanese-base進行微調,以便用於JSTS(句子相似度計算)。
- Downloads: 53
- Formzu/bert-base-japanese-jsnli
- 這個模型是在JSNLI數據集上對cl-tohoku/bert-base-japanese-v2進行微調的版本。
- Downloads: 52
- watashiha/Watashiha-Llama-2-13B-Ogiri-sft
- 這裡是英文文件。
- Downloads: 52
- rinna/nekomata-14b-instruction-gguf
- rinna/nekomata-14b-instruction-gguf簡介這個模型是rinna/nekomata-14b-instruction的GGUF版本。
- Downloads: 52
- A-Funakoshi/bert-base-japanese-v3-wrime-v1
- 基本模型:cl-tohoku/bert-base-japanese-whole-word-masking數據集:llm-book/wrime-sentiment優化器:adafactor在Optuna中進行超參數搜索學習率調度器類型(lr_scheduler_type):
- Downloads: 51
- MCZK/ArrowPro-7B-RobinHood-GGUF
- DataPilot公司的ArrowPro-7B-RobinHood已轉換為GGUF格式。
- Downloads: 50
- Tanrei/GPTSAN-japanese
- Tanrei/GPTSAN 模型卡 - 基于通用开关变压器的日语语言模型GPTSAN 具有一些独特的特性。
- Downloads: 50
- Aratako/c4ai-command-r-v01-japanese-instruct-GGUF
- c4ai-command-r-v01-japanese-instruct-GGUF概要是Aratako/c4ai-command-r-v01-japanese-instruct的已量子化GGUF版本。
- Downloads: 49
- Mizuiro-sakura/deberta-v2-base-japanese-finetuned-QAe
- 這個模型是基於deberta-v2-base-japanese進行微調,用於QA任務的版本。
- Downloads: 46
- NTQAI/chatntq-ja-7b-v1.0
- 聊天程序NTQ JA 7B V1.0型號
- Downloads: 46
- kit-nlp/transformers-ud-japanese-electra-base-discriminator-cyberbullying
- 這是一個針對日文的 ELECTRA 基本模型,用於自動偵測網路霸凌。
- Downloads: 46
- MCZK/Tora-7B-v0.1-GGUF
- ryota39 先生的 Tora-7B-v0.1 已被轉換為GGUF格式。
- Downloads: 45
- NovelAI/genji-jp
- 請查看我們的部落格文章,以獲取更多詳細資訊、範例、評估等內容:部落格文章模型描述Genji-JP 6B是一個在我們的日本故事敘述資料集上微調的模型,是基於EleutherAI的GPT-J 6B模型。
- Downloads: 45
- toshi456/chat-vector-llava-v1.5-7b-ja
- 對話-向量-LLaVA-v1.5-7b-JA 模型卡模型細節模型類型:對話-向量-LLaVA-v1.5-7b-JA 是一個視覺-語言模型,能夠用日語對輸入圖像進行對話。
- Downloads: 44
- sazyou-roukaku/AfterRealXL
- 因為這裡無法上傳,所以我已經在civitai上提前公開了。
- Downloads: 44
- ku-nlp/roberta-large-japanese-char-wwm
- 這是一個在日文維基百科和日本CC-100資料集上預先訓練的日文RoBERTa大型模型。該模型是使用字符級別的分詞和整詞遮罩進行訓練的。
- Downloads: 43
- AndrewMcDowell/wav2vec2-xls-r-300m-japanese
- 這個模型是在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - JA數據集上對facebook/wav2vec2-xls-r-300m進行微調的版本。
- Downloads: 42
- nlp-waseda/roberta-large-japanese
- nlp-waseda/roberta-large-japanese 的模型描述這是一個在日本維基百科和日本CC-100部分預訓練的日文 RoBERTa 大型模型使用方法您可以按以下方式將此模型用於遮罩語言建模:from transformers import AutoTokenizer, AutoModelForMaskedLMtokenizer = AutoTokenizer.from_pretrained("nlp-waseda/roberta-large-japanese")
- Downloads: 41
- thefrigidliquidation/nllb-jaen-1.3B-lightnovels
- NLLB 1.3B 在日語到英語輕小說翻譯上進行了微調。這個模型是針對日語到英語翻譯的輕小說和網絡小說進行了微調。
- Downloads: 41
- clu-ling/whisper-large-v2-japanese-5k-steps
- 這個模型是在日本CommonVoice數據集(v11)上對openai/whisper-large-v2進行微調的版本。
- Downloads: 41
- bennexx/cl-tohoku-bert-base-japanese-v3-jlpt-classifier
- 簡介這是一個文本分類器,用於指定JLPT級別。
- Downloads: 41
- abhishek/autonlp-japanese-sentiment-59363
- 使用AutoNLP訓練的模型問題類型: 二元分類模型ID: 59363驗證指標損失: 0.12651239335536957準確率: 0.9532079853817648精確率: 0.9729688278823665召回率: 0.9744633462616643AUC: 0.9717333684823413F1: 0.973715513
- Downloads: 40
- lyu-boxuan/llama-3-youko-8b-En-Ja-MT-LoRA
- 總覽此模型是基於 rinna 的 [rinna/llama-3-youko-8b],透過 LoRA 在少量的英語到日語平行句子上進行微調。
- Downloads: 39
- OrionStarAI/Orion-14B-Chat-RAG
- 獵戶座-14B🌐英文 | 🇨🇳中文 | 🇯🇵日本語 | 🇰🇷韓文🤗
- Downloads: 38
- fukugawa/transformer-lm-japanese-0.1b
- 這是一個基於 JAX/Flax 的日文數據集訓練的 Transformer 語言模型。
- Downloads: 38
- ptaszynski/yacis-electra-small-japanese
- 這是 ELECTRA Small 模型,是為日本語而預訓練,在 YACIS 部落格語料庫中有 3.54 億個句子 / 56 億個單詞的資料。
- Downloads: 37
- turing-motors/heron-chat-git-ja-stablelm-base-7b-v0
- Heron GIT日本穩定LM
- Downloads: 37
- sonoisa/vl-t5-base-japanese
- 這是一個在日本語語料庫上預先學習的 VL-T5(通過文本生成統一視覺與語言任務)模型。
- Downloads: 36
- LoneStriker/SambaLingo-Japanese-Chat-GGUF
- SambaLingo-Japanese-Chat是一个在日语和英语中训练的以人类为导向的聊天模型。
- Downloads: 36
- yellowback/gpt-neo-japanese-1.3B
- GPT-Neo 1.3B 預訓練模型的日文版本模型描述:GPT2/GPT3 樣式的模型,使用日文語料庫進行訓練。
- Downloads: 36
- bclavie/fio-base-japanese-v0.1
- fio-base-japanese-v0.1日本語版將於近期發布(因為我正在學習日語,所以請見諒可能的錯誤!)
- Downloads: 35
- natsusakiyomi/KaedeMix
- 📄 授權 / License修改 CreativeML OpenRAIL-M 授權 / 修改 CreativeML OpenRAIL-M 授權未註明出處即使用此模型出售使用此模型生成的圖像在賺錢的圖像生成服務中運行分享使用此模型的合併模型出售此模型或使用此模型的合併模型在合併使用此模型的模型中設定不同權限
- Downloads: 35
- p1atdev/t5-base-xlsum-ja
- t5-base-xlsum-ja 的意思是將「base」設定為 t5,並給予大型的摘要任務(xlsum),目標語言為日文(ja)。
- Downloads: 34
- spow12/Visual-novel-transcriptor
- 模型卡片用於 Model IDFine tune 後的 ASR 模型,源自 distil-whisper/distil-large-v2。此模型旨在轉錄日語音頻,特別針對視覺小說。
- Downloads: 34
- TFMC/ChatNTQ-JA-7b-v1.0-GGUF
- GGUF将NTQAI/chatntq-ja-7b-v1.0ChatNTQ-JA-7b-v1.0转换为的是一种日语聊天微调模型,它构建在stabilityai/japanese-stablelm-base-gamma-7b之上,后者最初基于Mistral 7B v0.1。
- Downloads: 34
- TheBloke/japanese-stablelm-instruct-beta-70B-GPTQ
- 聊天和支援:TheBloke 的 Discord 伺服器想要貢獻嗎?
- Downloads: 34
- lightblue/openorca_stx
- 該模型是Lightblue基於日本微調數據集對OpenOrca的Open-Orca/OpenOrcaxOpenChat-Preview2-13B模型進行的QLoRA微調。
- Downloads: 33
- ken11/bert-japanese-ner
- 這個模型是由京都大學黒橋・褚・村脇研究室基於釋出的BERT日語預訓練模型,針對日語固有表現抽取任務進行調整,並利用stockmark有限公司釋出的ner-wikipedia-dataset進行微調的結果。
- Downloads: 32
- KoichiYasuoka/roberta-base-japanese-aozora-ud-head
- 羅柏塔基底日文青空UD頭模型
- Downloads: 31
- LoneWolfgang/bert-for-japanese-twitter
- BERT用於日本Twitter這是為日本Twitter製作的基本BERT模型。
- Downloads: 30
- skytnt/gpt2-japanese-lyric-medium
- 日文 GPT2 歌詞模型描述。該模型用於生成日文歌詞。
- Downloads: 30
- owner203/japanese-llama-2-13b-gguf
- 日本語-LLaMA-2-13B-GGUF 是日語-LLaMA-2-13B 的 GGUF 格式。
- Downloads: 29
- TheBloke/japanese-stablelm-instruct-beta-7B-GPTQ
- 聊天&支援:TheBloke的Discord伺服器想要貢獻嗎?
- Downloads: 29
- doc2query/msmarco-japanese-mt5-base-v1
- 這是基於 mT5(也稱為 docT5query)的 doc2query 模型。
- Downloads: 29
- arc-r/faster-whisper-large-v2-mix-jp
- whisper-large-v2-mix-jp 模型,用於 CTranslate2 本存儲庫包含將 vumichien/whisper-large-v2-mix-jp 轉換為 CTranslate2 模型格式。
- Downloads: 28
- turing-motors/heron-chat-git-ELYZA-fast-7b-v0
- Heron GIT 日本 ELYZA Llama 2 Fast 7BModel
- Downloads: 28
- JhonVanced/whisper-large-v3-japanese-4k-steps-ct2
- 將 drewschaub/whisper-large-v3-japanese-4k-steps 轉換為 CTranslate2 模型格式的 Whisper large-v3 模型此存儲庫包含 drewschaub/whisper-large-v3-japanese-4k-steps 的轉換到 CTranslate2 模型格式。
- Downloads: 28
- knok/japanese-distilgpt2
- 日本語 GPT2 蒸餾模型,這個模型是使用 rinna/japanese-gpt2-meduim 作為教師進行蒸餾得來的。
- Downloads: 27
- OrionStarAI/Orion-14B-Base-Int4
- 奧瑞恩-14B🌐英語 | 🇨🇳中文 | 🇯🇵日語 | 🇰🇷韓語🤗
- Downloads: 27
- abeja/Mixtral-8x7B-v0.1-japanese
- Mixtral-8x7B-v0.1-japanese 是基於 Mixtral-8x7B-v0.1 進行日語詞彙擴充持續預訓練的模型。
- Downloads: 27
- kurogane/Llama3-BioYouri-8B-instruct-chatvector-mergetest
- 這個模型是基於精通生物學和醫學的OpenBioLLM-8B,為了提高日語相容性,將Llama-3-youko-8b-instruct-chatvector整合進去而成。
- Downloads: 27
- MaziyarPanahi/japanese-stablelm-instruct-gamma-7b-Mistral-7B-Instruct-v0.1
- japanese-stablelm-instruct-gamma-7b-Mistral-7B-Instruct-v0.1japanese-stablelm-instruct-gamma-7b-Mistral-7B-Instruct-v0.1是以下模型的合併:mistralai/Mistral-7B-Instruct-v0.1stabilityai/japanese-stablelm-instruct-gamma-7b🧩 配置片段:- sources:-
- Downloads: 27
- megagonlabs/t5-base-japanese-web-8k
- t5-base-japanese-web-8k(具有Byte-fallback,8K)描述megagonlabs/t5-base-japanese-web-8k是一個在日本網頁文本上預先訓練的T5(文本轉換變壓器)模型。
- Downloads: 27
- nlp-waseda/gpt2-small-japanese
- 該模型是日文 GPT-2,在日文維基百科和 CC-100 上預訓練。預期用途和限制您可以使用原始模型進行文本生成,或對其進行微調以進行下游任務。
- Downloads: 26
- KoichiYasuoka/bert-large-japanese-wikipedia-ud-head
- bert-large-japanese-wikipedia-ud-head 模型描述
- Downloads: 26
- MaziyarPanahi/japanese-stablelm-base-gamma-7b-Mistral-7B-Instruct-v0.1
- japanese-stablelm-base-gamma-7b-Mistral-7B-Instruct-v0.1 是以下模型的合併:mistralai/Mistral-7B-Instruct-v0.1 和 stabilityai/japanese-stablelm-base-gamma-7b🧩 配置切片: - 來源: -
- Downloads: 26
- rinna/nekomata-7b-instruction-gguf
- rinna/nekomata-7b-instruction-gguf概述這個模型是rinna/nekomata-7b-instruction的GGUF版本。
- Downloads: 26
- ebisuke/liz-nojaloli-ja
- ebisuke/liz-nojaloli-ja使用了MIT許可證作為基礎,並使用rinna/japanese-gpt-neox-3.6b。
- Downloads: 26
- KoichiYasuoka/bert-large-japanese-luw-upos
- 波特大型日语LUW-词性标注模型
- Downloads: 26
- kit-nlp/transformers-ud-japanese-electra-base-discriminator-irony
- 這是一個針對日語進行微調以進行自動反諷偵測的 ELECTRA Base 模型。
- Downloads: 25
- nlp-waseda/comet-v2-gpt2-small-japanese
- COMET-GPT2 和 v2 Fine-tuned GPT-2 是 ATOMIC的大版本,使用因果語言建模(CLM)目標。
- Downloads: 25
- dahara1/ELYZA-japanese-Llama-2-7b-instruct-AWQ
- 模型卡片,模型ID原始模型 elyza/ELYZA-japanese-Llama-2-7b-instruct 是基於 Meta 的 "Llama 2",並進行了額外的日文指導預訓練。
- Downloads: 25
- mmnga/Tanuki-ZeRo-gguf
- 這是Tanuki-ZeRo-ggufkanhatakeyama先生所公開的Tanuki-ZeRo的gguf格式轉換版。
- Downloads: 25
- drewschaub/whisper-large-v3-japanese-4k-steps
- 這個模型是在Common Voice 16.1數據集上針對openai/whisper-large-v3進行微調的版本。
- Downloads: 25
- Miwa-Keita/zenz-v1
- zenz-v1 是一個專注於日文漢字轉換任務的語言模型,基於 GPT-2 架構。
- Downloads: 24
- owner203/japanese-alpaca-2-13b-gguf
- 日本-羊駝-2-13B-GGUF是日本-羊駝-2-13B的GGUF格式。
- Downloads: 24
- ebisuke/liz-nojaloli-nxja-ja
- ebisuke/liz-nojaloli-nxja-ja是基於MIT許可證的
abeja/gpt-neox-japanese-2.7b
所使用的。 - Downloads: 24
- ebisuke/liz-nojaloli-nxja-ja是基於MIT許可證的
- Aratako/Oumuamua-7b-RP
- 這是通過 mergekit 創建的預訓練語言模型的合併版本。點擊這裡查看 GGUF 版本。
- Downloads: 23
- KoichiYasuoka/roberta-large-japanese-aozora-ud-goeswith
- 模型描述这是一个在青空文库文本上进行POS标注和依存分析(使用goeswith进行子词分析)预训练的RoBERTa模型,衍生自roberta-large-japanese-aozora和UD_Japanese-GSDLUW。如何使用类UDgoeswith(对象):def init(self,bert):
- Downloads: 23
- Local-Novel-LLM-project/Ninja-v1
- 我們的模型VecteusNinja-v1Ninja-v1-NSFWNinja-v1-128kNinja-v1-NSFW-128kNinja-v1.0 的模型卡片基於 Mistral-7B 的大型語言模型(LLM)是 Mistral-7B-v0.1 的新數據集微調版本與 Mistral-7B-v0.1 相比,Ninja 有以下變化:- 實現高
- Downloads: 22
- Aruno/Bloom-JP-160m
- 在日本語語料庫上進行訓練的 Bloom 模型。
- Downloads: 22
- ThePioneer/MoeDiffusionPlusPlus
- V1 = MoeDiffusion 1.0 + (HassanBlend 1.5 - VMix03) * 0.2V2 = MoeDiffusion 0.6:HassanBlend 1.5 0.2:VMix03:0.2有傳言稱,混合中可能包含NAI洩漏或Insta系列模型,因此不建議使用NAI洩漏反對・Insta系列模型反對。為了展現出理
- Downloads: 22
- KoichiYasuoka/bert-base-japanese-char-extended
- 基於bert-base-japanese-char-extended模型
- Downloads: 22
- Fugaku-LLM/Fugaku-LLM-13B
- Fugaku-LLM 使用規約本使用規約(以下簡稱為「本規約」)是由富士通株式會社、國立研究開發法人理化學研究所、國立大學法人東京工業大學、國立大學法人東北大學、株式會社CyberAgent、國立大學法人東海
- Downloads: 21
- TeamFnord/manga-ocr
- 漫畫 OCR (Optical Character Recognition) 是用於日文文本的光學字符識別技術,主要應用於日本漫畫。
- Downloads: 21
- tsukemono/japanese-novel-gpt-j-6b-f16-marisa
- 這是模型概述,可以與東方Project角色霧雨魔理沙對話的模型。
- Downloads: 21
- MCZK/Tora-7B-v0.2-GGUF
- ryota39 先生的 Tora-7B-v0.2 已轉換為 GGUF 格式的版本。
- Downloads: 21
- turing-motors/heron-chat-blip-ja-stablelm-base-7b-v1-llava-620k
- Heron BLIP是一個穩定的日本 StableLM。
- Downloads: 21
- okazaki-lab/japanese-gpt2-medium-unidic
- 這是一個使用類似BERT的分詞器的中型日文GPT-2模型。
- Downloads: 21
- ClassCat/gpt2-base-japanese-v2
- GPT2 的日本基础模型版本 2 先决条件为 transformers==4.19.2 模型。
- Downloads: 21
- AndrewMcDowell/wav2vec2-xls-r-1b-japanese-hiragana-katakana
- 這個模型是在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - JA數據集上對facebook/wav2vec2-xls-r-1b進行微調的版本。
- Downloads: 21
- Ivydata/wav2vec2-large-speech-diarization-jp
- 在日語電話通話2個說話人辨識模型中進行了對XLSR-53大型模型的微調,該模型是在日本使用電話通話數據CallHome微調的facebook/wav2vec2-large-xlsr-53。
- Downloads: 21
- KoichiYasuoka/roberta-base-japanese-aozora-char
- 模型描述這是一個在青空文庫文本上使用字符分詞器預先訓練的 RoBERTa 模型。
- Downloads: 20
- microsoft/unihanlm-base
- 對於粗細中日語言模型的預訓練,採用Unihan數據庫。模型描述中文和日文共享許多具有類似表層形態的字符。
- Downloads: 20
- stabilityai/japanese-stablelm-2-base-1_6b
- 通過點擊「同意」,您同意許可協議並承認Stability AI的隱私政策。
- Downloads: 20
- tsukemono/japanese-stablelm-base-alpha-7b-f16-marisa
- 模特兒概述:這是一款可以與雾雨魔理沙聊天的模特兒。
- Downloads: 20
- Mizuiro-sakura/open-calm-large-finetuned-databricks-dolly
- OpenCALM-LARGE模型描述OpenCALM是CyberAgent公司開發的一套僅解碼器的語言模型套件,預先在日本資料集上進行訓練。
- Downloads: 20
- Helsinki-NLP/opus-mt-ja-he
- jpn-heb來源群組:日文目標群組:希伯來語OPUS 自述:jpn-heb模型:transformer-align來源語言:jpn_Hani jpn_Hira jpn_Kana目標語言:希伯來語模型:transformer-align前處理:正規化 + SentencePiece(spm32k,spm32k)
- Downloads: 19
- colorfulscoop/bert-base-ja
- BERT基本日文模型這個存儲庫包含一個在日本維基百科數據集上訓練的BERT基本模型。
- Downloads: 19
- nlp-waseda/gpt2-small-japanese-wikipedia
- 這個模型是基於日本維基百科預訓練的日文GPT-2。
- Downloads: 19
- Hemlok/REV-Mix
- ◆REV-Mix是一款名為“革命”的模型。
- Downloads: 19
- Spiral-AI/Spiral-RetNet-3b-base
- SpiralAI Spiral-RetNet-3b-base 我們已從頭開始對 RetNet(https://arxiv.org/abs/2307.08621)進行了預訓練。
- Downloads: 19
- owner203/japanese-llama-2-7b-gguf
- 日語-LLaMA-2-7B-GGUF是日語-LLaMA-2-7B的GGUF格式。
- Downloads: 19
- yukismd/JapaneseQuizChatbot_v1
- 模型卡片摘要该模型是使用H2O LLM Studio训练的。
- Downloads: 19
- akiFQC/japanese-dialogpt-small-aozora
- 日本DialoGPT Small是在青空文庫上訓練的。
- Downloads: 19
- oshizo/japanese-e5-mistral-7b_slerp
- 這個模型是通過合併intfloat/e5-mistral-7b-instruct和stabilityai/japanese-stablelm-base-gamma-7b兩者而創建的。
- Downloads: 18
- vitouphy/wav2vec2-xls-r-300m-japanese
- 這個模型是用來將音頻轉錄成平假名,這是日語的一種文字格式。
- Downloads: 18
- ttop324/wav2vec2-live-japanese
- wav2vec2-live-japanese https://github.com/ttop32/wav2vec2-live-japanese-translator 通過將 facebook/wav2vec2-large-xlsr-53 在日文假名上進行微調,使用 thecommon_voiceJSUTCSS10TEDxJP-10KJVSJSSS 進行微調。 推論#用法 import torch import torchaudio from datasets import load_dataset from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor model = Wav2Vec2For
- Downloads: 18
- KoichiYasuoka/deberta-base-japanese-wikipedia-ud-goeswith
- Model Description這是在日本維基百科和青空文庫文本上預訓練的 DeBERTa(V2) 模型,用於詞性標記和依存分析(使用 subwords 的 goeswith),源自 deberta-base-japanese-wikipedia-luw-upos 和 UD_Japanese-GSDLUW。使用方式如下:class UDgoeswith(object): def init(self,bert):
- Downloads: 18
- aipib/karasu-lora-jp-qa-chat
- karasu-Lora-JP-QA-Chatkarasu通過Lora方法對原始Q&A數據集進行了微調模型。
- Downloads: 18
- abeja/Mixtral-8x7B-Instruct-v0.1-japanese
- Mixtral-8x7B-Instruct-v0.1-japaneseMixtral-8x7B-Instruct-v0.1-japanese是基於Mixtral-8x7B-Instruct-v0.1並進行了日語詞彙拓展持續事前學習的模型。
- Downloads: 18
- abeja/Mixtral-8x7B-Instruct-v0.1-japanese-alpha-merged
- Mixtral-8x7B-Instruct-v0.1-japanese-alpha-merged是在基於Mixtral-8x7B-Instruct-v0.1的模型上進行日語詞彙擴展持續預先學習的過程中,進行差分合併的模型。
- Downloads: 18
- aixsatoshi/Swallow-MX-8x7b-NVE-chatvector-Mixtral-instruct-v2
- 這是將Swallow-MX-8x7b-NVE-v0.1與Mixtral-8x7B-Instruct-v0.1以及Mixtral-8x7B-v0.1的差異合併而成的模型。
- Downloads: 18
- rinna/nekomata-14b-gguf
- rinna/nekomata-14b-gguf概述這個模型是rinna/nekomata-14b的GGUF版本。
- Downloads: 18
- oshizo/qa-refine-japanese-gpt-1b
- 這個模型卡片是用於模型ID rinna/japanese-gpt-1b,它是基於rinna/japanese-gpt-1b模型訓練而來,用於從上下文中提取問答以及在新上下文中進行答案微調學習。
- Downloads: 18
- ysakuramoto/mobilebert-ja
- MobileBERT 日語事前學習完成模型震撼登場!!
- Downloads: 18
- vumichien/wav2vec2-xls-r-1b-japanese
- 模型描述這個模型是在我收集的用於研究Common Voice 7.0的公共日語語音數據集上對facebook/wav2vec2-xls-r-1b進行微調的版本,也用於日本猿渡實驗室(JUST)的日語語音語料庫。
- Downloads: 18
- Aratako/calm3-22b-RP-v2
- calm3-22b-RP-v2 GGUF 版在這裡/點擊這裡以獲取 GGUF 版本。同時,這裡也發佈了這個模型的演示。
- Downloads: 17
- KoichiYasuoka/deberta-large-japanese-aozora-ud-goeswith
- 模型描述這是一個在青空文庫文本上預訓練的 DeBERTa(V2) 模型,用於詞性標記和依存分析(使用 goeswith 來處理子詞),源自 deberta-large-japanese-luw-upos 和 UD_Japanese-GSDLUW。如何使用類 UDgoeswith(that):def init(this,貝爾特):
- Downloads: 17
- KoichiYasuoka/deberta-base-japanese-aozora-ud-goeswith
- 模型描述這是一個在青空文庫文本上預訓練的 DeBERTa(V2) 模型,用於詞性標記和依存句法分析(使用 goeswith 用於子詞),衍生自 deberta-base-japanese-aozora 和 UD_Japanese-GSDLUW。如何使用類 UDgoeswith(object):def init(self,bert):
- Downloads: 17
- daisaku-s/medtxt_ner_roberta
- 使用由社交計算研究實驗室開源的MedTxt-CR模型,對RoBERTa進行fine-tuning後,獲得了固有表現抽取模型。
- Downloads: 17
- inu-ai/alpaca-guanaco-japanese-gpt-1b
- 使用了羊驼-大羊鹿-日本-1b1.3B参数的日文GPT模型进行对话人工智能。
- Downloads: 17
- hotchpotch/youri-7b-sft-qa-context-jaqket-gptq
- 已經經過適當學習的模型也包括了從通知中學習的回答,另外還有這個模型:https://huggingface.co/hotchpotch/youri-7b-stf-qa-context-jaqket-jsquad-gptq。
- Downloads: 17
- abeja/Mixtral-8x7B-Instruct-v0.1-japanese-alpha
- Mixtral-8x7B-Instruct-v0.1-japanese-alpha是基於Mixtral-8x7B-Instruct-v0.1,進行日語詞彙擴展持續預訓練的中途模型。
- Downloads: 17
- minkhantycc/translation-en-ja
- 該模型是在 bsd_ja_en 數據集上對 Helsinki-NLP/opus-mt-ja-en 進行微調的版本。
- Downloads: 17
- TheBloke/japanese-stablelm-instruct-beta-7B-AWQ
- 聊天和支援:TheBloke的Discord伺服器想要貢獻嗎?
- Downloads: 17
- cinmodel/electra-small-japanese-discriminator
- 日本提供一個日本ELECTRA-Small模型,如電子書"ELECTRA:預訓練文本編碼器作為鑑別器而非生成器"中所描述的。
- Downloads: 17
- qqpann/w2v_hf_jsut_xlsr53
- 在日語上使用 Common Voice 和 JSUT Fine-tuned 了 Wav2Vec2-Large-XLSR-53-Japanese 的 facebook/wav2vec2-large-xlsr-53。
- Downloads: 16
- KoichiYasuoka/deberta-large-japanese-wikipedia-ud-goeswith
- 模型描述這是在日文維基百科和青空文庫文本上預訓練的 DeBERTa(V2) 模型,用於詞性標記和依存分析(使用 goeswith 進行子詞處理),源自 deberta-large-japanese-wikipedia-luw-upos 和 UD_Japanese-GSDLUW。使用方式類 UDgoeswith(object):def init(self,bert):
- Downloads: 16
- ku-nlp/deberta-v2-base-japanese-with-auto-jumanpp
- 日本DeBERTa V2 baseModel的模型卡
- Downloads: 16
- yasyune/bert_vits2_2.2_jvnv
- jvnv語料庫的 F2 資料經由學習後建構的 bert-vits2 日語模型。
- Downloads: 16
- ThePioneer/MyVoiceClone-Style-Bert-VITS2
- 這個模型是為了Style Bert VITS2而創建的,是我的聲音克隆版本。
- Downloads: 16
- umiyuki/Japanese-Chat-Umievo-itr004-7b
- 這是使用mergekit創建的預訓練語言模型的合併。
- Downloads: 16
- Aratako/Swallow-MoE-2x13B-v0.1
- Swallow-MoE-2x13B-v0.1 是一個採用 Llama-2 為基礎的預訓練日語模型 tokyotech-llm/Swallow-13b-instruct-hf,以及依賴此模型的合併模型 nitky/Superswallow-13b-v0.2,在使用 mergekit 進行 MoE 運算後生成的模型。
- Downloads: 16
- Lycoris53/Vits-TTS-Japanese-Only-Sakura-Miko
- VITS TTS 只有日语版本櫻巫女 這是根據「櫻巫女」的語音數據集訓練的 VITS-TTS 模型。
- Downloads: 16
- Miwa-Keita/zenz-v2.5-medium
- zenz-v2.5-small zenz-v2.5是一個專注於假名漢字轉換任務的GPT-2架構條件式語言模型。
- Downloads: 16
- KoichiYasuoka/roberta-base-japanese-luw-upos
- roberta-base-japanese-luw-uposModel -> 羅伯塔基底日語-luw-upos 模型
- Downloads: 15
- KoichiYasuoka/roberta-base-japanese-aozora
- roberta-base-japanese-aozora模型描述這是一個在青空文庫文本上使用日文LUW-Tokenizer預訓練的 RoBERTa 模型。
- Downloads: 15
- ushikado/yuyuyui-chatbot
- 這個模型是基於rinna/japanese-gpt2-medium,並在《結城友奈是勇者》情境語料庫上進行了微調。
- Downloads: 15
- Local-Novel-LLM-project/Ocuteus-v1
- 這是一個基於 Vecteus 的模型,並支援 LLava。
- Downloads: 15
- aken12/splade-japanese
- 我們從東北大學NLP的bert-base-japanese-v2初始化SPLADE-japanese。
- Downloads: 15
- if001/tiny_mixtral_ja
- 使用了275.86M的Mixtral模型在日語數據集上進行預訓練的範例。from transformers import AutoTokenizer, AutoModelForCausalLMmodel = AutoModelForCausalLM.from_pretrained("if001/tiny_mixtral_ja")
- Downloads: 15
- ganchengguang/USA-7B-instruction-incontext-learning
- 僅供日語使用。請使用AutoTokenizer和AutoModelForCausalLM,並且必須使用Unifine格式進行輸入和輸出。
- Downloads: 15
- Nikolajvestergaard/Japanese_Fine_Tuned_Whisper_Model
- 這個模型是在Common Voice數據集上對openai/whisper-tiny進行微調的版本。
- Downloads: 15
- nlp-waseda/comet-gpt2-small-japanese
- COMET-GPT2 和 jaFine-tuned GPT-2 是基於 ATOMIC,並使用因果語言建模(CLM)目標。
- Downloads: 15
- naclbit/gpt-j-japanese-6.8b
- 這個預訓練模型還在持續進行中!
- Downloads: 14
- megagonlabs/transformers-ud-japanese-electra-base-ginza
- 變壓器-ud-日本語-埃萊卡-銀座(蘇打恰特拉-單詞片, mC4 日語)
- Downloads: 14
- OrionStarAI/Orion-14B-LongChat
- Orion-14B🌐英文 | 🇨🇳中文 | 🇯🇵日文 | 🇰🇷韓文🤗
- Downloads: 14
- rinna/nekomata-7b-gguf
- rinna/nekomata-7b-gguf概述該模型是rinna/nekomata-7b的GGUF版本。
- Downloads: 14
- ThePioneer/MoeSharpV1
- 模型說明:MoeDiffusionPlusPlus 0.7:DreamShaper 3.3(完整版)0.3。
- Downloads: 14
- sonoisa/sentence-bert-base-ja-en-mean-tokens
- 這是一個日語+英語句子-BERT模型。
- Downloads: 14
- KoichiYasuoka/bert-large-japanese-char-extended
- 這是一個在日文維基百科文本上預訓練的BERT模型,衍生自bert-large-japanese-char。
- Downloads: 14
- Miwa-Keita/zenz-v2.5-xsmall
- zenz-v2.5-small是一個專注於假名漢字轉換任務的GPT-2架構的條件式語言模型。
- Downloads: 14
- KoichiYasuoka/deberta-base-japanese-wikipedia
- 這是一個在日本維基百科和青空文庫文本上預先訓練的DeBERTa(V2)模型。
- Downloads: 14
- tohoku-nlp/bert-large-japanese-char
- BERT大型日語模型(使用字級別tokenization和整詞遮罩技術,jawiki-20200831)這是一個在日語文本上預訓練的BERT模型。
- Downloads: 13
- KoichiYasuoka/deberta-large-japanese-aozora
- 該模型是在青空文庫文本上預訓練的 DeBERTa(V2) 模型。
- Downloads: 13
- nu-dialogue/sfc2022-stable-diffusion
- SFCOCO穩定擴散模型卡片SFCOCO穩定擴散是一種特定於日本的潛在文本到圖像的擴散模型,能夠根據任何文本輸入生成逼真的照片。
- Downloads: 13
- taishi-i/awesome-japanese-nlp-classification-model
- 模型概述:這個模型是用於令人驚嘆的日文自然語言處理分類數據集的基準模型。
- Downloads: 13
- if001/llama2_ja_small_instruct
- 這是由在instruction用途資料集上進行了sft技術的llama2進行了training從日文轉換而來的base:https://huggingface.co/if001/llama2_ja_smalltraining請參閱以下scripthttps://github.com/Lightning-AI/lit-gpt/tree/main使用從 transformers import AutoTokenizer, AutoModelForCausalLMtokenizer = AutoTokenizer.from_pretrained("if001/sentencepiece_ja", trust_remote_code=True)model = AutoModelForCausal
- Downloads: 13
- TheBloke/japanese-stablelm-instruct-gamma-7B-GPTQ
- 聊天與支援:TheBloke 的 Discord 伺服器想要貢獻一份力嗎?
- Downloads: 13
- oshizo/japanese-sexual-moderation-v2
- japanese-sexual-moderation-v2是一個根據studio-ousia/luke-japanese-large-lite進行微調的模型。
- Downloads: 13
- HachiML/Swallow-MS-7b-instruct-v0.1
- Swallow-MS-7b-v0.1 這個模型是tokyotech-llm/Swallow-MS-7b-instruct-v0.1的tokenizer.chat_template進行以下更改的版本。
- Downloads: 13
- sambanovasystems/SambaLingo-Japanese-Base
- SambaLingo-Japanese-BaseSambaLingo-Japanese-Base 是一個預訓練的雙語日語和英語模型,通過在 Cultura-X 資料集的日語部分上進行訓練,從 420 億個標記中適應 Llama-2-7b 模型至日語。
- Downloads: 13
- yasyune/bert_vits2_2.1_jvnv
- 這是從 jvnv 語料庫中學習並建立的 bert-vits2 日文模型。
- Downloads: 13
- ketman/whisper_for_dominion
- Dominion 日本語 LLM for Whisper(2023/12/19 1.0版) 摘要: 在 Whisper 中,這個 Dominion(桌上遊戲)的用語和卡牌內容能夠被轉錄成文字的目標上調過的 LLM。
- Downloads: 13
- ganchengguang/Yoko-7B-Japanese-v1
- 這個模型是使用 guanaco 數據集進行訓練的。
- Downloads: 13
- Jumtra/mpt-7b-base
- MPT-7B-base這個模型是使用MosaicML的llm-foundry存儲庫來對mosaicml/mpt-7b進行微調的模型。
- Downloads: 13
- Miwa-Keita/zenz-v2.5-small
- zenz-v2.5-small zenz-v2.5 是一個專門用於假名漢字轉換任務的條件式語言模型,採用了 GPT-2 結構。
- Downloads: 13
- KoichiYasuoka/roberta-large-japanese-char-luw-upos
- 羅貝塔大型日文字符LUW UPOS模型
- Downloads: 12
- izumi-lab/electra-small-japanese-discriminator
- ELECTRA小型日語判別器這是一個在日語文本上預先訓練的ELECTRA模型。
- Downloads: 12
- spacy/ja_core_news_lg
- 詳情:https://spacy.io/models/ja#ja_core_news_lg 專為 CPU 進行優化的日文流程管線。
- Downloads: 12
- KoichiYasuoka/roberta-large-japanese-aozora-ud-head
- 羅柏塔大型日語青空UD頭型模型
- Downloads: 12
- thefrigidliquidation/nllb-200-distilled-1.3B-bookworm
- NLLB-200 1.3B 是在《本好きの下剋上》上進行微調的模型。此模型用於將網絡小說從日語翻譯成英語。
- Downloads: 12
- arc-r/faster-whisper-large-v2-jp
- whisper-large-v2-jp 模型用於 CTranslate2這個存儲庫包含了將 vumichien/whisper-large-v2-jp 轉換為 CTranslate2 模型格式的代碼。
- Downloads: 12
- ganchengguang/Yoko_13B_Japanese_QLoRA
- 這個模型是使用llm-japanese-dataset數據集訓練的。
- Downloads: 12
- schroneko/ELYZA-japanese-Llama-2-13b-fast-instruct-gguf
- ELYZA-日本-大羊-2-13b-快速指导-ggufELYZA-日本-大羊-2-13b-快速指导的 GGUF
- Downloads: 12
- Deepreneur/blue-lizard
- Deepreneur-blue-lizard 模型說明 Deepreneur-blue-lizard 模型是通過使用日語的學習數據,如維基百科和書籍,對 Meta 的 Llama-2-7b 進行額外的預訓練和使用獨有數據進行微調而得來。
- Downloads: 12
- Aratako/ELYZA-japanese-Llama-2-fast-MoE-2x7B-v0.1
- ELYZA-日本語-Llama-2-快速-MoE-2x7B-v0.1。英文描述在這裡。概要:這是一個使用Llama-2基礎的預訓練日本語模型elyza/ELYZA-日本語-Llama-2-7b-fast以及其instruction tuning模型elyza/ELYZA-日本語-Llama-2-7b-fast-instruct,透過mergekit進行Mo
- Downloads: 12
- haqishen/h2o-Llama-3-8B-Japanese-Instruct
- 簡介我是:祈神哈
- Downloads: 12
- nlp-waseda/tacomet-gpt2-xl-japanese
- TaCOMET_ja -> TaCOMET_ja
- Downloads: 12
- TheBloke/japanese-stablelm-instruct-beta-70B-AWQ
- 聊天及支援:TheBloke的Discord服務器想要貢獻嗎?
- Downloads: 12
- kit-nlp/electra-small-japanese-discriminator-cyberbullying
- 這是一個針對日文進行微調以進行自動網絡欺凌檢測的ELECTRA Small模型。
- Downloads: 12
- espnet/kan-bayashi_jsut_full_band_vits_prosody
- ESPnet2 TTS 預訓練模型 kan-bayashi/jsut_full_band_vits_prosody ♻
- Downloads: 12
- svjack/Stable-Diffusion-Pokemon-ja
- 日本穩定擴散口袋妖怪模型卡Stable-Diffusion-Pokemon-ja 是一種特定於日本的潛在文本到圖像擴散模型,能夠根據任何文本輸入生成口袋妖怪圖像。
- Downloads: 11
- LoneStriker/shisa-7b-v1-8.0bpw-h8-exl2
- 石獅 7B (shisa-7b-v1)
- Downloads: 11
- watashiha/Watashiha-Llama-2-13B-Ogiri-sft-neuron
- 這份英文文件包含了模型概要,這是一個經過編譯以在AWS的inf2實例上運行的Watashiha-Llama-2-13B-Ogiri-sft模型。
- Downloads: 11
- AIgroup-CVM-utokyohospital/Llama-2-70b-chat-4bit-japanese
- 這個模型是Llama-2-Chat 70B,經過 fine-tuned,使用了一部分日本語指示數據集 izumi-lab/llm-japanese-dataset。
- Downloads: 11
- huranokuma/es_IT
- 我已對日文GPT-2模型進行了微調。
- Downloads: 11
- mmnga/Phi-3-medium-128k-instruct-gguf
- Phi-3-medium-128k-instruct-ggufmicrosoft 先生所公開的 Phi-3-medium-128k-instruct 的 gguf 格式轉換版。
- Downloads: 669
- mmnga/aixsatoshi-Honyaku-13b-gguf
- aixsatoshi-Honyaku-13b-ggu這是aixsatoshi先生公開的Honyaku-13b檔案的gguf格式轉換版本。
- Downloads: 604
- Mitsua/elan-mt-bt-en-ja
- ElanMTElanMT-BT-en-ja是由ELAN MITSUA Project / Abstract Engine開發的英文到日文翻譯模型。
- Downloads: 529
- 2121-8/japanese-parler-tts-mini
- 日語 Parler-TTS Mini 這個存儲庫基於 parler-tts/parler-tts-mini-v1,重新訓練了模型以實現日語文本的朗讀。
- Downloads: 497
- LoneWolfgang/bert-for-japanese-twitter-sentiment
- BERT 用於日本 Twitter 情感分析
- Downloads: 210
- mmnga/Deepreneur-blue-lizard-gguf
- Deepreneur-blue-lizard-ggufDeepreneur 先生公開的 blue-lizard 的 gguf 格式轉換版。
- Downloads: 176
- mmnga/stockmark-100b-gguf
- stockmark-100b-gguf是stockmark先生公開的stockmark-100b的gguf格式轉換版。
- Downloads: 137
- Mitsua/elan-mt-bt-ja-en
- ElanMTElanMT-BT-ja-en是由ELAN MITSUA Project / Abstract Engine開發的日語到英語翻譯模型。
- Downloads: 132
- stockmark/stockmark-100b
- Stockmark-100b 是基於約 9100 億令牌的日語和英語語料庫從零開始預先訓練的 1000 億參數 LLM。
- Downloads: 125
- second-state/Llama-3-8B-Japanese-Instruct-GGUF
- Llama-3-8B-日本指导-GGUFOriginal Modelhaqishen/Llama-3-8B-日本指导与LlamaEdgeLlamaEdge版本: v0.10.1及以上提示模板提示类型: llama-3-chat提示字符串<|begin_of_text|><|start_header_id|>系统<|end_header_id|>{{ system_prompt }}<|eot_id|><|start_header_id|>用户<|end_header_id|>
- Downloads: 108
- Aratako/Ninja-v1-RP-expressive-GGUF
- 忍者v1角色扮演表現GGUF概要Aratako/Ninja-v1-RP-expressive的量子化完成版。
- Downloads: 99
- Aratako/Ninja-v1-RP-GGUF
- 忍者-v1-RP-GGUF概要是 Aratako/Ninja-v1-RP 的量子化済み GGUF 版本。
- Downloads: 93
- Aratako/Ninja-v1-RP-WIP
- Ninja-v1-RP-WIP概要Local-Novel-LLM-project/Ninja-v1-NSFW是一個在LoRA中進行Fine-tuning用於角色扮演的模型。
- Downloads: 71
- nk2t/Llama-3-8B-Instruct-japanese-nk2t-v0.3
- Llama-3-8B-Instruct-JP-nk2t-v0.3模型詳細: 使用Meta Llama 3構建的llama-3-8b的日本語持續學習模型,應用ChatVector,接著在QLora上進行微調。
- Downloads: 67
- gaianet/Llama-3-8B-Japanese-Instruct-GGUF
- Llama-3-8B-日文-指令-GGUFOriginal Modelhaqishen/Llama-3-8B-日文-指令运行 with LlamaEdgeLlamaEdge版本:v0.10.1及以上提示模板提示类型:llama-3-聊天提示字符串<|begin_of_text|><|start_header_id|>系统<|end_header_id|>{{ system_prompt }}<|eot_id|><|start_header_id|>
- Downloads: 43
- MCZK/Japanese-Chat-Umievo-itr004-7b-GGUF
- umiyuki様的 Japanese-Chat-Umievo-itr004-7b 已轉換為GGUF格式。
- Downloads: 38
- RikkaBotan/style_bert_vits2_jp_extra_cool_original
- X(Twitter)帳號,歡迎來玩喔。
- Downloads: 37
- RikkaBotan/style_bert_vits2_jp_extra_sweet_original
- X(Twitter) 帳號,歡迎來逛逛。
- Downloads: 36
- izumi-lab/electra-base-japanese-generator
- ELECTRA基於日文的生成器這是一個在日文文本上預訓練的ELECTRA模型。
- Downloads: 29
- hakuhodo-tech/japanese-clip-vit-h-14-bert-wider
- 日本語 CLIP ViT-H/14 (更寬)目錄概覽使用模型細節評估限制與偏見引用參見聯繫資訊概覽開發者:HAKUHODO Technologies Inc.模型類型:對比性語言-圖像預訓練模型語言:日本語授權:CC BY-NC-SA 4.0這裡介紹了
- Downloads: 29
- Aratako/Ninja-v1-RP
- Ninja-v1-RPGGUF版可以在這裡找到/點擊這裡進入GGUF版本概要。這是使用mergekit創建的預訓練語言模型的合併版本。基於Aratako/Ninja-v1-RP-WIP,通過添加Task Vector和Model Stock進行合併,強化了指示追隨能力和表現力,這是一個用於角色扮
- Downloads: 27
- webbigdata/C3TR-Adapter_gptq
- 模型卡片的英日、日英翻譯用模型C3TR-Adapter的GPTQ4位元量子化版。
- Downloads: 23
- isek-ai/isekai-bert-v1
- 異世界-bert-v1
- Downloads: 21
- napopoa32/swallow-hermes-st-v1
- 為了製作《swallow-hermes-st-v1》的故事,我們考慮到是否能夠製作出更強大的模型而製作的。
- Downloads: 17
- KoichiYasuoka/deberta-v3-base-japanese-ud-goeswith
- 這是一個在LLM-jp語料庫v1.0上針對詞性標記和依存分析(使用subwords的goeswith方法)進行預訓練的DeBERTa(V3)模型,源自deberta-v3-base-japanese和UD_Japanese-GSDLUW。如何使用:class UDgoeswith(object):def init(self,bert):
- Downloads: 16
- Jumtra/mpt-7b-inst
- 這個模型是通過使用MosaicML的llm-foundry存儲庫對mosaicml/mpt-7b-instruct進行微調而獲得的模型。
- Downloads: 16
- KoichiYasuoka/roberta-small-japanese-char-luw-upos
- 羅伯塔-小-日語-字符-luw-upos模型
- Downloads: 15
- mmnga/ELYZA-japanese-CodeLlama-7b-instruct-GPTQ-calib-ja-1k
- ELYZA-japanese-CodeLlama-7b-instruct-GPTQ-calib-ja-1k是由Kelyza所公開的ELYZA-japanese-CodeLlama-7b-instruct,在日語校準設定下生成的GPTQ模型。
- Downloads: 15
- ohwi/japanese-stablelm-instruct-gamma-7b-dpo-uf-v0
- 日本穩定LM指示Gamma 7B +
- Downloads: 15
- falche/opennovel_oc2_01a_7b
- 模型描述Cyberagent公司的cyberagent/calm2-7b-chat已進行額外學習,成為作家助手AI的Alpha版本。
- Downloads: 15
- huranokuma/es
- 我使用日語GPT-2模型進行了ES寫作AI的微調,並使用了兩萬多份已錄取者的ES來進行微調。
- Downloads: 15
- espnet/kan-bayashi_jsut_fastspeech2
- 範例 ESPnet2 TTS 模型 kan-bayashi/jsut_fastspeech2 ♻
- Downloads: 15
- LoneStriker/stabilityai_japanese-stablelm-instruct-gamma-7b-5.0bpw-h6-exl2
- 日本穩定LM Instruct Gamma 7B型號描述
- Downloads: 14
- megagonlabs/roberta-long-japanese
- 羅伯塔-日文(jumanpp + sentencepiece,mC4 日文)這是在約200...上預先訓練的羅伯塔日文模型的較長輸入版本
- Downloads: 13
- TheBloke/japanese-stablelm-instruct-gamma-7B-AWQ
- 聊天和支援:TheBloke 的 Discord 伺服器想貢獻一份力嗎?
- Downloads: 13
- nitky/Superswallow-70b-v0.1
- SuperSwallow-70b-v0.1已知性能問題在此模型中發現了兩個潛在的問題:需要重複懲罰(repetition_penalty)需要高溫度(high temperature)參考資料︰ 在 Nejumi LLM Leaderboard Neo 上的 日文LLM基準結果目前的基準結果比 Swallow 更差,Swallow 是一個基於合併的模型。
- Downloads: 13
- alfredplpl/suzume-poc
- 首先,我們對Google的Gemma-2B進行了持續的預先學習,使其可以在日語中使用,這是可用於商業用途的基礎模型。
- Downloads: 13
- ryota39/Phi-3-mini-4k-instruct-dpo
- 模型基础模型:microsoft/Phi-3-mini-4k-instruct 学习数据集:llm-jp/hh-rlhf-12k-ja 学习方式:全参数调整 示例 import torch from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained( "ryota39/Phi-3-mini-4k-instruct-dpo", trust_remote_code=True, ) model = AutoModelForCausalLM.from_pretrained( "ryota39/Phi-3-mini-4k-instruct-dpo", device_map
- Downloads: 13
- Elizezen/Omnia-2x7B
- Omnia 2x7B描述 這個存儲庫托管了Omnia-2x7B,一個專門訓練用於生成小說的高級日語語言模型。
- Downloads: 13
- LoneStriker/shisa-7b-v1-3.0bpw-h6-exl2
- 獅子七號B (shisa-7b-v1)
- Downloads: 13
- KoichiYasuoka/deberta-large-japanese-upos
- 這是一個在青空文庫文本上進行預訓練的DeBERTa(V2)模型,用於詞性標記和依存分析,衍生自deberta-large-japanese-aozora。
- Downloads: 13
- KoichiYasuoka/roberta-small-japanese-aozora-char
- 模型描述這是一個在青空文庫文本上使用字符分詞器進行預訓練的 RoBERTa 模型。
- Downloads: 12
- izumi-lab/electra-base-japanese-discriminator
- 這是一個 ELECTRA 模型,是在日語文本上預先訓練的。
- Downloads: 12
- TheBloke/japanese-stablelm-base-beta-70B-GPTQ
- 聊天和支援:TheBloke 的 Discord 伺服器想要貢獻嗎?
- Downloads: 12
- zaq-hack/Orion-14B-LongChat-bpw600-h6-exl2
- 獵戶座-14B 🌐 英文 | 🇨
- Downloads: 12
- loiccabannes/MambaSan-370m
- MambaSan-370m 🐍 MambaSan-370m是基於狀態空間模型結構(Mamba)的第一個聊天日文語言模型。
- Downloads: 12
- Local-Novel-LLM-project/Ninja-v1-128k
- 我們的模型:ModelsVecteusNinja-v1Ninja-v1-NSFWNinja-v1-128kNinja-v1-NSFW-128kModel Card for Ninja-v1-128k基於Mistral-7B的大型語言模型(LLM)是Mistral-7B-v0.1的noveldataset fine-tuned版本。Ninja-128k 相比 Mistral-7B-v0.1 有以下變化:128k 內文窗口(
- Downloads: 12
- NilanE/tinyllama-en_ja-translation-v2
- 基於tinyllama的正在進行中的長文本日英翻譯模型。
- Downloads: 12
- akineAItech/Jeneri-SAMA-6B
- 這個模型是基於總共216部評價良好的輕小說、青空文庫和維基百科等文章所訓練的,用於生成小說的QLoRA模型。 原文網址為:https://huggingface.co/AIBunCho/japanese-novel-gpt-j-6b"。
- Downloads: 12
- ohwi/japanese-stablelm-instruct-gamma-7b-repro
- 再制造日本稳定LM指导Gamma 7B型号说明
- Downloads: 12
- hotchpotch/youri-7b-sft-qa-context-jaqket-awq
- 通過學習適當的回答,這個模型是從通知中學習的: https://huggingface.co/hotchpotch/youri-7b-stf-qa-context-jaqket-jsquad-gptq。
- Downloads: 12
- kanxxyc/JPNsensei-V2
- JPNsensei-V2Model應用這是一個專門用於回答用英語學習日語相關問題的QA模型。
- Downloads: 12
- ohtaman/falcon-7b-kokkai2022-lora
- 這個模型學習了2022年日本國會的議事過程。
- Downloads: 12
- KoichiYasuoka/roberta-base-japanese-aozora-ud-goeswith
- roberta-base-japanese-aozora-ud-goeswith 模型描述
- Downloads: 12
- Momerio/meigen_generate_Japanese
- 名言推論模型
- Downloads: 11
- jweb/japanese-soseki-gpt2-1b
- 這個存儲庫提供了一個有 13 億參數的微調日文 GPT2 模型。
- Downloads: 11
- KoichiYasuoka/deberta-base-japanese-aozora
- 這是一個在青空文庫文本上預訓練的 DeBERTa(V2) 模型。
- Downloads: 11
- KoichiYasuoka/deberta-base-japanese-wikipedia-luw-upos
- deberta-base-japanese-wikipedia-luw-uposModelDeBERTa基底日文維基百科-魯瓦藏-通用部分-模型
- Downloads: 11
- if001/llama2_ja_ss
- 使用日語訓練的llama2model大小為130.78M。訓練請參考以下腳本https://github.com/Lightning-AI/lit-gpt/tree/main使用以下程式碼從transformers庫匯入必要模組:pythonfrom transformers import AutoTokenizer, AutoModelForCausalLMtokenizer = AutoTokenizer.from_pretrained("if001/sentencepiece_ja", trust_remote_code=True)model = AutoModelForCausalLM.from_pretrained("if001/
- Downloads: 11
- llm-jp/llm-jp-13b-instruct-lora-jaster-dolly-oasst-v1.0
- llm-jp-13b-instruct-lora-jaster-dolly-oasst-v1.0LLM-JP-13B指令-羅拉-傑斯特-多利-維護人員培訓-V1.0
- Downloads: 11
- LoneStriker/stabilityai_japanese-stablelm-instruct-gamma-7b-3.0bpw-h6-exl2
- 日本穩定的LM指令Gamma 7B模型
- Downloads: 11
- TheBloke/japanese-stablelm-base-beta-70B-AWQ
- 聊天與支援:TheBloke 的 Discord 伺服器想要貢獻嗎?
- Downloads: 11
- LoneStriker/SambaLingo-Japanese-Chat-6.0bpw-h6-exl2
- SambaLingo-Japanese-Chat是一個以人為導向的聊天模型,在日文和英文上接受訓練。
- Downloads: 11
- aixsatoshi/Swallow-MX-8x7b-NVE-chatvector-Mixtral-instruct
- 我們已經上傳了更新情報的日語功能和平衡調整過的版本2,稱為Swallow-MX-8x7b-NVE-chatvector-Mixtral-instruct-v2。這個模型概要是將Mixtral-8x7B-Instruct-v0.1和Mixtral-8x7B-v0.1與Swallow-MX-8x7b-NVE-v0.1的差異合併而成。
- Downloads: 11
- sosoai/Orion-14B-Chat-safetensors
- Orion-14B🌐英语 | 🇨🇳中文 | 🇯🇵日语 | 🇰🇷韩语🤗
- Downloads: 11
- LoneStriker/shisa-7b-v1-6.0bpw-h6-exl2
- 希莎 7B 希莎 7B (shisa-7b-v1)
- Downloads: 11
- LoneStriker/shisa-7b-v1-5.0bpw-h6-exl2
- 獅子7B 獅子7B (獅子-7b-v1)
- Downloads: 11
- LoneStriker/shisa-7b-v1-4.0bpw-h6-exl2
- 獅子座 7B(shisa-7b-v1)
- Downloads: 11
- okazaki-lab/japanese-reversed-gpt2-medium-unidic
- 這是一個中等大小的日語反向 GPT-2 模型,使用類似 BERT 的分詞器。
- Downloads: 11
- tokyotech-llm/Llama-3.1-Swallow-8B-Instruct-v0.2
- 3.1 駱馬吞嚥 - 基於駱馬構建 3.1 駱馬吞嚥是一系列大型語言模型(8B, 70B),通過對 Meta 駱馬 3.1 模型進行持續預訓練而構建。
- Downloads: 14,967
- team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GPTQ-4bit
- 狸-8x8B-dpo-v1.0-GPTQ-4bit 是在GENIAC松尾研佈局過的LLM發展項目中開發的LLM模型weblab-GENIAC/Tanuki-8x8B-dpo-v1.0的GPTQ 4bit量化模型。
- Downloads: 14,385
- cyberagent/Llama-3.1-70B-Japanese-Instruct-2407
- Llama-3.1-70B-Japanese-Instruct-2407模型描述:這是基於meta-llama/Meta-Llama-3.1-70B-Instruct的日本持續預訓練模型。
- Downloads: 5,149
- tokyotech-llm/Llama-3.1-Swallow-70B-Instruct-v0.1
- 3.1燕子-由Llama构建 3.1燕子是一系列通过对Meta Llama 3.1 模型进行持续预训练而构建的大型语言模型(8B,70B)。
- Downloads: 5,052
- mmnga/Llama-3.3-70B-Instruct-gguf
- Llama-3.3-70B-Instruct-gguf 是 meta-llama 公開的 Llama-3.3-70B-Instruct 的 gguf 格式轉換版。
- Downloads: 4,835
- rinna/gemma-2-baku-2b
- 金瑪 2 巴庫 2B (rinna/gemma-2-baku-2b)
- Downloads: 4,384
- webbigdata/gemma-2-2b-jpn-it-translate-gguf
- gemma-2-2b-jpn-it-translate-gguf是一個專注於日英與英日翻譯任務的SLM(Small Language Model)模型。
- Downloads: 2,007
- pkshatech/RoSEtta-base-ja
- RoSEtta RoSEtta(基於RoFormer的句子編碼器通過提煉)是一個通用的日語文本嵌入模型,在檢索任務中表現優異。
- Downloads: 1,528
- mmnga/tokyotech-llm-Llama-3.1-Swallow-70B-Instruct-v0.3-gguf
- 東京工業大学-llm-羊駝-3.1-燕子-70B-指導-v0.3-gguf,為東京工業大學llm所公開的Llama-3.1-Swallow-70B-Instruct-v0.3的gguf格式轉換版本。
- Downloads: 982
- dahara1/Qwen2.5-3B-Instruct-gguf-japanese-imatrix-128K
- 關於這個模型。
- Downloads: 964
- mradermacher/Llama-3-8B-Instruct-japanese-nk2t-v0.2-GGUF
- 關於 https://huggingface.co/nk2t/Llama-3-8B-Instruct-japanese-nk2t-v0.2 的靜態量化,加權/imatrix 量化可從 https://huggingface.co/mradermacher/Llama-3-8B-Instruct-japanese-nk2t-v0.2-i1-GGUF 取得。如果您不確定如何使用 GGUF 檔案,請參考TheBloke的其中一個 README 以獲
- Downloads: 854
- mmnga/umiyuki-Umievo-itr012-Gleipnir-7B-gguf
- umiyuki-Umievo-itr012-Gleipnir-7B-ggufumiyuki所公開的Umievo-itr012-Gleipnir-7B的gguf格式轉換版本。
- Downloads: 607
- tohoku-nlp/tohokunlp-bert-500m-sq4096-alpha
- (請翻譯成繁體中文)
- Downloads: 576
- hotchpotch/japanese-splade-base-v1
- 稀疏词汇扩展模型(Sparse Lexical and Expansion Model) 是一个高性能的日语模型。
- Downloads: 426
- mradermacher/Llama-3-8B-Instruct-japanese-nk2t-v0.2-i1-GGUF
- 關於 https://huggingface.co/nk2t/Llama-3-8B-Instruct-japanese-nk2t-v0.2 的加權/imatrix quants,可在 https://huggingface.co/mradermacher/Llama-3-8B-Instruct-japanese-nk2t-v0.2-GGUF 中找到靜態 quants 的用法。
- Downloads: 281
- mmnga/sarashina2.1-1b-sft-gguf
- Aratako先生所公開的sarashina2.1-1b-sft的gguf格式轉換版。
- Downloads: 200
- nitky/Llama-3.3-SuperSwallow-70B-Instruct-v0.1
- Llama-3.3-SuperSwallow-70B-Instruct-v0.1 這是使用 mergekit 創建的預訓練語言模型的合併。
- Downloads: 176
- mmnga/Llama-3.1-70B-Instruct-gguf
- Llama-3.1-70B-Instruct-ggufmeta-這是由llamaさん公開的Meta-Llama-3.1-70B-Instruct的gguf格式轉換版本。
- Downloads: 170
- Local-Novel-LLM-project/WabiSabi-V1
- Wabisabi-v1.0模型卡 - 基于Mistral-7B的大型语言模型(LLM)是精调的新颖数据集版本,相比Mistral-7B-v0.1,wabisabi有以下变化。
- Downloads: 152
- ascktgcc/Mistral-nemo-ja-rp-v0.2-GGUF
- ascktgcc/Mistral-nemo-ja-rp-v0.2的GGUF版本。
- Downloads: 124
- kit-nlp/bert-base-japanese-basic-char-v2-irony
- 這是一個針對日語進行微調以進行自動反諷檢測的 BERT 基本模型。
- Downloads: 123
- dahara1/translate-task-thinking-test
- 翻譯任務 思考 測試 模型 模型描述
- Downloads: 106
- tohoku-nlp/tohokunlp-bert-500m-sq8192-alpha
- (英文部分如下日文部分。
- Downloads: 99
- nitky/EZO-QwQ-32B-Preview
- EZO-QwQ-32B-Preview 這是使用mergekit創建的預訓練語言模型的合併。
- Downloads: 98
- mav23/Sakura-13B-Galgame-GGUF
- SakuraLLM Sakura:使用普遍角色和關係屬性的知識,對輕小說和Galgame領域的日文到中文翻譯進行了SFT和RLHF模型。
- Downloads: 88
- SousiOmine/minoshiro-v0.2-7B_GGUF
- https://huggingface.co/SousiOmine/minoshiro-v0.2-7B 是GGUF量子化版本。
- Downloads: 84
- llm-jp/llm-jp-3-172b
- "LLM-jp-3 172B" 使用條款 本使用條款(以下稱為「本條款」)旨在規定大學共同利用機構法人資訊・系統研究機構國立資訊學研究所(以下稱為「提供者」)開發的成果,並作為開放資源公開的大
- Downloads: 66
- TKU410410103/uniTKU-hubert-japanese-asr
- 這個模型是在uniTKU提供的數據集上進行微調的,並且在common_voice_11_0數據集上保持了原始的性能指標。
- Downloads: 59
- llm-jp/llm-jp-3-172b-beta2
- 「LLM-jp-3 172B beta2」使用條款這些使用條款(以下稱為「本條款」)是由大學共同利用機構法人資訊・系統研究機構國立資訊學研究所(以下稱為「提供者」)制定,旨在規範由提供者開發並公開的
- Downloads: 59
- cl-nagoya/ruri-pt-base
- Ruri: 日文一般文本嵌入使用方法 首先安裝 Sentence Transformers 函式庫:pip install -U sentence-transformers 然後你可以加載這個模型並執行推論。
- Downloads: 58
- rinna/llama-3-youko-70b
- 請問您指的是狐狸 3 羊駝 70B (rinna/llama-3-youko-70b) 嗎?
- Downloads: 39
- hakutaku/qwen2.5-ja-zh
- Qwen2.5-ja-zh -> Qwen2.5-ja-zh
- Downloads: 38
- ascktgcc/Mistral-nemo-ja-rp-v0.2
- GGUF版可到達ascktgcc/Mistral-nemo-ja-rp-v0.2-GGUF。概述:Mistral-nemo模型經過微調以適用於EPR用途,由包含日文的數據集進行微調,因此應該比magnum等模型具有更強的日文能力。基於Mistral-Nemo,建議將溫度設置為0.3
- Downloads: 34
- alabnii/jmedroberta-base-manbyo-wordpiece-vocab50000
- 這是一個在日本科學技術振興機構(JST)收集的醫學科學學術文章上進行預訓練的日文 RoBERTa 基礎模型。
- Downloads: 22
- ce-lery/dolly-japanese-gpt-1b-clone
- dolly-japanese-gpt-1b-clone概要:這是rinna公司使用日本語數據集「databricks-dolly-15k-ja」所訓練的推理模型,來自「japanese-gpt-1b」。
- Downloads: 21
- KoichiYasuoka/deberta-large-japanese-luw-upos
- 德伯塔-大-日本-卢瓦-upos模型
- Downloads: 21
- KoichiYasuoka/roberta-large-japanese-luw-upos
- 羅伯塔大型日文LUW UPOS 模型
- Downloads: 18
- KoichiYasuoka/roberta-small-japanese-aozora
- 羅伯塔-小型-日文-青空模型描述:這是一個使用日文LUW分詞器預訓練在青空文庫文本上的羅伯塔模型。
- Downloads: 17
- ToPo-ToPo/line-japanese-large-lm-1.7b-kunishou-databricks-dolly-15k-ja-full-instruction-sft
- 對於模型概要 line-corporation/japanese-large-lm-1.7b 的基礎模型,我們進行了使用 sft 進行 full instruction tuning 調整。
- Downloads: 17
- Aratako/ELYZA-japanese-Llama-2-MoE-2x13B-v0.1
- ELYZA-日語-Llama-2-MoE-2x13B-v0.1 此處是英文描述。概要:這是一個使用mergekit進行MoE的模型,合併了基於Llama-2的預訓練日語模型ELYZA-japanese-Llama-2-13b以及其instruction tuning模型ELYZA-japanese-Llama-2-13b-instruct。
- Downloads: 17
- KoichiYasuoka/roberta-base-japanese-char-luw-upos
- roberta-base-japanese-char-luw-uposModel 的 Traditional Chinese translation is "roberta-base-japanese-char-luw-uposModel". Would you like a different translation or more information?
- Downloads: 16
- yohida/yoshida_gpt
- 這個存儲庫提供了一個擁有 13 億參數的日文 GPT 模型。
- Downloads: 16
- kcoopermiller/llm-jp-1.3b-v1.0-aya
- llm-jp-1.3b-v1.0-ayallm-jp 的 llm-jp-1.3b-v1.0 模型在 Cohere 的 aya 數據集上進行了微調。模型的評估結果為 AVGkcoopermiller/llm-jp-1.3b-v1.0-aya0.0698。llm-jp/llm-jp-1.3b-v1.00.047。如何使用:import torchfrom transformers import Auto
- Downloads: 15
- watashiha/Watashiha-Llama-2-13B-Ogiri-sft-vlm
- 模型簡介:我(Watashi)使用LLaVA學習了Llama-2-13B-Ogiri-sft,這是一個針對圖像的大喜劇語言模型。
- Downloads: 14
- astremo/JAINU
- JAINU 模型(T5 微調模型)是一個日本 - 阿伊努語機器翻譯模型。
- Downloads: 13
- fznx92/openai-whisper-large-v2-ja-transcribe-colab
- ID為Japanese transcription的模型卡片,測試正在進行以查看結果,主要個人用途是應用於日本喜劇,有9GB的VRAM與此Lora模型詳細資訊 模型描述openai-whisper-large-v2-LORA-ja 開發者: FZNX 模型類型: PEFT LORA 語言:(NLP):部分、全部日文。
- Downloads: 13
- kanhatakeyama/Tanuki-ZeRo
- 狸狸-ZeroBase 模型: llm-jp/llm-jp-13b-v1.0指令数据: 随机采样,15k Jaster 数据集(训练)源码在此。
- Downloads: 13
- KoichiYasuoka/deberta-small-japanese-aozora
- 迪伯塔小型日文青空模型說明
- Downloads: 13
- nlp-waseda/comet-gpt2-xl-japanese
- COMET-GPT2和v2 Finetuned GPT-2 xl是ATOMIC的大型版本,使用因果語言建模(CLM)目標。
- Downloads: 12
- LoneStriker/stabilityai_japanese-stablelm-instruct-gamma-7b-4.0bpw-h6-exl2
- 日本穩定的LM指令Gamma 7B模型描述
- Downloads: 12
- sbtom/karakuri-MS-01
- 自動操り人形MS-01型的詳細資訊在這裡。
- Downloads: 12
- ohwi/japanese-stablelm-instruct-gamma-7b-dpo-uf-v1
- 日本穩定的 LM 指導 Gamma 7B + DPO 模型
- Downloads: 12
- LoneStriker/stabilityai_japanese-stablelm-instruct-gamma-7b-8.0bpw-h6-exl2
- 日本穩定的LM指導Gamma 7B模型描述
- Downloads: 11
- if001/llama2_ja_small
- 訓練後的llama2模型大小:
- Downloads: 11
- kkuramitsu/mt5-mini9L
- 模型 ID 的模型卡片這是一個小型的 T5(文本轉文本轉換 Transformer)模型,是在日語和英語語料庫上預先訓練的。
- Downloads: 11
- llm-jp/llm-jp-3-1.8b
- llm-jp-3-1.8b -> 道加载模型-日本-3-1.8b
- Downloads: 25,694
- JujoHotaru/lora
- 十條螢(Hotaru Jujo)製作的 LoRA 正在發放中。
- Downloads: 6,020
- kotoba-tech/kotoba-whisper-bilingual-v1.0
- 言葉-Whisper-雙語(v1.0)
- Downloads: 1,932
- cl-nagoya/ruri-reranker-large
- Ruri-Reranker:日本將軍 Reranker 用法直接使用(句子轉換器)
- Downloads: 1,455
- tokyotech-llm/Llama-3-Swallow-70B-Instruct-v0.1
- Llama3 Swallow我們的 Swallow 模型已接受 Llama3 家族的持續預訓練,主要增加了日語數據。
- Downloads: 1,366
- mmnga/tokyotech-llm-Llama-3.1-Swallow-8B-Instruct-v0.1-gguf
- 東京工業大學-llm-Llama-3.1-Swallow-8B-Instruct-v0.1-gguf 是東京工業大學的llm發佈的Llama-3.1-Swallow-8B-Instruct-v0.1的gguf格式轉換版本。
- Downloads: 1,040
- mmnga/tokyotech-llm-Llama-3.1-Swallow-8B-Instruct-v0.2-gguf
- 東京工業大學的tokyotech-llm發布的Llama-3.1-Swallow-8B-Instruct-v0.2的gguf格式轉換版本。
- Downloads: 1,020
- llm-jp/llm-jp-3-vila-14b
- LLM-jp-3 VILA 14BLLM-jp-3 VILA 14B
- Downloads: 791
- mmnga/HODACHI-EZO-Common-T2-2B-gemma-2-it-gguf
- HODACHI-EZO-Common-T2-2B-gemma-2-it-ggufHODACHI先生所公開的EZO-Common-T2-2B-gemma-2-it的gguf格式轉換版。
- Downloads: 516
- mmnga/tokyotech-llm-Llama-3.1-Swallow-70B-Instruct-v0.1-gguf
- 東京工科大學-llm-大羊-3.1-燕-70B-指令-v0.1-gguf 是東京工科大學-llm提供的Llama-3.1-Swallow-70B-Instruct-v0.1的gguf格式轉換版本。
- Downloads: 431
- cl-nagoya/ruri-reranker-base
- Ruri-Reranker: 日文一般Reranker用法直接用法(句子轉換器)
- Downloads: 377
- QuantFactory/ELYZA-japanese-Llama-2-7b-instruct-GGUF
- QuantFactory/ELYZA-japanese-Llama-2-7b-instruct-GGUF量化工廠/ELYZA-日文-拉瑪-2-7b-指導-GGUF
- Downloads: 184
- fishaudio/fish-speech-1.2
- 魚語音 V1.2是一種領先的文字轉語音(TTS)模型,經過了30萬小時的英文、中文和日文音頻資料訓練。
- Downloads: 152
- Mitsua/mitsua-japanese-clip-vit-b-16
- Mitsua Japanese CLIP ViT-B-16 是一個僅使用經過明確授權的許可允許數據、開放授權數據和公有領域數據進行訓練的日語/英語雙語 CLIP(對比語言-圖像預訓練)模型。
- Downloads: 149
- nitky/AtheneX-V2-72B-instruct
- AtheneX-V2-72B-instruct是使用mergekit创建的预训练语言模型的合并。
- Downloads: 130
- ssanjay22/japanese_partner
- 開發者:SANJAY S 授權:MIT 微調自模型:Meta's LLAMA 3.2(3B)
- Downloads: 124
- EQUES/MedLLama3-JP-v2
- Llama3基礎的日語醫療LLM MedLlama3-JP這個模型是由Llama3的持續學習所建立,包含了4種LLM的合併模型。
- Downloads: 122
- turing-motors/heron-chat-blip-ja-stablelm-base-7b-v0
- Heron BLIP 日本 StableLM
- Downloads: 121
- AELLM/Llama-3.2-Chibi-3B
- 序言 小型参数LLM非常适合应对日语的复杂性,包括汉字、平假名和片假名等多种字符系统,以及微妙的社交暗示。
- Downloads: 94
- dahara1/Qwen2.5-7B-Instruct-gguf-japanese-imatrix-128K
- 請查看 dahara1/Qwen2.5-3B-Instruct-gguf-japanese-imatrix-128K。
- Downloads: 94
- DeL-TaiseiOzaki/llm-jp-3-172b-instruct3-4bit
- 在這個存儲庫中,由大學共同利用機構法人信息・系統研究機構國立情報學研究所(以下簡稱「NII」)提供的「llm-jp-3-172b-instruct3」模型(以下簡稱「本模型」)已經轉換為4位元的量子化模型(以下簡
- Downloads: 84
- Respair/Hibiki_ASR_Phonemizer_v0.2
- Hibiki ASR Phonemizer 這個模型是一個音素級語音識別網絡,原本是根據不同的日本數據集在 openai/whisper-large-v3 的精煉版本上進行調整的。
- Downloads: 75
- AIJapanese/Moriyasu_Qwen2_JP_7B
- Moriyasu_Qwen2_JP_7B 模型描述 Moriyasu_Qwen2_JP_7B 是由 Moriyasu 訓練的大型語言模型。
- Downloads: 75
- DataPilot/Llama3.1-ArrowSE-v0.4
- 概要:此模型是基於llama3.1-8B-instruct模型,通過Mergekit和微調技術來提升日本語性能而創建的。
- Downloads: 74
- Respair/Japanese_Phoneme_to_Grapheme_LLM
- 模型識別碼的模型卡片
- Downloads: 65
- QuantFactory/Llama-3.1-Swallow-8B-v0.1-GGUF
- QuantFactory/Llama-3.1-Swallow-8B-v0.1-GGUF 這是 quantized 版本的 tokyotech-llm/Llama-3.1-Swallow-8B-v0.1,使用了 llama.cpp 建立。原始模型卡片 Llama 3.1 Swallow - 由 Llama 創建 Llama 3.1 Swallow 是一系列大型語言模型(8B, 70B),是通過對 Meta Llama 3.1
- Downloads: 59
- Kendamarron/llm-jp-3-3.7b-o1-v0.1
- 這是透過在CoT數據集上微調模型llm-jp/llm-jp-3-3.7b-instruct而生成的推理模型。
- Downloads: 54
- 2121-8/japanese-parler-tts-large-bate
- 日本語 Parler-TTS 大型版(β 版)這個存儲庫是基於parer-tts/parer-tts-large-v1,重新訓練以實現日語文本朗讀功能的模型的公開。
- Downloads: 48
- Local-Novel-LLM-project/Vecteus-v1-abliterated
- Vecteus 是一個高性能的日本語大規模語言模型。
- Downloads: 41
- upskyy/gte-base-korean
- upskyy/gte-korean-base 這個模型是來自 Alibaba-NLP/gte-multilingual-base 的 korsts 和 kornli 微調模型。
- Downloads: 27
- llm-jp/llm-jp-3-172b-beta1
- 「LLM-jp-3 172B beta1」使用條款 本使用條款(以下稱為「本條款」)規定了由大學共同利用機構法人資訊・系統研究機構國立資訊學研究所(以下稱為「提供者」)開發的成果,以公開方式提供的大型語言模型
- Downloads: 24
- espnet/kan-bayashi_tsukuyomi_tts_finetune_full_band_jsut_vits_raw_phn_jaconv_pyopenjtalk_prosody_latest
- ESPnet2 TTS 預先訓練模型 kan-bayashi/tsukuyomi_tts_finetune_full_band_jsut_vits_raw_phn_jaconv_pyopenjtalk_prosody_latest ♻
- Downloads: 24
- kz/mt5base-finetuned-ECC-japanese-small
- Google 的 mt5-base 在日語上進行了微調,以解決錯誤檢測和糾正任務。
- Downloads: 24
- Language-Media-Lab/byt5-small-ain-jpn-mt
- Byt5-small-ain-jpn-mt 是一個機器翻譯模型,它是使用 Google 的 ByT5-small 預訓練,並在從網絡抓取的雙語數據集上進行微調的。
- Downloads: 23
- jri-advtechlab/layoutlm-wikipedia-ja
- LayoutLM-wikipedia-ja 模型
- Downloads: 18
- tirthadagr8/Japanese_to_english_gpt2CasualLM_GemmaTokenizer
- 為學習目的從頭開始使用 GPT-Small 製作。
- Downloads: 18
- kaiinui/kotoba-whisper-v2.0-mlx
- kotoba-whisper-v2.0-mlx 這個存儲庫包含了 kotoba-whisper-v2.0 的轉換後 mlx-whisper 模型,適用於在 Apple Silicon 上運行。
- Downloads: 14
- Aratako/ELYZA-japanese-Llama-2-MoE-2x7B-v0.1
- ELYZA-日本語-Llama-2-MoE-2x7B-v0.1 這裏是英文描述:概要 Llama-2基礎的預訓練日本語模型ELYZA-japanese-Llama-2-7b以及其instruction調整模型ELYZA-japanese-Llama-2-7b-instruct,在使用mergekit進行MoE後合併而成的模型。
- Downloads: 14
- Gustav114514/work
- 對日語語音識別進行了微調的XLSR-53大型模型,使用了Common Voice 6.1、CSS10和JSUT的訓練和驗證分割,微調了facebook/wav2vec2-large-xlsr-53。在使用此模型時,請確保您的語音輸入採樣頻率為16kHz。
- Downloads: 14
- hotchpotch/bert-base-japanese-v3-retromae
- 東北大学NLP研究室/日本語BERTベースV3モデルは、RetroMAEを使用して事前学習されました。
- Downloads: 13
- GralchemOz/Qwen1.5-14B-vntl-jp2zh-4.5bpw-h6-exl2
- 這個模型是 qwen-14b-vntl 和 Qwen1.5-14B-Chat 的合併版本,旨在將日本語上下文翻譯成中文。
- Downloads: 13
- hotchpotch/ruri-pt-base-retromae
- cl-nagoya/ruri-pt-base 是在 RetroMAE 中預先訓練的模型。
- Downloads: 13
- Hemlok/ArcanaMix
- ◆ArcanaMix是一款針對二次元插圖進行調整,以生成可愛插圖的模型。
- Downloads: 13
- izumi-lab/electra-small-japanese-generator
- ELECTRA 是一個小型的日本發電機,這是一個在日語文本上預訓練的 ELECTRA 模型。
- Downloads: 12
- izumi-lab/electra-small-japanese-fin-generator
- 這是一個以日語文本預訓練的ELECTRA小型金融生成器模型。
- Downloads: 12
- KoichiYasuoka/deberta-large-japanese-aozora-ud-head
- 從 DeBERTa-Large 日文 Aozora 語料庫訓練的 UD 標頭模型
- Downloads: 12
- slplab/wav2vec2-xls-r-300m-japanese-hiragana
- Wav2Vec2-XLS-R-300M-Japanese-HiraganaFine-tuned facebook/wav2vec2-xls-r-300m 在日文平假名字符上使用 Common Voice 和 JSUT 进行微调。句子输出不包含词边界。
- Downloads: 12
- reazon-research/reazonspeech-espnet-v1
- reazonspeech-espnet-v1 是為日語自動語音識別(ASR)訓練的 ESPnet 模型。
- Downloads: 12
- owner203/japanese-llama-2-7b
- Japanese-LLaMA-2-7B是基本模型,完整模型。
- Downloads: 12
- A-Funakoshi/bert-base-japanese-v3-wrime-v2
- 基礎模型:cl-tohoku/bert-base-japanese-whole-word-masking 資料集:llm-book/wrime-sentiment 優化器:adamw 使用Optuna進行超參數搜尋,學習率排程類型為(lr_scheduler_type):
- Downloads: 12
- Formzu/roberta-base-japanese-jsnli
- 這個模型是在 JSNLI 數據集上對 nlp-waseda/roberta-base-japanese 進行微調的版本。
- Downloads: 12
- Tomohiro/RealMedNLP_CR_JA
- 這是用於日本醫學文件命名實體識別的模型。
- Downloads: 12
- KoichiYasuoka/deberta-large-japanese-wikipedia-ud-head
- deberta-large-japanese-wikipedia-ud 描述模型
- Downloads: 12
- KoichiYasuoka/deberta-base-japanese-wikipedia-ud-head
- deberta-base-japanese-wikipedia-ud-headModel 請做翻譯。
- Downloads: 12
- megagonlabs/transformers-ud-japanese-electra-base-discriminator
- 變形金剛-UD-日本-艾萊卓-銀座(SudachiTra-WordPiece,mC4 日語)-
- Downloads: 12
- kz/mt5base-finetuned-patentsum-japanese-small
- Google 的 mt5-base 被微調為日語版本,以便在有限的藥物領域內總結專利申請摘要。
- Downloads: 12
- swdq/Visual-novel-whisper
- KoichiYasuoka/roberta-large-japanese-juman-ud-goeswith
- 模型描述這是一個在日文維基百科和CC-100文本上進行預訓練的 RoBERTa 模型,用於詞性標記和依存分析(使用 goeswith 處理次單詞),衍生自 roberta-large-japanese。
- Downloads: 11
- LoneStriker/stabilityai_japanese-stablelm-instruct-gamma-7b-6.0bpw-h6-exl2
- 日文穩定LM指令 Gamma 7B 模型
- Downloads: 11
- oshizo/japanese-e5-mistral-1.9b
- 經過將oshizo/japanese-e5-mistral-7b_slerp縮減為8層後,在800,000句日語句子上訓練的模型。
- Downloads: 11
- LoneStriker/SambaLingo-Japanese-Chat-5.0bpw-h6-exl2
- SambaLingo-Japanese-Chat是一種以日文和英文訓練的人類對齊聊天模型。
- Downloads: 11
- retrieva-jp/t5-base-short
- 模型卡片的模型ID這是一個T5 v1.1模型,預先在日文語料庫上進行了訓練。
- Downloads: 11
- KoichiYasuoka/deberta-large-japanese-juman-ud-goeswith
- 模型描述:這是一個DeBERTa(V2)模型,它在日文維基百科、CC-100和OSCAR文本上進行了預訓練,用於詞性標記和依存解析(使用goeswith來處理子詞),派生自deberta-v2-large-japanese。
- Downloads: 11
- paulhindemith/fasttext-jp-embedding
- fasttext-jp-embedding 這個模型是實驗性的。
- Downloads: 11
- KoichiYasuoka/deberta-large-japanese-wikipedia-luw-upos
- deberta-large-japanese-wikipedia-luw-upos 模型描述
- Downloads: 11
- mradermacher/Mixtral-8x7B-v0.1-japanese-GGUF
- 關於 https://huggingface.co/abeja/Mixtral-8x7B-v0.1-japanese 的靜態量化,權重/矩陣量化似乎目前(由我)無法使用。
- Downloads: 275
- alfredplpl/gemma-2b-it-ja-poc-2
- 首先,這是一款可用於商業用途的能夠說日語的人工智慧。
- Downloads: 35
- hiroshi-matsuda-rit/electra-base-japanese-discriminator-v2
- 電基底日本歧視器(蘇達奇特拉詞塊,mC4 日本)-
- Downloads: 25
- grapevine-AI/sarashina2-70b-gguf
- 這是什麼?
- Downloads: 21
- KoichiYasuoka/bert-base-japanese-unidic-luw-upos
- bert-base-japanese-unidic-luw-uposModel 轉換為繁體中文為「日文 Bert 基礎單位辭典 Luw Upos 模型」。
- Downloads: 17
- KoichiYasuoka/bert-large-japanese-unidic-luw-upos
- 這是一個在日文維基百科文本上進行了預訓練的BERT模型,用於詞性標記和依存分析,源自於bert-large-japanese。
- Downloads: 15
- KoichiYasuoka/deberta-base-japanese-luw-upos
- 德伯塔-基本-日文-luw-upos模型
- Downloads: 15
- KoichiYasuoka/deberta-small-japanese-luw-upos
- 德貝爾塔-小型-日語-LUW-UPOS模型
- Downloads: 15
- KoichiYasuoka/deberta-base-japanese-juman-ud-goeswith
- 模型描述這是一個 DeBERTa(V2) 模型,它在日文維基百科、CC-100 和 OSACR 文本上進行了預訓練,用於詞性標記和依存分析(使用 goeswith 進行次詞的處理), 從 deberta-v2-base-japanese 模型衍生而來。
- Downloads: 15
- megagonlabs/transformers-ud-japanese-electra-base-ginza-520
- 這是一個 ELECTRA 模型,預先訓練於從 mC4 中擷取的約 2 億句子,並由 spaCy v3 在 UD_Japanese_BCCWJ r2.8 上進行微調。其基礎預訓練模型為 megagonlabs/transformers-ud-japanese-electra-base-discriminator。
- Downloads: 15
- KoichiYasuoka/deberta-large-japanese-unidic
- 這是一個使用 BertJapaneseTokenizer 在青空文庫文本上預先訓練的 DeBERTa(V2) 模型。
- Downloads: 15
- KoichiYasuoka/deberta-base-japanese-unidic
- deberta-base-japanese-unidic 模型描述
- Downloads: 15
- KoichiYasuoka/roberta-large-japanese-aozora
- 這是一個使用日本青空文庫文本進行預訓練的 RoBERTa 模型,使用了日文-LUW-Tokenizer。
- Downloads: 14
- KoichiYasuoka/roberta-large-japanese-aozora-char
- roberta-large-japanese-aozora-char模型描述這是一個在青空文庫文本上使用字元分詞器預訓練的 RoBERTa 模型。
- Downloads: 14
- KoichiYasuoka/deberta-base-japanese-upos
- 這是一個在青空文庫文本上預訓練的 DeBERTa(V2) 模型,用於詞性標記和依存分析,衍生自 deberta-base-japanese-aozora。
- Downloads: 14
- KoichiYasuoka/deberta-large-japanese-unidic-ud-head
- 這段文字沒有明確的意義,看起來像是一串不同單詞的組合而已。可以請您提供更多上下文或背景資訊嗎?例如這段文字可能是出現在一個句子或是專業領域中。這樣我才能更準確地為您翻譯。
- Downloads: 14
- KoichiYasuoka/deberta-base-japanese-unidic-ud-head
- 從deberta-base-japanese-unidic-ud-headModel
- Downloads: 14
- Formzu/bart-large-japanese
- 這個模型是從京都大學釋出的原始日文 BART 預訓練模型轉換而來的。
- Downloads: 14
- KoichiYasuoka/roberta-base-japanese-juman-ud-goeswith
- roberta-base-japanese-juman-ud-goeswith 模型描述
- Downloads: 14
- natsusakiyomi/Riga_Collection
- Riga_collection 是什麼?
- Downloads: 13
- Mizuiro-sakura/deberta-v2-base-japanese-finetuned-ner
- 這個模型是利用deberta-v2-base-japanese進行微調以用於專有名詞識別(NER)的。
- Downloads: 13
- naclbit/trin_tokenizer_v3
- 為 AI 小說家的 SuperTrin 和 Damsel 20B 模型訓練的日語專用 SentencePiece 分詞器。
- Downloads: 13
- KoichiYasuoka/deberta-large-japanese-unidic-luw-upos
- deberta-large-japanese-unidic-luw-uposModel迪贝尔大型日语统一词典鲁瓦通用部分标记模型
- Downloads: 13
- KoichiYasuoka/deberta-base-japanese-unidic-luw-upos
- 德伯塔-基本-日语-UNidic-LUW-词性模型
- Downloads: 13
- astremo/friendly_JA
- 友善-JA-模型(T5微調模型)是使用友善-JA语料库训练的机器翻译模型,旨在通过使用拉丁文/英文衍生片假名词汇表,使日语更易学、更易接触给西方人。示范输入输出:最適化を応用した機械翻訳モデルは高精度だ→オプティマイ
- Downloads: 13
- KoichiYasuoka/deberta-small-japanese-upos
- 這是一個在青空文庫文本上使用預訓練的 DeBERTa(V2) 模型,用於詞性標記和依存解析,派生自 deberta-small-japanese-aozora。
- Downloads: 12
- kit-nlp/bert-base-japanese-basic-char-v2-cyberbullying
- 這是針對日語進行微調,用於自動檢測網絡欺凌的BERT基礎模型。
- Downloads: 12
- ku-accms/bert-base-japanese-ssuw
- 這是一個針對超短單元詞(SSUW)的預訓練日文 BERT 基礎模型。
- Downloads: 12
- agiera/manga-ocr-base
- Manga OCR 是用於日文文本的光學字符識別技術,主要用於日本漫畫。
- Downloads: 12
- KoichiYasuoka/deberta-large-japanese-wikipedia
- 這是一個在日本維基百科和青空文庫文本上預先訓練的 DeBERTa(V2) 模型。
- Downloads: 11
- Formzu/bart-base-japanese
- 這個模型是由京都大學釋出的原始日文 BART 預訓練模型轉換而來。
- Downloads: 11
- ku-accms/roberta-base-japanese-ssuw
- 這是一個用於超短單位詞(SSUW)的日文 RoBERTa 基礎預訓練模型的描述。
- Downloads: 11
- Mizuiro-sakura/deberta-v2-tiny-japanese-finetuned-QA
- 這個模型是以deberta-v2-tiny-japanese作為基礎,經過微調以用於QA任務的。
- Downloads: 11
- liwii/line-distilbert-base-japanese-fork
- LINE DistilBERT 日文(由 liwii 更新)這是 DistilBERT 模型的分支版本,預先在 131 GB 的日本網頁文本上進行了預訓練。
- Downloads: 11
- hyperonym/barba
- BarbaBarba 是一個多語言自然語言推理模型,用於文本蘊含和零樣本文本分類,在 TensorFlow Serving 中提供端對端服務。
- Downloads: 11
- traintogpb/llama-3-mmt-xml-it-sft-adapter
- 預訓練的 LM beomi/Llama-3-Open-Ko-8B(麻省理工學院許可證)。
- Downloads: 11
- tokyotech-llm/Llama-3.1-Swallow-8B-v0.1
- Llama 3.1 Swallow - 使用Llama构建 Llama 3.1 Swallow 是一系列大语言模型(8B, 70B),通过在Meta Llama 3.1模型上进行持续的预训练构建而成。
- Downloads: 16,575
- llm-jp/llm-jp-3-172b-beta2-instruct2
- 「LLM-jp-3 172B beta2」 使用條款 這些使用條款(以下稱為「本條款」)是由大學共同利用機構法人信息・系統研究機構國立信息學研究所(以下稱為「提供者」)按其開發成果公開的大規模語言模型「LLM-jp-3 172
- Downloads: 4,219
- tokyotech-llm/Llama-3.1-Swallow-8B-v0.2
- 羚羊 3.1 Swallow - 由羚羊打造 羚羊 3.1 Swallow 是一系列大型語言模型(8B、70B),通過持續在 Meta 羚羊 3.1 模型上進行預訓練而建立的。
- Downloads: 1,290
- tokyotech-llm/Llama-3.1-Swallow-70B-v0.1
- 3.1 系列-裝配了3.1 系列是一系列大型語言模型( 8B, 70B),通過對元裝置上的持續預訓練建造。
- Downloads: 563
- llm-jp/llm-jp-3-172b-beta1-instruct
- 「LLM-jp-3 172B beta1」使用條款 本使用條款(以下簡稱「本規約」)旨在規範大學共同利用機構法人情報・システム研究機構國立情報學研究所(以下簡稱「提供者」)開發並公開的大規模語言模型「LLM-jp
- Downloads: 36
- Helsinki-NLP/opus-mt-ja-ms
- jpn-msa來源組:日語目標組:馬來語(概括語言)OPUS自述:jpn-msa模型:轉換對齊源語言:日語日語漢 日語平假名 日語假名目標語言:印尼 文籟姆拉丁字母
- Downloads: 22
- lorenzoncina/whisper-small-ja
- Whisper Small JA - Lorenzo Concina這個模型是根據Common Voice 11.0數據集對[SVJ日文數據集](https://huggingface.co/SVJ Japanese dataset)進行微調的版本。
- Downloads: 18
- Mizuiro-sakura/luke-japanese-large-finetuned-ner
- 這個模型是在luke-japanese-large模型基礎上進行微調,以用於命名實體識別(NER)的版本。
- Downloads: 17
- nakamura196/roberta-small-hi-char-mlm
- 羅伯特小型 HiCHAR MLM 模型描述
- Downloads: 17
- espnet/kan-bayashi_jsut_tacotron2
- 例子 ESPnet2 TTS 模型 kan-bayashi/jsut_tacotron2 ♻
- Downloads: 15
- if001/tiny_mixtral_ja_instruction
- 已使用tiny_mixtral_ja數據集進行訓練,請參考以下連結:https://huggingface.co/if001/tiny_mixtral_ja
- Downloads: 15
- vumichien/wav2vec2-large-pitch-recognition
- 將 Wav2Vec2 Accent JapaneseFine-tuned facebook/wav2vec2-large-xlsr-53 進行日本口音微調。
- Downloads: 15
- hiroshi-matsuda-rit/bert-base-japanese-basic-char-v2
- BERT基礎日文(使用字級別標記和整詞遮罩,jawiki-20200831)該預訓練模型與cl-tohoku/bert-base-japanese-char-v2幾乎相同,但不需要fugashi或unidic_lite。
- Downloads: 14
- ybelkada/japanese-dummy-tokenizer
- 包含在 snow_simplified_japanese_corpus 資料集上訓練過的虛擬日文分詞器的日文虛擬分詞器存儲庫。
- Downloads: 14
- izumi-lab/electra-small-paper-japanese-fin-discriminator
- ELECTRA 是一款小型的日本金融辨識器。這是一個在日語文本上預先訓練的 ELECTRA 模型。
- Downloads: 14
- Mizuiro-sakura/luke-large-commonsenseqa-japanese
- 這個模型是基於luke-japanese-large進行微調,以用於JCommonsenseQA(常識問答)的版本。
- Downloads: 13
- megagonlabs/electra-base-japanese-discriminator
- 日本传统Electra基础鉴别器(SudachiTra-WordPiece,mC4日本)-
- Downloads: 12
- Lycoris53/Vits-TTS-Japanese-Only-Amitaro
- VITS TTS 唯一日文 Amitaro VITS TTS 模型,使用自 amitaro 免費聲音數據調整而成,取自此處 あみたろの声素材工房。微調代碼來自 Plachtaa - VITS 快速微調。查看樣本用法 Lycoris53/VITS-TTS-Japanese-Only-Amitaro。模型詳情:訓練使用 76 個已
- Downloads: 12
- k-ush/xlm-roberta-base-ance-en-jp-warmup
- 在mMARCO日文數據集上使用ANCE warmup腳本訓練的XLM-RoBERTa-base模型。
- Downloads: 12
- y-oikawa/Information-triage-for-disaster-tweets
- ELECTRA資訊篩選日本基礎
- Downloads: 12
- nakamura196/roberta-small-hi-char
- 羅伯塔-小型-嗨-字元 模型描述
- Downloads: 12
- izumi-lab/electra-small-paper-japanese-generator
- ELECTRA是一款小型的日本發電機,這是一個在日語文本上預先訓練過的ELECTRA模型。
- Downloads: 12
- spacy/ja_core_news_md
- 詳細資訊:https://spacy.io/models/ja#ja_core_news_md 日文管道優化適用於 CPU。
- Downloads: 11
- Yokohide031/rust_cl-tohoku_bert-large-japanese
- 這是什麼型號?
- Downloads: 11
- hiroshi-matsuda-rit/bert-base-sudachitra-v11
- bert-base-sudachitra-v11 的翻譯是 BERT 基礎的 SudaChitra-v11。
- Downloads: 11
- A-Funakoshi/bert-finetuned-multilingual-sentiments-adamw
- 基本模型:cl-tohoku/bert-base-japanese-whole-word-masking 數據集:tyqiangz/multilingual-sentiments 批量大小:16固定 優化器:adamw 透過Optuna進行超參數搜索 學習率調度類型(lr_scheduler_type):
- Downloads: 11
- hakuhodo-tech/japanese-clip-vit-h-14-bert-deeper
- 日文 CLIP ViT-H/14(更深入)目錄 概述 用法 模型細節 評估 限制與偏見 引用
- Downloads: 11
- hakuhodo-tech/japanese-clip-vit-h-14-bert-base
- 日文 CLIP ViT-H/14 (基社)目錄概述使用模型詳細評估限制和偏見引用請參閲聯繫信息總覽開發者: HAKUHODO Technologies Inc.模型類型: 對比語言圖像預訓練模型語言: 日語許可證: CC BY-NC-SA 4.0此處展示了一個日文 CL
- Downloads: 11
- TylorShine/distilhubert-ft-japanese-50k
- 精煉Hubert-ft-japanese-50k。进一步微調(更準確地說,繼續訓練)。
- Downloads: 11
- ThePioneer/NaturalGirlyVoice
- 不要太誇張像是動畫角色的聲音,也不要像是使用了Vocaloid之類的軟體所合成出來的聲音,希望聽起來像是班上其中一個女生的自然且親切的聲音。
- Downloads: 11
- cinmodel/electra-small-japanese-generator
- 日本 ELECTRA-small 我們提供一個日本 ELECTRA-Small 模型,如 ELECTRA:使用文本編碼器作為鑑別器而不是生成器 的 文章中所描述的。
- Downloads: 11
- Aratako/ELYZA-japanese-Llama-2-fast-MoE-2x7B-v0.1-GGUF
- ELYZA-japanese-Llama-2-fast-MoE-2x7B-v0.1-GGUF概要Aratako/ELYZA-japanese-Llama-2-fast-MoE-2x7B-v0.1的量子化完成GGUF版本。
- Downloads: 20
- sbtom/karakuri-midroze-mg
- karakuri-midrose-mg 模型的詳細資訊在這裡。
- Downloads: 16
- sbtom/karakuri-midrose-CV
- 自動機械人偶-CV模型的詳細資訊在這裡。
- Downloads: 14
- qqpann/wav2vec2-large-xlsr-japanese-0325-1200
- Wav2Vec2-Large-XLSR-53-{語言} #待辦事項: 請用您的{語言}替換語言,例如
- Downloads: 14
- furnqse/elyza-fork2
- ELYZA-日本-草泥馬-2-7b型號描述ELYZA-日本-草泥馬-2-7b
- Downloads: 11
- 2121-8/japanese-parler-tts-mini-bate
- 日本語 Parler-TTS Mini(β 版)這個存儲庫是基於 parler-tts/parler-tts-mini-v1,重新訓練以實現日本語文本朗讀的模型。
- Downloads: 1,039
- Lasorco/spekulatius
- 這是一個混合了speculatius的產品,偶爾會產生出「雖然與原本目的不同,但感覺不應該被捨棄的模型」,這個系列提供給您分享。
- Downloads: 14
- kit-nlp/yacis-electra-small-japanese-irony
- YACIS ELECTRA 專為自動識別諷刺所設計的日語小模型,這是一個 ELECTRA 基礎模型,經過調校以適應日語。
- Downloads: 13
- izumi-lab/electra-small-paper-japanese-discriminator
- ELECTRA小型日本區分器,這是使用日語文本預先訓練的ELECTRA模型。
- Downloads: 11
- koshin2001/Japanese-to-emotions
- 我使用 WRIME Ver2 作為教師數據,對日文進行 Fine-tuned LINE DistillBERT 模型,以情感為基礎。
- Downloads: 1,430
- Aratako/ELYZA-japanese-Llama-2-MoE-2x13B-v0.1-GGUF
- ELYZA - 日本 - 娾-2-MoE-2x13B-v0.1-GGUF 概要Aratako/ELYZA - 日本 - 娾-2-MoE-2x13B-v0.1 的量子化済み GGUF 版本。
- Downloads: 25
- espnet/kan-bayashi_jsut_conformer_fastspeech2
- 示例ESPnet2 TTS模型 kan-bayashi/jsut_conformer_fastspeech2♻
- Downloads: 17
- Aratako/Swallow-MoE-4x7B-lisa
- 將Swallow-MoE-4x7B-lisa的概要描述為基於tokyotech-llm/Swallow-7b-hf,通過使用gate_mode=random對以下4個模型進行MoE操作,然後應用名為LISA的技術進行指令調節的模型。
- Downloads: 15
- lmg-anon/vntl-gemma2-2b-lora
- 總結:這是使用 VNTL 3.1 資料集創建的 Gemma 2 Baku lora。
- Downloads: 14
- Elizezen/Phos-7B
- Phos 7B「求懈怜 我已疲倦」生成例[粗體字以後為AI生成]「求懈怜」"它"哀求。
- Downloads: 11
- alfredplpl/llm-jp-3-1.8b-instruct-gguf
- llm-jp-3-1.8b-instruct-gguf的模型卡。這些是對LLM-jp先生的llm-jp-3-1.8b-instruct進行量子化的過程。
- Downloads: 1,466
- cardiffnlp/tweet-topic-large-multilingual
- 這個模型基於 cardiffnlp/twitter-xlm-roberta-large-2022 語言模型,並進行了微調,用於英語、西班牙語、日語和希臘語的多標籤主題分類。
- Downloads: 745
- tohoku-nlp/stable-diffusion-xl-jp-base-1.0
- (英文部分见下文。)
- Downloads: 36
- llm-jp/llm-jp-13b-instruct-lora-jaster-v1.0
- llm-jp-13b-instruct-lora-jaster-v1.0翻譯:llm-jp-13b-指導-lora-jaster-v1.0
- Downloads: 11
- izumi-lab/electra-small-paper-japanese-fin-generator
- ELECTRA是一個小型的日文金融生成器。這是一個在日語文本上預先訓練的ELECTRA模型。
- Downloads: 11
- tealgreen0503/japanese-gpt2-medium-ppo-araisan
- 用強化學習來賦予角色特色的閒聊回應生成
- Downloads: 11
- MCZK/EZO-gemma-2-2b-jpn-it-GGUF
- AXCXEPT 公司的 AXCXEPT/EZO-gemma-2-2b-jpn-it 已轉換為 GGUF 格式。
- Downloads: 13,791
- elyza/Llama-3-ELYZA-JP-8B-AWQ
- Llama-3-ELYZA-JP-8B-AWQ模型描述Llama-3-ELYZA-JP-8B是由ELYZA公司訓練的大型語言模型。基於meta-llama/Meta-Llama-3-8B-Instruct,通過額外的預訓練和指導調整,已針對日本使用進行了增強。
- Downloads: 1,668
- team-hatakeyama-phase2/Tanuki-8B-dpo-v1.0-GGUF
- 狸-8B-dpo-v1.0-GGUF 是由GENIAC松尾研LLM開發項目開發的LLM(Long Lead Material)產品,這是weblab-GENIAC/Tanuki-8B-dpo-v1.0的GGUF量子化模型。
- Downloads: 1,653
- mmnga/Llama-3-Swallow-70B-Instruct-v0.1-gguf
- Llama-3-Swallow-70B-Instruct-v0.1-gguftokyotech-這是由llm公開的與Llama-3-Swallow-70B-Instruct-v0.1相容的gguf格式轉換版本。
- Downloads: 875
- mmnga/Llama-3-Swallow-8B-Instruct-v0.1-gguf
- Llama-3-Swallow-8B-Instruct-v0.1-gguftokyotech-llm released by Llama-3-Swallow-8B-Instruct-v0.1 has been translated into gguf format by llm.
- Downloads: 848
- dahara1/gemma-2-2b-jpn-it-gguf-japanese-imatrix
- 關於這個模型。
- Downloads: 816
- team-hatakeyama-phase2/Tanuki-8B-dpo-v1.0-AWQ
- 狸-8B-dpo-v1.0-AWQ 是由GENIAC Matsuo研究小組(LLM開發項目)開發的LLM,是weblab-GENIAC/Tanuki-8B-dpo-v1.0的AWQ 4位元量化模型。
- Downloads: 813
- grapevine-AI/gemma-2-2b-jpn-it-gguf
- 這是什麼?
- Downloads: 793
- ascktgcc/Mistral-nemo-ja-rp-v0.1
- Mistral-nemo是為了EPR應用而進行微調的模型。由於使用的數據集約一半是日語,因此它應該比magnum等模型更擅長處理日語?
- Downloads: 727
- QuantFactory/plamo-13b-GGUF
- QuantFactory/plamo-13b-GGUF量化工廠/plamo-13b-GGUF
- Downloads: 697
- mmnga/HODACHI-Borea-Phi-3.5-mini-Instruct-Jp-gguf
- HODACHI-Borea-Phi-3.5-mini-Instruct-Jp-gguf是由HODACHI公開的Borea-Phi-3.5-mini-Instruct-Jp的gguf格式轉換版本。
- Downloads: 498
- team-hatakeyama-phase2/Tanuki-8B-dpo-v1.0-GPTQ-4bit
- 狸-8B-dpo-v1.0-GPTQ-4bit 概述 GENIAC 松尾研 LLM開發項目中開發的LLM,即weblab-GENIAC/Tanuki-8B-dpo-v1.0 的GPTQ 4位元量子化模型。
- Downloads: 350
- tokyotech-llm/Llama-3-Swallow-70B-v0.1
- Llama3 Swallow我們的 Swallow 模型經過來自 Llama 3 家族的持續預訓練,主要是加入了日語數據。
- Downloads: 317
- mmnga/AXCXEPT-EZO-Qwen2.5-72B-Instruct-gguf
- AXCXEPT-EZO-Qwen2.5-72B-Instruct 的 gguf 格式轉換文件是由 AXCXEPT 公開的 EZO-Qwen2.5-72B-Instruct 版本。
- Downloads: 188
- lmg-anon/vntl-llama3-8b-202409-gguf
- 這個存儲庫包含了使用合併的VNTL LLaMA3 8B 202409 qlora模型進行的一些GGUF量化,該模型是使用定製版本的VNTL數據集和VNTL-Chat數據集結合而成的。
- Downloads: 161
- lmg-anon/vntl-gemma2-27b-gguf
- 這個存儲庫包含了對VNTL Gemma 2 27B模型的一些GGUF量化版本。
- Downloads: 134
- team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-AWQ
- 狸-8x8B-dpo-v1.0-AWQ 是在 GENIAC 松尾研 LLM 開發項目中開發的 LLM,是 weblab-GENIAC/Tanuki-8x8B-dpo-v1.0 的 AWQ 4 位元量子化模型。
- Downloads: 82
- nitky/Oumuamua-7b-instruct-v2
- 歐姆阿穆阿-7b-指揮-v2🚨 如果您想避免看起來像直譯的輸出,請提示此模型扮演一位日本人。
- Downloads: 62
- llm-jp/llm-jp-3-172b-alpha1
- llm-jp-3-172b-alpha1 -> llm-jp-3-172b-alpha1
- Downloads: 37
- tohoku-nlp/stable-diffusion-xl-jp-refiner-1.0
- (日文部分)請問您需要翻譯成繁體中文的文本是什麼?
- Downloads: 21
- Aratako/Ninja-v1-RP-expressive-breadcrumbs
- Ninja-v1-RP-expressive-breadcrumbsGGUF版在這裡/點擊這裡查看GGUF版本概要這是使用mergekit創建的預先訓練語言模型的合併。
- Downloads: 16
- loiccabannes/MambaSan-130m-instruct
- MambaSan-130m-instruct 🐍 MambaSan-instruct是基於狀態空間模型架構(Mamba)而不是變壓器的首個聊天式日語語言模型。
- Downloads: 15
- MuneK/bert-large-japanese-v2-finetuned-jed
- 這個模型是由 JEmpatheticDialogues 從 cl-tohoku/bert-large-japanese-v2 進行 finetune 而來。
- Downloads: 15
- werty1248/Mistral-Nemo-NT-Ko-12B-sft
- Mistral-Nemo-NT-Ko-12B-sft 描述 Mistral-Nemo-NT-Ko-12B-sft 是 mistralai/Mistral-Nemo-Base-2407 的說明調整版本,在英語、韓語、中文和日語之間進行精細調整。
- Downloads: 13
- Lycoris53/style-bert-vits2-sakura-miko
- Style-Bert-VITS2 只有日本語 桜巫女 這是基於「櫻巫女」的語音資料集訓練的 VITS-TTS 模型。
- Downloads: 12
- masato12/bert-base-japanese-v3-marc_ja
- https://huggingface.co/llm-book/bert-base-japanese-v3-marc_ja 內含 ONNX 權重,以便與 Transformers PHPbert-base-japanese-v3-marc_ja 相容。這是第5章中介紹的(情感分析)模型,屬於「大規模言語模型入門」系列。
- Downloads: 12
- Lasorco/Kokuwa
- 在尋找透過Kokuwalametta進行改進後可進行合併的模型時,我找到了一個名為KiwiMix的有趣模型。
- Downloads: 12
- hs-hf/m2v-LaBSE-distilled
- m2v-LaBSE-distilled 模型卡
- Downloads: 12
- LoneStriker/SambaLingo-Japanese-Chat-3.0bpw-h6-exl2
- SambaLingo-Japanese-Chat 是一個以人為導向訓練並支援日語和英語的聊天模型。
- Downloads: 11
- RikkaBotan/style_bert_vits2_jp_extra_asmr_original
- X(Twitter)帳號 歡迎來玩。
- Downloads: 23
- lightblue/kurage-ja
- 水母是Lightblue推出的一款多功能RAG模型。
- Downloads: 15
- aashish1904/gemma-2-2b-jpn-it-Q2_K-GGUF
- aashish1904/gemma-2-2b-jpn-it-Q2_K-GGUF請將此段文字翻譯為繁體中文。
- Downloads: 15
- spacy/ja_core_news_trf
- 詳細資訊: https://spacy.io/models/ja#ja_core_news_trf 日語變壓器流程 (Transformer(name='cl-tohoku/bert-base-japanese-char-v2', piece_encoder='char', stride=160, type='bert', width=768, window=216, vocab_size=6144)).
- Downloads: 13
- izumi-lab/electra-small-japanese-fin-discriminator
- 儀電小型日本金融辨識器這是一個在日本語文本上預訓練的ELECTRA模型。
- Downloads: 13
- kit-nlp/electra-small-japanese-discriminator-irony
- 這是一個針對日語進行微調以自動偵測反諷的ELECTRA基礎模型。
- Downloads: 11
- DavidAU/alpaca-guanaco-japanese-gpt-1b-Q8_0-GGUF
- 這個模型是從inu-ai/alpaca-guanaco-japanese-gpt-1b轉換為GGUF格式,使用llama.cpp通過ggml.ai的GGUF-my-repo空間進行轉換。
- Downloads: 19
- Dallyana/EspnetASR
- reazonspeech-espnet-v1 是為日語自動語音識別(ASR)訓練的 ESPnet 模型。
- Downloads: 15
- hotchpotch/japanese-splade-base-v1-dummy-fast-tokenizer-for-tei
- japanese-splade-base-v1是用於在huggingface/text-embeddings-inference中運行的分叉版本。
- Downloads: 13
- espnet/kan-bayashi_jsut_tts_train_conformer_fastspeech2_transformer_teacher_r-truncated-f43d8f
- ESPnet2 TTS 預訓練模型 kan-bayashi/jsut_tts_train_conformer_fastspeech2_transformer_teacher_raw_phn_jaconv_pyopenjtalk_prosody_train.loss.ave ♻
- Downloads: 13
- Aratako/ELYZA-japanese-Llama-2-MoE-2x7B-v0.1-GGUF
- ELYZA-japanese-Llama-2-MoE-2x7B-v0.1-GGUF概要Aratako/ELYZA-japanese-Llama-2-MoE-2x7B-v0.1的量化版本GGUF。
- Downloads: 13
- aixsatoshi/Meta-Llama-3.1-8B-Instruct-plus-Swallow
- Swallow-8B是經過額外的日語持續預先學習的結果,使得它的日語非常流暢,是Llama-3的衍生模型。
- Downloads: 8,064
- Local-Novel-LLM-project/Assistance-GGUF
- 協助 的 GGUF 版本我們的模型 for GGUF Vecteus-GGUF Ninja-v1-GGUF Ninja-v1-NSFW-GGUF Ninja-v1-128k-GGUF Ninja-v1-NSFW-128k-GGUF
- Downloads: 19
- aken12/splade-japanese-efficient
- 輸出 筑波 2.0035860538482666つくば 1.6586617231369019研究 1.6227693557739258大學 1.3798155784606934實驗 0.5522942543029785學生 0.42351895570755005分析 0.37844282388687134國立 0.3685397505760193校園 0.36495038866996765茨城 0.305641502141952
- Downloads: 15
- aixsatoshi/Meta-Llama-3.1-8B-Instruct-plus-Swallow-b
- Swallow-8B通過額外的日語持續預學習,使其成為一個非常流利的Llama-3衍生模型。
- Downloads: 13
- alfredplpl/llm-jp-3-3.7b-instruct-gguf
- llm-jp-3-3.7b-instruct-gguf 的模型卡片是 llm-jp 先生的 llm-jp-3-3.7b-instruct 的量子化版本。
- Downloads: 537
- QuantFactory/gemma-2-2b-jpn-it-GGUF
- 量化工廠/寶石-2-2b-日-意-GGUF
- Downloads: 485
- MCZK/gemma-2-2b-jpn-it-GGUF
- 這是將 Google 先生的 google/gemma-2-2b-jpn-it 轉換為 GGUF 格式的結果。
- Downloads: 333
- MCZK/gemma-2-baku-2b-it-GGUF
- 林娜小姐的rinna/gemma-2-baku-2b-it已轉換為GGUF格式的內容。
- Downloads: 296
- NikolayKozloff/gemma-2-2b-jpn-it-Q8_0-GGUF
- 尼古拉·科茨洛夫/ 珍玛-2-2b-日文-意大利文-Q8_0-GGUF
- Downloads: 46
- litagin/vits-japros-pretrained
- 用於VITS-JaPros-WebUI的預先訓練的日文TTS模型。
- Downloads: 14
- teasan/endlessMix
- ■ 關於 endlessMix 系列 概況 這款型號是基於 Defacta 所開發的階層合併模型。
- Downloads: 13
- ThePioneer/MoeDiffusion
- 模型說明YaguruMagiku 0.6:AbyssOrangeMix2_sfw 0.4據傳說原始根源包含NAI洩漏,因此NAI洩漏防護者不推薦使用能展現理想黑髮馬尾臉型的YaguruMagiku,將充滿控制性且與之相近的AbyssOrangeMix2混合在一起。
- Downloads: 11
- mmnga/Llama-3.1-70B-Japanese-Instruct-2407-gguf
- Llama-3.1-70B-Japanese-Instruct-2407-ggufcyberagent所發佈的Llama-3.1-70B-Japanese-Instruct-2407的gguf格式轉換版。
- Downloads: 3,004
- mmnga/Llama-3.1-8B-EZO-1.1-it-gguf
- 3.1-8B-EZO-1.1-it-ggufHODACHI先生公開的Llama-3.1-8B-EZO-1.1-it的gguf格式轉換版。
- Downloads: 2,805
- AXCXEPT/Llama-3-EZO-8b-Common-it
- 【草泥馬-3-EZO模型卡】
- Downloads: 2,602
- mmnga/Llama-3.1-8B-Instruct-gguf
- 大獅駝-3.1-8B-Instruct-ggufmeta-llama所提供的Meta-Llama-3.1-8B-Instruct的gguf格式轉換版本。
- Downloads: 2,483
- mmnga/aya-23-8B-gguf
- aya-23-8B-ggufCohereForAI所公開的aya-23-8B gguf格式轉換版本。
- Downloads: 1,932
- mmnga/Mistral-7B-Instruct-v0.3-gguf
- Mistral-7B-Instruct-v0.3-ggufmistralai公開了Mistral-7B-Instruct-v0.3版本的gguf格式轉換版。
- Downloads: 1,413
- mmnga/Reflection-Llama-3.1-70B-gguf
- 反射-駱馬-3.1-70B-gguf mattshumer先生所公開的Reflection-Llama-3.1-70B的gguf格式轉換版。
- Downloads: 1,323
- mmnga/mathstral-7B-v0.1-gguf
- mathstral-7B-v0.1-ggufmistralai 先生所公開的 mathstral-7B-v0.1 的 gguf 格式轉換版。
- Downloads: 1,067
- MCZK/EZO-Common-9B-gemma-2-it-GGUF
- HODACHI先生的 EZO-Common-9B-gemma-2-it 被轉換為GGUF格式。
- Downloads: 1,027
- mmnga/Llama-3-ELYZA-JP-8B-gguf
- Llama-3-ELYZA-JP-8B-ggufelyza所公開的Llama-3-ELYZA-JP-8B的gguf格式轉換版本。
- Downloads: 1,008
- mmnga/aya-23-35B-gguf
- aya-23-35B-ggufCohereForAI 公開的格式轉換版本。
- Downloads: 993
- owner203/japanese-llama-3-8b
- Japanese-LLaMA-3-8B是基礎模型、完整模型。
- Downloads: 919
- mmnga/ArrowPro-7B-KillerWhale-gguf
- ArrowPro-7B-KillerWhale-ggufDataPilot 公布了 ArrowPro-7B-KillerWhale 的 gguf 格式轉換版本。
- Downloads: 815
- mmnga/gemma-2-2b-it-gguf
- gemma-2-2b-it-ggufgoogle 發布的 gemma-2-2b-it 的 gguf 格式轉換版本。
- Downloads: 788
- Aratako/calm3-22b-RP-GGUF
- calm3-22b-RP-GGUF 概要這是Aratako/calm3-22b-RP的量子化完成版GGUF。
- Downloads: 731
- QuantFactory/TinySlime-1.1B-Chat-v1.0-GGUF
- QuantFactory/TinySlime-1.1B-Chat-v1.0-GGUF 這是使用 llama.cpp 創建的 Quantized 版本 2121-8/TinySlime-1.1B-Chat-v1.0 的 TinySlime 原始模型卡片 TinySlime-1.1B-Chat-v1.0。TinySlime 是專為日文而設計的小尺度語言模型。
- Downloads: 726
- mmnga/Llama3-ArrowSE-8B-v0.3-gguf
- Llama3-ArrowSE-8B-v0.3-ggufDataPilot所公開的Llama3-ArrowSE-8B-v0.3的gguf格式轉換版。
- Downloads: 700
- sbintuitions/sarashina1-13b
- Sarashina1-13B 這個資料庫提供了由 SB Intuitions 訓練的日語語言模型。
- Downloads: 691
- fishaudio/fish-speech-1.2-sft
- Fish Speech V1.2 是一個領先的文本轉語音(TTS)模型,經過在 300k 小時的英語、中文和日語音頻數據上訓練。
- Downloads: 690
- sbintuitions/sarashina1-65b
- 猴子遮那1-65B 這個資料庫提供了由SB Intuitions 訓練的日語語言模型。
- Downloads: 685
- mmnga/Llama-3.1-70B-EZO-1.1-it-gguf
- Llama-3.1-70B-EZO-1.1-it-ggufHODACHI先生發布的Llama-3.1-70B-EZO-1.1-it的gguf格式轉換版本。
- Downloads: 667
- sbintuitions/sarashina1-7b
- 猴山1-7B這個存儲庫提供了由SB Intuitions訓練的日語語言模型。
- Downloads: 661
- AXCXEPT/Llama-3.1-70B-EZO-1.1-it
- [Llama-3.1-70B-EZO-1.1-it] 模型卡片模型信息這個模型是基於 Meta AI 的 Llama 3.1,通過微調來提高在日本語任務中的性能。
- Downloads: 568
- mmnga/rinna-llama-3-youko-70b-instruct-gguf
- rinna-llama-3-youko-70b-instruct-ggufrinna所公開的llama-3-youko-70b-instruct的gguf格式轉換版。
- Downloads: 546
- mmnga/pfnet-Llama3-Preferred-MedSwallow-70B-gguf
- pfnet-Llama3-Preferred-MedSwallow-70B-ggufpfnet在公開的Llama3-Preferred-MedSwallow-70B的gguf格式轉換版本。
- Downloads: 503
- MCZK/EZO-Humanities-9B-gemma-2-it-GGUF
- HODACHI様的 EZO-Humanities-9B-gemma-2-it 已轉換為 GGUF 格式的文件。
- Downloads: 474
- mmnga/HODACHI-EZO-Common-9B-gemma-2-it-gguf
- HODACHI-EZO-Common-9B-gemma-2-it-gguf這是HODACHI所公開的EZO-Common-9B-gemma-2-it的gguf格式轉換版本。
- Downloads: 451
- MCZK/Llama3-ArrowSE-8B-v0.3-GGUF
- DataPilot 先生的 Llama3-ArrowSE-8B-v0.3 已轉換為 GGUF 格式的版本。
- Downloads: 449
- team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GGUF
- 狸-8x8B-dpo-v1.0-GGUF 是由GENIAC松尾研LLM開發項目中開發的LLM,是weblab-GENIAC/Tanuki-8x8B-dpo-v1.0的GGUF量子化模型。
- Downloads: 432
- mmnga/datagemma-rag-27b-it-gguf
- datagemma-rag-27b-it-gguf 是谷歌公開的 datagemma-rag-27b-it 的 gguf 格式轉換版。
- Downloads: 424
- QuantFactory/shisa-7b-v1-GGUF
- QuantFactory/shisa-7b-v1-GGUf這是使用llama.cpp創建的augmxnt/shisa-base-7b-v1的量子化版本。模型描述:shisa-base-7b-v1採用Mistral 7B,並添加了主要為日語預訓練的額外8B令牌。
- Downloads: 417
- QuantFactory/Llama3.1-ArrowSE-v0.4-GGUF
- QuantFactory/Llama3.1-ArrowSE-v0.4-GGUF這是使用llama.cpp創建的DataPilot/Llama3.1-ArrowSE-v0.4的量化版本原始模型卡摘要。這個模型是基於llama3.1-8B-instruct,在Mergekit和Fine-tuning的幫助下,旨在提高其日本性能而創建的。
- Downloads: 354
- QuantFactory/Umievo-itr012-Gleipnir-7B-GGUF
- 這是使用llama.cpp創建的umiyuki/Umievo-itr012-Gleipnir-7B的量子化版本。模型描述這個模型是利用進化算法演化合併了四個強大的日語模型而成的。
- Downloads: 353
- QuantFactory/ELYZA-japanese-Llama-2-13b-fast-instruct-GGUF
- ELYZA-japanese-Llama-2-13b-fast-instruct-GGUF 是 quantized(量化)版本的 ELYZA/ELYZA-japanese-Llama-2-13b-fast-instruct,使用 llama.cpp 創建。模型描述ELYZA-japanese-Llama-2-13b 是在 Llama 2 的基礎上進行了額外的預先訓練,用於擴展日語能力的模型。
- Downloads: 348
- mmnga/Mistral-Nemo-Instruct-2407-gguf
- Mistral-Nemo-Instruct-2407-ggufmistralai所提供的Mistral-Nemo-Instruct-2407的gguf格式轉換版。
- Downloads: 318
- mmnga/HODACHI-Borea-Phi-3.5-mini-Instruct-Common-gguf
- HODACHI-Borea-Phi-3.5-mini-Instruct-Common-gguf 是由HODACHI公開的 Borea-Phi-3.5-mini-Instruct-Common 的 gguf 格式轉換版本。
- Downloads: 312
- MCZK/Llama-3-Swallow-8B-Instruct-v0.1-GGUF
- 東京工業大學-llm先生的 Llama-3-Swallow-8B-Instruct-v0.1 被轉換為GGUF格式的版本。
- Downloads: 299
- mmnga/Mistral-Large-Instruct-2407-gguf
- 米斯卓-大-说明-2407-ggufmistralai 公開的米斯卓-大-说明-2407 的 gguf 格式轉換版。
- Downloads: 249
- team-hatakeyama-phase2/Tanuki-8B-dpo-v1.0-4k-GGUF
- Tanuki-8B-dpo-v1.0-GGUF 是 GENIAC 松尾研 LLM 開發專案中開發的 LLM,為 weblab-GENIAC/Tanuki-8B-dpo-v1.0-4k 的 GGUF 量子化模型。
- Downloads: 215
- team-hatakeyama-phase2/Tanuki-8B-dpo-v1.0-GPTQ-8bit
- Tanuki-8B-dpo-v1.0-GPTQ-8bit 概要 GENIAC 松尾研 LLM開発プロジェクトで開発されたLLMであるweblab-GENIAC/Tanuki-8B-dpo-v1.0的GPTQ 8bit量子化模型。
- Downloads: 202
- mmnga/HODACHI-EZO-Humanities-9B-gemma-2-it-gguf
- HODACHI-EZO-Humanities-9B-gemma-2-it-gguf是HODACHI先生公開的EZO-Humanities-9B-gemma-2-it的gguf格式轉換版。
- Downloads: 133
- MCZK/EZO-Common-T2-2B-gemma-2-it-GGUF
- HODACHI先生的 EZO-Common-T2-2B-gemma-2-it 已轉換為GGUF格式的文件。
- Downloads: 117
- QuantFactory/shisa-gamma-7b-v1-GGUF
- QuantFactory/shisa-gamma-7b-v1-GGUF 這是使用 llama.cpp 創建的 augmxnt/shisa-gamma-7b-v1 的量化版本。模型描述更多資訊請參見我們的主 Shisa 7B 模型。我們將我們的微調數據集應用於 Japanese Stable LM Base Gamma 7B 的一個版本,效果相當不錯,僅分享,可能會引起
- Downloads: 117
- MCZK/Llama-3.1-8B-EZO-1.1-it-GGUF
- HODACHI先生的Llama-3.1-8B-EZO-1.1-it已轉換為GGUF格式。
- Downloads: 112
- QuantFactory/llama-3-youko-8b-GGUF
- 這是使用 llama.cpp 創建的 rinna/llama-3-youko-8b 的量化版本模型描述概述我們對來自日語和英語數據集混合的 22B tokens 進行 meta-llama/Meta-Llama-3-8B 的持續預訓練。
- Downloads: 108
- cl-nagoya/ruri-reranker-small
- 碧-Reranker:日本通用的Reranker用途直接使用(句子轉換器)
- Downloads: 94
- Miwa-Keita/zenz-v1-checkpoints
- zenz-v1 检查点zenz-v1 是一种基于 GPT-2 结构专门用于假名-汉字转换任务的语言模型。
- Downloads: 85
- Aratako/Ninja-v1-RP-expressive-v2-GGUF
- Ninja-v1-RP-expressive-GGUF 概要 Aratako/Ninja-v1-RP-expressive-v2 的量子化版 GGUF。
- Downloads: 81
- mm/japanese-e5-mistral-7b_slerp_gguf
- 日文 E5 Mixtral 7B Slerp GGUFGGUF 轉換 oshizo/japanese-e5-mistral-7b_slerp 可用格式:Q2_K.gguf、Q3_K.gguf、Q4_K.gguf、Q5_K.gguf、Q6_K.gguf、Q8_0.gguf、F16.gguf 使用需求:llama-cpp-python from functools import partial import numpy as np from llama_cpp import Llama max_length = 512 model = Llama.from_pretrained(repo_id="mm/japanese-e5
- Downloads: 80
- keitokei1994/Llama-3-ELYZA-sqlcoder-2x8B-GGUF
- 模特兒說明(下面是英文解釋。)
- Downloads: 74
- MCZK/Vecteus-V2-7B-GGUF
- Local-Novel-LLM-project 様的 Vecteus-V2-7B 已轉換為 GGUF 格式。
- Downloads: 68
- RPAmodels/PN-analysis
- 情感分析於此模型是由jarvisx17製作,並從頭開始在chABSA數據集上進行訓練。
- Downloads: 66
- MCZK/Ninja-V2-7B-GGUF
- Local-Novel-LLM-project先生的Ninja-V2-7B已轉換為GGUF格式的版本。
- Downloads: 63
- hotchpotch/luke-japanese-base-lite-xlm-roberta
- 將luke-japanese-base-lite-xlm-roberta studio-ousia/luke-japanese-base-lite模型的權重名稱替換為XLMRoberta格式,使其可以作為XLMRoberta模型使用。
- Downloads: 62
- team-hatakeyama-phase2/Tanuki-8B-dpo-v1.0-4k-GPTQ-4bit
- 狸-8B-dpo-v1.0-4k-GPTQ-4bit 是GENIAC 松尾研 LLM 開發計畫中開發的低傳遞時延濾波器,這是weblab-GENIAC/Tanuki-8B-dpo-v1.0-4k的GPTQ 4bit量子化模型。
- Downloads: 57
- cl-nagoya/ruri-reranker-stage1-large
- 瑠璃-重新排名器:日本將軍重新排名器使用指南(句子轉換器)
- Downloads: 48
- cl-nagoya/ruri-pt-large
- 這是基於 tohoku-nlp/bert-large-japanese-v2 調整過的句子轉換器模型 SentenceTransformer。
- Downloads: 46
- MCZK/Ninja-V3-GGUF
- Local-Novel-LLM-project様的Ninja-V3已轉換為GGUF格式。
- Downloads: 45
- ascktgcc/Mistral-Nemo-Japanese-Instruct-2408-Q4_K_S-GGUF
- ascktgcc/Mistral-Nemo-Japanese-Instruct-2408-Q4_K_S-GGUF愛斯凱泰州/米斯特拉-涅莫-日文-指引-2408-Q4_K_S-GGUF
- Downloads: 44
- team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GPTQ-8bit
- 狸-8x8B-dpo-v1.0-GPTQ-8bit 摘要 GENIAC 松尾研 LLM 開發專案中開發的LLM,是 weblab-GENIAC/Tanuki-8x8B-dpo-v1.0 的 GPTQ 8bit 量子化模型。
- Downloads: 44
- DataPilot/Llama3-ArrowSE-8B-v0.3
- 依據elyza/Llama-3-ELYZA-JP-8B的基礎,我們利用聊天向量進行改良,專為AItuber進行特化。
- Downloads: 42
- keitokei1994/swallow-3-8B-sqlcoder-2x8B-GGUF
- 模特兒的說明 (下面附有英文解釋。)
- Downloads: 41
- 2121-8/TinySlime-1.1B-Chat-v1.0
- TinySlime-1.1B-Chat-v1.0TinySlime 是一個專注於日本語的小型語言模型。
- Downloads: 40
- KoichiYasuoka/ltgbert-base-japanese-ud-goeswith
- ltgbert-base-japanese-ud-goeswith模型描述
- Downloads: 38
- KoichiYasuoka/llm-jp-1.3b-upos
- llm-jp-1.3b-upos 模型描述
- Downloads: 34
- QuantFactory/Oumuamua-7b-instruct-GGUF
- 奧穆阿穆亞-7b-指示-GGUF這是使用llama.cpp創建的nitky/Oumuamua-7b-指示的量子化版本模型描述這是使用mergekit創建的預訓練語言模型的合併輸出範例[INST] <<SYS>>你是會說日語的優秀助理。
- Downloads: 33
- MCZK/Llama-3-EZO-8b-Common-it-GGUF
- HODACHI先生的 Llama-3-EZO-8b-Common-it 已轉換為 GGUF格式。
- Downloads: 33
- alfredplpl/sarashina2-7b-it
- Sarashina2-7B Instructsarashina2-7B經過全面微調以使其能夠進行對話。
- Downloads: 30
- keitokei1994/Llama-3-Umievo-Shizuko-sqlcoder-2x8B
- 模型說明(英文解釋如下)
- Downloads: 29
- masato12/bert-base-japanese-v3-jsts-with-tokenizer
- bert-base-japanese-v3-jsts是在《大规模语言模型入门》第5章中介绍的(意义相似度计算)模型。
- Downloads: 27
- nptdat/bert-japanese-12M
- bert-japanese-12M 模型概覽bert-japanese-12M 模型是一個基於 Transformer 架構的模型,具備 BERT 架構,旨在用於處理日文文本。
- Downloads: 26
- Local-Novel-LLM-project/Vecteus-V2-7B
- Vecteus-V2-7B 這個模型是使用向量合併等技術製作的高性能基本模型。
- Downloads: 25
- umiyuki/Llama-3-Umievo-itr014-Shizuko-8b
- 這個模型是基於日語Llama-3基礎的四個模型,通過進化算法進行進化性合併而成的。
- Downloads: 25
- p1atdev/zenz-v1-onnx
- Miwa-Keita/zenz-v1-checkpoints 現已轉換為 ONNX 格式,以達到最佳效果。
- Downloads: 24
- fukugawa/transformer-lm-japanese-1.0b
- transformer-lm-japanese-1.0b 這是在日語數據集上訓練的基於JAX/Flax的Transformer語言模型。
- Downloads: 24
- team-hatakeyama-phase2/Tanuki-8B-dpo-v1.0-4k-AWQ
- 狸-8B-dpo-v1.0-4k-AWQ 概要 GENIAC 松尾研 LLM 開發項目中所開發的LLM,即 weblab-GENIAC/Tanuki-8B-dpo-v1.0-4k 的 AWQ 4 位元量化模型。
- Downloads: 24
- cl-nagoya/ruri-reranker-stage1-base
- Ruri-Reranker:日本將軍重新排序使用直接使用(句子轉換器)
- Downloads: 23
- cl-nagoya/ruri-pt-small
- 基於 line-corporation/line-distilbert-base-japanese 的 SentenceTransformer 這是一個從 line-corporation/line-distilbert-base-japanese 進行微調的句子轉換模型。
- Downloads: 21
- AXCXEPT/EZO-InternVL2-26B
- EZO模型卡
- Downloads: 20
- sehiro/EvoLLM-JP-A-v1-7B-IQ4_XS-GGUF
- sehiro/EvoLLM-JP-A-v1-7B-IQ4_XS-GGUFThe translation into traditional Chinese is:sehiro/EvoLLM-JP-A-v1-7B-IQ4_XS-GGUF
- Downloads: 20
- ithattieu/XML-RoBERTa-NER-Japanese
- XML-RoBERTa-NER-Japanese這個模型是在Stockmark Inc.基於Wikipedia日文NER數據集上對xlm-roberta-base進行微調的版本。
- Downloads: 19
- AXCXEPT/Llama-3-EZO-VLM-1
- Llama-3-EZO-VLM-1 是基於SakanaAI/Llama-3-EvoVLM-JP-v2進行增強,通過額外的預訓練和指導調整,以適應日本使用。
- Downloads: 19
- KoichiYasuoka/RakutenAI-7B-upos
- 樂天AI-7B-upos 模型描述
- Downloads: 18
- cl-nagoya/ruri-reranker-stage1-small
- 瑠璃重排: 日語一般重排使用直接使用(句子轉換器)
- Downloads: 18
- KoichiYasuoka/rinna-gpt-neox-small-japanese-ud-causal
- 林拿GPT-Neox-Small-Japanese-UD-Causal模型描述
- Downloads: 17
- KoichiYasuoka/goldfish-gpt2-japanese-5mb-ud-causal
- 金魚-gpt2-japanese-5mb-ud-causal 模型描述
- Downloads: 17
- Noginowa/AnimaMixColorXL
- Animagine系列的模型混合了VAE内置融合模型。
- Downloads: 17
- llm-jp/llm-jp-3-172b-alpha2
- llm-jp-3-172b-alpha2這是一個特定的代碼,沒有特定的上下文。
- Downloads: 16
- lmg-anon/vntl-llama3-8b-202409-qlora
- 摘要這是使用VNTL數據集的自定義版本結合VNTL-Chat數據集創建的LLaMA 3 Youko qlora。
- Downloads: 15
- frost-beta/Llama3-33.5M-Japanese
- 在Macbook Pro上使用M3 Max訓練10小時得到的一個非常小的33.5M Llama3模型。
- Downloads: 15
- nitky/Oumuamua-7b-base
- 歐姆邁亞-7b-base這是使用mergekit創建的預訓練語言模型的合併。
- Downloads: 14
- KoichiYasuoka/rinna-gpt2-medium-japanese-ud-causal
- rinna-gpt2-medium-japanese-ud-causal 模型描述
- Downloads: 14
- AbeShinzo0708/Japanese-Starling-ChatV-7B-exl2
- 這個模型是基於"chatntq-ja-7b-v1.0"的7B參數,用於日本語的聊天模型。
- Downloads: 13
- 2121-8/TinySlime-1.1B-v1.0
- TinySlime-1.1B-v1.0TinySlime 是一個專注於日語的小型語言模型。
- Downloads: 13
- mlx-community/Llama-3.1-70B-Japanese-Instruct-2407-8bit
- mlx-community/Llama-3.1-70B-Japanese-Instruct-2407-8bit 的模型從 cyberagent/Llama-3.1-70B-Japanese-Instruct-2407 轉換為 MLX 格式,並使用 mlx-lm 版本 0.16.1。使用 mlxpip 安裝 mlx-lmfrom mlx_lm 導入 load, generatemodel, tokenizer = load("mlx-community/Llama-3.1-70B-Japanese-Instruct-2407-8bit")。
- Downloads: 13
- KoichiYasuoka/rinna-gpt2-xsmall-japanese-ud-causal
- rinna-gpt2-xsmall-japanese-ud-causal 模型描述
- Downloads: 13
- sehiro/EvoLLM-JP-A-v1-7B-Q4_K_M-GGUF
- sehiro/EvoLLM-JP-A-v1-7B-Q4_K_M-GGUF西日本地區風力發電場第一發電單元4號機組製造串裝通信區間。
- Downloads: 13
- KoichiYasuoka/abeja-gpt2-large-japanese-ud-causal
- abeja-gpt2-large-japanese-ud-causal 模型描述
- Downloads: 13
- hotchpotch/ruri-base-dummy-fast-tokenizer-for-tei
- 該模型為 text-embeddings-inference(TEI),是使用mecab / unidic等日本語Tokenizer模型,通過使用虛構的tokenizer.json文件來強制執行的方法示例。
- Downloads: 12
- espnet/kan-bayashi_jsut_transformer_accent
- 範例 ESPnet2 TTS 模型 kan-bayashi/jsut_transformer_accent ♻
- Downloads: 11
- espnet/kan-bayashi_jsut_tacotron2_accent
- 例 ESPnet2 TTS 模型 kan-bayashi/jsut_tacotron2_accent♻
- Downloads: 11
- espnet/kan-bayashi_jsut_fastspeech
- 示例 ESPnet2 TTS 模型 kan-bayashi/jsut_fastspeech ♻
- Downloads: 11
- Kendamarron/fineweb-edu-classifier-ja
- 為了重新現HuggingFaceFW/fineweb-edu-classifier,這是通過在日文數據上訓練pkshatech/GLuCoSE-base-ja模型。
- Downloads: 11
- KoichiYasuoka/karasu-1.1B-upos
- 小冢康治/烏鴉-1.1B-upos 模型描述
- Downloads: 11
- KoichiYasuoka/rinna-gpt2-small-japanese-ud-causal
- rinna-gpt2-small-japanese-ud-causal 模型描述
- Downloads: 11
- KoichiYasuoka/goldfish-gpt2-japanese-10mb-ud-causal
- 金魚-gpt2-japanese-10mb-ud-causal 模型描述
- Downloads: 11
- team-hatakeyama-phase2/Tanuki-8B-dpo-v1.0-4k-GPTQ-8bit
- 狸-8B-dpo-v1.0-4k-GPTQ-8bit 摘要 GENIAC 松尾研 LLM 開發專案中開發的LLM,即 weblab-GENIAC/Tanuki-8B-dpo-v1.0-4k 的 GPTQ 8bit 量子化模型。
- Downloads: 11
- Miwa-Keita/zenz-v2-gguf
- zenz-v2是一個基於GPT-2架構、專門用於做假名漢字轉換任務的語言模型。
- Downloads: 11
- QuantFactory/Llama3-ArrowSE-8B-v0.3-GGUF
- QuantFactory/Llama3-ArrowSE-8B-v0.3-GGUF這是使用llama.cpp創建的DataPilot/Llama3-ArrowSE-8B-v0.3的量子化版本。原始模型卡片概要elyza/Llama-3-ELYZA-JP-8B,經過chat vector的改進,專為AItuber而設。
- Downloads: 58
- KoichiYasuoka/gpt2-medium-japanese-unidic-upos
- gpt2-medium-japanese-unidic-upos 模型描述
- Downloads: 15
- hiroshi-matsuda-rit/ja_gsd_bert_wwm_unidic_lite
- 日本語のTransformerモデル(bert-base)パイプライン。
- Downloads: 11
- KoichiYasuoka/gpt2-medium-japanese-unidic-ud-causal
- gpt2-medium-japanese-unidic-ud-causal 模型描述
- Downloads: 11
- KoichiYasuoka/gpt2-small-japanese-juman-upos
- gpt2-small-japanese-juman-upos 模型描述
- Downloads: 11
- Aratako/Ninja-v1-RP-expressive-breadcrumbs-GGUF
- 忍者-v1-RP-表現-GGUF概要Aratako / 忍者-v1-RP-表現-面包屑 的量子化完成的GGUF版本。
- Downloads: 121
- mmnga/matsuolab-weblab-10b-instruction-sft-gguf
- 松尾實驗室的matsuolab-weblab-10b-instruction-sft-gguf版本已經公開,這是weblab-10b-instruction-sft的gguf格式轉換版。
- Downloads: 59
- natsusakiyomi/AnzuMix
- AnzuMixSeriesVAE沒有內臟!絕對不能被說有內臟!!!!
- Downloads: 21
- mlx-community/Llama-3.1-70B-Japanese-Instruct-2407-4bit
- mlx-community/Llama-3.1-70B-Japanese-Instruct-2407-4bit 模型是從 cyberagent/Llama-3.1-70B-Japanese-Instruct-2407 轉換為 MLX 格式,使用了 mlx-lm 版本 0.16.1。可透過 mlxpip install mlx-lm 進行安裝,並使用以下程式碼進行載入模型、生成文本或進行分詞:from mlx_lm import load
- Downloads: 20
- KoichiYasuoka/gpt2-small-japanese-ud-causal
- gpt2-small-japanese-ud-causal模型描述
- Downloads: 19
- KoichiYasuoka/gpt2-large-japanese-ud-causal
- gpt2-large-japanese-ud-causal 模型描述
- Downloads: 16
- espnet/kan-bayashi_jsut_transformer_accent_with_pause
- 示例 ESPnet2 TTS 模型 kan-bayashi/jsut_transformer_accent_with_pause♻
- Downloads: 13
- SpassMedAI/MLMedLlama3
- 使用QLoRA進行微調的 Model ID MMedBench 和 KoreanMedMCQA 指示 Fine-Tuned 多語言 Llama3 8B 4比特量化模型的模型卡。
- Downloads: 13
- KoichiYasuoka/gpt2-medium-japanese-ud-causal
- gpt2-medium-japanese-ud-causal 模型描述
- Downloads: 13
- kotoba-tech/kotoba-whisper-v1.0
- Kotoba-Whisper 是由Asahi Ushio和Kotoba Technologies合作开发的针对日文ASR的Whisper模型精选集合。
- Downloads: 2,472
- mmnga/RakutenAI-7B-gguf
- 樂天AI-7B-gguf是由樂天公司公開的樂天AI-7B的gguf格式轉換版本。
- Downloads: 85
- Aratako/Ninja-v1-RP-expressive-v2
- Ninja-v1-RP-expressive-v2GGUF版本在這裡/點擊這裡進入GGUF版本概要。這是使用mergekit.Aratako/Ninja-v1-RP-expressive創建的預訓練語言模型的合併版本,與Aratako/Ninja-v1-RP-expressive具有相同的概念,這個模型的許可證不包括CC-BY-NC的元素。
- Downloads: 30
- owner203/japanese-llama-3-8b-instruct-v2-gguf
- 日文-LLaMA-3-8B-指示-v2-GGUF是日文-LLaMA-3-8B-指示-v2的GGUF格式。
- Downloads: 26
- Akimite/Qwen2-7b-Instruct-Boku-v2
- 實驗模型。
- Downloads: 22
- nitky/Oumuamua-7b-instruct
- 這是使用 mergekit 創建的預先訓練語言模型合併的結果。輸出示例 [INST] <<SYS>> あなたは日本語を話す優秀なアシスタントです。
- Downloads: 21
- yashvoladoddi37/kanji-diffusion-v1-4
- 漢字擴散 v1-4 模型卡片 漢字擴散是一種潛在的文本到圖像擴散模型,能夠根據任何英文提示幻化出漢字字符。
- Downloads: 20
- Ryu-m0m/16bit-japanese-finetuned-mistral-7b-v0
- 模型概述:當用日語提問時,將會獲得用日語回答。
- Downloads: 20
- KoichiYasuoka/gpt2-small-japanese-upos
- 該模型是一個用於詞性標記和依存分析的GPT-2模型,衍生自gpt2-small-japanese-char。
- Downloads: 17
- KoichiYasuoka/gpt2-large-japanese-upos
- 這是從 gpt2-large-japanese-char 衍生出來的用於詞性標記和依存分析的 GPT-2 模型。
- Downloads: 13
- LoneWolfgang/bert-for-japanese-twitter-sentiment-mixed-label
- 用於日本 Twitter 情感分析的 BERT
- Downloads: 13
- youhansun/Llama-3-70B-japanese-suzume-vector-v0.1-Q2_K-GGUF
- 這個模型是從 mmnga/Llama-3-70B-japanese-suzume-vector-v0.1 轉換為 GGUF 格式,使用 llama.cpp 通過 ggml.ai 的 GGUF-my-repo 空間進行轉換。
- Downloads: 13
- Aratako/calm3-22b-RP-v0.1
- calm3-22b-RP-v0.1 是根據 cyberagent/calm3-22b-chat 模型為基礎,在 QLoRA 上進行微調,專為角色扮演而設計的模型。
- Downloads: 11
- NikolayKozloff/h2o-Llama-3-8B-Japanese-Instruct-Q8_0-GGUF
- 這個模型是從 haqishen/h2o-Llama-3-8B-Japanese-Instruct 轉換成 GGUF 格式的,使用 llama.cpp 通過 ggml.ai 的 GGUF-my-repo 空間進行轉換。
- Downloads: 11
- natsusakiyomi/SakuraMix
- 將背景和角色質量同時融合在一個集成了VAE的模型中具有背景和角色質量的內建VAE模型📄 授權/許可修正CreativeML OpenRAIL-M 授權/許可在未授予創作者榮譽的情況下使用這個模型銷售他們生成的圖像在賺錢的圖像
- Downloads: 65
- keitokei1994/shisa-v1-qwen2-7b-GGUF
- 石狮-V1-琼-7B-古峰 (下面是英文解释。)
- Downloads: 62
- Vsukiyaki/Yaki-Dofu-Mix
- Yaki-Dofu-Mix概要 / 概述Yaki-Dofu-Mix是一個專注於動漫風格畫風的合併模型。
- Downloads: 32
- hibikaze/tiny_mixtral_ja_with_tokenizer
- 275.86M的mixtral是在日語數據集上進行預訓練的模型。從transformers庫中導入AutoTokenizer和AutoModelForCausalLM,模型可以通過以下方式加載:model = AutoModelForCausalLM.from_pretrained("if001/tiny_mixtral_ja")
- Downloads: 19
- taoki/phi3-mini-4k-qlora-jmultiwoz-dolly-amenokaku-alpaca_jp_python-GGUF
- 這個資料庫包含了一個已經訓練過的模型(QLoRA-SFT)。
- Downloads: 11
- mmnga/karakuri-lm-70b-chat-v0.1-gguf
- 傀儡-lm-70b-chat-v0.1-gguf是由傀儡-ai發布的傀儡-lm-70b-chat-v0.1的gguf格式轉換版本。
- Downloads: 545
- Kendamarron/fineweb-edu-classifier-ja-v2
- 為了重現HuggingFaceFW/fineweb-edu-classifier,這是使用日語數據訓練的tohoku-nlp/bert-base-japanese-v3模型。
- Downloads: 25
- LoneStriker/SambaLingo-Japanese-Chat-4.0bpw-h6-exl2
- SambaLingo-Japanese-Chat 是一個以日語和英語訓練的人類對齊聊天模型。
- Downloads: 13
- dummy-foo/ChatGLM3-Japanese
- ChatGLM3-6B是一個中英雙語大型模型,本專案為ChatGLM3-6B加入日文能力。
- Downloads: 12
- LoneStriker/SambaLingo-Japanese-Chat-8.0bpw-h8-exl2
- SambaLingo-Japanese-Chat 是一个在日语和英语中训练过的人类对齐聊天模型。
- Downloads: 11
- natsusakiyomi/AsagaoMix
- 📄 授權 / License修改 CreativeML OpenRAIL-M 授權 / Modified CreativeML OpenRAIL-M 授權不得不註明創作者使用此模型。 不得出售使用此模型產生的圖像。在賺錢的圖像生成服務上運行此模型。分享使用此模型的合併模型。出售此模型或使用此模型的合併模型。在分享合併時,可以設定不同
- Downloads: 45
- SoMiyagawa/AinuTrans-2.0
- 這是一個將シサム語翻譯成アイヌ語和日文的雙向機器翻譯模型。
- Downloads: 17
- DataPilot/ArrowSmartPlus_3.6B_instruction
- 「LOCAL AI HACKATHON」中,DataPilot小組的第四個成果。
- Downloads: 11
- atsuki-yamaguchi/tigerbot-7b-base-random-ja
- 虎機器人-7B 日文
- Downloads: 11
- KoichiYasuoka/gpt2-medium-japanese-upos
- gpt2-medium-japanese-uposModel 譯為中文是「gpt2-中型-日文-uposModel」。
- Downloads: 11
- keitokei1994/Llama-3-8B-shisa-2x8B
- 模特兒介紹(英文解釋如下)。
- Downloads: 11
- HODACHI/Llama-3.1-8B-EZO-1.1-it
- [Llama-3.1-8B-EZO-1.1-it] Model Card 模型資訊/模型資訊這個模型是由 Meta AI 的
- Downloads: 10,197
- HODACHI/Llama-3.1-70B-EZO-1.1-it
- [Llama-3.1-70B-EZO-1.1-it] Model Card模型信息 / 模型資訊這個模型是基於 Meta AI 的 Llama 3.1 模型,為了提高在日語任務上的性能而進行了微調。
- Downloads: 479
- HODACHI/Llama-3-EZO-VLM-1
- Llama-3-EZO-VLM-1是基於 SakanaAI/Llama-3-EvoVLM-JP-v2 進行了增強,通過額外的預訓練和指導調整,以適應日本使用需求。
- Downloads: 289
- HODACHI/Llama-3-EZO-8b-Common-it
- 【Llama-3-EZO 型模型卡】基於 meta-llama/Meta-Llama-3-8B-Instruct,透過額外的預訓練和調校進行增強,以適應日本使用。
- Downloads: 250
- HODACHI/EZO-InternVL2-26B
- EZO模型卡
- Downloads: 32
- keitokei1994/Llama-3-ELYZA-hermes-2x8B
- 模特兒描述(英文說明如下。)
- Downloads: 13
- Aratako/Oumuamua-7b-instruct-v2-RP
- 奧母阿母-7b-指令-v2-RPnitky/Oumuamua-7b-指令-v2 是一個為角色扮演而在 LoRA 中進行微調的模型。
- Downloads: 13
- shinyice/chatvector-llava-v1.5-plus-houou-v3-7b
- Chatvector-llava-v1.5-plus-Houou-v3-7b 模型卡模型細節。※這是一個由好奇心驅使而誕生的模型。
- Downloads: 11
- mpasila/Llama-3-Nymeria-ELYZA-8B
- Llama-3-Nymeria-ELYZA-8B 是 Llama 3 模型和一般 RP 模型之間的實驗合併,該模型已通過持續的日文數據預訓練,以查看其保留日語能力和 RP 能力的情況。
- Downloads: 14
- HODACHI/glm-4-9b-chat-FT-ja-v0.3
- 概述GLM-4-9B-Chat是一個通過選擇日語Wiki數據並進行額外訓練後,在日語上表現非常出色的模型。
- Downloads: 11
- Akimite/Gemma2-9B-it-Boku-v1
- 實驗模型。
- Downloads: 13
- nitky/RP-7b-instruct
- RP-7b-instruct🚨 這個模型正在調整至 RP,並且知識可能不穩定。這是使用 mergekit 創建的預訓練語言模型合併。輸出示例[INST] <<SYS>>你是一位說日語流利的助手。
- Downloads: 11
- Akimite/Qwen2-7b-Instruct-Boku-v3
- Akimite/Qwen2-7b-Instruct-Boku-v2的輕微修改版。
- Downloads: 11
- espnet/kan-bayashi_jsut_tts_train_fastspeech2_transformer_teacher_raw_phn_jac-truncated-60fc24
- 請示範 ESPnet2 TTS 模型 kan-bayashi/jsut_tts_train_fastspeech2_transformer_teacher_raw_phn_jaconv_pyopenjtalk_accent_with_pause_train.loss.ave。
- Downloads: 11
- classla/xlm-roberta-base-multilingual-text-genre-classifier
- X-GENRE 分類器 - 多語言文本風格分類器,基於 xlm-roberta-base 模型,並在三個風格數據集的組合上進行微調:斯洛維尼亞 GINCO 數據集(Kuzman 等人)。
- Downloads: 2,946
- keitokei1994/Llama-3.1-70B-EZO-1.1-it-GGUF
- 拉马-3.1-70B-EZO-1.1-it-ggufHODACHI先生公开的HODACHI/Llama-3.1-70B-EZO-1.1-it的gguf版本。
- Downloads: 12
This list is sorted by downloads as of January 28, 2025. 430 datasets are listed.
- KakologArchives/KakologArchives
- 尼哥尼哥實況過去日誌封存是一個從尼哥尼哥實況服務開始至今所收集的所有過去日誌評論的數據集。
- Downloads: 245,981
- nlp-waseda/JMMLU
- JMMLU是一套包含日文翻譯問題(Paper, Github)的部分MMLU問題和基於獨特日本文化背景的問題的四選擇問題集合。
- Downloads: 141,737
- nyanko7/danbooru2023
- Danbooru2023:
- Downloads: 8,194
- turing-motors/Cauldron-JA
- 大鍋是一個包含50個視覺語言數據集(僅限訓練集)的龐大收集,這些數據集被用於對視覺語言模型Idefics2進行微調。
- Downloads: 6,226
- joujiboi/japanese-anime-speech-v2
- 日本動漫語音數據集V2日本語是一個用於訓練自動語音識別模型的音訊文本數據集。
- Downloads: 1,893
- elyza/ELYZA-tasks-100
- ELYZA-tasks-100: 日文指令模型評估資料集 資料說明 本資料集是為進行指令微調的模型所準備的評估資料集。
- Downloads: 1,806
- kumapo/JAQKET
- 製作的資料集是模仿先前研究[7],以Wikipedia2的文章標題作為答案的日語開放領域問答任務的資料集。
- Downloads: 1,794
- Helsinki-NLP/tatoeba
- 將一個不在配置中的語言配對載入,您只需將語言代碼指定為配對即可。
- Downloads: 1,312
- joujiboi/japanese-anime-speech
- 日本动漫对话数据集Japanese Anime Speech Dataset 是一个用于训练自动语音识别模型的音频文本数据集。
- Downloads: 1,236
- kunishou/databricks-dolly-15k-ja
- 這個資料集是通過將"databricks-dolly-15k"自動翻譯成日語而創建的。
- Downloads: 1,206
- shunk031/JGLUE
- 請隨時提出問題或發起拉取請求。
- Downloads: 1,201
- Coldog2333/JMedBench
- 這是 JMedBench 的數據集合,這是用於評估日本生物醫學大型語言模型(LLMs)的基準測試。
- Downloads: 1,159
- defunct-datasets/amazon_reviews_multi
- 我們提供一個用於多語言文本分類的亞馬遜產品評論數據集。
- Downloads: 1,024
- globis-university/aozorabunko-clean
- 概觀這個資料集提供了青空文庫的資料,這是一個收集日本公有領域書籍的網站,以機器學習應用為理想的便利且用戶友好的格式。
- Downloads: 1,016
- hpprc/jsick
- 數據集。
- Downloads: 923
- hatakeyama-llm-team/japanese2010
- 這裡的資料是關於2010年的日語網頁語料庫,已經上傳到huggingface。根據2009年著作權法的修正(平成21年通常國會 著作權法修正等|文化廳),僅可用於信息分析研究。使用形態素分析,自動添加句號。轉換代
- Downloads: 908
- izumi-lab/llm-japanese-dataset
- LLM構建用的日語指示(聊天)數據集主要用於使用英語構建的LLM模型等,可以用於通過LoRA等進行調整以進行聊天(指示)回應任務。
- Downloads: 906
- sbintuitions/JMTEB
- JMTEB:
- Downloads: 898
- nyanko7/yandere2023
- Yandere2023:
- Downloads: 848
- lmg-anon/vntl-leaderboard
- VNTL 排行榜
- Downloads: 762
- ayousanz/voicevox-voice-corpus
- 使用VOICEVOX的人工音頻語音數據集,使用的文本語料庫包括ITA語料庫、つくよみちゃん語料庫和ROHAN語料庫。數據集包含的資訊量可在資料夾內找到。
- Downloads: 662
- hotchpotch/wikipedia-passages-jawiki-embeddings
- 將維基百科的日語文本轉換為各種日語嵌入向量或faiss索引。
- Downloads: 662
- mkshing/xlsum_ja
- 這是經過篩選的 XL-Sum 日語子集,接著是 PaLM 2filters15-gram 重疊程式碼:https://gist.github.com/mkshing/d6371cbfdd50d4f352cee247fd4dd86a。範例數量:訓練:4215(之前:7113)、驗證:758(之前:889)、測試:766(之前:889)。
- Downloads: 656
- reazon-research/reazonspeech
- 這個數據集包含了從地面電視信號中收集的多樣的自然日語語音。
- Downloads: 642
- ThePioneer/japanese-photos
- 日本多樣影像資料集概述 這個資料集是一個包含高品質影像的綜合收集,捕捉了日本多樣的方面,包括城市風景、自然景觀、歷史遺址、當代藝術、日常生活和美食體驗。
- Downloads: 608
- shunk031/wrime
- 在這項研究中,我們介紹了一個新的數據集 WRIME,用於情緒強度估計。
- Downloads: 543
- kogi-jwu/jhumaneval
- LLM 的程式碼生成能力標準基準 HumanEval 的日文翻譯版本。
- Downloads: 538
- llm-book/wrime-sentiment
- 我正在使用在 GitHub 存儲庫 ids-cv/wrime 中公開的數據集。
- Downloads: 501
- Elite35P-Server/EliteVoiceProject
- Elite Voice Project 這是一個非官方項目,旨在將Hololive旗下Vtuber櫻美雞的聲音資料化,以便可以應用於語音識別等用途。
- Downloads: 459
- kanhatakeyama/japanese-corpus-categorized
- 翻譯: 在經過清理的日本語語料庫如mc4-ja和其他網絡語料庫後,使用非監督式學習模型將文本大約1萬條分為不同的群集。 可以用於依法允許的信息分析目的。 由於部分文件未進行Parquet轉換,請注意。 文件列表位
- Downloads: 458
- Manual-Dataset-Creation-Project/Malum-230
- Malum-230描述:Malum-230是一個精心製作的日本數據集,包含多輪對話和段落,專門設計用於邏輯推理任務。
- Downloads: 431
- hotchpotch/JQaRA
- JQaRA:帶檢索擴充(RAG)的日本問答資料集 - 隨著高性能的LLM崛起,使用LLM進行問答的應用案例正在增加。
- Downloads: 427
- cc-clean/CC-MAIN-2019-30
- CC-MAIN-2019-30歡迎您!這個資料集是從名為CommonCrawler的資料庫中提取出的僅含日語的資料。
- Downloads: 387
- tanganke/kmnist
- KMNIST数据集将KMNIST数据集中的图像分类为10个类别之一,代表不同的日语字符。
- Downloads: 378
- hpprc/kaken-trans-ja-en
- llm-jp-corpus-v3 中的 kaken 子資料集中的日文文本,經由 Qwen/Qwen2.5-32B-Instruct 進行從日文到英文的翻譯,這是一組資料集。
- Downloads: 378
- tokyotech-llm/lmsys-chat-1m-synth
- LMSYS-Chat-1M-Synth-Llama3.1-Ja-and-En:源自LMSYS-Chat-1M的日語/英語合成對話數據集。 LMSYS-Chat-1M-Synth-Llama3.1-Ja-and-En是日語和英語對話數據集。
- Downloads: 363
- JMMMU/JMMMU
- JMMMU: => 這個文本的意思並不清晰。
- Downloads: 330
- DeL-TaiseiOzaki/magpie-llm-jp-3-13b-20k
- 利用大型語言模型(LLM)自動生成的日文指示及其對應回應的收集數據集簡介。
- Downloads: 294
- SkelterLabsInc/JaQuAD
- JaQuAD 是為了提供一個類似 SQuAD 的日文 QA 資料集而開發的。
- Downloads: 294
- bclavie/mmarco-japanese-hard-negatives
- [施工中]這是包含在MMarco數據集日本部分所有查詢的存儲庫,這是MSMarco數據集的多語言版本。
- Downloads: 293
- llm-book/ner-wikipedia-dataset
- 我們正在使用 Github 倉庫 stockmarkteam/ner-wikipedia-dataset 中公開的數據集。
- Downloads: 285
- alfredplpl/simple-zundamon
- 簡單豆蓉糰資料集是一個包含豆蓉糰相關設定的簡單資料集。
- Downloads: 281
- neulab/odex
- ODEX 是一個基於開放域執行的自然語言轉程式碼生成的資料基準。
- Downloads: 281
- MomoyamaSawa/Voice-KusanagiNene
- 🥕如果兔兔的資料庫對你有幫助的話點個⭐喵~ 如果Tutu的倉庫對你有幫助的話點個⭐喵~ 🍉 任何❓
- Downloads: 273
- matsuxr/JaGovFaqs-22k
- 這個資料集涵蓋了日本政府官方網站上刊登的「常見問題」,是透過手動抽取而成的資料集,供指導用途使用。
- Downloads: 267
- hotchpotch/cc100-ja-documents
- HuggingFace 在 cc100 / cc100-ja 中公開的資料是將按行分割的文本結合成文件單位的結果。
- Downloads: 254
- turing-motors/Japanese-Heron-Bench
- 日本鷺座標資料集描述Japanese-Heron-Bench是用來評估日語視覺語言模型的基準。
- Downloads: 250
- llm-jp/databricks-dolly-15k-ja
- 這個資料庫提供了一個由在日本展開的合作項目LLM-jp所開發的指導調校資料集。
- Downloads: 241
- NilanE/ParallelFiction-Ja_En-100k
- 數據集細節該數據集中的每一條目都是一個句子對齊的日語網絡小說章節和英文粉絲翻譯。
- Downloads: 230
- kajuma/CC-news-2024-July-October-cleaned
- CC-news-2024-July-October-cleaned 這個資料集包含從Common Crawl的news子集中整理出的 2024年7月至10月的日本新聞文章。
- Downloads: 212
- cl-nagoya/auto-wiki-qa
- AutoWikiQA東工大公開的Swallow-MX可以使用Wikipedia中的文本作為輸入,生成「問題(query)」和「答案(answer)」,然後對所生成的問題和答案進行篩選,形成了這個資料集。
- Downloads: 209
- range3/cc100-ja
- 這個數據集包含了從cc100數據集中提取並分片的 parquet 文件,僅包含日語。
- Downloads: 205
- YANS-official/senryu-test
- 從數據集中讀取,輸入以下代碼:from datasets import load_dataset dataset = load_dataset("YANS-official/senryu-test", split="test") 摘要:該數據集包含了從川柳投稿網站『写真川柳』和『川柳投稿まるせん』中爬取的數據,以及由 YANS 委員創建的數據。
- Downloads: 204
- allganize/RAG-Evaluation-Dataset-JA
- Allganize RAG Leaderboard 是指在五個產業領域(金融、信息通信、製造、公共事業、流通與零售)中對日語RAG性能進行評估的資料。
- Downloads: 201
- llm-book/livedoor-news-corpus
- 我們正在使用原始網站相同的東西。
- Downloads: 197
- llm-book/llm-jp-eval
- 我們正在使用與原始網站相同的內容。
- Downloads: 193
- kai271/TinyStories-Japanese
- 包含大約7000篇由 GPT-4o-mini 合成生成的日語童話故事的數據集,這些故事只使用簡單的詞彙。
- Downloads: 189
- izumi-lab/llm-japanese-dataset-vanilla
- 這是從izumi-lab/llm-japanese-dataset構建用的日語聊天數據集中提取出的,不包括日英翻譯數據集等的內容。
- Downloads: 189
- ryo0634/bsd_ja_en
- 這個資料集是通過三個步驟構建的:選擇商務場景,根據選定的場景編寫單語對話情境,然後將情境翻譯成另一種語言。
- Downloads: 182
- kanhatakeyama/SyntheticText
- 根據從以下數據來源隨機抽取的文本、重新生成的phi3文章如下。WikibooksWikipediaCosmopedia判例數據代碼在這裡。有些計算使用東京工業大學的超級計算機TSUBAME4.0進行。
- Downloads: 180
- cc-clean/CC-MAIN-2019-35
- 歡迎來到CC-MAIN-2019-35。這個資料集是從一個名為CommonCrawler的數據集中提取的僅包含日語的部分。
- Downloads: 174
- hotchpotch/sentence_transformer_japanese
- 將日語資料集轉換為較易於在 SentenceTransformers 中進行訓練的欄位名稱和結構。
- Downloads: 173
- taishi-i/awesome-japanese-nlp-classification-dataset
- 數據集概觀這個數據集用於辨識GitHub儲存庫描述是否涉及日語自然語言處理(NLP)。
- Downloads: 172
- Emu-Academic/pjsk-emu-dataset
- MashiroSA/sovits-emu-dataset 是從 Project Sekai 角色鳳澄Emu收集的語音數據集。總共包括2735個文件,全部為WAV格式。
- Downloads: 168
- systemk/washi
- 和紙(一種傳統的日本紙張),此數據集是從 uonlp/CulturaX 提取的 ja(日語)子集中取樣得來的。利用 DSIR(通過重要重採樣進行語言模型數據選擇),選擇最接近 csebuetnlp/xlsum 的日語子集以及 systemk/aozorabunko_chunk
- Downloads: 167
- LiuliFox/stickers
- るり的貼紙,只是為了好玩。
- Downloads: 164
- alfredplpl/anime-with-caption-cc0
- 這個數據集是為了更容易對插圖進行道德學習而設計的,其中包含對日本插圖的標題。
- Downloads: 160
- Silviase/Japanese-Heron-Bench
- 這個數據集是為了日本評估標準套件的建構而包含的圖像、內文和問題集的澄清版本。
- Downloads: 156
- hpprc/jawiki
- JaWikiWikipedia 的 HTML 格式備份檔中提取的文字資料集。
- Downloads: 146
- SNOW-NLP/snow_simplified_japanese_corpus
- 该语料库有5万个经手工简化和对齐的句子。
- Downloads: 143
- yuzuai/rakuda-questions
- 樓下 - 日本模特兒問題庫
- Downloads: 135
- sbintuitions/JSQuAD
- 評分分數的可再現性確保以及 SB Intuitions 修正版本的公開用克隆來源: yahoojapan/JGLUE 在 GitHub 上 JSQuAD。JSQuAD 是 SQuAD(Rajpurkar等人,2016)的一份資料集的日文版本,屬於閱讀理解的數據集之一。
- Downloads: 133
- TLME/Umamusume-voice-transcription
- 烏馬娘-語音轉錄 總字數:77 附帶轉錄。
- Downloads: 132
- fujiki/guanaco_ja
- 這是Guanaco數據集的一部分,其中包含日文內容。
- Downloads: 132
- AhmedSSabir/Japanese-wiki-dump-sentence-dataset
- 數據集5M(5121625)包含清潔的日語完整句子及其上下文。
- Downloads: 132
- range3/wiki40b-ja
- 這個資料集由wiki40b資料集中的三個parquet檔案組成,僅提取日語資料。
- Downloads: 129
- kunishou/oasst1-89k-ja
- 這個數據集是通過將“OpenAssistant/oasst1”自動翻譯成日語而創建的。
- Downloads: 121
- hotchpotch/JaCWIR
- JaCWIR:日本語休閒網路資訊檢索 - 日本語資訊檢索評估的小規模休閒網路標題和摘要資料集。近年,隨著大規模語言模型(LLM)的興起,使用普通日語提問自然搜尋查詢的使用案例正在增加。
- Downloads: 117
- hpprc/en-ja-align
- 日英对译文对应数据是根据内山等人(2003年)的研究公开的日英对译文数据集。
- Downloads: 117
- tet550/jawiki_sentences
- Jawiki句子數據集 這個數據集是基於日文維基百科的文章創建的。
- Downloads: 115
- hpprc/llmjp-kaken
- 將llm-jp-corpus-v3的kaken子集轉換為HF格式,對於可以從每個數據附帶的URL中獲取原文章標題的數據,已經取得並添加到數據集中。
- Downloads: 115
- Fhrozen/CABankSakura
- CABank日文櫻花語料庫 三宅珊妮 醫學科學岡山愛知縣淑德大 學smiyata@asu.aasa.ac.jp 網站: https://ca.talkbank.org/access/Sakura.html 重要
- Downloads: 113
- Kendamarron/japanese-photo-instruction
- 數據集資訊:這個數據集是基於ThePioneer/japanese-photos的照片而來。
- Downloads: 111
- kunishou/amenokaku-code-instruct
- Amenokaku-Code-InstructUpdate:2023/12/27 將 JaxTon 和專業Java的程式碼數據集新增了180條記錄。
- Downloads: 110
- blastai/Open_o1_sft_Pro_translated_jp
- 概要:這個資料集是使用Qwen公司的Qwen2.5-14B-Instruct將Open_o1_sft_Pro資料集翻譯成日文的版本。
- Downloads: 108
- nu-dialogue/real-persona-chat
- 請查看 GitHub 以獲得更詳細的資訊。
- Downloads: 108
- GENIAC-Team-Ozaki/WikiHowNFQA-ja_cleaned
- Lurunchik/WikiHowNFQA被翻譯成日文,是經人手清理過的資料集。
- Downloads: 107
- DeL-TaiseiOzaki/Tengentoppa-sft-v1.0
- Tengentoppa corpus for sft(日语指导数据集合)概要。该数据集是一个大规模的有监督学习数据集,整合了16个日语指令遵循数据集而成。
- Downloads: 107
- ebisuke/liz-nojaloli-ja-ds
- ebisuke/liz-nojaloli-ja-ds License MIT License Description ebisuke/liz-nojaloli-ja的學習來源資料集。
- Downloads: 107
- Aratako/Synthetic-JP-EN-Coding-Dataset-801k
- 使用Synthetic-JP-EN-Coding-Dataset-801k Magpie所創建的代碼SFT資料集Aratako/Synthetic-JP-EN-Coding-Dataset-Magpie-69k為基礎,使用類似Evol-Instruct的方法,生成並擴展多條指令和回應,形成日英混合的801262條代碼SFT合成資料集。
- Downloads: 105
- fujiki/japanese_alpaca_data
- [github]. [GitHub].
- Downloads: 105
- cc-clean/CC-MAIN-2019-39
- CC-MAIN-2019-39歡迎您,這個數據集是從名為CommonCrawler的資料中提取出的僅包含日語部分的數據。
- Downloads: 103
- hpprc/tanaka-corpus
- HF Datasets 版本的田中语料库。
- Downloads: 102
- jpft/danbooru2023
- 淘寶2023:
- Downloads: 102
- p1atdev/japanese-stackexchange
- 這是從能夠讓使用者用英文提問有關日語的問題的 Japanese Stack Exchange 資料庫中提取出來的資料,經過整理加工後成為問題和回答對的 QA 資料集。
- Downloads: 101
- JunSotohigashi/JapaneseWikipediaTypoDataset_kanji
- 日本語維基百科輸入錯誤數據集(漢字錯變轉換版)概要。該數據集是由京都大學語言媒體研究室公開的數據集,經HuggingFace轉換後可供使用。
- Downloads: 100
- shi3z/rachel
- 這是一個用來製作日本對話機器人的手工數據集。
- Downloads: 99
- sappho192/Tatoeba-Challenge-jpn-kor
- 數據集詳情 數據集來源存儲庫:Helsinki-NLP/Tatoeba-Challenge 詳情:日語 - 韓語 jpn-kor 用途 這個數據集可用於訓練將日語句子翻譯為韓語的翻譯模型。
- Downloads: 99
- community-datasets/covid_tweets_japanese
- 該註釋是由多數意見的5至10名群眾工作者所決定的。
- Downloads: 98
- llm-book/aio-passages-bpr-bert-base-japanese-v3
- 對於 llm-book/aio-passages 數據集,llm-book/bert-base-japanese-v3-bpr-passage-encoder 已將通過 passage encoder 生成的二進制向量添加到 embeddings 欄位中。
- Downloads: 97
- llm-book/jawiki-sentences
- 我正在使用在 GitHub 倉庫 singletongue/wikipedia-utils 上公開的數據集。
- Downloads: 97
- kunishou/J-ResearchCorpus
- J-ResearchCorpusUpdate: 在2024年3月16日新增了包含自然语言处理学会第30届年会(NLP2024)在内的1,343篇论文数据。 在2024年2月25日新增了包含在《自然语言处理》杂志上以CC-BY-4.0许可发布的360篇论文数据。 这是一个从以CC-BY-*许可发布的日文论文和学会杂志等中精选出的高
- Downloads: 97
- saldra/sakura_japanese_dataset
- Sakura_dataset 是一個可以用於商業用途的超小規模高品質日本語數據集。
- Downloads: 96
- mohamed-khalil/AnimeSongsLyrics
- 動漫歌曲歌詞資料庫 —— アニメソングの歌詞データセット 歡迎來到動漫歌曲歌詞資料庫總覽 這個資料集匯編了各種動漫歌曲的歌詞,為愛好者和研究人員提供豐富的資源。
- Downloads: 95
- YANS-official/ogiri-test-with-references
- 從數據集導入加載數據集的方法:from datasets import load_dataset dataset = load_dataset("YANS-official/bokete-ogiri-test", split="test") 概要:這是大喜利投稿網站Bokete的爬蟲數據。
- Downloads: 95
- Sakalti/Multilingal-sakalt-data
- 多語言資料集。
- Downloads: 94
- Atsushi/fungi_indexed_mycological_papers_japanese
- 真菌索引菌学論文日本語データセット最後更新日期:2024年2月23日(至R3-11457)。====语言:日本语。此数据集仅提供日本语版本。
- Downloads: 94
- llm-book/jsnli
- JSNLI Version 1.1數據集中經過過濾的訓練集(train_w_filtering)
- Downloads: 93
- kunishou/OpenMathInstruct-1-1.8m-ja
- OpenMathInstruct-1 將成為一個包含 180 萬條指導調整數據的商業可用自動翻譯成日語的數據集。
- Downloads: 92
- Aratako/Japanese-RP-Bench-testdata-SFW
- 這個資料集是為了評估LLM日語角色扮演能力的Japanese-RP-Bench基準而設計的評估資料集。
- Downloads: 92
- llm-book/aio-retriever
- GitHub 倉庫 cl-tohoku/quiz-datasets 中公開的資料集,我正在使用。
- Downloads: 90
- Aratako/Synthetic-Japanese-Roleplay-gpt-4o-mini-39.6k-formatted
- 人造-日本語-角色扮演-gpt-4o-mini-39.6k格式化20240907 資料擴增(約19800筆→約39600筆) 摘要 這是使用gpt-4o-mini創建的日本語角色扮演資料集Aratako/Synthetic-Japanese-Roleplay-gpt-4o-mini-39.6k,添加系統訊息並整理之資料集。
- Downloads: 89
- inu-ai/ggml-japanese-gpt2
- Windows 的使用者應該可以在 ggml-japanese-gpt2 的執行檔上運行。
- Downloads: 89
- llm-jp/hh-rlhf-12k-ja
- 該存儲庫提供了由日本LLM-jp發起的合作項目開發的人類偏好數據集。
- Downloads: 88
- hpprc/mqa-ja
- mqa數據集的query-passage對,已刪除重複的數據集。
- Downloads: 88
- Inoichan/OpenO1-SFT-JA
- 這個資料集是 OpenO1-SFT 資料集的日文翻譯版本,包含了為了微調語言模型而設計的 Chain of Thought (CoT) 推理範例。
- Downloads: 88
- Chasottco/Japanese-patent-evaluation-dataset-01
- 這是一個測試數據集的建立方法。 在ChatGPT-4o中,生成包含律師介紹的五個觀點的50個查詢。 使用ChatGPT-4o生成針對查詢的答案和評估觀點。請注意,除了介紹律師的10個問題外,其餘被排除的10個問題,將從
- Downloads: 87
- tarudesu/gendec-dataset
- 從日本名字中的性別辨識與機器學習
- Downloads: 86
- DeL-TaiseiOzaki/magpie-qwen2.5-32B-10K-ja
- 合成日本語指示資料集 概要 這個資料集是基於大型語言模型(Qwen2.5-32B-instruct)生成的。
- Downloads: 86
- team-hatakeyama-phase2/LLMChat
- LLMChat 概述 GENIAC 松尾研 LLM開發專案中開發的模型,為了進行人工評估而建立的LLMChat系統收集的問題及LLM的回答,以及人工評估的資料。
- Downloads: 84
- sudy-super/CoTangent
- CoTangent是一個人手製作的高品質且乾淨的包含100個樣本的日文CoT數據集。
- Downloads: 83
- Aratako/Synthetic-JP-Conversations-Magpie-Nemotron-4-10k
- 我們創建了大約10,000條日語指令調整數據集,並將Synthetic-JP-Conversations-Magpie-Nemotron-4-10kMagpie的方法應用於nvidia/Nemotron-4-340B-Instruct。
- Downloads: 83
- hpprc/alt-parallel-en-ja
- 亞洲語言樹庫(ALT)項目ALT
- Downloads: 83
- llm-jp/oasst2-33k-ja
- 這個存儲庫提供了一個由日本啟動的合作項目LLM-jp開發的指導調整數據集。
- Downloads: 82
- tokyotech-llm/swallow-magpie-ultra-v0.1
- 📰 新聞
- Downloads: 80
- p1atdev/LLM-jp-Toxicity-Dataset
- LLM-jp 有害資料集 日文有害資料集「LLM-jp 有害資料集」 請參閱 https://gitlab.llm-jp.nii.ac.jp/datasets/llm-jp-toxicity-dataset
- Downloads: 80
- recruit-jp/japanese-image-classification-evaluation-dataset
- 由Recruit Co.開發:recruit-jp/japanese-image-classification-evaluation-dataset總覽
- Downloads: 79
- hpprc/janli
- 受英文HANS數據集啟發,JaNLI(日本對抗性NLI)數據集旨在需要對日本語言現象有深入理解,並凸顯模型的弱點。
- Downloads: 79
- zan/lima-ja
- 2023年)。
- Downloads: 78
- Aratako/Magpie-Tanuki-Instruction-Selected-Evolved-26.5k
- 喜鵲狸-指示-精選-進化-26.5k 概要 這是一個約有2萬6500個條目的日文合成指示資料集,是按照以下步驟創建的。
- Downloads: 78
- globis-university/aozorabunko-chats
- 概述 這個資料集是通過一種簡單的啟發式方法從青空文庫(Aozora Bunko)中提取的對話資料,該文庫收集了日本公共領域中的書籍。
- Downloads: 77
- HachiML/alpaca_jp_python
- alpaca_jp_python是使用Stanford Alpaca的mistralai/Mixtral-8x22B-Instruct-v0.1方法生成的合成數據(Synthetic data)。
- Downloads: 76
- llm-book/ja-vicuna-qa-benchmark
- 我們正在使用原始網站相同的內容。
- Downloads: 75
- ikedachin/CC-news-2024-October-cleaned-1204
- 根據kajuma/CC-news-2024-July-October-cleaned,提取出了9月和10月的新聞資料集。
- Downloads: 75
- taishi-i/nagisa_stopwords
- 這是針對日文博物館分析庫nagisa所創建的日文常用停用詞清單。
- Downloads: 74
- Inoichan/KUM-Bench
- KUM-Bench:用於日本高級推理能力評估的基準 KUM-Bench(京都大學數學入學考試基準)旨在通過利用來自京都大學的數學入學考試問題來評估日本的高級推理能力,京都大學是日本最著名的大學之一。
- Downloads: 74
- weblab-GENIAC/aya-ja-evol-instruct-calm3-dpo-masked
- 在您同意以下條件的前提下,將下載已公開的模型和數據集等(以下稱為“本內容”)。
- Downloads: 73
- SakanaAI/JA-VG-VQA-500
- JA-VG-VQA-500數據集描述JA-VG-VQA-500是日本視覺基因問答數據集的500個樣本子集。
- Downloads: 73
- sbintuitions/JCommonsenseQA
- 評估分數的再現性確保和SB直覺修訂版的公開克隆源:在GitHub上的yahoojapan/JGLUE上找到JCommonsenseQA。JCommonsenseQA是CommonsenseQA(Talmor等人,2019)的日文版本,是一個需要常識推理能力的多選問答數據集。
- Downloads: 72
- llm-jp/mbpp-ja
- 這個資料庫提供了由日本LLM-jp合作項目翻譯成日文的mbpp數據集。
- Downloads: 72
- llm-book/ner-wikinews-dataset
- 固有表現標籤採用了llm-book/ner-wikipedia-dataset相同的內容,共有8種類(人名、法人名、地名、產品名、政治組織名、機構名、其他組織名、事件名)。
- Downloads: 72
- kanhatakeyama/AutoMultiTurnByCalm3-22B
- 這個自動生成的多輪對話資料集是通過從開放數據源採集資料,使用Calm3-22b自動生成的。部分計算使用了東京工業大學的超級計算機TSUBAME4.0。起始的資料源和問題(q1)是從各種數據源中收集的。隨後的對話全部由Calm生成。
- Downloads: 71
- weblab-GENIAC/Open-Platypus-Japanese-masked
- 在同意下,我們將下載所公開的模型及數據集等(以下稱為“本內容”)。
- Downloads: 71
- Aratako/iterative-dpo-data-for-SimPO-iter2
- 使用Aratako/Magpie-Tanuki-Instruction-Selected-Evolved-26.5k作為合成instruction數據的基礎,按照以下步驟創建的日語偏好數據集。
- Downloads: 71
- kanhatakeyama/AutoMultiTurnByMixtral8x22b
- 這段文字的翻譯如下:這是從自動生成的多轉換數據集開放數據源中使用了MaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUF產生問答(Q&A)的內容。在部分相關程式碼的計算中,我們使用了東京工業大學的超級電腦TSUBAME4.0。
- Downloads: 70
- weblab-GENIAC/aya-ja-nemotron-dpo-masked
- 在同意以下條件的前提下,我將下載公開的模型和數據集等(以下簡稱“本內容”)。
- Downloads: 70
- mohamed-khalil/AnimeQuotes
- 動漫名言資料集 ― 歡迎來到動漫名言資料集總覽。這個資料集包含了從各種動漫系列中彙整的啟發性和令人難忘的名言,來源自Anime Motivation網站。
- Downloads: 70
- hotchpotch/ms_marco_japanese
- ms_marco_japanese這是 ms_marco 的日文翻譯數據。
- Downloads: 70
- numad/yuho-text-2023
- 各筆錄的url欄位為來源。
- Downloads: 69
- sbintuitions/JEMHopQA
- JEMHopQA(Japanese Explainable Multi-hop Question Answering)是一個日文多跳問答數據集,可評估內部推理。
- Downloads: 69
- ThePioneer/Artificial-super-girlfriend-for-fine-tuning
- 通過創建了我自己的人工超女友(版本2.1和版本2.6),我已經製作了一個約2800張圖片的數據集,以便比較清晰地解決與真實模型中特有的肖像權問題。
- Downloads: 68
- sudy-super/dialogsum-ja
- 這個數據集包含了對話摘要、CSDS等翻譯後的日語對話摘要數據集。
- Downloads: 68
- hatakeyama-llm-team/AutoGeneratedJapaneseQA
- 這是從各種數據來源中使用MaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUF自動生成的Q&A。自動生成的答案分為兩種,一種是從CommonCrawl或CC-BY類型的數據來源生成的。
- Downloads: 68
- Aratako/Synthetic-Japanese-Roleplay-gpt-4o-mini-39.6k
- 合成-日本語-角色扮演-gpt-4o-mini-39.6k 20240907 資料增量(約19800條→約39600條) 概要 這是一個利用gpt-4o-mini製作的,包含約39600條日本語角色扮演對話的合成資料集。
- Downloads: 68
- Aratako/Self-Instruct-Qwen2.5-72B-Instruct-60k
- 自学式-Qwen2.5-72B-Instruct-60k是通過以下步驟創建的約6萬條日語合成指令數據集。
- Downloads: 68
- kunishou/databricks-dolly-69k-ja-en-translation
- 這個數據集是通過自動將“databricks-dolly-15k”翻譯成日語創建的。
- Downloads: 68
- bandad/sayoko-tts-corpus
- 薩蘭娜 聲音語料庫 下載方法 資料集已經壓縮成zip檔案,並放在gdrive上。
- Downloads: 67
- aixsatoshi/Longcontext-aozora-instruction
- 長篇指示文件資料集。
- Downloads: 67
- Aratako/Magpie-Tanuki-8B-97k
- 勉强-狸-8B-97k Magpie的方法应用到weblab-GENIAC/Tanuki-8B-dpo-v1.0上,制作出的97269个日语对话数据集。
- Downloads: 67
- Nan-Do/OpenSubtitlesJapanese
- 該數據集包含(幾乎)整個日語的 OpenSubtitles 資料庫:超過 7000 部電視節目和/或電影。
- Downloads: 67
- creative-graphic-design/CAMERA
- 希望我們的數據集在研究中能夠派上用場,以實現更先進的廣告文本生成模型。
- Downloads: 66
- aixsatoshi/Longcontext-aozora-summary
- 長文摘要資料集。
- Downloads: 66
- Aratako/iterative-dpo-data-for-ORPO-iter3
- 迭代式 DPO 数据用于 ORPO 迭代 3 的概要。这是根据合成指令数据 Aratako/Self-Instruct-Qwen2.5-72B-Instruct-60k 创建的日本语偏好数据集。
- Downloads: 66
- fujiki/japanese_hh-rlhf-49k
- 這是一個略有不同的版本kunishou/hh-rlhf-49k-ja,沒有包含ng_translation == 1的範例。
- Downloads: 65
- turing-motors/LLaVA-Pretrain-JA
- 數據集詳情數據集類型:Japanese LLaVA Pretrain 是原始 LLaVA Pretrain 數據集的本地化版本。
- Downloads: 65
- ayousanz/common-voice-speechMOS-analyze
- 概要 Common Voice Corpus 17.0 在 speechMOS 上進行了音質分析的結果。
- Downloads: 65
- aixsatoshi/cosmopedia-japanese-100k
- cosmopedia-japanese-20k的數據,經由kunishou提供的20k-100k,將系統擴展至100k。
- Downloads: 65
- YANS-official/ogiri-bokete
- 從數據庫載入方式 import load_dataset dataset = load_dataset("YANS-official/ogiri-bokete", split="train") 概要 這是來自大喜利投稿網站Bokete的爬蟲數據。
- Downloads: 64
- Aratako/Synthetic-JP-10-Turns-Roleplay-Dialogues-Nemotron-4-1k
- 使用Synthetic-JP-10-Turns-Roleplay-Dialogues-Nemotron-4-1knvidia/Nemotron-4-340B-Instruct創建的,收錄了約1000條對話,每條對話有10個回合的日文角色扮演對話的合成對話數據集。
- Downloads: 64
- tohoku-nlp/abc-multiple-choice
- abc-multiple-choice 資料集是根據競技問答比賽「abc」中使用的四選一問題創建的多選擇式問答資料集。
- Downloads: 64
- stockmark/ner-wikipedia-dataset
- 透過使用維基百科,從日文擷取特定表達數據集GitHub:https://github.com/stockmarkteam/ner-wikipedia-dataset/LICENSE:CC-BY-SA 3.0由Stockmark Inc. 開發。
- Downloads: 64
- Aruno/guanaco_jp
- 使用langdetect提取的GuanacoDataset的日文提示。
- Downloads: 63
- oshizo/japanese-wikipedia-paragraphs
- 單語/維基百科工具的剖析和分塊方法的略微修改版本。
- Downloads: 63
- numad/yuho-text-2014-2022
- 每個記錄的URL列將作為引用來源。
- Downloads: 63
- if001/aozorabunko-clean-sin
- 這是 forkhttps://huggingface.co/datasets/globis-university/aozorabunko-cleanfilteredrow["meta"]["文字遣い種別"] == "新字新仮名"
- Downloads: 63
- Fhrozen/CABankSakuraCHJP
- CABank日本語CallHome语料库参与者: 120研究类型:电话通话地点:美国媒体类型:音频DOI:doi:10.21415/T5H59V网址:https://ca.talkbank.org/access/CallHome/jpn.html引文信息这里有一些引文。
- Downloads: 62
- Kendamarron/jimba-instuction-1k-beta
- 這是通過人工檢查和修正 cyberagent/calm2-7b-chat 的輸出所創建的日文指令數據集。
- Downloads: 62
- joujiboi/bluemoon-fandom-1-1-rp-jp-translated
- 藍月-粉絲-1-1-角色扮演-日文翻譯。根據指令-r-08-2024,由Squish42/bluemoon-fandom-1-1-角色扮演-清理的子集進行翻譯。
- Downloads: 62
- DeL-TaiseiOzaki/Tengentoppa-sft-reasoning-ja
- 日本語指示・推論・回答データセット 概要 この資料庫将SkunkworksAI/reasoning-0.01中的指示數據作為基礎,使用Qwen/Qwen2.5-32B-Instruct模型創建的日文版指示・推論・回答數據集。
- Downloads: 62
- yulanfmy/databricks-qa-ja
- 這是關於在Databricks手動創建的問題和回答對的日文資料集概要。
- Downloads: 61
- llm-jp/japanese-photos-conversation
- 這些圖像來源於https://huggingface.co/datasets/ThePioneer/japanese-photos。
- Downloads: 61
- toshi456/llava-bench-in-the-wild-ja
- 這個數據集是對 MBZUAI/multilingual-llava-bench-in-the-wild 中日文數據的翻譯錯誤和未翻譯數據進行修正的數據。
- Downloads: 60
- SakanaAI/ChouBun
- ChouBun數據集描述ChouBun是一個用於評估語言模型(LLMs)在日語長文本任務中表現的基準。
- Downloads: 60
- hpprc/TALPCo
- TALPCo數據集的日英翻譯對轉換為HuggingFace格式的數據集。
- Downloads: 60
- p1atdev/danbooru-ja-tag-pair-20241015
- 2024/10/15創建的danbooru標籤與日本語標籤對應數據集(約15萬條)p1atdev/danbooru-ja-tag-pair-20240715所不同之處在於,由於基礎的wiki數據增加,對應標籤也增加了。添加了在fasttext中進行篩選。明顯是其他
- Downloads: 60
- p1atdev/ja-stackoverflow
- 利用 Stack Overflow 的日文版 Stack Overflow 的數據備份,進行資料處理,調整成問題和答案配對的 QA 資料集。
- Downloads: 59
- hatakeyama-llm-team/AutoGeneratedJapaneseQA-other
- 利用自動生成Q&A數據源,使用MaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUF來自動生成Q&A。這些數據是由團隊創建的,並且是基於Common Crawl生成的。
- Downloads: 59
- karakuri-ai/corrected-mt-bench-ja
- 這是由Corrected MT-Bench-ja Inflection AI糾正的Corrected MT-Bench的日本語翻譯。
- Downloads: 59
- Calvin-Xu/Furigana-NDLBIB
- 從全國書誌數據中創建的假名數據集(GitHub)
- Downloads: 59
- hpprc/jsec
- JSEC網站
- Downloads: 59
- JunSotohigashi/JapaneseWikipediaTypoDataset
- 日本語維基百科輸入錯誤資料集 概述 這是由京都大學語言媒體研究室發佈的資料集,已被轉換為可在HuggingFace上使用的形式。
- Downloads: 59
- aixsatoshi/Chat-with-cosmopedia
- 這是一個信息密度高的多輪對話數據,涉及推理、知識和對話交流等。
- Downloads: 59
- svjack/pokemon-blip-captions-en-ja
- 用於訓練神奇寶貝文字轉圖像模型的數據集,添加一列神奇寶貝BLIP標題的日語列。從Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image Synthesis(FastGAN)介紹的Few Shot Pokémon數據集中生成的神奇寶貝圖像的BLIP標題。
- Downloads: 58
- Aratako/magpie-sft-v1.0-dpo-judged
- magpie-sft-v1.0-dpo-judged 概要 llm-jp/magpie-sft-v1.0基礎上進行了以下修改而創建的日本語Preference數據集。
- Downloads: 58
- Aratako/Magpie-Tanuki-8B-annotated-96k
- 鵲狸8B標註96k Magpie的方法應用於weblab-GENIAC/Tanuki-8B-dpo-v1.0,並創建了Aratako/Magpie-Tanuki-8B-97k數據集,使用cyberagent/calm3-22b-chat對instruction進行了難易度、質量和類別的注釋數據集。
- Downloads: 58
- FrancophonIA/XFUND
- 數據集來源:https://github.com/doc-analysis/XFUND XFUND:
- Downloads: 57
- larryvrh/WikiMatrix-v1-Ja_Zh-filtered
- 經過過濾並修改後的日語/中文語言對資料,來自WikiMatrix v1。處理步驟如下:1.
- Downloads: 57
- Atsushi/fungi_trait_circus_database
- 請勿暫時將該數據集用於學術研究用途。
- Downloads: 57
- Nurture-intelligence/thinking_dataset_v1
- 概要:這個資料集是收集用於建立思考模型的問題資料。
- Downloads: 56
- tomo1222/Japanese-QA111dataset
- 人手製造的資料
- Downloads: 56
- sbintuitions/aio-extended-answers
- AIO與擴展答案AIO(AI王)是一個日本的測驗數據集。
- Downloads: 56
- y2lan/japan-law
- 日本法律 這個資料集包含了從日本官方政府網站 e-Gov 檢索出的8.75K份法律記錄。
- Downloads: 56
- zetavg/ShareGPT-Processed
- ShareGPT-Processed將RyokoAI/ShareGPT52K數據集轉換為Markdown格式,並標記所使用的語言。
- Downloads: 56
- range3/wikipedia-ja-20230101
- 這個數據集包含一個 parquet 檔案,其中只提取了維基百科數據集中的日文數據。
- Downloads: 56
- ganchengguang/Text-Classification-and-Relation-Event-Extraction-Mix-datasets
- GIELLM數據集的文件。
- Downloads: 55
- Aratako/magpie-reasoning-llama-nemotron-70b-100k-filtered
- magpie-reasoning-llama-nemotron-70b-100k經過篩選過的DeL-TaiseiOzaki/magpie-reasoning-llama-nemotron-70b-100k數據集中,提取未包含"改良"一詞的行,並轉換為OpenAI messages格式。
- Downloads: 55
- Inoichan/NuminaMath-CoT-JA-100K
- 數據集摘要 這個數據集是 NuminaMath CoT 數據集的日文翻譯子集,包含原始數據集中的前 100k 樣本。
- Downloads: 55
- noname0202/oscar-cleaned-256
- 我從neody/oscar-ja-cleaned的數據中提取了不多於256個字符的內容。
- Downloads: 55
- Nurture-intelligence/ins_dataset
- 摘要:這個資料集是以問答形式製作的,用來回答sakura_japanese_dataset中問題的合成資料集。
- Downloads: 55
- kanhatakeyama/SyntheticTextOpenMathInstruct
- 從以下數據來源隨機抽取的日文文本,經由Phi-3構建的語料庫。對於某些計算,我們使用了東京工業大學的超級計算機TSUBAME4.0。
- Downloads: 55
- hotchpotch/msmarco-ja-hard-negatives
- msmarco-ja-hard-negatives hpprc/msmarco-ja 是對 MS MARCO 的日文翻譯數據進行了以下處理的硬性負面挖掘。
- Downloads: 54
- Atsushi/fungi_diagnostic_chars_comparison_japanese
- 真菌診斷特徵比較日文資料集 最後更新日期:2024年2月23日(至R3-11457)====語言:日文此資料集僅提供日文版本。
- Downloads: 54
- WarriorMama777/databricks-dolly-15k-ja_cool
- 概觀 這個資料集是從 kunishou/databricks-dolly-15k-en 編輯而來。
- Downloads: 54
- zenless-lab/jamp
- Jamp:用於評估語言模型泛化能力的受控日語時間推理數據集 Jamp(tomo-vv/temporalNLI_dataset)
- Downloads: 54
- Mitsua/wikidata-parallel-descriptions-en-ja
- Wikidata平行描述 en-ja 機器翻譯平行語料庫,由Wikidata數據備份(2024-05-06)生成。
- Downloads: 54
- sakusakumura/databricks-dolly-15k-ja-scored
- 請點擊這裡查看英文版本。
- Downloads: 54
- jaCappella/jaCappella
- jaCappella 語料庫:日本無伴奏合唱聲樂團語料庫。jaCappella 語料庫是日本無伴奏合唱聲樂團的語料庫。
- Downloads: 54
- R1b3y/NE4Mitsua
- 負面嵌入/文字排列Inverse NE4Mitsua是《Mitsua擴散 One》的一種負面嵌入方式。
- Downloads: 53
- llm-book/jawiki-paragraphs
- 我們正在使用 GitHub 倉庫 singletongue/wikipedia-utils 中公開的數據集。
- Downloads: 53
- yutakobayashi/diet-members-voice-embeddings
- 這是一個使用 speechbrain/spkrec-ecapa-voxceleb 模型對日本國會議員的聲音進行 embedding 的資料集。
- Downloads: 53
- shi3z/Japanese_Wikipedia_Conversation
- 維基百科日語版數據集(izumi-lab/wikipedia-ja-20230720)
- Downloads: 53
- nu-dialogue/jmultiwoz
- 數據集摘要 JMultiWOZ 是一個大規模的日本多領域任務導向對話數據集。
- Downloads: 53
- hotchpotch/jaqket_cc
- JAQKET 提供的 AI 王官方發布數據集中僅包含 CC-BY-SA 授權的數據。這是一個包含 CC-BY-SA-4.0 授權數據的數據集。
- Downloads: 53
- Aratako/Bluemoon_Top50MB_Sorted_Fixed_ja
- 「Bluemoon_Top50MB_Sorted_Fixed」經過 GENIAC-Team-Ozaki/karakuri-lm-8x7b-chat-v0.1-awq 轉換成日文後的角色扮演學習資料集。
- Downloads: 53
- Kendamarron/jimba-wiki-instruction-calm3
- 利用Kendamarron/jimba-wiki-instruction-calm3grapevine-AI/CALM3-22B-Chat-GGUF的Q4_K_M進行合成instruction數據集。
- Downloads: 53
- YukiTomita-CC/AKU-d_ms-0.5B-v0.1_dataset
- AKU-d_ms-0.5B-v0.1_資料集概要 這個資料集儲存了我開發的AKU系列之一,即AKU-d_ms-0.5B-chat-v0.1 的預訓練所使用的文本數據。
- Downloads: 53
- hpprc/honyaku
- 這是一個包含從英文維基百科文章開頭萃取的多個句子,並且由人工翻譯成日文的文章級平行資料集。
- Downloads: 53
- OmniAICreator/Japanese-Roleplay-Dialogues
- 這是從日本角色扮演論壇(通常稱為「なりきりチャット」)收集的對話語料庫。
- Downloads: 53
- Verah/JParaCrawl-Filtered-English-Japanese-Parallel-Corpus
- 介紹這是從ntt的JParaCrawl v3大型英日平行語料庫中的前100萬行中,經過LLM過濾處理的數據集。
- Downloads: 53
- Atom007/mc4-japanese-data
- 參考資料:https://huggingface.co/datasets/mc4
- Downloads: 52
- Nexdata/English-Japanese_Parallel_Corpus_Data
- 它涵蓋多個領域,如旅遊、醫療、日常生活、新聞等。
- Downloads: 52
- Gustav114514/work
- 對日語語音識別進行了微調的XLSR-53大型模型,使用了Common Voice 6.1、CSS10和JSUT的訓練和驗證分割,微調了facebook/wav2vec2-large-xlsr-53。在使用此模型時,請確保您的語音輸入採樣頻率為16kHz。
- Downloads: 52
- trojblue/sakugabooru2025
- 作画棒2025:
- Downloads: 52
- watashihakobashi/ogiri
- 東京大學松尾・岩澤研究室主辦的LLM講座2024的第5回「SFT」演習所使用的數據集。
- Downloads: 52
- Aratako/Synthetic-JP-EN-Translation-Dataset-Magpie-Nemotron-4-20k
- 將Synthetic-JP-EN-Translation-Dataset-Magpie-Nemotron-4-20kMagpie的方法應用於nvidia/Nemotron-4-340B-Instruct並創建的20000條日⇔英翻譯數據集。
- Downloads: 52
- shi3z/ja_conv_wikipedia_llama2pro8b_30k
- 這個資料集是基於日本維基百科資料集,並使用 llama2Pro8B 轉換為多輪對話格式。由於其使用 llama2 授權,可以商業性地用於服務。
- Downloads: 52
- baobab-trees/wikipedia-human-retrieval-ja
- 日文維基百科人類檢索數據集。這是一個由訓練有素的人類工作者在維基百科文章中進行檢索的日文問答數據集。
- Downloads: 52
- shunk031/jsnli
- 數據集預處理支持的任務和排行榜。 語言備註均以日語為主要語言。
- Downloads: 52
- DeL-TaiseiOzaki/Tengentoppa-sft-qwen2.5-32b-reasoning-100k
- 合成日文指示數據集概述。該數據集是針對大型語言模型(Qwen2.5-32B-instruct)而建立的。
- Downloads: 51
- Aratako/Magpie-Tanuki-Qwen2.5-72B-Answered
- 鵲狸-Qwen2.5-72B-Answered Aratako/鵲狸-8B-標注-96k中篩選出input_quality為excellent,並對其進行Qwen/Qwen2.5-72B-Instruct回答再生成的資料集。
- Downloads: 51
- BASF-AI/PubChemWikiJAPC
- PubChem & Wikipedia英文-日文段落配對分類 這個資料集是PubChem & Wikipedia段落配對分類資料集的多語言擴展。
- Downloads: 51
- YYama0/CT-RATE-JPN
- CT-RATE-JPN 数据集是 CT-RATE 数据集的一個版本,其中包含了與對應放射學報告配對的胸部 CT 量測,是日語翻譯版本。
- Downloads: 51
- kunishou/HelpSteer2-20k-ja
- NVIDIA 公布的針對 SteerLM 的試用數據集 HelpSteer2 被自動翻譯成日語。
- Downloads: 51
- Ego/jpflan
- 這是約40個日本開源下游任務數據集的模板化版本。
- Downloads: 51
- llm-book/aio-passages
- 我正在使用 GitHub 存儲庫 cl-tohoku/quiz-datasets 中公開的數據集。
- Downloads: 50
- zenless-lab/jnli
- JGLUE[JNLI]: 日語通用語言理解評估 JNLI(yahoojapan/JGLUE)
- Downloads: 50
- Kendamarron/multiturn-qwen2.5-32b
- Qwen/Qwen2.5-32B-Instruct-AWQ所生成的包含3个回合的多回合instruction数据集。
- Downloads: 50
- Sakalti/hachiwari
- #起源 這個名字來自於「鉢割/はちわり」(千岳/ちいかわ)。
- Downloads: 50
- ryota39/Aya_ja
- 這個資料集是從CohereForAI/aya_dataset中僅擷取出日文指示資料的資料集。
- Downloads: 50
- Calvin-Xu/Furigana-Aozora-Speech
- 從青空文庫和Sapie音訊資料中創建的帶有換行注釋的音訊語料庫資料集 https://github.com/ndl-lab/hurigana-speech-corpus-aozora 所有原始資料中的文字檔已經處理為3361443條目;在清理後移除了重複和沒有漢字的條目。
- Downloads: 49
- Calvin-Xu/Furigana-Aozora
- 從青空文庫及猿人的點字數據所製作的假名數據集(GitHub)https://github.com/ndl-lab/huriganacorpus-aozora 在驗證過程中排除了原始語料庫中的某些不匹配(307例)。錯誤:烈烈的節奏。
- Downloads: 49
- Aratako/LLMChat-Judge-Results
- LLMChat-Judge-Results team-hatakeyama-phase2/LLMChat的兩個模型回應,對應使用多個模型進行Pairwise評估的結果數據。
- Downloads: 49
- shi3z/OpenOrcaJapanese
- 這是OpenOrca數據集的日文翻譯版本。目前正在進行翻譯工作,OpenOrca整個數據集大約有1/5的翻譯已經完成,現在公開該部分內容。
- Downloads: 49
- tombailey/oasst1-ja
- 基於OpenAssistant對話數據集(OASST1)的描述
- Downloads: 49
- DataPilot/databricks-dolly-15k-Nyan-ja
- 這個數據集是kunishou先生公開的"databricks-dolly-15k"的日文翻譯版本,使用kunishou/databricks-dolly-15k-ja數據集的詞尾,並使用ArrowPro-7B-KUJIRA,將其翻譯為「にゃん!」
- Downloads: 48
- oshizo/JMDNClustering-ja
- 嵌入式模型的訓練和評估所需的分類數據集。
- Downloads: 48
- ibm/AttaQ-JA
- AttaQ-JA 資料集卡 AttaQ 紅隊測試資料集是為了評估大型語言模型(LLM)而設計的,主要通過評估它們生成有害或不良回應的傾向來進行,包含 1402 個精心製作的敵對問題。
- Downloads: 48
- Moleys/Filtered-Japanese-English-Parallel-Corpus
- 定義提示(japanese, english):
- Downloads: 48
- polm-stability/jblimp
- 這是來自《JBLiMP:日本語語音最小對照基準》(Someya和Oseki,2023)的數據。
- Downloads: 47
- ikeno-ada/Japanese-English_translation_of_contents_HScodes
- 根據日本郵便提供的「國際郵件內容品的日英中英翻譯、HS編碼類」(2024/05/09)的數據。
- Downloads: 47
- hatakeyama-llm-team/AutoGeneratedJapaneseQA-CC
- 這是從自動生成的Q&A資料來源中,使用了MaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUF生成的Q&A。這是基於Common Crawl來生成的。
- Downloads: 47
- speed/english_quotes_ja
- 這個資料集是使用llm-jp/llm-jp-3-3.7b-instruct模型將https://huggingface.co/datasets/Abirate/english_quotes翻譯成日語的結果。
- Downloads: 47
- ganchengguang/Sentence-Classification-and-NER-Mix-Datasets-SCNM
- SLG框架的數據集。
- Downloads: 47
- labofsahil/animelist-dataset
- 一個基於 JSON 的動畫數據集,包含最重要的元數據以及對各種動畫網站(如 MAL、ANIDB、ANILIST、KITSU 等等)的交叉引用。
- Downloads: 47
- zenless-lab/jsem
- JSeM:日本語意味テストスイート(日本語FraCaSと拡張版)の説明は、言語学において重要な説明対象の一つであり、理論を検証するためのベンチマークとして使用されています。
- Downloads: 47
- kanhatakeyama/SyntheticTextWikiTranslate
- 從以下的資料來源隨機抽取的日語文本,進行Phi-3再生成後自動翻譯為英文的語料庫。這是使用東京工業大學的超級計算機TSUBAME4.0進行部分計算的結果。
- Downloads: 47
- ayousanz/reazon-speech-v2-all-speechMOS-analyze
- 概要:根據對reazon-research/reazonspeech-v2 [all]在speechMOS中進行的音質分析結果。
- Downloads: 47
- kubota/defamation-japanese-twitter
- 誹謗中傷日本推特Twitter日語誹謗中傷檢測資料庫資料集概要社交網站中誹謗中傷檢測的資料集。
- Downloads: 47
- llm-book/jawiki-20220404-c400
- 這個資料集包含了2022年4月4日之前從日文維基百科擷取並組成的各個段落,每個段落由連續的句子組成,每句不超過400個字符。
- Downloads: 46
- JapanDegitalMaterial/Places_in_Japan
- 日本的地方。
- Downloads: 46
- tellarin-ai/llm-japanese-dataset-vanilla-aya-format
- 這包含了用於LLM建構/調整的日文指示式數據。
- Downloads: 46
- kunishou/ApolloCorpus-ja
- ApolloCorpus-ja 是將多語言醫療數據集 ApolloCorpus 自動翻譯為日文的 525k 指示調整資料集。
- Downloads: 46
- mohamed-khalil/KaidanNihonbunka
- 怪談日本文化:穿越百物語鬼故事之旅 歡迎來到怪談日本文化的資料集 關於名稱怪談日本文化在日本的翻譯是怪談日本文化: 怪談(Kwaidan):鬼故事或超自然故事。
- Downloads: 46
- YANS-official/senryu-shashin
- 從數據集中讀取導入數據集:from datasets import load_dataset dataset = load_dataset("YANS-official/senryu-shashin", split="train") 摘要 這是株式會社東建集團運營的Home Mate Research舉辦的“Home Mate川柳大獎”中關於以圖片形式提供的“相片川柳”相關的爬蟲數
- Downloads: 46
- deepghs/fgo_voices_jp
- JP Voice-Text Dataset for為JP聲音文本數據集
- Downloads: 46
- Hoshikuzu/JParaCrawl
- 請參閱以下網站以獲取更多資訊!
- Downloads: 46
- oshizo/HSClustering-ja
- 用於嵌入式模型的訓練和評估的聚類數據集。
- Downloads: 46
- NilanE/SmallParallelDocs-Ja_En-6k
- 這個數據集包含來自不同來源的中日對照的文本資料。
- Downloads: 46
- kunishou/oasst2-chat-68k-ja
- 這是轉換為聊天格式的oasst2-135k-ja數據集。
- Downloads: 46
- oshizo/japanese-wikipedia-paragraphs-embeddings
- 以下資料集已經使用 intfloat/multilingual-e5-base 模型進行向量化,並通過 faiss 創建了索引文件。
- Downloads: 45
- ayousanz/reazon-speech-v2-all-WAND-SNR-analyze
- 在WADA SNR進行了reazon-research/reazonspeech-v2[all]的音質分析。
- Downloads: 45
- waddledee/three_line_summarization_for_japanese_news_articles
- 這是LiveDoor新聞語料庫的三行摘要數據集。
- Downloads: 45
- Aratako/Synthetic-JP-EN-Coding-Dataset-801k-50k
- Synthetic-JP-EN-Coding-Dataset-801k-50k 是由 Aratako/Synthetic-JP-EN-Coding-Dataset-801k 中提取了 5 萬個英語部分的資料集。
- Downloads: 45
- DeL-TaiseiOzaki/magpie-reasonig-ja-qwen2.5-72b-16k
- 合成日本語指示資料集 概要 這個資料集是使用大規模語言模型(LLM)自動生成的日本語指示,以及相對應的推論、初始回應和改善回應的收集。
- Downloads: 45
- saillab/alpaca-japanese-cleaned
- 這個儲存庫包含了TaCo論文使用的資料集。
- Downloads: 45
- werty1248/OpenOrca-EnKoZhJa-18k
- 這個數據集是由韓文、中文和日文的OpenOrca翻譯數據集組成。
- Downloads: 45
- oshizo/ASRClustering-ja
- 用於嵌入式模型訓練和評估的聚類數據集。
- Downloads: 45
- kunishou/oasst2-135k-ja
- 更新:2023/12/25 我們已經將 oasst2-135k-ja 轉換為聊天形式並且發布了 oasst2-chat-68k-ja。
- Downloads: 45
- nakayama/hh-rlhf-helpful-base-ja
- https://github.com/anthropics/hh-rlhf 的內容中,選中了 helpful-base 內所記載的英文,經 fuguMT 翻譯後,成功翻譯的內容如下。
- Downloads: 44
- alfredplpl/genai-terminology-en-ja
- 生成AI的日英專業術語集。
- Downloads: 44
- kunishou/cosmopedia-100k-ja-preview
- cosmopedia-100k 的索引从20k到100k已被自动翻译成日文数据(因文本过长而无法翻译的记录已被排除)。
- Downloads: 44
- turing-motors/LLaVA-v1.5-Instruct-620K-JA
- 數據集詳情數據集類型: 日文 LLaVA v1.5
- Downloads: 44
- kenkensz9/nareba1691
- 這個資料集是在將OpenAI公司的GPT-3.5模型進行 https://huggingface.co/datasets/kenkensz9/kenkensz9_1242tw2 的微調之後,使用另外收集的包含人格的330條推文再次進行微調得到的模型,用來生成推文並對其進行評分。
- Downloads: 44
- YukiTomita-CC/ELYZA-tasks-100_Human_solved
- 這份資料集是對日本語LLM(Japanese Language Model)進行評估時常用的elyza/ELYZA-tasks-100,在這份資料集中收集了人類對相應問題的回答結果。
- Downloads: 44
- DancingPrismPJ/Wikipedia-Horse-Dataset
- 這是 DancingPrismPJ/wikipedia-horse-dataset Wikipedia 的資料集卡片。資料集包含在文章中標有特定命名實體標籤的項目。
- Downloads: 44
- Aratako/Synthetic-JP-Coding-Dataset-Magpie-Nemotron-4-10k
- Synthetic-JP-Coding-Dataset-Magpie-Nemotron-4-10kMagpie的方法應用於nvidia/Nemotron-4-340B-Instruct並創建的,約10000條日語編碼對話數據集。
- Downloads: 44
- Nexdata/Chinese-Japanese_Parallel_Corpus_Data
- 它涵蓋了許多領域,包括一般、資訊科技、新聞、專利和國際引擎。
- Downloads: 43
- shi3z/ja_conv_wikipedia_llama2pro8b_10k
- 這個資料集是基於日文維基百科資料集,並通過 llama2Pro8B 轉換為多輪對話格式。
- Downloads: 43
- shi3z/ja_conv_wikipedia_llama2pro8b_3k
- 這個資料集是基於日文維基百科資料集,並使用 llama2Pro8B 轉換成多輪對話格式。
- Downloads: 43
- shi3z/ja_conv_wikipedia_orion14B_100K
- 這是一個從日本維基百科數據集使用Orion14B-Chat生成的多輪對話數據集。
- Downloads: 43
- dichmau/ja_vi_translation
- 日語-越南語翻譯句對。
- Downloads: 43
- seungwon929/Ja-miracl
- 這個資料集代表將 miracl 資料集中的日語(Ja)部分轉換為 BeIR 格式,使其與 mteb 一起使用時相容。
- Downloads: 43
- YANS-official/senryu-debug
- 從資料集中導入import load_dataset函式庫,資料集= load_dataset("YANS-official/senryu-debug", split="test") 這是一個用於確認大喜利生成功能的資料集。
- Downloads: 43
- if001/elementray_l
- 使用calm3-22b建立了一個包含簡單日語例句的資料集。
- Downloads: 43
- hpprc/llmjp-warp-html
- 將經過level2篩選的llm-jp-corpus-v3的warp_html數據轉換為HF格式,對於每個數據可以從附加的URL中獲取原文章標題的數據集已經取得和添加。
- Downloads: 43
- YANS-official/senryu-test-with-references
- 從數據集中導入讀取方式,代碼如下: from datasets import load_dataset dataset = load_dataset("YANS-official/senryu-test", split="test")。概要:這是「川柳投稿サイト」中「写真川柳」和「川柳投稿まるせん」的爬蟲數據。
- Downloads: 43
- Aratako/Synthetic-JP-Roleplay-Instruction-Nemotron-4-1k
- 合成-JP-ロールプレイ-訓練-ネモトロン-4マグパイの手法をnvidia/Nemotron-4-340B-Instructに適用して作成した、約1000の日本語ロールプレイ用のinstructionデータセットです。
- Downloads: 43
- shi3z/ja_conv_wikipedia_orion14B_10K
- 這是使用Orion14B-Chat從日文維基百科數據集生成的多輪對話數據集。
- Downloads: 43
- kunishou/oasst1-chat-44k-ja
- oasst1-89k-ja 為轉換為聊天形式的資料集。
- Downloads: 42
- p1atdev/novecomi-novel-metadata
- novecomi小說元數據 https://dengekibunko.jp/novecomi/novel/ 從網站進行抓取。
- Downloads: 42
- Ego/jpflan-raw
- 這是來自約 40 個日本開源下游任務數據集的原始數據集合。
- Downloads: 42
- YANS-official/ogiri-debug
- 從數據集中導入讀取方法,數據集 = load_dataset("YANS-official/ogiri-debug", split="test")。概要:這是用於檢查大喜劇生成功能的數據集。
- Downloads: 42
- Hoshikuzu/Japanese-Law-Translation
- 日本法律翻譯數據集摘要
- Downloads: 42
- hatakeyama-llm-team/CommonCrawlPDFJa
- 從CommonCrawlPDFJapanese域中提取的數據代碼在這裡
- Downloads: 42
- kunishou/HelpSteer-35k-ja
- NVIDIA 公開的 SteerLM 專用試用數據集 HelpSteer 已經被自動翻譯成日語。
- Downloads: 42
- shi3z/ja_conv_wikipedia_llama2pro8b_20k
- 這個資料集基於日本版的維基百科資料集,並使用llama2Pro8B轉換為多輪對話格式。
- Downloads: 42
- kunishou/jp-effective-instructions
- oasst1-89k-ja,databricks-dolly-15k-ja,hh-rlhf-49k-ja 中經由 JGLUE(JcommonsenseQA,MARC-ja,JSQuAD) 觀點篩選出高品質資料集的資料集。
- Downloads: 42
- augmxnt/shisa-pretrain-en-ja-v1
- 這個預訓練數據集是為shisa-base-7b-v1創建的。它主要由MADLAD-400 JA/EN樣本的DSIR採樣組成,比例為90%/10%。
- Downloads: 42
- yubo0306/fed_ja
- 這是使用 Google Cloud Translate API v2 將 FED 數據集翻譯為日語的數據集。
- Downloads: 42
- aixsatoshi/Swallow-MX-chatbot-DPO
- 從Chatbot Arena Conversations的質問中選擇了aixsatoshi/Swallow-MX-8x7b-NVE-chatvector-Mixtral-instruct-v2模型來生成回覆。質問文使用了以下模型的Prompt部分,請參考以下引用。
- Downloads: 41
- mpasila/ParallelFiction-Ja_En-100k-json
- 這是我將 NilanE/ParallelFiction-Ja_En-100k 轉換為可以在訓練模型時被 text-generation-webui 讀取的 json 格式。
- Downloads: 41
- toshi456/ViQuAE-JA
- 這個數據集是通過將"ViQuAE"機器翻譯為日語而創建的。
- Downloads: 41
- hpprc/quiz-no-mori
- 這是收錄了截至2024年8月5日時點可取得並且二次利用許可等級為「自由」的杜様網站中刊載的問答之資料集。
- Downloads: 41
- cc-clean/CC-MAIN-2019-51
- CC-MAIN-2019-51歡迎您。這個資料集是從一個名為CommonCrawler的資源中提取出的僅含日語的資料。
- Downloads: 41
- noname0202/merged-ja
- 將該資料集中256個字元以下的行抽取出來並進行合併。
- Downloads: 41
- cc-clean/CC-MAIN-2019-49
- 歡迎來到CC-MAIN-2019-49。這個資料集是從名為CommonCrawler的資料中提取出的日語部分。
- Downloads: 41
- den2nova/den2niji
- LoRA數據集公開使用資料。
- Downloads: 40
- shi3z/Qarasu_Wikipedia_multiturn_human_gpt_10K
- 日本多輪對話數據是使用基於維基百科數據的Qarasu14B生成的。
- Downloads: 40
- Verah/tatoeba_dedupe_en-jp_2024-March-01
- 從https://tatoeba.org/en/downloads取出的英語 - 日語對,然後去除重複的條目。
- Downloads: 40
- wolf4032/token-classification-japanese-search-local-cuisine
- 這是一個包含搜尋烹飪食譜問句和問句中包含的搜尋關鍵字信息的資料庫。固有表現類型有以下四種。
- Downloads: 40
- toshi456/NLVR-JA
- 這個數據集是通過機器將"nlvr"翻譯成日語創建的。nlvr數據集鏈接:https://github.com/lil-lab/nlvr/tree/master/nlvr
- Downloads: 40
- iam-ajaymeena/Self-Instruct-Japanese-Elzya-13B
- 使用開源模型elyza / ELYZA-japanese-Llama-2-13b-instruct生成的日本語數據集。
- Downloads: 40
- Aratako/Synthetic-JP-EN-Coding-Dataset-Magpie-69k
- Synthetic-JP-EN-Coding-Dataset-Magpie-69k 是應用 Magpie 方法於不同模型並創建的約 69,000 條日語和英語編碼對話數據集。
- Downloads: 40
- FrancophonIA/Jibiki_fr_ja
- 數據集來源:https://jibiki.fr/data/ 描述Jibiki.fr 這個項目的目標是通過協作建立一個高質量且涵蓋廣泛的法語-日語詞典,以及一個對齊的雙語語料庫。
- Downloads: 40
- oshizo/LawClustering-ja
- 埋嵌模型的訓練和評估所需的聚類數據集。
- Downloads: 40
- toshi456/Rakuten-Alpaca-Data-32K
- 在進行數據生成時,我們使用了有熱心人士製作的seed_tasks_japanese.jsonl作為SEED數據。
- Downloads: 40
- tzmtwtr/tw-posts-japanese
- 數據製作者(t_w)
- Downloads: 40
- Nexdata/Japanese_Conversational_Speech_by_Mobile_Phone
- 他們就許多指定主題進行自由討論,涉及各種領域;他們的語氣自然流暢,符合實際對話現場。
- Downloads: 39
- masajek/openassistant-guanaco-ja
- 這個資料集是開放助理資料集的一部分,只包含日語對話。
- Downloads: 39
- RyokoExtra/JapaneseGoblin
- 數據集摘要:JapaneseGoblin 是 en.touhouwiki.net 維基百科的傾印。
- Downloads: 39
- U23-lab/wiki40b_qa_ja
- 從wiki40b-ja生成的問答資料集
- Downloads: 39
- Kendamarron/pret-a-porter-instruction-v0.1
- 這是通過手動檢查和修正開源LLM輸出的指令,使用Swallow-MX生成輸出的數據集。
- Downloads: 39
- ryota39/open_preference_v0.2
- 公開的RLHF日本數據集在建立獎勵模型方面已經重新格式化為分類任務。日本文本的質量有些低,這是由於合成生成文本和機器翻譯API的組合所導致的。細節如下:重新格式化的開放偏好數據集v0.1標籤1代表選擇的
- Downloads: 39
- iam-ajaymeena/Self-Instruct-Japanese-Qwen1.5-14B
- 使用 Qwen/Qwen1.5-14B 模型生成的日本資料集。
- Downloads: 39
- hpprc/quiz-works
- 這是包含了2024年8月4日至8月5日期間在Quiz Works網站上可以取得的問答的資料集。
- Downloads: 39
- if001/elementray_m
- 利用calm3-22b建立了一個包含簡單日文例句的數據集。
- Downloads: 39
- if001/elementray_small
- 這裏有更多的創建內容:https://huggingface.co/datasets/if001/elementray_m,這是使用 calm3-22b 模型創建簡單的日文例句的數據集。
- Downloads: 39
- Rio-Rf/oscar_2023_filtered_and_ai_text_filtered
- 人類製作的文本(OSCAR)和LLM生成的文本(GPT-3.5 Turbo)組成的數據集,用於驗證LLM生成的日文文本的檢測性能。有關詳細信息,請參考以下代碼:https://github.com/Rio-Rf/Lab-CreateDataset
- Downloads: 39
- Aratako/Open-Platypus-Japanese-masked-formatted
- 這是一個將Open-Platypus-Japanese-masked的格式化數據轉換為OpenAI messages形式的數據集。
- Downloads: 39
- hama-jp/magpie-qwen-turbo-27k
- Magpie-Qwen-Turbo-27k Aratako/Magpie-Tanuki-8B-annotated-96k 的標註資料中,利用了標註來減少條目數量,並以qwen-2.5-turbo進行重新生成,產生了包含26728個條目的SFT子集。
- Downloads: 39
- longisland3/NMLE
- 醫師國家考試數據集(NMLE數據集)首先,我沒有找到這個資料集(可能是因為我查詢不足),所以我決定公開這個醫師國家考試數據集。作為一名醫生和AI工程師,我認為醫師國家考試的數
- Downloads: 39
- fufufukakaka/pokemon_battle_team_dataset_regulation_f
- 這是一個記錄了寶可夢(VGC)的F規則賽事選出數據的數據集。
- Downloads: 39
- GENIAC-Team-Ozaki/chatbot-arena-ja-calm2-7b-chat-experimental_deduped
- 從chatbot-arena-ja-calm2-7b-chat數據集中刪除了與prompt匹配的數據。
- Downloads: 39
- tzmtwtr/tw-posts-japanese-v2
- 資料製作者(t_w)
- Downloads: 39
- Miwa-Keita/zenz-v2.5-dataset
- zenz-v2.5數據集是為了專注於假名漢字轉換任務而建立的條件語言模型"zenz-v2.5"系列的訓練目的而構建的數據集。
- Downloads: 39
- HachiML/Evol-Alpaca-gen3-500
- Evol-Alpaca-gen3-500是使用Evol-Instruction的mistralai/Mixtral-8x22B-Instruct-v0.1方法來將Stanford Alpaca的seed tasks日語化後產生的合成數據(Synthetic data)。
- Downloads: 38
- YANS-official/ogiri-test
- 從資料集導入導入對資料庫進行導入from datasets import load_dataset。 資料集= load_dataset("YANS-official/ogiri-test", split="test") 概觀 大喜利投稿網站Bokete的爬蟲數據。
- Downloads: 38
- Aihometr/anime-your-name
- 這個數據集是使用 AI Gemini 2.0 快閃實驗版從原始的字幕格式創建的。
- Downloads: 38
- Hoshikuzu/Tanaka-corpus
- 更多資訊請參閱以下網站!
- Downloads: 38
- mpasila/ParallelFiction-Ja_En-100k-alpaca-4k-context
- 這是 NilanE/ParallelFiction-Ja_En-100k 的修改版本,已轉換為 Alpaca 格式。
- Downloads: 38
- MilosNaniwa/WarChestDojo
- 資料集中的每個鍵及其說明: state_id: 用於唯一識別遊戲狀態的ID。
- Downloads: 38
- MakiAi/Tokama_Club_QA
- 東方托卡瑪克俱樂部 資料集概要這資料集是關於東方Project的托卡瑪克俱樂部所收集的資訊。
- Downloads: 38
- turing-motors/LLaVA-Instruct-150K-JA
- 數據集詳情數據集類型:Japanese LLaVA Instruct 150K 是原始 LLaVA Visual Instruct 150K 數據集的本地化版本。
- Downloads: 38
- Sunbread/SyosetuNames-3.5M
- SyosetuNames-3.5M:日本輕小說角色名稱語料庫概述 這個資料集從日本輕小說平台「小說家になろう」(syosetu.com)上公開的小說文本中提取虛構角色名稱。
- Downloads: 38
- p1atdev/fake-news-jp
- 日本語假新聞資料集 日本語假新聞資料集 轉換為 HuggingFace datasets 的格式。
- Downloads: 37
- Nexdata/Japanese-English_Parallel_Corpus_Data
- 有關更多詳細資訊,請參考以下連結:https://www.nexdata.ai/datasets/153?
- Downloads: 37
- saillab/alpaca_japanese_taco
- 這個存儲庫包含了 TaCo 論文中使用的數據集。
- Downloads: 37
- ryota39/open_preference-v0.3
- 在日本公共领域的RLHF数据集中,奖励模型的构建已重新格式化为分类任务。
- Downloads: 37
- DataPilot/Generated-dataset-by-deepseek-v2.5
- 摘要:這個資料集是使用null-instruct-ja和DeepSeek-v2.5的q4合成而成的。
- Downloads: 37
- EQUES/YakugakuQA
- YakugakuQA 是一個問答資料集,包含了 13 年(2012-2024)。
- Downloads: 37
- U23-lab/everyday_conversations_ja
- 這個資料集是將 HuggingFaceTB/everyday-conversations-llama3.1-2k 透過機器翻譯翻譯成日語的版本。
- Downloads: 37
- YANS-official/senryu-marusen
- 從數據集導入資料集中的讀取方法:from datasets import load_dataset dataset = load_dataset("YANS-official/senryu-marusen", split="train")。這是關於每月在國內最大的俳句投稿網站「俳句投稿まるせん」上有一萬句以上投稿的爬蟲數據。
- Downloads: 37
- YANS-official/ogiri-keitai
- NHK 定期播放的節目《接到便來電!》的大綱
- Downloads: 37
- AlienKevin/ndlbib-furigana
- 國立國會圖書館的書目資料製作的振り仮名數據集。
- Downloads: 37
- RJZ/ConceptNetSyntheticPhi3Text_ja
- 必須涵蓋所有信息,並以日語輸出。
- Downloads: 37
- tellarin-ai/ntx_llm_inst_japanese
- 有關於原始的NTX數據集詳細信息,包括轉換為Aya指令格式,或更多詳細信息,請參考指令形式的完整數據集(https://huggingface.co/datasets/tellarin-ai/ntx_llm_instructions)。
- Downloads: 37
- izumi-lab/sciq-ja-mbartm2m
- 資料集描述:這是 sciq 的日文翻譯版本。
- Downloads: 37
- izumi-lab/piqa-ja-mbartm2m
- 數據集描述:這是 piqa 的日文翻譯版本。
- Downloads: 37
- Coaso/test-dolly-15ja-for-stftrainer
- 這只是一組 dolly-15k-jp 的數據集(*1)。
- Downloads: 36
- JapanDegitalMaterial/Scenery_of_japan
- 日本的風光。
- Downloads: 36
- Nexdata/Japanese_Pronunciation_Dictionary
- 所有的詞語和發音均為日本語言學者所提供。
- Downloads: 36
- kenkensz9/kenkensz9_1242tw2
- 此資料集是由作者本人在推特上發表的特別優秀的帖子(後文有詳述)組成。
- Downloads: 36
- DataPilot/in-foxhound-ja
- 概要:這個數據集是由glaive-ai公開的in-foxhound資料集,並使用KUJIRA來進行日語翻譯。
- Downloads: 36
- weblab-GENIAC/OpenBookQA-Japanese-masked
- 在同意以下條件之後,將下載公開的模型和數據集等(以下稱為「本內容」)。
- Downloads: 36
- kanhatakeyama/multiturn-conv-from-aozora-bunko
- 基於從青空文庫中隨機抽取的文本生成了Calm3-22B-chat自動生成的多輪對話數據。生成碼:我輩は猫である 限定ver 輕微清潔。
- Downloads: 36
- weblab-GENIAC/jhellaswag
- 在同意以下條件的情況下,您可以下載公開的模型和數據集(以下稱為「本內容」)。
- Downloads: 36
- kanhatakeyama/CreativeCommons-RAG-QA-Mixtral8x22b
- 以下文本是從隨機抽取的日文文本數據源中生成的RAG格式問答,並非作為Wikibooks、Wikipedia案例數據指導資料集,而是用於事前訓練以進行質疑回答。在某些計算過程中使用了東京工業大學的超級計算機TSUBAME4.0。
- Downloads: 36
- lissette/Nanami-Chiaki-audio
- 彈丸論破的七海千秋語音數據
- Downloads: 36
- FreedomIntelligence/MMLU_Japanese
- MMLU数据集的日文版本已由gpt-3.5-turbo翻译完成。
- Downloads: 36
- takosama/databricks-dolly-15k-ja-google-trans
- 這個存儲庫是 Databricks 開發的 Dolly 專案的日語翻譯版。
- Downloads: 36
- kanhatakeyama/AutoWikiQA
- 自動生成Mixtral 8x22b的GGUF(5位元)基於Wikipedia日文版的Q&A,我們使用Wikipedia日文版的文章以及自動生成程式碼1和自動生成程式碼2來創建Q&A。我們使用東京工業大學的超級計算機TSUBAME4.0進行計算。請注意,答案中可能包含幻想等元素,可能需要進行
- Downloads: 35
- Inoichan/NuminaMath-Enhanced-CoT-JA-50K
- NuminaMath 增強版 CoT 資料集 (日本 50k 子集)
- Downloads: 35
- weblab-GENIAC/jwinogrande
- 在同意以下條件的前提下,將會下載公開的模型、數據集等(以下稱為「本內容」)。
- Downloads: 35
- weblab-GENIAC/jbbh
- 在同意以下條件之後,將會下載公開的模型和數據集等內容(以下稱為「本內容」)。
- Downloads: 35
- weblab-GENIAC/jarc
- 我將同意下列條件,並且將會下載已發佈的模型和數據集等(以下稱為「本內容」)。
- Downloads: 35
- toshi456/LLaVA-JP-Instruct-108K
- 數據集詳情 數據集類型:
- Downloads: 35
- GENIAC-Team-Ozaki/WikiHowNFQA-ja
- Lurunchik/WikiHowNFQA 是一個已翻譯成日文的資料集。
- Downloads: 35
- hpprc/mmarco-ja
- mmarco數據集中關於query--passage對的數據集,已經根據query作為鍵值刪除了重複的數據。
- Downloads: 35
- sergicalsix/Japanese_NER_Data_Hub
- 大綱:這是為大規模語言模型(LLM)所設計的專有名詞識別數據集(J-NER)的存儲庫。
- Downloads: 34
- Kendamarron/jimba-instruction-simplify-200
- 這是從 Kendamarron/jimba-instuction-1k-beta 教學資料中挑選出 200 個較簡單的任務,並重新寫成的資料集。
- Downloads: 34
- Calvin-Xu/FLFL-Aozora-Speech-Train
- Calvin-Xu / Furigana-Aozora-Speech的更加積極地清理版本,包括從原始數據生成的3,361,443條目中的2,536,041條目。這些數據集可從此GitHub頁面獲取:https://github.com/ndl-lab/hurigana-speech-corpus-aozora。
- Downloads: 34
- ltvmoon/opusbook_ja_en
- 語言:jp en 標籤:翻譯 許可證:cc-by-4.0
- Downloads: 34
- CausalLM/GPT-4-Self-Instruct-Japanese
- 抱歉,這個在 Hugging Face 上已經不提供了。
- Downloads: 34
- p1atdev/oiocha
- 嗨~這是「お~いお茶新俳句大賞」的獲獎作品資料集,包含221首俳句,其中大約有200首附有作者和評委的評論。
- Downloads: 34
- BigleBomb/japanese-vet-terms
- 獸醫學日語數據集 這個數據集包含了用日語紀錄的獸醫學術語的音頻文件,按療法、疾病和症狀進行了分類。
- Downloads: 33
- aipracticecafe/wataoshi-dialogues-rp
- 這個資料集是關於《我的推し是壞女主角》的。
- Downloads: 33
- pokutuna/tasks-ime-and-kakko-jp
- 東京大學松尾・岩澤研究室(松尾研)於 2024 年舉辦的 Deep Learning 應用課程中,擬由 @pokutuna 所創建的模型為了克服其薄弱問題而創建了類似 IME 及括號分析任務的變化任務。
- Downloads: 26
- davidstap/kanji_definitions
- KanjiVG 的 PNG 圖像與文本描述。這個數據集是由 Ulrich Apel 改編而成。
- Downloads: 24
- oshizo/japanese-text-image-retrieval-train
- shunk031/JDocQA訓練集中包含的PDF數據被轉換為圖像,並與使用NDLOCR進行OCR的文本匹配,形成的數據集。
- Downloads: 12
- kurogane/DSR1D-qwen-2.5-32B-aya-ja-1k-generated
- DSR1D-qwen-2.5-32B-aya-ja-1k-generated 這是使用 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B,生成 weblab-GENIAC/aya-ja-evol-instruct-calm3-dpo-masked 的前1000個回應,最大新標記為3060。
- Downloads: 12
- kajuma/ABEJA-CC-JA
- ABEJA-CC-JA 這個資料集是 https://registry.opendata.aws/abeja-cc-ja/ 的 HF 鏡像。請參考 https://tech-blog.abeja.asia/entry/abeja-cc-ja-202409。這個資料集是 https://registry.opendata.aws/abeja-cc-ja/ 的HF鏡像。
- Downloads: 154
- Aratako/magpie-qwen2.5-32b-reasoning-100k-formatted
- 喜鵲-qwen2.5-32b-推理-100k-格式化的DeL-TaiseiOzaki/喜鵲-qwen2.5-32b-推理-100k是轉換為OpenAI訊息格式的資料集。
- Downloads: 51
- Marianoleiras/voxpopuli_es-ja
- 數據集摘要 這個數據集是為了自動語音識別(ASR)和翻譯任務而設計,能夠將西班牙語音轉換為日文文字。
- Downloads: 254
- numad/yuho-text-2024
- 每个记录的URL列将成为引用来源。
- Downloads: 32
- hpprc/kaken-translations-ja-en
- llm-jp-corpus-v3中的Kaken子集中的日文文本是使用Qwen/Qwen2.5-32B-Instruct進行從日文到英文的翻譯資料集。
- Downloads: 365
- alfredplpl/commoncatalog-cc-by-ext
- CommonCatalog CC-BY 擴展 此存儲庫擴展了CommonCatalog CC-BY,並添加了額外的信息。
- Downloads: 44
- ikedachin/CC-news-2024-October-cleaned-sft-1204
- 根據 kajuma/CC-news-2024-July-October-cleaned,提取了只包含十月份新聞的資料集。
- Downloads: 32
- litagin/reazon-speech-v2-denoised
- Reazon Speech v2經過去噪版本 使用UVR去除背景音樂和雜音的這個數據集的鏡像。
- Downloads: 8,174
- NekoFi/whisper_toku
- 數據集描述
- Downloads: 145
- DeL-TaiseiOzaki/reasoning-finetuning-ja
- 日本語指示・推論・回答データセット 概要 本資料庫是基於SkunkworksAI/reasoning-0.01中的指示資料,使用Qwen/Qwen2.5-32B-Instruct 模型製作的日本語版本指示・推論・回答資料集。
- Downloads: 59
- sode-k/txt_suicidality
- 使用Wrime-v1的部分文本,以及基於OpenAI生成的文章為基礎,通過tohoku-nlp/bert-base-japanese-whole-word-masking進行了tokenization,以便在有上下文的情況下合成新的文章。
- Downloads: 49
- DeL-TaiseiOzaki/magpie-qwen2.5-32b-reasoning-100k
- 合成日本語指示數據集概要。該數據集是一個大型語言模型(Qwen2.5-32B-instruct)。
- Downloads: 37
- p1atdev/ichikara-instruction
- ichikara-指引(非商業用途)LLM的日文指引数据 將從公開頁面上取得,在言語處理學會第30屆年度大會上進行發表。
- Downloads: 117
- hotchpotch/jaqket_v1_qa_wikija_context
- AI王 公式分發資料集(JAQKET)中包含了添加了維基百科內容的資料集。
- Downloads: 13
- litagin/ehehe-corpus
- 在使用此數據集時,您需同意許可協議的條款。
- Downloads: 32
- Aratako/Synthetic-Japanese-Roleplay-gpt-4o-mini-19.8k
- 合成-日本語-角色扮演-gpt-4o-mini-19.8k 摘要 這是一個包含約19800個由gpt-4o-mini生成的日本語角色扮演對話的綜合數據集。
- Downloads: 63
- Aratako/Synthetic-Japanese-Roleplay-gpt-4o-mini-19.8k-formatted
- 這是使用gpt-4o-mini建立的日文角色扮演數據集Aratako/Synthetic-Japanese-Roleplay-gpt-4o-mini-19.8k,並添加系統訊息進行整理的資料集。
- Downloads: 12
- sin2piusc/jgca_v2_50k_2
- 常見聲音,谷歌fleurs,JSUTv1.1,JAS_v2(joujiboi/japanese-anime-speech-v2)
- Downloads: 11
- Aratako/Synthetic-JP-EN-Coding-Dataset-567k
- Synthetic-JP-EN-Coding-Dataset-567k 是由 Magpie 創建的代碼 SFT 數據集。它是在基於 Aratako/Synthetic-JP-EN-Coding-Dataset-Magpie-69k 的基礎上,使用類似 Evol-Instruct 的方法生成多個指令和回應並擴展而成的,用於日英混合共計 567,077 條代碼 SFT 的合成數
- Downloads: 153
- misdelivery/OpenMathInstruct-ja-phi-3-medium-test
- 根植/OpenMathInstruct-1-1.8m-ja 的 question_ja 為基礎,使用 phi-3-medium 生成的資料集,不需要使用程式語言的形式。
- Downloads: 12