Skip to content

Latest commit

 

History

History
75 lines (72 loc) · 2.35 KB

info-extract.md

File metadata and controls

75 lines (72 loc) · 2.35 KB
类别 大模型 信息抽取能力 排名
商用 360gpt-turbo(new) 97.0 1
开源 deepseek-chat-v3 97.0 2
商用 abab7-chat-preview 96.3 3
商用 gemini-2.0-flash-exp(new) 96.3 4
商用 gpt-4o 96.3 5
商用 ERNIE-4.0-Turbo-8K 94.8 6
商用 Claude-3.5-Sonnet 94.8 7
开源 Llama-3.3-70B-Instruct(new) 94.8 8
商用 Baichuan4 94.1 9
开源 qwen2.5-32b-instruct 94.1 10
开源 phi-4(new) 93.3 11
商用 gpt-4o-mini 93.3 12
商用 GLM-4-Long 93.3 13
商用 step-1-8k(new) 93.3 14
商用 Baichuan4-Turbo 93.3 15
开源 gemma-2-27b-it 93.3 16
商用 xunfei-spark-max 92.0 17
商用 GLM-4-Plus 91.9 18
商用 Baichuan4-Air 91.9 19
商用 GLM-4-Air 91.9 20
商用 GLM-4-AirX 91.9 21
商用 360gpt2-pro(new) 91.9 22
开源 Meta-Llama-3.1-405B-Instruct 90.4 23
商用 gemini-1.5-flash-8b(new) 90.4 24
商用 gemini-1.5-pro 90.4 25
商用 SenseChat-5 90.4 26
开源 qwen2.5-14b-instruct 90.4 27
开源 internlm2_5-20b-chat 90.4 28
商用 yi-lightning 90.4 29
商用 360gpt-pro(new) 90.4 30
商用 hunyuan-standard 89.6 31
商用 ERNIE-3.5-8K 89.6 32
商用 gemini-1.0-pro 89.6 33
商用 qwen-plus 89.6 34
商用 ERNIE-4.0 89.0 35
商用 qwen-max 88.9 36
开源 Llama-3.1-70B-Instruct 88.9 37
商用 hunyuan-large 88.9 38
商用 Doubao-pro-32k 88.1 39
商用 ERNIE-Speed-8K 88.1 40
开源 qwen2.5-7b-instruct 88.1 41
商用 abab6.5s-chat 88.0 42
商用 gemini-1.5-flash 87.4 43
开源 qwen2.5-72b-instruct 87.4 44
商用 Doubao-lite-32k 86.7 45
商用 GLM4 86.7 46
商用 qwen-long 85.9 47
开源 Llama-3.1-8B-Instruct 85.2 48
商用 hunyuan-turbo 85.2 49
商用 step-1-flash(new) 85.2 50
商用 qwen-turbo 85.2 51
商用 moonshot-v1-8k 85.0 52
商用 xunfei-4.0Ultra 84.4 53
开源 internlm2_5-7b-chat 84.4 54
开源 Yi-1.5-34B-Chat 83.0 55
开源 Yi-1.5-9B-Chat 83.0 56
开源 glm-4-9b-chat 82.2 57
开源 gemma-2-9b-it 82.2 58
商用 xunfei-spark-pro 82.0 59
商用 GLM-4-Flash 80.0 60
商用 SenseChat-v4 78.5 61
商用 SenseChat-Turbo 77.8 62
开源 qwen2.5-3b-instruct 75.6 63
开源 qwen2.5-1.5b-instruct 71.9 64
开源 qwen2.5-0.5b-instruct 53.3 65
开源 qwen2.5-math-72b-instruct / 66
开源 qwq-32b-preview / 67
商用 o1-preview / 68
商用 o1-mini / 69

lin