-
Notifications
You must be signed in to change notification settings - Fork 7.9k
This issue was moved to a discussion.
You can continue the conversation there. Go to discussion →
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
新增需求征集(Collect Feature Request) #10334
Comments
范例: example: |
需求描述: |
需求描述: |
需求描述: |
需求描述: |
需求描述:一个支持简繁英日的东亚模型 |
需求描述:表格结构提取 |
需求描述:古籍识别 |
范例:
|
Scene Text Recognition with Permuted Autoregressive Sequence Models,即parseq 文本识别算法效果不错,有没有在paddleOCR上实现。 |
需求描述:PaddleOCR与PaddleDetection与Pillow新版本10.x不兼容。目前PaddleOCR采用的临时解决方案是在依赖列表中限制只能使用旧版本Pillow(参见 #10344 ),而PaddleDetection未采取任何措施(按照文档安装后,使用 需求场景: 目前已发现涉及使用字体的相关场景存在此问题。 潜在解决方案:
|
需求描述: |
需求描述: |
你好,我基于paddleocr转换了模型,重构了推理代码,可脱离paddlepaddle训练框架,在精度不变的情况下效率和推理速度都提高了:https://github.com/jingsongliujing/OnnxOCR |
你好,这个可以提交PR到我们的repo中吗?@jingsongliujing |
后续是这样,但是不知道提交到那个repo |
看上去你已经实现了相关功能,请问为什么使用不方便呢? 欢迎给我们贡献相关代码。 |
请求新增针对给定图片的语言进行判定的模型。例如对于包含日文的图判定为 这个特性的实际意义是,在进行ocr任务的时候,可以对检测到的区域的语言进行判定,以便自动选用合适的文本识别模型,这样即可比较优雅地完成针对任意多语言的ocr任务。 当然,更进一步,可以针对给定的图片进行进一步的拆分,将各个子区域的语言均给出预测,这样甚至可以做到对复杂的多语言混合内容(比如日语、俄语、中文、英文混合的情况)进行准确地识别。 BTW:实际上直接训练一个支持现有主要语言的检测和识别模型也同样可以解决此问题。 |
需要来回注释代码,个人再去改命令行的代码改动的位置可能有点多,能力有限,代码效率不一定好;建议官方增加一个命令行参数,传入仅需要识别的字符(字符串或者类似dict.txt字典文件的样子)这样来用更方便。 |
基于昆仑芯R200适配PaddleOCR |
你好,使用新增数据进行增量训练之后,模型本身的识别能力会严重下降吗? |
识别后的文字根据原文恢复排版,去除拍照造成的同一行字Y轴不同的现象。 |
可以微调,减少轮数/学习率, |
我们已经支持返回单字识别的坐标了,可以基于这个#10515 ,使用自己的字体恢复了。 |
|
需求描述:PPOCRLabel工具在表格结构识别标注的功能中,增加对单元格标注框类别class label的标注功能 |
#10404 ,这个issue看回复说登记到需求池里面了,点击进来没看到,再update一下~ 需求描述:KIE (SER和RE两个任务)支持长度大于512的文档infer |
需求描述:c++版本tensorRT的demo每次运行都要大量时间构建trt-engine,期望提供一个临时cache文件夹,固化保存 |
带文字的图像矫正模型,可以矫正任意角度的图片 |
请问现在有技术去实现吗 |
范例: |
需求描述:希望能在apple m2上可以完全运行 |
需求描述:自然场景下的繁体字识别(chinese_cht_PP-OCRv3对于一些自然场景中的文字识别的不够准确) |
需求描述:基于C#预测引擎推理部署 |
需求描述:国际化切换后文本布局对比。 |
不知道是什么语种的时候希望加一个自动识别语言的多语言模型 |
This issue was moved to a discussion.
You can continue the conversation there. Go to discussion →
我们将这个Issue 保持开放状态,以收集用户的功能请求并听取您的声音。我们的发布计划将在不同的问题上进行更新。
在这个Issue中,您可以:
We keep this issue open to collect feature requests from users and hear your voice. Our release plan will be updated on different issues.
In this issue, you can either:
The text was updated successfully, but these errors were encountered: