一个基于 Google Gemini 2.0的高精度 OCR 文字识别应用,支持多国语言和手写字体识别。
- 🚀 高精度文字识别
- 🌍 支持多国语言识别
- ✍️ 支持手写字体识别
- 🎨 优雅的渐变动画效果
- 📱 响应式设计,支持移动端
- 🖼️ 多种图片输入方式:
- 文件上传
- 拖拽上传
- 粘贴板上传
- 图片链接上传
本项目使用 Vercel 进行部署。在部署时需要设置以下环境变量:
GEMINI_API_KEY
: Google Gemini API 密钥
- Node.js 16.x 或更高版本
- npm 或 yarn
- 克隆项目
git clone https://github.com/your-username/ocr-app.git
cd ocr-app
- 安装依赖
npm install
# 或
yarn install
- 配置环境变量
创建
.env.local
文件并添加以下配置:
REACT_APP_GEMINI_API_KEY=your_api_key_here
- 启动开发服务器
npm start
# 或
yarn start
访问 http://localhost:3000 即可看到应用。
- React.js
- Google Gemini Vision API
- CSS3 动画
- React Markdown
- Vercel 部署
- 支持拖拽上传
- 支持粘贴上传(包括截图和图片文件)
- 支持图片链接上传
- 支持多图片批量上传
- 实时流式输出
- 优雅的渐变动画效果
- 支持多国语言
- 支持手写体识别
- 自动优化排版格式
- 支持 Markdown 格式
- 一键复制识别结果
- 图片预览功能
- 多图片导航切换
- 请确保您的 Google Gemini API 密钥有足够的配额
- 图片链接需要允许跨域访问
- 建议上传清晰的图片以获得最佳识别效果
MIT License