从图片中提取文字的免费 OCR 工具(支持中日英文)
使用 Tesseract OCR 引擎,从 PNG / JPEG 格式的图片中提取文本。支持中文、日文、英文混排。可从截图、照片、扫描文档、名片、票据中提取文字,并转换为可复制的文本。无需注册,完全免费。
什么是 OCR(光学字符识别)
OCR 是利用机器学习模型识别图片中的文字,并转换为可编辑文本的技术。可将手机拍摄的文档转为文字、从截图中复制文字、将纸质资料数字化,在图片与文字之间架起桥梁。
本工具采用由 Google 支持的开源 OCR 引擎 Tesseract(版本 5 系列)。内置日文训练数据 (`tesseract-ocr-jpn`),因此可以准确识别假名、汉字、字母数字混排的文本。
使用方法
1. 通过拖放上传图片(PNG / JPG / JPEG,Free 方案最大 20 MB) 2. 自动运行 OCR 处理,提取的文本会显示在下方 3. 复制文本粘贴到其他工具,或下载为 .txt / .md 文件
处理时间通常每页 3~10 秒,具体取决于文字量与图片分辨率。
提升识别精度的技巧
・**分辨率**: 推荐使用 300 DPI 以上的扫描件,或手机近距离拍摄的图片 ・**对比度**: 白底黑字识别精度最高。彩色背景或叠在照片上的文字精度会下降 ・**倾斜校正**: 拍摄时若文档发生倾斜,识别率会降低。建议先用手机 App 自动校正后再上传 ・**手写文字**: Tesseract 针对印刷体优化,不擅长手写体。手写较多的文档建议考虑专门的 AI OCR(如 Google Vision)
与其他工具的组合
OCR 提取的文本通常与其他工具组合使用价值更高。
例如:拍摄会议白板 → OCR 转为文字 → 通过 AI 会议纪要工具转换为结构化纪要的工作流。或者拍摄纸质文档 → OCR → 通过 AI 文档格式化工具整理为会议纪要 / 报告格式等。
本工具专注于「文字提取」,后续整理交由其他工具完成。