Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！

2年前更新

02220

前段时间，微信 PC 端更新了一个 OCR 功能，能识别图片里的文字。

说实话，这应该是微信 10 年来推出的最实用功能之一了。

比如你用微信截图时，只要点击下方的「识别文字」，就可以获取截图里的文字。

图片[1]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

在微信里收到的图片，也支持你直接选取文字复制。

图片[2]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

除了功能实用，另一方面，微信早已成了电脑上必装软件，微信截图也是很多人默认截图工具。

所以微信 OCR 就好比系统功能一样，无需任何安装成本，以后遇到什么无法复制的文字，调出微信就好。

图片[3]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

一般来说，微信 OCR 是可以满足大部分人的需求。

但因为功能较基础，在一些特殊情况时，它就显得有点笨了。

比如你有很多文字需要识别，那就得一次次截图再一次次识别，再一次次复制。

或者你要 OCR 一段古诗，文字是纵向且自右向左，那微信识别出的顺序就会乱。

就在最近，趣哥发现了一款叫 Umi-OCR 的工具（支持 Win10&11 ）。

它的功能很强大，支持你批量识别图片、选择屏蔽区域、指定文字方向，微信能不到的它都能做到。

噢最关键的是，它免费开源，无需安装、无需网络，离线可用。

图片[4]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

简单给大家演示一下。

假如下面是一段要充钱才能复制的文字，我们点击软件的截图功能，然后把文字框住，0.73 秒后就能获得文字。

因为是本地运行，电脑性能越强，耗时会越短。

图片[5]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

和微信不同的是，Umi-OCR 自带了一个记录板，每次识别出的文字会出现在记录板，并一直保存。

这就是说，如果你有一堆要识别的文字，就可以像打连狙一样，连续截图。

截完所有的图片，记录板上也已经识别了所有文字。

到这时你再来复制粘贴啥的，会方便很多。

图片[6]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

当然还有一种情况，你本地里已经存好了所有的图片，那这就更方便了。

Umi-OCR 支持批量识别，如果说刚才是连狙，那么这个功能就是一键加特林。

直接扔几百张图片过去，剩下的交给 Umi-OCR。

图片[7]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

接着，记录板上就会出现一行行的文字。

与此同时，识别结果还会以 txt 文件保存起来，可以说一条龙服务齐全了。

图片[8]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

如果你不需要 txt，而是 md、jsonl 的格式，没关系它都支持。

图片[9]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

除了刚才说的这几项，Umi-OCR 还有一些细节功能，可以照顾到特殊情况。

举个例子，下面这个图你只想要正文里的那一句话，水印等其他无效信息不想要。

图片[10]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

要是一张图，你截图划一个区域就行了。

但要是有 100 张类似的图呢？

诶，这个软件支持你指定识别区域。

图片[11]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

只要你导入一张照片，然后选择一些要屏蔽的区域，那接下来所有同分辨率的图片，识别时就会自动屏蔽这些区域。

图片[12]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

这样批量识别出的结果，就只有我们想要的部分了。

图片[13]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

另外，Umi-OCR 还可以调整段落化。

什么意思呢，一般 OCR 段落识别是根据行距来的，行与行之间空隙大了，它就会判断为下一段。

图片[14]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

但如果遇到下面这样的特殊格式，一句话就是一段，距离很近，那 OCR 工具会把它们识别成一句话，合在一起。

比如微信识别出来是这样的。

图片[15]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

但 Umi-OCR 支持段落优化，不同的段落格式可以选择不同的设置，如单行优化、左对齐、自然段等等。

图片[16]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

遇到刚才的格式，就可以选择「优化单行」。

图片[17]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

其他的情况也都有对应的选项，下图供参考。

图片[18]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

最后，Umi-OCR 还支持更改文字识别方向。

比如你要识别一首古诗，只要选择一下「文字方向为纵向、从右到左」即可。

图片[19]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

对了有一点忘了提，除了支持中文、英文识别，通过导入多语言识别扩展包，Umi-OCR 还支持繁中、日、韩、俄、德、法等语言，链接会一起放在文末。

我知道，大家肯定关心它的识别准确率，我只能说表现尚可。

在第一张测试图里，趣哥就发现捂脸表情被识别成一个（，然后少了一个引号和一个句号。

图片[20]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

小表情识别成文字，这点错误各位应该可以接受，毕竟没多少文章像我们这样，写着写着塞点表情。

引号和句号丢失，我认为无伤大雅。

但除了这几个问题，Umi-OCR 也会识别错文字，比如把「毕竟」识别成了「华竟」。

图片[21]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

另外，趣哥建议各位不要用它识别一些粗体字，效果不太理想。

图片[22]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

当然，大家也不要因此拒绝使用 Umi-OCR，市面上就没有一家 OCR 工具敢保证 100% 准确率。

像刚才的古诗，Umi-OCR 错了最后一个字，但微信 OCR 识别下来，就没几个对的了。

图片[23]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

此外，微信 OCR 还会把粗体的 MVP 识别成 MUP。

图片[24]-Umi-OCR，基于Python的开源OCR工具，轻松实现批量图片转文字！-科技匣子

所以说，使用 OCR，不管你用的是哪家，都要做好会遇到识别错误的准备。趣哥是建议大家每次自己再简单检查一遍。

还是那句话，如果只是偶尔需要 OCR，那还是微信好。

但如果你的需求很大，很特殊，害怕泄露隐私啥的，那这款 Umi-OCR 更适合你。

Github下载：
https://github.com/hiroi-sora/Umi-OCR

蓝奏云下载：（请留意发布日期和版本号）
https://hiroi-sora.lanzoul.com/s/umi-ocr

THE END

相关推荐

评论抢沙发

欢迎您留下宝贵的见解！

提交

暂无评论内容