一行Python代码从图像读取文本

发布时间：2021-03-05 12:58:42 所属栏目：动态来源：互联网

导读：真的很难。在某种程度上，我们是天造地设的一对。至少现在是这样。虽然图像分类和涉及到一定程度计算机视觉的任务可能需要大量的代码和扎实的理解，但是从格式良好的图像中读取文本在Python中却是简单的，并且可以应用于许多现实生活中的问题。在今天的帖

真的很难。在某种程度上，我们是天造地设的一对。至少现在是这样。

虽然图像分类和涉及到一定程度计算机视觉的任务可能需要大量的代码和扎实的理解，但是从格式良好的图像中读取文本在Python中却是简单的，并且可以应用于许多现实生活中的问题。

在今天的帖子中，我想证明这一点。虽然会安装一些库，但不会花很多时间。这些是你需要的库:

OpenCV

现在，这个库将只用于加载图像，实际上你不需要事先对它有太多了解(尽管它可能有帮助，你将看到为什么)。

根据官方文件:

OpenCV(开源计算机视觉库)是一个开源的计算机视觉和机器学习软件库。OpenCV的目的是为计算机视觉应用提供一个通用的基础结构，并加速机器感知在商业产品中的使用。OpenCV是bsd许可的产品，OpenCV使企业可以轻松地使用和修改代码

简而言之，你可以使用OpenCV来做任何类型的图像转换，这是一个相当简单的库。

如果你还没有安装它，那么它将只是终端中的一行：

不多就是这样。在此之前，一切都很简单，但这种情况即将改变。

PyTesseract

这个库到底是什么东西?根据维基百科:

Tesseract是用于各种操作系统的光学字符识别引擎。它是免费软件，根据Apache许可2.0版发布，自2006年以来由Google赞助开发。

我敢肯定，现在有更多复杂的库可用，但是我发现这个库运行良好。根据我自己的经验，该库应该能够从任何图像中读取文本，但前提是该字体不会使你连连看都看不懂。

如果无法从你的图像中读取文字，花更多的时间使用OpenCV，应用各种过滤器使文本高亮。

现在安装在底部有些麻烦。如果你使用的是Linux，则全部归结为几个sudo-apt ge

（编辑：宣城站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

中科院地球大数据研究	稳定性和可靠性测试在
政策助力5G全连接工厂	国产GPU厂商加入中国头