前段时间,有位同事跟我说,大部分PDF文字提取软件都是收费的,她每次都是使用微信语音把内容读出来后,转成文字,然后再编辑。她问我可以找到免费的不能?
免费的也许有,但是懒得找,因为你找的时间都可以做一个出来了。
请看下图:
这个工具很简单,采用的VB.NET开发,配合百度OCR,因为有的用户不允许使用外网,所以程序集成了内网版OCR识别,即使再没有外网的情况下也可以使用。
百度OCR提供的接口返回的是JSON数据,需要解析一下:
Dim Result = Client.GeneralBasic(image).ToString
Dim jsonObject As JObject = JObject.Parse(Result)
Dim jsonArray As JArray = JArray.Parse(jsonObject.SelectToken("words_result").ToString)
For Each item As JObject In jsonArray
abc = abc & item.SelectToken("words").ToString + vbCrLf
Next
评论区留言获取工具。
这种比网上上传图片转换那种方便多了。
根据指定区域获取文字信息