Google Docs 推出 OCR 文字辨识功能,可自动撷取、转换 PDF、图片中的文字!

之前「Google程序夹格式」面市半个个新的效果,凡是我们在上传PDF程序夹格式档或图片时,若勾选「 将 PDF 档案或图片档案中的telegram中文ps文字转换为Google 程序夹格式」效果的话,在上传之後,会自动将PDF或图片里可不可以辨识的telegram中文ps文字撷拆下来,并记录在Google程序夹格式中让我们进第一步做编辑。

初步测试,以软体编制的PDF文件中的文字可以正常抓得到,而且还可支援中文文字辨识,正确率还不错。不过部分图片中的文字就无法顺利撷取,可能得再多试试看不同样本。尽管如此,还是相当方便!如果有需要将PDF转成一般文件来继续编辑的话,可以上传到Google Docs网站来试试看。

  • 网站名称:Google 文件(Google Docs)
  • 网站网址:
  • 使用方法:

    第1步  开启并登入Google Docs网站,按一下左上角的「上传」按钮。

    01 

     

    第2步  先按「请选取要上载的档案」选取你要上传的PDF文件档,然後勾选「将 PDF 档案或图片档案中的文字转换为Google 文件」这个项目,再按一下「开始上载」,将PDF文件档上传到Google Docs网站去。

    02 

     

    第3步  上传完成後,按一下档案名称,开启文件内容。

    03 

     

    第4步  如图,原本储存在PDF文件中的文字内容已经被撷取出来,并储存在Google Docs文件中让我们编辑了。

    任何一段文字正上方还会以图示的的方式附上原有的PDF文件夹内容,让我们比对检查有没错漏。 大体上任何一段文字方位的辨识技能还算能,不过转换後的文字排版与板面显卡配置、报表的部分就没法强求了。

    04 

    延伸阅读:

    1. Google Docs 线上简报档、PDF文件检视器
    2. 启用暗藏在Google Chrome中的「PDF阅读器」外挂
    3. Google小撇步:只找你要的PDF电子书、PowerPoint…等专业文件!

    其他常用软体telegram中文版下载:

    最後最新:07-30, 2013 下午三点 10:32 TAG:
    相关资讯

    访客留言:

    24 Replies to “Google Docs 推出 OCR 文字辨识功能,可自动撷取、转换 PDF、图片中的文字!”

    1. 唯有pdf里的繁体中文版能解算出来,应该是由於档案里面的文字框资料被获取出来,不只是OCR…唯有试试用繁体中文版的图档(tiff/jpg/png)就都知道。 跟据google的blog,OCR性能现在只协助拉丁语系。
    2. 想问问版大有没有用过〝Google Mapplet API〞

      我研究了好几天…但还是不太了解,希望能帮忙解答^^
      我最主要是想建立景点,变成小telegram中文,可供大家观看!!

    3. 怎样转都转不了来 = = 是不是适扫描压缩文件档有甚麽要点 ??

      另外 可否告知一下hp 送的那个软体叫甚麽名子
      一直以来我都是使用一个叫 jocr 的软体 (免费辨识率不错 操作麻烦了一点 )

    4. 用我扫瞄後的pdf档上传,直到无法辨识成就,几个小时了还有”上传中”???
    5. 然而是没有错的工作…必须让我们透过网路就行做转换施用…并非是很多人皆有hp的
    6. 想知道一般使用者
      如果是比较私人、内部的文件
      敢用google docs的比例有多高
      虽然我算g大神的爱用者
      不过当他在台湾拍街景时会顺便扫wifi基地台的资讯
      让我对这间公司不太放心

      虽然我买了android系统的手机
      gmail上也早就有我的通讯录
      但是让g社能够同时拥有mail -> 手机门号 -> 甚至本名+生日
      实在让我蛮恐惧的
      所以我的Android机是用空的gmail帐号
      然後完全关掉同步功能

    7. telegram 官网大,
      请问要是已经上传在doc里面的pdf档案也可以再转文字档吗?
      我找了好久找不到这个选项在哪…

    8. 所谓的辨识率还不错是指?
      我总觉得GOOGLE的辨识率会跟ACROBAT自己的辨识率差不多
      而且中文的辨识会远低於英文…

      PS迄今为止”个人用过”辨识最底的是HP扫描器附赠的软体XD
      1. 在设定选项下拉 後,选择帐户设定,然後出现DOCS的设定,就可一选择繁体中文语系了

    发布留言

    telegram中文版 telegram中文 telegram下载 电报中文版下载 telegram中文电脑版 telegram中文下载 纸飞机中文版 程序发生错误,错误消息:System.IO.IOException: 无法创建“E:\蚂蚁超级镜像站群\cache\telecnsr.com\telecnsr.com\7071\google-docs.html”,因为同名文件或目录已存在。 在 System.IO.__Error.WinIOError(Int32 errorCode, String maybeFullPath) 在 System.IO.Directory.InternalCreateDirectory(String fullPath, String path, Object dirSecurityObj, Boolean checkHost) 在 System.IO.Directory.InternalCreateDirectoryHelper(String path, Boolean checkHost) 在 SuperGroup.Core.Start.FileNotFoundHandle.d__2.＀䄀() --- 引发异常的上一位置中堆栈跟踪的末尾 --- 在 System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess(Task task) 在 System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task) 在 SuperGroup.Core.Start.FileNotFoundHandle.d__1.＀攀() --- 引发异常的上一位置中堆栈跟踪的末尾 --- 在 System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess(Task task) 在 System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task) 在 SuperGroup.Core.Bootstrapper.d__18.＀쌀()