可以获取(提取)文档的文字内容吗?(info=0)
可以!

info=0:获取文件信息。高级版,应用场景为:可提前获取文件的页面、文字内容等,提取到自己的数据库中,然后以便用户检索。返回值为json数据。有如下值:
Word、PDF返回:文件名、文件大小、总页数、总字数、创建时间、修改时间、文字。
Excel返回:文件名、文件大小、工作表个数,创建时间、修改时间、各工作表名称。
PowerPoint返回:文件名、文件大小、幻灯片页数、创建时间、修改时间、各幻灯片大纲(主标题)

返回的结果为Json数据,形如:
{"FileName":"关于加快临时设施建设速度和保证建设标准的通知","FileSize":767956,"PageCount":3,"WordCount":678,"CreateTime":"2014/4/13 14:59:00","LastTime":"2015/8/12 16:42:00","Text":"中铁十九局集团第十工程有限公司 京沪高铁十标段九项目部文件 部计字〔2010〕9号 各"}



words:在info=0的情况下配合使用,返回Word、PDF、PPT中正文内容的字数,为0或省略,则返回全部文字。

关键词:获取文字 提取 json
客户服务支持 029-68095586 商务在线咨询 029-68095589 关注我们

Copyright © 2014-2024 西安大西信息科技有限公司陕ICP备15006746号 陕公网安备61019002002764号
地址: 西安市高新区唐兴路6号唐兴数码大厦302/306  Email:service@officeweb365.com 快书编标 公告 帮助