SoMark文档智能API
    • 使用说明
    • 插件使用说明
      • Coze插件
      • Dify插件
    • SoMark-同步解析
      POST
    • SoMark-异步解析-任务提交
      POST
    • SoMark-异步解析-结果查询
      POST

    使用说明

    SoMark文档智能解析接口说明(同步接口)#

    接口概述#

    SoMark文档解析的同步接口。

    使用限制#

    文件大小:单个文件最大支持200MB
    页数限制:单个文件最多300页
    频率限制:每次最多同时处理1篇文档,同时上传多篇会排队。(当前在Beta测试阶段,每个账号的QPS均为1)

    目前支持文档组件#

    中文名称英文标识符
    文字段text
    标题title
    图figure
    图例figure_caption
    表table
    表例table_caption
    页眉header
    页脚footer
    脚注footnote
    侧边栏sider
    目录cate
    目录条目cate_item
    代码块code
    选项choice
    填空blank
    二维码qrcode
    印章stamp
    参考文献reference
    公式equation
    化学结构式cs
    化学方程式cs_equation

    目前支持特色功能#

    SoMark 提供三项智能增强功能,可通过请求参数按需开启,全面提升文档解析质量。

    功能列表#

    功能名称参数字段说明
    文字跨页拼接enable_text_cross_page跨页文本合二为一,打通文本信息的跨页隔断。
    表格跨页拼接enable_table_cross_page跨页表格合二为一,数据呈现一览无余。
    标题层级识别enable_title_level_recognition智能识别标题等级,让文档结构一目了然。开启此功能可能会大幅延长解析耗时,请确认后再启用。
    注意:以上功能均默认关闭,需在请求时显式传入参数启用。

    使用方式#

    在同步或异步接口的请求体中,通过 extract_config 字段传入 JSON 字符串来启用特色功能(multipart/form-data):
    参数名类型说明
    extract_configstring (JSON)特色功能配置,值为 JSON 字符串
    extract_config JSON 结构:
    {
      "enable_text_cross_page": true,
      "enable_table_cross_page": true,
      "enable_title_level_recognition": true
    }

    示例代码#


    SoMark文档智能解析接口说明 (异步接口)#

    接口概述#

    SoMark提供一套异步接口进行文档解析,专门用于处理可能耗时较长的任务。与同步接口一次请求即返回结果不同,异步接口将解析过程分为两步:
    1.
    提交任务:您首先通过 任务提交 接口上传文件。服务器收到请求后,不会立即开始处理,而是将任务放入一个队列,并立即返回一个唯一的 task_id。
    2.
    查询结果:您需要使用这个 task_id,通过轮询(即每隔几秒调用一次)结果查询 接口来获取任务的最新状态。当任务处理完成后,该接口会返回最终的解析结果。
    这种模式的优点是,客户端无需长时间等待HTTP连接,可以避免请求超时,特别适合集成在需要后台处理的业务流程中。

    使用限制#

    文件大小:单个文件最大支持200MB
    页数限制:单个文件最多300页
    频率限制:每次最多同时处理1篇文档,同时上传多篇会排队。(当前在Beta测试阶段,每个账号的QPS均为1)

    目前支持文档组件#

    同上面的同步说明部分

    目前支持特色功能#

    同上面的同步说明部分

    示例代码#

    以下 Python 代码演示了完整的异步调用流程:从提交任务到轮询结果。

    Q & A#

    Q:直接在本网页中调用出现Agent Server Error怎么办?
    A:这个是这个APIFox的错误,可以的话最推荐代码方式来请求。
    Q:结果如何查看?
    A:我们推荐VSCode来看Markdown,但是因为渲染器问题,他们暂时无法渲染表格中的公式,因此推荐用SoMark官网渲染器进行查看。
    修改于 2026-03-30 13:02:26
    下一页
    Coze插件
    Built with