diff --git a/数学图谱后端接口定义.md b/数学图谱后端接口定义.md index 8e0dbe3..810470f 100644 --- a/数学图谱后端接口定义.md +++ b/数学图谱后端接口定义.md @@ -414,17 +414,89 @@ question_id 也需要记录。其他字段忽略. 输入:上面的切割试卷api所生成的url; 输出:markdown形式的带有数学公式的题目文本内容。 -大模型api地址:https://oneapi.apps.k8s.aiscenes.cn/v1/chat/completions +大模型api地址:https://ekt1.suzhou.edu.cn/llm/v1/chat/completions openai兼容格式 模型名称:qwen-vl,是一个VL模型。 上传需要先把url解析成base64。模型不能直接识别url。 设定温度为0; 设定提示词是: ``` -你是一名数学文字识别专家。 -你的任务是,将图片中的文字,严格转换为markdown格式的文字; -如图中有数学公式,你必须使用$或者$$进行包裹,生成markdown可解析的latex格式的数学公式; -你无需输出其他任何解释性文字,只需严格输出图片中的文字。 +你是一名数学文字识别专家。你的任务是,将图片中的文字,严格转换为markdown格式的文字;如图中有数学公式,你必须使用$或者$$进行包裹,生成markdown可解析的latex格式的数学公式;你无需输出其他任何解释性文字,只需严格输出图片中的文字。 +``` +输入示例: + +`POST: https://ekt1.suzhou.edu.cn/llm/v1/chat/completions` +`HEADER: Authonrization: Bearer sk-PqY5sI1od5Hbl6hVsniLDp7G0DOOBlUzE8E22p8HdVSTM5Rs` + + +```json +{ + "model": "qwen-vl", + "messages": [ + { + "role": "system", + "content": "你是一名数学图片文字识别专家。" + }, + { + "role": "user", + "content": [ + { + "type": "text", + "text": "你的任务是,将图片中的文字,严格转换为markdown格式的文字;如图中有数学公式,你必须使用$或者$$进行包裹,生成markdown可解析的latex格式的数学公式;你无需输出其他任何解释性文字,只需严格输出图片中的文字。" + }, + { + "type": "image_url", + "image_url": { + "url": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAABfYAAAGCCAIAAAAt4wW+AAAACXBIWXMAAAsTAAALEwEAm==CC" + } + } + ] + } + ], + "temperature": 0 +} ``` + +输出格式: +```json +{ + "id": "chatcmpl-08cc11398014472fa86bd8cbdb2ded8b", + "object": "chat.completion", + "created": 1764146440, + "model": "qwen-vl", + "choices": [ + { + "index": 0, + "message": { + "role": "assistant", + "content": "12. 已知集合 $A=\\{1, 2, 4, 8\\}$, $B=\\{z|z=xy, x \\in A, y \\in A\\}$, 则下列四个结论正确的是 ( $\\not A B$ )\n\nA. $A \\nsubseteq B$\n\nB. $\\{1, 4, 16, 64\\} \\subseteq B$\n\nC. 集合 $B$ 中元素的个数为 8\n\nD. 集合 $B$ 的真子集的个数为 127", + "refusal": null, + "annotations": null, + "audio": null, + "function_call": null, + "tool_calls": [], + "reasoning_content": null + }, + "logprobs": null, + "finish_reason": "stop", + "stop_reason": null + } + ], + "service_tier": null, + "system_fingerprint": null, + "usage": { + "prompt_tokens": 841, + "total_tokens": 972, + "completion_tokens": 131, + "prompt_tokens_details": null + }, + "prompt_logprobs": null, + "kv_transfer_params": null +} + +``` + + "content": 这里面的文字就是ocr的结果。 + ### 3. 题目分析api: