note/work/教育产业/科大讯飞.md
2025-11-19 10:16:05 +08:00

25 KiB
Raw Permalink Blame History

科大讯飞

一些常用数据:

苏州市第三中学 school_id:1010000001000020417 江苏省新苏师范学校附属小学 school_id:1500000100152793411 苏州市立达中学校 school_id:1010000001000022960

1. 数据库

dw_answerdetail_withmask_month_202506

学生考试答题记录

  1. 描述:学生每次作业、考试的详情,以单个题目为一条数据,包含了考试或作业编号、学校编号、学生编号、单个题目的编号,以及答案、正确答案、是否做对、得了几分、题目类型等。

  2. 作用:

    1. 以单个题目为单位,可以对每个题目进行班级、年级范围内的统计,统计这道题目的得分等情况。
    2. 以学生为单位,学生在某个时间段的情况;
    3. 以班级和考试为单位,班级横向、纵向对比;
    4. 多个考试,可统计趋势。但数据量有点大
  3. 关键字段:

    1. correct是否正确用于统计学生答题正确率
    2. create_time4d,week,month:与时间相关的,统计阶段性时间;
    3. subject_code;
    4. topic_number:

举例:

字段 注释 范例
inc_id 自增主键 13
answer 答案 ACD
category 答题类型 (如: t01Exam, t10homework等) t01Exam
correct 是否正确 (TRUE, FALSE) TRUE
create_time4d 操作时间_天 2025/6/12
week 操作时间_周 2025-24
month 操作时间_月 Jun-25
phase 学段 5
score 得分 6
small_topic_number 小题号
standard_score 标准分
subject_code 科目ID 2
subject_name 科目名 数学
topic_id 试题Id ae776a2f-d9e7-42aa-a833-e4c3953e3c87
topic_number 题号 7
topic_set_id 试题集Id (如: 试卷ID) ebb4ddb7-4687-4815-8bc9-8dc27f2ffed7
user_id 用户ID 1.5E+18
class_id 班级ID 1.5E+18
class_name 班级名称 10班
grade 年级 11
school_id 学校ID 2.3E+18
school_name 学校名称 常熟外国语学校
exam_id 考试Id, 默认-1 726fb179-0406-48f4-8171-f8158bb0ba59
exam_type_code 考试类型编码, 默认-1 (如: homework等) weeklyExam
exam_time 考试时间, 默认-1 2025/6/11 0:00
answertype 答案类型, s01Text, s02Image等 s01Text
knowledgecodes 知识点编码集合字符串 020549034n
is_selected_undo 是否选题未做 0
exam_name 考试名称 高二下学期周三测试卷2025. 6. 11
exam_type_name 考试类型名称 周考
marking_paper_name 试卷名称 高二下学期周三测试卷2025. 6. 11(数学)
question_small_type_code 小题类型code 20503
question_small_type_name 小题类型名称 多项选择题
pdate 日分区 2025/6/30

dw_report_user_exam_fact_withmask_month_202506

学生维度的某次考试报告

从用户维度,这是学生单次考试的情况;

注释 范例
inc_id 自增主键 808234
exam_id 考试id 1843c3bf-b73b-4991-826a-f542a7749191
exam_name 考试名称 高二数学周周练12
grade_code 年级code 11
grade_name 年级名 高二
user_id 用户id 1.5E+18
user_name 用户名称 刘芸熙
user_num 用户学号 55275811
score 学生得分 68
subject_code 科目code 2
class_id 班级id, 上课班级id, 可能和行政班id不同(分层走班) 1.5E+18
class_name 班级名称 高二年级10班
class_rank 班级排名, -2 表示缺考 -3表示未扫描 15
class_rank_rate 班级排名击败率, (班级排名)/班级人数 bg-1
school_id 学校id 1.01E+18
school_name 学校名 苏州市第三中学
school_rank 学校排名, -2 表示缺考 -3表示未扫描 15
school_rank_rate 学校排名击败率, -2 表示缺考 -3表示未扫描 bg-1
union_rank 联考排名, 只在联考时有值 bg-1
class_student_num 班级的人数 39
create_time 记录创建时间 35:43.3
create_exam_time 考试创建时间 19:28.0
exam_time 考试时间 19:28.0
is_custom 是否自定义, 为0或空, 表示默认报告, 1表示自定义报告 0
is_final 是否考试结束, 标注是否结束阅卷, 结束后依然可更新 1
is_remove 是否被剔除, 0表示没有被剔除, 1表示被剔除 0
remove_message 剔除信息, 剔除前的统计信息, 包括班级排名, 学校排名, 分数 bg-1
remove_student_num 剔除学生人数 0
pre_assign_score 赋分前分数 0
user_subject_score 考试中单科的集合 bg-1
report_version 版本, 结束多次时, 每结束一次, 版本+1(即更新操作) 15929996
exam_type_code 考试类型编码 homework
exam_type_name 考试类型名称 手阅作业
wenli_rank 文理考生排名 bg-1
wenli_rank_rate 文理考生排名击败率 bg-1
elective_rank 选考组合排名 bg-1
elective_rank_rate 选考组合排名击败率 bg-1
elective_course 选考组合 bg-1
elective_type 选考类型, arts:文科, science:理科 bg-1
custom_class_rank 自定义校级排名 15
custom_school_rank 自定义班级排名 15
standard_score 标准分 150
remark_status bg-1 normal
student_states bg-1 ["normal"]
level_name 等级名称 bg-1
level_dist 等级分配 bg-1
pdate 日分区 2025/6/30

dw_report_user_subject_fact_withmask_month_202506

学生维度的学科考试报告

好的这是根据您提供的图片转换的Markdown表格。

注释 范例
inc_id 自增主键 1719364
exam_id 考试ID 499ed4a3-6b78-4a0b-8887-a0cd2d2adc3
exam_name 考试名称 高二下学期期末复习模拟卷(一)
grade_code 年级code 11
grade_name 年级名 高二
user_id 用户ID 1.5E+18
user_name 用户名称 杨馨语
user_num 用户学号 55275823
score 学生得分 92
standard_score 满分 150
subject_code 科目code 2
subject_name 学科名 数学
class_id 班级ID, 上课班级ID, 可能和行政班ID不同(分层走班) 1.5E+18
class_name 班级名称 高二年级10班
class_rank 班级排名, -2 表示缺考 -3 表示未扫描 1
school_id 学校ID 1.01E+18
school_name 学校名 苏州市第三中学
school_rank 学校排名, -2 表示缺考 -3 表示未扫描 1
union_rank 联考排名, 只在联考时有值 bg-1
create_paper_time 试卷创建时间, 指管理员创建试卷的时间, 一般在考试前 31:57.0
exam_time 考试时间, 管理员选择考试时间 28:05.0
create_time 创建时间, 记录插入时间, 更新记录时会更新该字段 32:45.3
update_time 更新时间, 现在单科是全量数据, 该字段已经无意义 32:45.3
answer_create_time 答题记录创建时间, 其他端使用, 每个学生的答题记录时间都一样 bg-1
category 试卷类型, 包括正式考试、自主练习。共17种, 已有class的枚举类 t01Exam
marking_paper_id 试题集ID, 试卷 3402911f-d853-430d-9621-95655a8cbd5d5
marking_paper_name 试题集名称 高二下学期期末复习模拟卷(一)(数学)
sub_subject_code 子科目代码, ["05", "06", "13"]如理综; 若为语文等, 则为空 bg-1
is_remove 是否被剔除, 0表示没有被剔除, 1表示被剔除 0
remove_message 剔除信息 {"tiClassRank":3,"tiSchoolRank":3,"tiScore":88}
admin_class_id 新高考主班id, 所在行政班的班级ID (走读) 1.5E+18
admin_class_name 新高考主班名称 高二年级10班
is_custom 是否自定义, 为0或空, 表示默认报告, 1表示自定义报告 0
assign_score 等级赋分, 分数区间[90~100] bg-1
assign_score_level 等级赋分的等级, 分数区间名称, 如A等 bg-1
exam_type_code 考试类型编码 homework
exam_type_name 考试类型名称 手阅作业
report_version 版本, 结束多次时, 每结束一次, 版本+1(即更新操作) 1
custom_class_rank bg-1 1
custom_school_rank bg-1 1
remark_status bg-1 normal
student_states bg-1 ["normal"]
pdate 日分区 2025/6/29

dw_report_class_exam_fact_withmask_month_202506

以班级为单位的某个考试的详细报告

注释 范例
inc_id 自增主键 957
exam_id 考试id ea8070ed-bdc7-4114-b284-03f0db1fc6b3
exam_name 考试名称 苏州市第三中学2025高中“慧成实验班”自主招生综合素质评价(一)
exam_type_code 考试类型编码 homework
exam_type_name 考试类型名称 手阅作业
school_id 学校id 1.01E+18
school_name 学校名 苏州市第三中学
grade_code 年级code 9
grade_name 年级名 九年级
class_id 班级id 1.5E+18
class_name 班级名称 九年级8班
subject_code 科目code 2
create_time 创建时间 04:12.2
create_exam_time 创建考试时间 09:17.0
exam_time 考试时间 09:17.0
is_custom 是否自定义, 为0或空, 表示默认报告, 1表示自定义报告 0
is_final 考试是否结束 1
max_score 班级最高分 60
min_score 班级最低分 25
avg_score 班级平均分 41.20512772
standard_deviation 标准差 8.659305
student_num 学生人数 39
submit_student 实考人数 bg-1
unsubmit_student 未考人数 bg-1
remove_message 剔除信息 bg-1
remove_student_num 被剔除的人数 0
score_section 分数区间 [{"count":31,"maxScore":50.0,"minScore":0.0,"rate":0.7948718,"showModel":"LCR0"},{"count":8,"maxScor...
report_version 版本, 结束多次时, 每结束一次, 版本+1(即更新操作) 16453819
standard_score 标准分数 100
excellent_num 优秀人数 0
excellent_rate 优秀占比 0
good_num 良好人数 1
good_rate 良好占比 0.025641026
qualified_num 合格人数 38
qualified_rate 合格占比 0.974358976
disqualified_num 不合格人数 1
disqualified_rate 不合格占比 0.025641024
pass_num 及格人数 17
pass_rate 及格占比 0.43589744
low_num 低分人数 0
low_rate 低分占比 0
unpass_min_score 不及格最低分 0
unpass_max_score 不及格最高分 60
excellent_min_score 优秀最低分 85
excellent_max_score 优秀最高分 100
excellent_score_rate 优秀分值比例 0.85
low_min_score 低分最低分 0
low_max_score 低分最高分 40
low_score_rate 低分分值比例 0.7
pass_min_score 及格最低分 60
pass_max_score 及格最高分 70
pass_score_rate 及格分值比例 0.6
good_min_score 良好最低分 70
good_max_score 良好最高分 85
good_score_rate 良好分值比例 0.7
stat_student_num bg-1
pdate 日分区 2025/6/30

dw_report_class_subject_fact_withmask_month_202506

以班级学科为单位的某个考试的详细报告

注释 范例
inc_id 自增主键 7398
exam_id 考试id ea8070ed-bdc7-4114-b284-03f0db1fc6b3
exam_name 考试名称 苏州市第三中学2025高中“慧成实验班”自主招生综合素质评价(一)
exam_type_code 考试类型编码 homework
exam_type_name 考试类型名称 手阅作业
school_id 学校id 1.01E+18
school_name 学校名 苏州市第三中学
grade_code 年级编码 9
grade_name 年级名 九年级
class_id 班级id 1.5E+18
class_name 班级名称 九年级3班
subject_code 学科编码 2
subject_name 学科名称 数学
exam_time 考试时间 09:17.0
max_score 班级最高分 54
min_score 班级最低分 31
avg_score 平均分 41.94285583
standard_deviation 标准差 6.667374134
class_student_num 总人数 35
submit_student_num 实考人数 35
report_version 报告版本 1
standard_score 标准分数 100
excellent_num 优秀人数 0
excellent_rate 优秀率 0
good_num 良好人数 0
good_rate 良好率 0
qualified_num 合格人数 0
qualified_rate 合格率 0
unqualified_num 不合格人数 35
unqualified_rate 不合格率 1
pass_num 及格人数 0
unpass_min_score 不及格最低分 0
unpass_max_score 不及格最高分 60
excellent_min_score 优秀最低分 85
excellent_max_score 优秀最高分 100
excellent_score_rate 优秀分值比例 0.85
low_min_score 低分最低分 0
low_max_score 低分最高分 40
low_score_rate 低分分值比例 0.7
pass_min_score 及格最低分 60
pass_max_score 及格最高分 70
pass_score_rate 及格分值比例 0.6
good_min_score 良好最低分 70
good_max_score 良好最高分 85
good_score_rate 良好分值比例 0.7
pdate 日分区 2025/6/30

2. 维度分析

下面,我将从教师维度(细分为任课老师、班主任、年级组长、校长)家长维度,来阐述可以从哪些角度进行数据分析、解析、对比和趋势洞察。

数据关联核心

在分析之前,我们首先要明确各表之间的关联关系,这是所有分析的基础:

  • 核心关联IDexam_id, user_id, class_id, school_id, subject_code, topic_id
  • 粒度层级dw_answerdetail (题目粒度) -> dw_report_user_subject_fact (学生-学科粒度) -> dw_report_user_exam_fact (学生-考试总分粒度)。同时,这些数据向上聚合,形成了 dw_report_class_subject_fact (班级-学科粒度) 和 dw_report_class_exam_fact (班级-考试总分粒度)。

1. 任课老师 (Subject Teacher)

核心关切: 我所教的这个/这些班级,在我所教的这门学科上,学得怎么样?学生知识点掌握情况如何?教学策略是否需要调整?

分析角度:

  • 教学效果即时诊断 (单次考试/作业分析)

    • 题目级分析 (教学反思)
      • 难点题目定位:通过 dw_answerdetail 表,按 exam_idclass_id 筛选,对每个 topic_id 计算平均得分率 (avg(score) / max(standard_score))。找出得分率最低的TOP 5题目进行重点讲评。
      • 高频错题分析:统计每个题目 (topic_id) 的错误人数和错误选项分布(如果是选择题),分析学生普遍的错误思路。
      • 知识点掌握度分析:利用 knowledgecodes 字段,将题目关联到知识点。聚合计算每个知识点下的所有题目的平均得分率,定位本班学生的薄弱知识章节。
      • 题型掌握度分析:利用 question_small_type_name 字段(如选择题、填空题、解答题),分析学生在哪类题型上失分较多,从而进行专项训练。
  • 班级学情横向对比 (多班级教学)

    • 班级整体对比:如果老师教多个班,可以对比所教各班在同一次考试中的 avg_score, max_score, min_score, pass_rate (及格率), excellent_rate (优秀率)。数据源:dw_report_class_subject_fact
    • 分数段分布对比:对比不同班级在高分段、中分段、低分段的人数分布,了解班级间的学习层次差异。数据源:dw_report_class_exam_fact 中的 score_section 字段。
    • 薄弱点共性与差异分析:对比不同班级的薄弱知识点和高频错题,判断是普遍的教学难点,还是个别班级的特殊问题。
  • 学生个体纵向追踪 (个性化辅导)

    • 关键学生识别
      • 优秀生:识别班级排名 (class_rank) 靠前但某些关键题目或知识点失分严重的学生,助其补强短板。
      • 边缘生:识别处于及格线 (pass_min_score) 附近的学生,分析其失分点,进行精准辅导,提升及格率。
      • 后进生:识别排名靠后的学生,重点分析其基础知识点的掌握情况,制定补差计划。
      • “伪学霸”识别:总分高,但某些基础题、送分题失分,说明学习习惯或态度有问题。
    • 学生进步趋势分析:通过 dw_report_user_subject_fact 表,筛选特定 user_idsubject_code,按 exam_time 排序,观察其 scoreclass_rank 的变化曲线,评估其学习状态的稳定性与进步情况。

2. 班主任 (Class Teacher)

核心关切: 班级整体学风、各学科均衡发展情况、关注每个学生的全面发展、及时发现有异常状况的学生。

分析角度:

  • 班级整体画像 (单次考试)

    • 全科总览:使用 dw_report_class_exam_fact 查看班级总分平均分、最高/最低分、标准差(反映分数离散度)。
    • 学科强弱分析:对比班级各科的平均分 (dw_report_class_subject_fact) 与年级平均分(需要关联年级数据计算),找出班级的优势学科和短板学科,以便和任课老师沟通。
    • 尖子生与后进生分布:查看总分排名 (class_rank from dw_report_user_exam_fact),了解高分层和低分层学生情况,思考如何分层管理。
  • 班级横向定位

    • 年级定位:对比本班总分平均分 (avg_score) 在全年级的排名。
    • 学科瘸腿分析:找出班级内总分排名靠前,但某单科排名 (class_rank in dw_report_user_subject_fact) 却很低的学生,进行谈心和辅导。反之亦然。
  • 学生动态趋势监控

    • 异常波动学生预警:对比本次与上次考试,筛选出总分排名 (class_rank) 下降超过 N 位如10位的学生主动关心其最近的学习生活状态。
    • 持续进步/退步学生画像:拉长时间轴(如一个学期),追踪每个学生总分排名的变化趋势,表扬持续进步者,干预持续退步者。
    • 学科发展不均衡预警:分析学生 user_subject_score 字段或关联 dw_report_user_subject_fact,观察是否有学生长期存在严重的学科偏科,并随时间加剧。

3. 年级组长 (Grade-Level Head)

核心关切: 年级整体教学质量、班级间的均衡性、各学科教学进度与效果的协调、关键指标(如平均分、优良率、及格率)的达成情况。

分析角度:

  • 年级整体质量监控

    • 年级整体报告:聚合 dw_report_class_subject_fact 数据,计算出年级各科的平均分、标准差、各分数段比率,形成年级整体学情报告。
    • 班级教学质量雷达图:以班级为单位,以各科的“平均分/年级平均分”的比值为指标,绘制雷达图,直观展示各班的学科优势与短板。
    • 教学公平性/均衡性分析:分析各班平均分 (avg_score) 的离散程度(如计算平均分的标准差)。如果标准差过大,说明班级间发展不均衡,可能需要调整师资或教学资源。
  • 教师教学成效评估 (需关联教师信息)

    • (假设存在教师-班级-学科对应关系表) 可以对比教授同年级同科目但不同班级的老师,其所教班级的平均分、优秀率等指标,作为教学评估的参考之一(注意要结合班级生源基础等因素综合判断)。
  • 趋势与目标管理

    • 年级整体进步趋势:追踪历次重要考试(如月考、期中、期末)年级总分、各科平均分的变化,评估年级整体的学业发展轨迹。
    • 目标达成度分析:将年级的 pass_rate, excellent_rate 等指标与学期初设定的教学目标进行比对,分析差距和原因。
    • 联考对标分析:若有联考数据 (union_rank),可横向对比本校同年级在联考学校中的排名和各项指标,找到差距,制定提升策略。

4. 校长 (Principal / School Leadership)

核心关切: 全校整体办学质量、跨年级/跨学部的教学表现、学校特色(如实验班)的有效性、与兄弟学校的竞争力、长期发展趋势。

分析角度:

  • 全校教学质量仪表盘

    • 跨年级对比对比不同年级在同一学科上的表现需考虑课程难度差异可使用标准分或T分数进行标准化后再比较评估教学的连贯性。
    • 特色班级成效评估:“慧成实验班”这类班级,需长期追踪其与平行班在平均分、高分段人数占比、排名等方面的差异,并分析差异是否随时间扩大,以验证特色培养模式的有效性。
    • 学校核心指标监控:关注全校的升学关键指标,如高分段学生(未来清北生源)、一本线(或特殊类型招生控制线)上线率预估等。
  • 学校竞争力分析

    • 联考成绩深度分析:通过 union_rank,不仅要看学校的整体排名,还要深入分析本校各分数段学生在联考中的分布,以及与顶尖学校的差距主要体现在哪个分数段。
    • 生源质量与加工能力分析结合学生入学时的成绩入口和历次大考的成绩出口建立增值评价模型Value-Added Assessment评估学校的“加工能力”即在现有生源基础上提升学生学业水平的能力。
  • 长期战略规划

    • 学科发展战略长期如3-5年追踪各学科的发展趋势决定资源倾斜方向打造学校的优势学科品牌。
    • 新高考改革适应性分析:利用 elective_course (选考组合) 字段,分析不同选科组合学生的表现,为下一届学生的选科指导提供数据支持,并优化分层走班(class_id vs admin_class_id)的教学管理。

5. 家长维度的分析角度

核心关切: 我的孩子学得怎么样?他的强项和弱项是什么?他在班级/学校处于什么位置?他最近是进步了还是退步了?

分析报告/App界面可以呈现以下分析结果

  • 单次考试成绩报告 (一目了然)

    • 核心成绩展示:清晰展示本次考试的总分、各科得分、班级排名 (class_rank) 和年级排名 (school_rank)。数据源: dw_report_user_exam_fact, dw_report_user_subject_fact
    • 成绩定位:用图表(如仪表盘或水平条)展示孩子的得分在班级/年级的位置例如“您的孩子本次数学得分92分超过了班级85%的同学”。数据源:score + class_rank / class_student_num
    • 与集体对比:将孩子的单科得分与班级/年级平均分、最高分进行对比,让家长了解孩子的相对水平。数据源:user_subject_fact.score vs class_subject_fact.avg_score / max_score
  • 学习诊断与建议 (深入分析)

    • 知识点掌握雷达图:基于 dw_answerdetailknowledgecodes,分析孩子在本次考试中涉及的各个知识点的得分率,生成雷达图,强弱项一目了然。
    • 失分题目详情:列出孩子所有做错的题目 (correct=FALSE),展示题目内容、孩子的答案、正确答案和标准得分,并附上该题在班级的平均得分率,让家长知道这是“不该错的题”还是“普遍的难题”。
    • 能力模型分析:基于 question_small_type_name,分析孩子在“基础应用”、“综合探究”、“计算能力”等不同能力维度上的表现。
  • 成长轨迹追踪 (纵向对比)

    • 成绩走势图:提供孩子在单个学科或总分上的历次考试成绩/排名的折线图,直观展示其进步、退步或波动情况。
    • 排名变化归因:当排名发生显著变化时,系统可初步分析原因,例如“本次排名上升,主要得益于数学成绩的大幅提升”或“本次排名下降,主要是因为在‘函数’这一知识模块失分较多”。

通过以上多维度的分析,我们可以将原始的、分散的成绩数据转化为有价值的、可指导行动的洞察,真正实现数据驱动的精准教学和个性化发展。