前言
前几天网上就公开了数据,不过官方提供的是图像,没有办法直接进行分析。本着技术人精神,现学现卖,从图像处理、图像表格自动分割到图像表格自动识别,最后加水印,一阵折腾终于靠程序自动提取出了结构化数据(文字数据)。由于是靠算法和模型提取,不可避免地有一些错误,比如表格线切割错位、文字识别错误、表格对齐错误等,又经过粗略的人工校对和修正,才有了最终数据。从另一个角度来看,总共不到1000条数据,就是一条条手工录,也花不了半天时间,写程序的时间可比这个花的时间多多了:) 。
由于是匆匆校对(如果很仔细地人工校对,前面那些技术工作就失去意义了:)),数据难免可能存在一些错误,不过从统计分析角度来说,应该没有大的影响,权当做个参考吧。如果有数据错误或者分析错误,欢迎指正。先谢过。
分析过程
从网上找来了中国大学、地图等数据,结合这份高考数据,进行分组统计。这里的大学数据里引入了香港、澳门等地区的大学数据,为了统一口径,把这些地区的大学以及一些中外合作等非常规院校也按通用标准进行等级划分(985、211、双一流等),对应如下图(如果错误,欢迎指正):
另外南方科技大学、港中深大学暂时也对标985大学 。
分析结果
厦门一中高中部学生总数应该是1000人出头,但收集到的数据只有932人,猜测应该是部分学生数据没有收集到,不过这个数字作为分析基数应该足够接近了。
985、211、双一流院校录取统计(按录取总人数倒排序)大学分析结果
厦门大学作为本省、本市唯一985高校还是最受厦门(一中)学生欢迎,其它的TOP5高校录取情况也相当不错,可以看出来厦门一中确实是很优秀的学校(厦门双十暂时还没有公开数据,因此没有办法量化分析,不过从历年情况来看,两者没有什么本质差别)。同样的福州大学作为本省唯一211,省内学生认可度也挺高。具体大家就看表格数据吧。
毕业校(初中)分析结果
从各个初中毕业校的角度分析大学录取情况(按985录取人数倒排序)。这里只是一中高中的录取数据,在厦门top3高中的总人数中只占大约1/3的数量,并且每个区域的初中选择倾向性不同:例如湖里区的初中学生大部分倾向于选择厦门双十,海沧区和外部语的初中大部分会选择外国语高中,特别地厦门双十初中虽然地处思明区,但该校大部分学生都有很强的母校情结,会选择自己的高中,即使双十高中离家更远一些。因此不能作为每个初中的实力对比指标,但一定程度上可以作为思明区初中(不包括双十初中)对比的一个参考。另外还需要考虑各个初中的总人数,这样比较起来才有意义:举个例子来说,2022届对应的华侨中学初中只有8个班,而厦门一中初中好像是20个班(?)、莲花中学初中好像是16个班(?),这样按比率来看,华侨中学并不比厦门一中差多少。相比于初中升高中比率这样的直接指标,这个指标可以作为另一个维度的参考。