高考数据分析是一个重要的研究课题,它可以帮助我们了解学生的学习情况,以及教育政策的有效性。基于Python进行高考数据分析是一个很好的选择,因为Python具有强大的数据处理能力,可以快速地处理大量数据。
首先,我们需要准备好所有的高考数据,包括学生的成绩、考试时间、考试地点等信息。然后使用Python进行数据分析,可以使用Pandas库来读取和处理这些数据。Pandas库可以帮助我们快速地对原始数据进行处理和分类,并将其转化为便于分析的格式。
之后,我们就可以使用Python中的各种工具来对高考数据进行分析了。例如,我们可以使用Matplotlib库来生成图表和图形,来帮助我们直观地看出不同学生之间的差异。此外,还可以使用SciPy库来计算不同学生之间的相关性和协方差。
最后,我们也可以使用Python中的机器学习工具来对高考数据进行分类和回归分析。例如:使用scikit-learn库中的决策树、随机森林、KNN、SVM等方法来对不同学生之间的相似性进行判断。
import pandas as pd # 加载Pandas库 import matplotlib.pyplot as plt # 加载Matplotlib库 from scipy import stats # 加载SciPy库 from sklearn import tree, svm, neighbors, ensemble # 加载scikit-learn库
本文转载至知乎ID:Charles(白露未晞)知乎个人专栏
下载手机App,0基础随时随地学编程>>戳此了解
不像考卷,现实生活中,有些事永远没有答案。
简单且随意地分析一下高考的一些数据~~~
让我们愉快地开始吧~~~
相关文件
网盘下载链接: https://pan.baidu.com/s/1zvVTTxfjmrTxjjX_M_DoEA
密码: 9jyd
相关文件中包含本文所涉及到的所有源代码和数据。
数据源于网络,不保证其完全可靠。
Python版本:3.6.4
相关模块:pyecharts模块;以及一些Python自带的模块。
安装Python并添加到环境变量,pip安装需要的相关模块即可。
pyecharts模块的安装可参考:
安装Python并添加到环境变量,pip安装需要的相关模块即可。
额外说明:
pyecharts模块安装时请依次执行以下命令:
pip install echarts-countries-pypkg
pip install echarts-china-provinces-pypkg
pip install echarts-china-cities-pypkg
pip install pyecharts
若安装过程中出现:
'utf-8' codec can't decode byte 0xb6
或者类似的编码错误提示。
可尝试修改Python安装文件夹下如下图所示路径下的__init__.py文件的第75行代码:
修改为下图所示内容:
“一本正经的分析”
首先让我们来看看从恢复高考(1977年)开始高考报名、最终录取的总人数走势吧:
T_T看来学生党确实是越来越多了。
不过这样似乎并不能很直观地看出每年的录取比例?Ok,让我们直观地看看吧:
看来上大学越来越“容易”之说不是空穴来风的,总录取比例高的可怕~~~
那么各省的情况呢?
由于各省高考最终录取人数的统计标准不一样,有些是只统计本科,有些是都统计的,为了避免统计标准不一而带来的不公平对比,我们只分析各省的高考报考人数。
从2010年开始到今年(2018年)各省份高考考生数量的分布图如下:
T_T河南的高考考生人数真是一枝独秀。
那么各省的大学数量又是如何分布的呢?以公办本科大学数量作为统计标准,其分布图大概是这样的:
Emmm。北京和江苏分别位居第一和第二名。想想也是必然T_T
那么985&211高校的分布又如何呢?
“那就这样吧,再爱都曲终人散了。”看到这个默默不说话了。
以省份为x轴,年份为y轴,该年该省报考的考生人数为z轴来更直观地看看各省每年的高考考生数量变化情况吧:
上图中省份的顺序是这样的:
北京、四川、陕西、江西、吉林、宁夏、广西、内蒙古、甘肃、西藏、福建、上海、广东、山东、浙江、河南、安徽、江苏、河北、黑龙江、湖南、湖北、山西、云南、贵州、海南、辽宁、重庆、天津、青海、新疆,台湾因为没有数据,所以没有加入。
T_T河南的高考考生数量真的恐怖。
Emmm,因为可用的数据不多,再分析下去大概就是花式的做图游戏了,想想还是算了吧。至于个人观点,还是不发表为好。毕竟,大家的“哈姆雷特”都不一样。
相关文件中包含了本文所涉及到的所有源代码、数据和结果,其中,数据来源网络,本人不保证其可靠性。
运行源代码前需将对应的注释去除。
本文转载至知乎ID:Charles(白露未晞)知乎个人专栏下载手机App,0基础随时随地学编程戳此了解导语偶遇了一篇文章:“Mapping Y...
Python3 sorted() 函数Python3 内置函数描述sorted()函数对所有可迭代的对象进行排序操作。sort 与 sorted 区别:sort 是应用在 ...
Python3 open() 函数Python3 内置函数Python3 open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到...
Python3bytes 函数Python3 内置函数描述Python3 bytes 函数返回一个新的 bytes 对象,该对象是一个 0 = x256 区间内的整数不可变...
Python3min() 函数 Python3 数字描述min() 方法返回给定参数的最小值,参数可以为序列。语法以下是 min() 方法的语法:min( x, y,...