【62 Pandas+Pyecharts | 智联招聘大数据岗位数据分析可视化】_智联招聘 数据分析
文章目录
- 🏳️🌈 1. 导入模块
- 🏳️🌈 2. Pandas数据处理
-
- 2.1 读取数据
- 2.2 数据信息
- 2.3 数据去重
- 2.4 薪资处理
- 🏳️🌈 3. Pyecharts数据可视化
-
- 3.1 各城市平均薪资
- 3.2 岗位数量前20的城市
- 3.3 岗位学历占比
- 3.4 不同学历平均薪资
- 3.5 岗位工作经验占比
- 3.6 不同工作经验平均薪资
- 3.7 不同行业平均薪资
- 3.8 不同企业类型数量
- 3.9 公司规模占比
- 3.10 岗位词云
- 🏳️🌈 4. 可视化项目源码+数据
大家好,我是 👉【Python当打之年(点击跳转)】
本期我们利用Python分析「智联招聘大数据岗位数据集」,看看:各招聘城市平均薪资分布、招聘岗位数量分布、岗位学历要求、岗位经验要求、不同学历不同工作经验平均薪资分布等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
涉及到的库:
- Pandas— 数据处理
- Pyecharts— 数据可视化
🏳️🌈 1. 导入模块
import pandas as pdfrom pyecharts.charts import *from pyecharts import options as optsimport warningswarnings.filterwarnings(\'ignore\')
🏳️🌈 2. Pandas数据处理
2.1 读取数据
df = pd.read_excel(\'datas.xlsx\')
2.2 数据信息
df.info()
2.3 数据去重
df = df.drop_duplicates()
2.4 薪资处理
def split_salary(salary, method): low_salary_1 = 0.0 high_salary_1 = 0.0 salary_t = salary.split(\'·\')[0] if \'-\' in salary_t: low_salary = salary_t.split(\'-\')[0] high_salary = salary_t.split(\'-\')[1] if \'万\' in salary_t: low_salary_1 = float(low_salary) * 10000 high_salary_1 = float(high_salary.replace(\'万\',\'\')) * 10000 elif \'元\' in salary_t: low_salary_1 = float(low_salary) high_salary_1 = float(high_salary.replace(\'元\',\'\')) if method == \'low\': returnint(low_salary_1) elif method == \'high\': returnint(high_salary_1)
🏳️🌈 3. Pyecharts数据可视化
3.1 各城市平均薪资
def get_chart(): chart = ( Map(i) .add(\'\', data_pair=datas, maptype=\'china-cities\', is_map_symbol_show=False, ) .set_global_opts( visualmap_opts=opts.VisualMapOpts( pos_left = \'3%\', pos_bottom=\'20%\', range_color=range_color ), legend_opts=opts.LegendOpts(is_show=False), title_opts=opts.TitleOpts( title=\"1-各城市平均薪资\", subtitle=subtitle, pos_left=\'center\', pos_top=\'2%\', title_textstyle_opts=opts.TextStyleOpts(color=\'#fff200\',font_size=20) ), ) )
- 东部地区平均薪资要明显高于中西部地区,沿海地区平均薪资更高。
3.2 岗位数量前20的城市
def get_chart(): chart = ( Bar() .add_xaxis(x_data) .add_yaxis(\'\', y_data) .set_global_opts( visualmap_opts=opts.VisualMapOpts(range_color=range_color), title_opts=opts.TitleOpts( title=\'2-岗位数量前20的城市\', pos_top=\'2%\',pos_left = \'center\', title_textstyle_opts=opts.TextStyleOpts(color=\'#fff200\',font_size=20) ), ) )
- 从招聘岗位上看上海、西安、成都、天津、重庆、武汉、北京、长沙、杭州、郑州等城市较其他城市更多。
3.3 岗位学历占比
- 本科学历要求占比最高,占比高达67%,其次是大专类约19%,硕士类约8%。
3.4 不同学历平均薪资
- 不同学历薪资方面来看,平均薪资和学历关系比较明显,博士平均薪资27K、硕士平均薪资16K、本科平均薪资13K。
3.5 岗位工作经验占比
def get_chart(): chart = ( Pie() .add(\'\', datas, radius=[\'40%\', \'70%\'], ) .set_global_opts( title_opts=opts.TitleOpts( title=\"5-岗位工作经验占比\", pos_top=\'2%\',pos_left = \'center\', title_textstyle_opts=opts.TextStyleOpts(color=\'#fff200\',font_size=20) ), visualmap_opts=opts.VisualMapOpts( is_show=False, range_color=range_color ), ) )
- 3-5年工作经验需求数量最多,占比约30%,其次是1-3年占比约25%,不限工作经验的岗位数量约占24%,和1-3年占比相当,5-10年工作经验的岗位也达到了15%。
3.6 不同工作经验平均薪资
- 不同工作经验平均薪资来看,工作经验和平均薪资基本呈正相关的关系,10年工作经验平均薪资30K,5-10年工作经验19K,3-5年工作经验13K。
3.7 不同行业平均薪资
- 从招聘行业薪资上看:汽车后市场、专用设备制造、新闻/出版、在线医疗、建材、人力资源服务、基金、船舶/航空/航天/火车制造、装饰装修、橡胶和塑料制品等行业的平均薪资相对较高。
3.8 不同企业类型数量
3.9 公司规模占比
3.10 岗位词云
def get_chart(): chart = ( WordCloud() .add(\'\',words,word_size_range=[20,50]) .set_global_opts( title_opts=opts.TitleOpts( title=\'10-岗位词云\', pos_top=\'2%\', pos_left=\"center\", title_textstyle_opts=opts.TextStyleOpts(color=\'#fff200\',font_size=20) ), visualmap_opts=opts.VisualMapOpts( is_show=False, range_color=range_color ) ) )
🏳️🌈 4. 可视化项目源码+数据
点击跳转:【全部可视化项目源码+数据】
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。