有位网友在后台提了一个问题,问:
武汉19~25岁的年轻人,居住在哪个区的人数最多?
如果你也想绘制一组与城市年轻人口相关的数据,刚好可以顺着这个问题展开探索。
探索的第一步,是找到准确的数据来源。
如今我们已处于弱人工智能的时代,最先进的通用型人工智能的智力水平,已经与正常成年人相当。
但AI面临的困境,除了算力、算法外,在数据端面临的最大困扰,或许是数据的真实程度。
毕竟,对于AI而言,其数据最大的来源,仍然是人类共享到网络上的各类信息。
做一个简单、且不存在任何争议的数学题:0.5X0.8到底等于几?如果不提供额外的参考信息,人类会给出三个主要的答案(4,0.4,0.04)以及若干个形式各异的、但出现概率较小的答案。
对于有统计经验的人而言,可以借助各国、地区的官方机构或专业的学术机构,获取到可信的数据来源。
对于开篇所说的问题,我们可以从《七普区县资料》、《湖北人口统计年鉴2020》、当地的《人口普查统计公报》,以及其他类似的普查公开信息中获取到。
探索的第二步,是对数据进行整理、分类。
事实上,前述的信息源,已经对原始数据做了很多个层次的整理、分类,其整理后数据规模,与一本书相当。
所以有必要只提取我们想要问题的答案,而不是将所有的数据都拿出来。
对于大部分人而言,在很短时间内,比如短视频的最佳时间15秒内,不借助视频辅助工具和方法,从几十个数据中,找到数据的分布规律,是非常困难的。
所以,在对数据进行整理分析之后,第三步的操作是,对数据进行一定程度的可视化处理,比如给数值加上进度条、添加不同的颜色,以确保我们能在极短的时间内,将数据的分布规律给找出来。
想知道武汉年轻人都居住在哪个区?这位提问网友的想法,大概是想找一个年龄相仿的异性,所以有必要对人口数量的性别做出区别。
我们可以采用人口年龄金字塔图的样式,来对武汉各区的19~25岁人口的分布,进行可视化处理。
在下图中,左侧表示武汉各区的19~25岁男性人数(用蓝色表示),右侧表示女性人数(粉色)。
事实上,在我国的人口普查中,为简化数据量,各省或各市的人口年龄,通常是以5岁为一个年龄组进行统计的。
比如0~4岁、5~9岁、90岁以上等,所以,我们很难从公开信息中获取到19~25岁人口的分布情况,最接近的数据,为20~24岁。
所以,下图展示的是武汉各区20~24岁男性和女性人口数量的分布情况。
从分布看,包括武汉经开区、东湖高新区、东湖景区以及武汉化工区等功能区在内的武汉各区中,20~24岁人口数量最多的区,当数洪山区。
次之的为江夏区、东湖高新区以及武昌区。
如果你仔细观察图表,还可以发现,这几个年轻人较多的区域,除了武昌区外,均是男多女少的现状。
如果你想去找一个女朋友,得慎重考虑一下,但如果找男朋友,可选择的机会还是比较多的。
另外,这几个区具有以下特征中的一个:
一,高校数量众多,聚集了大量的年轻人,按常住人口统计,各大高校的在校学生,统计为本地的常住人口;
二,企业数量多,相对于南通、铁岭等老年人口比例较高的城市而言,高新区等企业聚集的区域,对年轻劳动力具有极大的吸引力。
如果你也在武汉工作而且处于单身状态,你打算去哪里居住呢?