机票数据库数据分析

假日,饱肚,花了些时间清理了一下我们美中机票数据库中的数据,删除了一些无效的数据,把城市和机场的输入标准化,然后突发奇想,看着上万个数据记录,是否可以做一下数据分析,看看美中机票几年的趋势,也检验一下我们数据的有效性。

结果花了一个晚上的时间,才发现对我这种菜鸟来说,数据分析不是件很容易的事情,要画出有意义的图形更麻烦。试了多种方法,才用excel画出个马马虎虎的样子。贴上来,也不算白幸苦一场。

这个图是JFK-PEK双程来回往返在三个月之内的机票价格,根据我们的数据,我只是很简单地按月平均了一下,每个月一个点(不是很科学,因为5/30和6/1不应该简单的区别开,应该有平均移动这类方法吧)。不过即使从这个简单的图中也可以看出,每年旺季时暑期六七八三个月,寒假十二月因为是简单平均,反到看不出票价太贵(因为前半个月和后半个月价格差别较大)。还可以看出来的是2008暑期机票价格奇高,是由于奥运会的缘故了。当然机票价格的整体趋势是上扬的,2005-2006年的七八百元机票,如今已经平均到九百到一千了。

数据分析是很有意思的一件事情,可惜我不是很精通。如果网上有高手愿意试试,我可以帮助提供数据,和我联系,呵呵。

Posted: December 23, 2008in:
|

Leave a Reply

You must be logged in to post a comment.