第一次听说这个比赛还是去年在知乎上,当时也不知道这个比赛具体是怎么回事,当时自己还是一个小白,忙着搞懂各种主流的机器学习模型算法。
当时在我心中,模型算法是数据挖掘的最重要的组成部分,搞懂这些才能真正搞定数据挖掘。我当时对算法模型和数据的理解是:模型就是风车,数据就是流水。我要做的事就是撘一个强健的风车,让数据流过。
当我还没接触实际的工作前,我还没有没有从编程工转向挖掘工。我太注重编程本身了,而忘记我自己真正要挖掘的宝藏。
我以前在Quora
上搜如何成为数据科学家,我发现很多有经验的数据科学家他们都把“对数据的敏感和兴趣”作为数据科学家最重要的特征,而“了解各种算法模型并能应用到数据上”才是第二重要的。我当时不是太理解,我觉得后者才是更重要的。
参赛感想 #
这次参赛算是我学习数据挖掘第一次实际的挖掘,以前学习各种算法模型都是准备的很好的数据,只要套上算法模型就能跑的很好。所以我一开始就拼命的去找类似的大赛,看看获胜者他们用的模型是什么。
这几天我好像抱着一堆瓶子,拼命的想把巨大的石头(数据)塞进瓶口里,看起来工作量很大,流了很多汗,其实什么都没有干。今天在看一个类似的比赛选手答辩的时候的视频,突然明白自己好像走了一个死胡同。自己拼命的想这找一个合适的瓶子(模型),其实我更应该做的是把石头(数据)磨碎。
模型本身不重要,他只是一个载体,更重要的是数据。 #
第一次参加这样大型比赛,有点激动也有点惶恐,如何将所学的应用到实际,还有在实际中提高自己还有待自己“挖掘”。虽然这个比赛奖金“丰富”,但是我觉得在这个比赛中得到的体会乐趣比奖金更诱人。
比赛还有一个月,在这里立个小目标,争取跑到到前五页,我也会尽量抽时间把自己感想写出来。
未完待续。