总之目标就是:
这里主要说下通过Python捞取双色球的历史数据、回归预测。
一、历史数据
双色球的历史数据URL:/zhcw/html/ssq/list_1.html
爬取数据这块主要就是用beautifulsoup就可以了。
写入到txt文件里,格式如:
#('-05-03', '09,12,24,28,29,30,02')
#('-05-01', '06,08,13,14,22,27,10')
#('-04-28', '03,08,13,14,15,30,04')
二、回归预测
主要是通过LR对每位数字的训练预测概率
整体上来说比random心理觉得靠谱些。
三、深度学习训练预测
时间序列上的RNN可能效果更好点,毕竟多了些记忆的特点。
在这里用RNN的变种LSTM进行训练预测,Python中有不少包可以直接调用来构建LSTM模型,比如pybrain, kears, tensorflow, cikit-neuralnetwork等。这里我们选用keras。
具体的框架格式参考这里/CasiaFan/time_seires_prediction_using_lstm/blob/master/neural_network_run.py
至于还有很多其他方法待有空的时候再测试测试。
对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴趣同学加微信:tstoutiao,邀请您加入头条数据爱好者交流群,数据爱好者们都在这儿。
本文来源自天善社区数据分析侠的专栏。
原文链接:/p/26341086