决策树算法:N个属性决定一个结果,现在给出这N个属性的值,预测下结果。先训练样本,再预测。比如预测有哪些属性的客户最可能购买产品
关联算法:找出属性与属性之间的关系,典型的例子是啤酒与尿布、产品搭配、产品推荐
聚类分析:有N个样本,每个样本有不同的属性值,现对进行多类
线性回归算法:给出n个点(两个值确定坐标一点),求函数,然后预测下一个,比如给出业绩与员工数,预测下一个业绩
时序算法:考虑时间因素,比如给出业绩与月份历史数据,预测下一月的业绩
顺序分析与聚类分析:比如客户最先想买什么,再买什么
神经网络:找出N个属性与m个属性之间的关系
挖掘步奏:
1,建立一视图,2,建立挖掘,指定算法
注:挖掘准确性图表:可以查看与真实数据的差距
挖掘模型预测:据已训练好的数据,选新的数据源测试结果
2,在挖掘模型,右键设置算法参数中,可设置数据周期的提示(PERIODICITY_HINT),如一周7天{7}。
MAXIMUM_SERIES_VALUE:预测最大值
MINIMUM_SERIES_VALUE:预测最小值
AUTO_DETECT_PERIODICITY:通过更改 AUTODETECT_SEASONALITY 的值,可以影响生成的时间段的可能数目。可以反复设置,看偏差,选择一最优。
–sqlserver 查询ssas
EXEC sp_addlinkedserver
@server='LINKED_AS' , — local SQL name given to the linked server
@srvproduct='' , — not used
@provider='MSOLAP' , — OLE DB provider
@datasrc='localhost' , — analysis server name (machine name)
@catalog='MultidimensionalProject2' — default catalog/database
— FLATTENED转成平面表
SELECT * FROM
OPENQUERY(LINKED_AS ,
'SELECT FLATTENED PredictTimeSeries (amount,100) FROM [DW Daily Ship] ')
—ssas dmx预测
–传入新数据进行预测
SELECT PredictTimeSeries (amount,5,15,EXTEND_MODEL_CASES) as a
FROM [DW Daily Hour Ship]
NATURAL PREDICTION JOIN (
select '2014-10-21 21:00' as shipdate,2 as amount
union select
'2014-10-21 22:00'as shipdate,2 as amount
union
select '2014-10-21 23:00'as shipdate,2 as amount
union
select '2014-10-21 00:00'as shipdate,2 as amount
union
select '2014-10-21 01:00'as shipdate,2 as amount
) as t
-访问远程ssas,只有windows验证,所以要在远程服务器上添加当前机的账号密码,并且在远程ssas 实例属性-安全上添加账号
–用job运行ssas处理过程