2019-03-11派森学习第113天
2019-03-11 本文已影响0人
每日派森
今天第一天去了公司实习。
首先,通过和产品经理的沟通明确了一下的问题:
当前公司的问题
晚上回到学校后,和马老师沟通后,现在方案为:
1 偏向工程方面的处理
2 偏向学术方面的处理
不同的侧重,将会导致不同的处理方法。
针对1:
马老师说,如果动态出现的紧急度较低的故障,原有算法已经可以应对了。只需要对出现高紧急度的故障这种情况在进行算法方面的完善。
针对2:
需要用新的算法,可能要用到机器学习(强化学习)方面的算法。
接下来,就是先把智能派工的文章先过几遍,以及文章涉及的相关的内容看看,学一学,从这里入门。
今天继续学习了用Q-learning算法进行强化学习。
进行了一个小实验,小人寻找右侧宝藏。小人会通过强化学习,不断缩小每次找到宝藏T所需的步数。
寻找宝藏
刚开始,初始化Q-table为全0的矩阵,学习结束后,Q-table变成了:
学习结束后Q-table值
padans中:
loc——通过行标签索引行数据
iloc——通过行号索引行数据
ix——通过行标签或者行号索引行数据(基于loc和iloc 的混合)
同理,索引列数据也是如此!
也就是说,
想用loc时取出某一行时需要用标签来索引
想用iloc时取出某一行时需要用数字序号来索引
想用ix时取出某一行时用标签和数字序号来索引都可以
a就是标签