2019-08-13工作进展
2019-08-13 本文已影响0人
Songger
昨天工作:
尝试使用mv-dssm进行query关联title的效果改善,将封片图信息加入到网络的输入中。当前mv-dssm网络已经搭建完成。训练数据生成中,采用的阿里预训练的resnet50模型来得到图片特征,但是由于数据比较多,程序跑了13h也只完成了10%。
今天计划:
-
完成训练数据生成,开始mv-dssm网络的训练
-
寻找其他可以改善query关联video效果的方式
-
商品主图比较纯粹,没有什么背景,但是有些图片很模糊
select title, concat(https://img.alicdn.com/imgextra/ + pict_url) as pic_url from tbcdm.dim_tb_itm where ds=MAX_PT('tbcdm.dim_tb_itm') and is_online="Y" limit 100;
-
hs_query_ugc_co_video_final_result_info_1最原始的结果,效果非常不好;将query关键词的权重调到70,结果在hs_query_ugc_co_video_final_result_info_6,效果基本上是当前最好,将query关键词的权重调到150,效果变差,在表hs_query_ugc_co_video_final_result_info_7中
-
训练集中title对应的封面图:2658153552,我觉得需要每张图进行特征提取,但是费时
-
关于专利(内容、时间)