陈北坦言,“设想很美妙,但做起来有难度,单纯的新闻类a太过简单,而要说到你说的个性化推荐……又太难,你也是高级知识分子,应该知道模型这俩字,说起来容易,做起来真不容易。”
“具体,难在哪儿?”温晓光问道。
陈北仰着脑袋想了想,他那个头发是越来越少了。
“按照你的要求和设想,我们要根据用户的社交行为、阅读行为、地理位置、职业、年龄等挖掘出他的兴趣,如果要真正实现大致上要分成两步,第一步就是通过用户的阅读行为,计算出用户兴趣。第二步,要在用户的每一次动作之后捕捉其动态,然后更新用户模型。”
“你不必和我讲这么专业的东西,我并非计算机出身,听不懂你说的用户模型的内涵,你只告诉我,难在哪儿?”
“哪儿都难啊。”陈北都要眼含泪水了,“要从每一条信息中提取几十个到几百个高维特征,然后进行降维、相似计算、聚类等方法去除重复信息,之后要进行机器分类、lda主题分析、信息质量识别……”
“更关键的是,你说的是做到实时推荐,那需要计算机在多久时间内计算出结果?”
温晓光确实不大懂,“既然是实时,总归是得很短很短才行,1秒?”
“真1秒就好了。”陈北扯着嘴巴苦笑,“考虑到巨大的用户规模,每个实时推荐的计算要在01秒内得到结果,用3秒钟完成文章提取、挖掘、消重、分类,5秒计算新用户新区分配,10秒内更新用户模型。”
好吧,听起来是不大容易,温晓光原谅了他的抱怨。
“既然这样的话,我给你推荐一个人,你找到他,可以给他高薪,但能不能弄过来,得看你的本事。”
陈北陡然有了兴致,眼睛瞪大了问:“谁?”
“张一名。九九房的ceo,你去碰碰运气吧。”
陈北呲溜一下就跑了。
“要的确是人才,我真的会给很高的薪水的,反正到时候你发!”
温晓光微笑不语,他是无所谓的,这种人才不是钱的问题。