我的光影年代[校对版]_第1039页

怎么推荐？

根据用户的阅读行为、地理位置、职业、年龄等信息挖掘出兴趣；

自然语言处理和图像识别：对每条信息提取几十个到几百个高维特征，并对信息进行分类、摘要抽取，主题分析、信息质量识别、敏感词过滤、正能量指数计算等一系列处理；

然后精准推荐：根据用户特征、环境特征、文章特征三者的匹配程度进行推荐。

某种意义上说这种不构成侵权——本质上是一家技术服务商，而不是内容服务商！

当然，这很无耻——因为它将作品上传到自己的服务器内，而当我们阅读今日头条的作品时，我们阅读的是近日头条的服务器的作品，并没有直接导流道其它服务器！

这么说吧，人家辛辛苦苦原创的东西，被你无偿拿来使用，搁谁身上也受不了！

关键你还靠着这些阅读量赚钱了！

于是，藤逊、百度、网易、嗖狐，起诉的起诉，谴责的谴责，《新京报》还发了篇社论：今日头条是谁的头条？嗖狐、大洋网直接把今日头条给告了！

好，这是大前提！

稍微补充一下，两天前，今日头条b轮融资，直接融资一亿美元，头条估值超过五亿美元，也算是大背景……

……

“律师怎么说？”

张亦鸣：“律师说现在的版权很难界定……”

旁边的律师插话：“作为一个新闻推荐类应用，今日头条必须先通过计算机爬虫程序在各个新闻网站页面抓取相应的内容，然后才能分析并向用户推荐新闻，那么，其有没有权利抓取新闻网站的内容？根据现在互联网通行的规则，只要被抓取的网站不反对其抓取，即为有权。”

“如果新闻网站反对被爬虫程序抓取的，可以在专供爬虫程序读取的文件内设置白名单或者黑名单，禁止部分爬虫抓取信息或者只允许某些爬虫抓取信息。如果爬虫程序耍流氓，被禁止了还照抓不误，网站可以依据《反不正当竞争法》第二条的规定的起诉通过爬虫程序抓取信息者。”