首页 资讯 关注 科技 财经 汽车 娱乐 图片 视频 全国 手机版
数据 业内 数据 数码 手机

马蜂窝被捅背后,数据正义和生意在哪?

来源:网络整理 作者:采集侠 人气: 发布时间:2018-10-28
摘要:正确的数据代表一种正义,比如前几天一个创业团队乎睿数据“捅”了马蜂窝,用正确的数据说出了一丝真相。 但很多人忽视的是,正确的数据原本是一桩大生意,而中

马蜂窝被捅背后,数据正义和生意在哪?

正确的数据代表一种正义,比如前几天一个创业团队乎睿数据“捅”了马蜂窝,用正确的数据说出了一丝真相。

但很多人忽视的是,正确的数据原本是一桩大生意,而中国市场的事实是,大多数数据服务公司以提供虚假数据、贩卖排名为商业模式,在没有找到健康的商业模式的同时,却在驱赶真实数据。

乎睿数据这种新兴团队有可能成为数据市场一股清流,把正确数据商业模式带回中国市场。

作者:Oak 庆凡 微信公众号:略大参考(hyzibenlun)

01 数据正义

正义有时候看起来并不重要,乎睿数据和公众号作者梓泉很快就会被公众遗忘。

事件无需再赘述,乎睿数据是一个做语义分析的团队,即通过人工智能技术对自然语言做分析,通过工具扒拉出马蜂窝内容数据造假的事实,而马蜂窝造假的目的是将用户引向特定的商家。

在乎睿摆出的数据面前,很多人都会相信马蜂窝造假的事实,但马蜂窝并不会因此受到多大影响,他们知道,只要迅速让公号闭嘴,事情很快就能过去,毕竟信息洪流之下,人们的注意力两天就会转移。

马蜂窝起诉了乎睿数据和公众号梓泉,按照惯例,接下来就是申请“行为保全”,禁止该公众号继续发布相关内容,甚至是向媒体发律师函,要求删除相关文章。

在起诉之后,马蜂窝的律师函应该已经马不停蹄地递送到新浪、微信、知乎等各大社交平台以及凤凰网、新京报等媒体平台,要求删除相关文章。一般来说,这些平台在收到相关权利人的律师函后,都会予以删除,因为平台并没有能力判定是否构成侵权,所以采用保守做法,无可厚非的。

马蜂窝被捅背后,数据正义和生意在哪?

图:马蜂窝向法院提起诉讼

公众号“逻格斯说法”指出,代他人发类似的律师函,已经成了一个产业链,“一些中西部的小所会承接这类案件,不对事实做基本的调查,批量向全平台发送律师函,一封律师函只收取一两百块钱,删除负面新闻的效果非常好。”

也就是说,不管最后诉讼是否会胜利,公号和媒体在不再讨论相关内容之后,这件事情会从公众议题中逐渐消失。

马蜂窝这些网站上的评论在很大程度上影响着个人的购买等生活决策,马蜂窝这些网站用如此大的成本去造假也侧面反应了这个问题。

梓泉在他的文章里写到,“9月份,乎睿数据团队,带着这份起底报告,找了国内几家知名的科技媒体,他们听说了事情很积极,但是,一听说主人公是马蜂窝,都沉默了。”

在这种情况下,梓泉刊发了这几篇文章,而从媒体报道影响力来说,梓泉这几篇文章的影响力堪比那条被转发的锦鲤,的确不小了。

但即便如此,随着被禁言,公众淡忘,以及没有任何司法部门介入打击这种行为,事情很快就过去了。

而在大数据时代,这种造假无处不在,正确的数据偶尔能够指出一些真相,但往往又被卷入信息洪流之中。

02 好数据好生意

如果说在公众的注意力中难以追求持久的正义,可持续的商业模式在某种程度上能够让这种正义的影响力更为广泛。

乎睿数据其实是有良好的商业模式的,比如通过语义分析,它可以提供咨询服务。

在马蜂窝的案例中,它可以是投资人尽调的工具——2015年2月,马蜂窝获得高瓴资本、启明创投的C轮融资,金融逾亿元;梓泉的公号文章中指出,在那之后,马蜂窝点评异常活跃,到了2017年12月,再次获得淡马锡等一共1.33亿美元的D轮融资。如果投资人对于马蜂窝的内容造假有一定的识别能力的话,对他的活跃用户等指标有不同的判断,也许会重新做投资决策。

乎睿数据的成员,拥有大数据分析、自然语言处理这些技术和教育背景,整体解决方案也是以自然语言分析为入口,提供舆情预警、内容采集以及文本溯源等等,这些都是能够为公司策略、投资机构种种商业决策提供服务的。

从海量数据中抓取数据,并形成商业智能分析并不是新生意,但乎睿特点在于对自然语言的分析。如果说传统的数据公司支持的是对数据的分析——在行业中称为有结构的数据,而自然语言分析则是非结构数据,在深度学习等AI技术成熟之前,难以实现这样的分析,甚至得出结论。从2012年开始,深度学习等基础技术逐渐成熟,而语义分析并提供商业智能决策毫无疑问是深度学习技术商业化的方向之一。

乎睿这种对于自然语言的分析在美国已经有同类型的公司。

在亚马逊上也存在刷单行为,Fakespot.com也是一个通过自然语言分析来提供评论分析服务的平台。用户可以将评论复制放入搜索框,从而得出评论是否是伪造的结论。除此之外,这家公司还提供品牌的排行榜,即通过大数据分析,得知哪个商家在给产品评论造假,而哪家没有。

这家公司在2016年7月成立,在2018年9月才宣布了种子轮融资,而根据公司自己提供的数据,年收入已经达到150万美元。

数据服务永远是一门好生意。如果说提供语义分析的数据服务还是新兴生意的话,那些传统提供结构数据,比如金融数据、创投数据的公司已经展示了可观的商业前景。

CB Insights是一家提供科技行业市场数据的公司,他们的数据报道和榜单被大量引用,并已经成功实现盈利。

“我们每个月都会保证利润大于成本。”创始人Sanwal在2017年接受采访时表示,每年利润固定增长大概100%。

马蜂窝被捅背后,数据正义和生意在哪?

图:CB Insights创始人Sanwal

据了解,其收取的企业服务收费用范围为每年2万~6万美元,定制化的企业服务收费则达到10万美元以上。

“我们采用方法之一是数据抓取,所以也会使用大量的非结构化数据。它们的来源十分广泛,可以是新闻媒体报道、科技行业报告、公司财报等等”,Sanwal在接受媒体采访时说,他们利用这些数据来帮助用户分析未来某个科技产业的发展方向、竞争对手的发展方向,以及他们最应该关注的问题是什么。

根据介绍,CB Insights数据来源分为两个部分,60%是通过爬虫技术从网上获得的,每天要对上百万个网站抓取数据,此外,还专门开发了软件工具,从中国、日本、韩国或者新加坡等亚洲国家的在线出版物中寻找数据。比如在中国,腾讯科技是CB Insights引用源之一。

CB Insights剩下的40%的数据是直接获得的,即由机构主动向他们提交,这些数据他们通过新闻简报或行业调查的方式收集。

目前CB的客户主要是企业、VC及数据机构的用户,或者交易员、分析师、投资银行等。

责任编辑:采集侠
首页 | 资讯 | 关注 | 科技 | 财经 | 汽车 | 娱乐 | 图片 | 视频 | 全国

Copyright © 2006 中华汽车网学车频道 版权所有 Power by DedeCms 粤ICP备05115119号-1  技术支持:中华汽车网学车频道

电脑版 | 移动版