央视网评丨“爬虫”滥觞,窃取数据的行径该整肃了

2019-11-09 14:27:29

央视网评丨“爬虫”滥觞,窃取数据的行径该整肃了

最近,一些著名的大数据风力控制公司卷入了丑闻。他们使用“爬虫”技术侵犯用户隐私,滥用数据,并涉嫌协助借贷和收集。这是另一种以科技创新为掩护的传统业务,是“卖羊头狗肉”,值得警惕。

我们不否认大数据在提升产业和提高决策效率方面发挥着巨大作用。特别是大数据风控制正日益成为金融决策的数字大脑,广泛应用于银行贷款审批和反欺诈。

可以说,大数据风控制公司的业务逻辑应该是研究和判断数据规律,降低风险和控制损失。但是真相呢?他们正在搜寻数据并出售流量。常见的情况是一些公司使用爬虫技术(crawler technology)获取用户信息,如购物流程、通讯录中的联系人、银行卡账单、支付宝和微信交易记录,以及公积金和社保数据,然后打包出售。买家中,许多是贷款公司。他们甚至有这样一个“控风把戏”,购买大数据(Big Data)攀升到的其他贷款公司的数据,并根据“他家出多少钱,我就出多少钱”发放贷款,从而直接挽救了控风环节。事实上,第三方大数据公司提供的风控制报告几乎都是个人信息披露报告的摘要,基本上没有大数据分析。

从用户或同行那里抓取数据成本低、速度快,以至于大数据风力控制公司正在快速赚钱,这背离了风力控制的初衷。这反过来提醒我们,真正的大数据积累和风力控制是一项缓慢的活动,数据的研究和应用更加困难。

在概念包装和神秘化的情况下,我们需要认识到大数据产业在现实中的发展,它通常仍处于“刀耕火种”的阶段。在金融风险控制中,从大多数银行的实际登陆情况来看,“智能风险控制”或“智能风险控制”实际上是指以电子方式和在线方式进行人工操作过程和各种统计报表。此外,人们想象的大数据风控制的基本功能之一是预测风险。不幸的是,频繁发生的银行卡被盗和被盗事件表明,目前的风力控制水平远远不能识别欺诈性交易并拦截和处置这些交易。例如,在金融机构的“反洗钱”风控中,希望该系统能够通过设定某些参数和规则来判断交易中是否存在洗钱嫌疑,但从时间角度来看,预警是“事后”的,发现时损失已经发生。

更荒谬的是,高举科技旗帜的大数据风控制严重依赖人力。在日常的商业场景中,即使许多企业已经建立了风控制平台,但由于需要适应用户的体验和业务的顺畅性,他们在机器的自动判断中也可能会受到人为干预。特别是在现金贷款中,许多企业,在利润驱动和员工绩效共享的机制下,风控只是一种形式。

可以看出,大数据风控制正朝着错误的方向野蛮发展,在必要的道路上非常不发达。也可以说,可见风险不需要大数据。在当前的大数据风险控制水平上,很难识别真正的风险。

爬虫技术起源的一个客观原因是第三方公司没有足够的独立数据源,如电子商务平台或商业银行。大数据风控制工作的先决条件之一是应该有足够的数据。数据越多维,用户的肖像就越清晰,风险来源也就越清晰。目前,数据分散在各个角落。除了工商、税务、信用调查、司法、社会保障等信息分离之外,每个企业及其内部部门都将“打自己的仗”常见的情况是,如果一家银行未能申请消费贷款,另一家银行将能够进行周转,并能够腾出资金。由于数据零散,跨行交易监管一直是一个盲区。因此,所谓的“大”数据实际上在数量和维度上都是有限的,制约着行业的发展和风力控制的效果,打破“信息孤岛”势在必行。

爬虫技术的起源得益于长期缺乏监管,这充分暴露了我们在保护用户隐私方面明显缺乏意识和实力。尽管技术本身是无辜的,但人们会拥有它。江湖骗子杀人取钱是可恶的,窃取信息出卖信息的人也是可恶的。这个行业的清洗和“寒冬”的到来是一场彻底的改革。冬天越冷,越多的蛀虫会冻死。依靠爬虫技术窃取数据注定是不可持续的。提高数据处理能力、服务社会、实现普遍效益是未来的意义。

北京十一选五 江苏快3下注 福建十一选五 快乐十分钟 天津十一选五投注