远见个人信息保护法将出台揭开数据算法的神秘“面纱”

如今,大数据算法已深入每个人的生活:无论是电商平台,还是新闻客户端和短视频平台,大数据都能根据每个人的特点实现“千人千面”推送;在一些金融平台,科技金融公司也会用安全系统对用户进行“数字画像”,以此确定放款额度和利息。

但有时,大数据也让人有“被监视”的感觉,手机放在身边,刚和朋友说几句话,APP就会推送相应的内容,让人不寒而栗。此外,“大数据杀熟”也一直是备受争议和诟病的问题。

几年来,从网络安全法到时下备受瞩目的个人信息保护法草案、数据安全法草案,关于信息安全的立法进程不断完善和推进,数据算法的合理使用会服务人、更懂人,但是滥用则会侵犯人和控制人。算法到底是什么?怎样平衡安全和服务的边界?个人信息保护法又将怎样保护公民?

主持人:王思远总台央广经济之声【远见】栏目制作人

对话嘉宾:余弦资深安全技术专家、白帽黑客、漫雾科技创始人

数据安全法,明确“数字主权”,刹住数据越权乱象

思远:关于大数据的话题屡见不鲜,但很多时候是偏负面的,比如打车、住酒店时的“大数据杀熟”;外卖小哥被“困在系统里”。这些让算法变得很神秘和冰冷,作为从业者,你怎么用最通俗的理解去解释算法

余弦:简单说,“算法”就是用很多机器、服务器去尽可能模拟人类的思维、行为。大家会把算法简单理解为“人工智能”,但跟人类的思维和行为比,还有非常大差距。在长远的未来看,算法会让我们有更精准的感知和更好的应用场景;但当下还是早期,有时算法会比较“粗暴”。

思远:算法有时会给人两个极端的感觉。一面像是AlphaGo,特定的领域和规则下,表现远远优于人类;另一面,它又缺少人类的温度和感情。

余弦:技术的应用一定要看场景,比如AlphaGo下棋非常厉害,但只局限于此,下棋只是非常小的场景。单一场景内,模型的搭建是很简单的,在特定领域有小维度边界时,算法还能做到速度、储存量、运算能力上超过人类,但真的能够像人类似的万事俱通,在不同的领域都有自己的一套智慧和解决问题的方式,算法还差得非常远。

思远:2020年10月21日开始,个人信息保护法草案正式进入审议——千呼万唤始出来,无论是行业还是用户,都很需要。从业者需要知道数据使用和隐私保护的边界,用户希望技术服务人而不是侵犯人。个人信息保护法,整体从哪些方面保护人的权利?

现在的大数据乱象是伴随新事物而诞生,法律不能盲目制定,有一个过程。2017年6月1日起,网络安全法实施,其对网络个人数据已经有了一些定义;像民法总则、民法典等,也有关于个人信息、数据安全的规定。从国家层面,立法过程中也参考了海外,包括像欧盟通用的数据保护条例。无论是已经颁布的,还是探讨中的草案,我们都该重视它。

作为服务者,也要弄清自己的责任,比如数据储存在服务器里,但如果因为服务器漏洞被入侵的“黑客”偷走了,怎么界定责任?互联网厂商承不承担责任?法律上关于这种界定会越来越多,当下不能说法律很完善,但至少有了这几部法律的帮助,是很好的促进。

“爬虫学得好,牢饭吃到饱”?——论技术的价值观

思远:如果说算法是底层的逻辑和系统,那么大数据就是养料和细胞。从PC时代,到移动时代,再到物联网时代,算法都离不开“爬虫技术”,简单说就是通过网络勾连,实现数据的收集、分析和再组合,实现特定的目的。但“爬虫”经常会爬到隐私,听说圈里有一句话叫“爬虫学得好,牢饭吃到饱”?

余弦:在安全行业,尤其是前两年做“爬虫”生意的一些企业,都因此而触碰了法律被制裁。“爬虫”技术本身没有好与坏的说法,就像菜刀可以做菜,也可以犯罪。

思远:技术是中立的,但取决于人的价值观。

余弦:“爬虫”分为两种场景。第一种是专门做“爬虫”,故意去爬服务器的敏感数据,就是主观作恶。另一种是不小心把数据拿了回来。比如把个人的社保医疗隐私不小心爬回来了,但看到这个信息还挺有价值的,可能会二次利用。同时,这些社保医疗机构网站有漏洞,有没有责任呢?这就像是主动入室盗窃和主人没锁好门导致误闯民宅。不同情况,有不同的认定和处理,这是法律需要界定的。

场景1:金融风控,哪些“大数据画像”侵犯隐私?

思远:我们来聊聊算法的应用场景。生活中最常见的是金融风控——金融数据中的算法是怎样的逻辑?

余弦:核心是通过各类用户数据采集,进行用户画像。让业务决策者更好地理解目标群体,数据越准确、丰满,就越有利于特定的场景去做针对性的事情。

思远:比如给金融借贷,根据征信和消费行为等数据,判断优质客户,给出更好的还款周期和价格,用更低的价格、更高的额度做长线生意;对风险大的客户,拒绝放款。

余弦:这个现象确实非常普遍。很多时候,普通人高估了算法,在我们看来,很多技术真的非常粗暴,就如用户借贷的钱还不上,暴力催收公司通过非法采集用户数据,用灰色方式催债。

思远:很多信息的获取就是一瞬间,交易速度非常快,这对发现违法行为、固定证据会有很大麻烦。真正执法,要靠企业自律或相互监督、举报等,还是什么?

余弦:从操作角度来讲,这些法律是绝对可行的。这里面可能会涉及到具体敏感的话题,这里暂时不展开谈。但首先我们都得有法,才能去操作。未来的执法过程,一方面,数据的滥用,行业内确实有不少的外露特征,明面上能看到;执法肯定由公安进行——比如网安、网络警察。

场景2:大数据营销愈发精准,我们是否被“监视偷听”?

余弦:如果单方面来看,感觉会很惊悚,当然,实际上这是“幸存者偏差”,并不是非常普遍的事件,跟算法也没什么特别的关系——它可能是一种概率,碰巧遇到了,会放大这个事情。营销数据专门有做营销产业链的,通过各方面去采集数据,包括可能有非法的一些交易,能够尽量做到精准推广。

无论是个人信息保护法草案,还是数据安全法、网络安全法、民法典等,多少都有围绕隐私的关于数据的定义或说法。数据活动指的是,数据在收集、存储、加工、使用、提供、交易、公开等行为;数据安全是指通过采取必要的措施,保障数据得到有效保护和合法利用,并持续处于安全状态的能力。

思远:你说了两点。第一,有时大家过于敏感,陷入了“幸存者偏差”;第二,算法、大数据的合法性,包括大数据应该去脱敏的信息点,需要法律规范。回到算法本身,有句话说,“未来世界,只有两种人,一种是控制和决定算法的人,一种是被算法控制的人”。好像很有道理,以往人会自己去探索信息,有更多发展的可能性;现在算法会困住人,越来越懂你的同时,推荐的信息就越来越局限,会围绕着现有的水平、认知和圈层。你怎么看这个问题?

余弦:我赞同行业内这个说法。算法是机器输出来的,通过人类反应的信息,按照概率计算,反向给出推荐信息和服务,又让人形成新的依赖感,手机成了人的器官,人掉入了数据的舒适区,沉浸在这种数字体验中。我也会这样。

但另一方面,我懂技术,某些层面上我也控制算法,尽量让算法能为周边的人提供价值。所以我们才会讨论关于算法的法律红线,否则算法肯定会失控,要更规范,肯定要有法可依。某种程度上,算法和人是相互依存的关系,没有人的行为就没有数据,没有数据就没有了算法。

但同时我们也看到说,算法本身以技术的形式去存在,技术上,其实张一鸣曾在几年前抛出一个言论,大家也讨论得非常热烈,就是说,技术其实本来是工具,工具只分好用和不好用之分,技术高和技术低,我觉得这句话本身没有错。

因此,综合到算法上来说,无论是这个产业环境还是我们的生活,算法上有没有价值观,其实先放在一边,但是研究算法的人、使用算法的人必须有价值观,必须有法可依,算法才能更加值得人去信赖。

THE END
1.我的个人算法是什么?一、个人算法 > 个人系统 如果你接触过得到平台上的文章或课程,会明显感觉到创作团队善于把概念提炼成便于记忆的关键词。比如这篇谈怎么自我精进的课程中,借助了程序员思维,告诉你每个人都需要一套人生算法。 之前虽然也有接触过人生算法这个词,但完全没有深入思考过。只是一直很在意个人系统的搭建。而我对个人系统https://www.jianshu.com/p/b5fd0af47310
2.算法入门篇详解步骤的集合: 算法首先是一个步骤的集合,这些步骤用于解决某个特定的问题或执行特定的计算。这些步骤被明确地定义,并且按照特定的顺序执行。 明确性: 算法中的每一个步骤都必须是明确无误的,不能存在歧义。这意味着对于任何执行算法的人或系统来说,算法中的每一个步骤都应该有一个清晰、唯一的解释。 有穷性: 算https://blog.csdn.net/nndsb/article/details/140599327
3.个人算法笔记完整版.pdf个人算法笔记完整版.pdf,Table of Contents 开篇词 1.1 第零章、必读系列 1.2 学习算法和刷题的框架思维 1.2.1 动态规划解题套路框架 1.2.2 回溯算法解题套路框架 1.2.3 BFS 算法解题套路框架 1.2.4 我写了?诗,让你闭着眼睛也能写对?分搜索 1.2.5 我写了?诗,把滑https://max.book118.com/html/2020/1207/5010340124003040.shtm
4.不要披着算法的高科技外衣侵犯个人隐私或许这就是算法。在这里我们特别申明,我们只是借今日头条对算法的描述来印证算法的含义,而无指责之意。问题是,当算法成为风口之后,已经有越来越多的公司在应用算法或者打着算法的高科技幌子,行侵犯个人隐私之实。 法律法规的规制作用在大数据保护中都已滞后,在算法时代,就更显苍白了。 http://www.legaldaily.com.cn/commentary/content/2019-02/01/content_7762329.htm
5.保护个人信息,让算法推荐不再“算计人”但其负面效应还不止于此。为了取悦用户,算法会不断推荐其感兴趣的内容。业内人士认为,这种个性化推荐收窄了用户的信息接收范围,并减少了接受差异化讯息的可能性,容易让人深陷“信息茧房”而不自知,不利于个人认知成长。 与此同时,算法取代人工充当信息推荐的“编辑”角色,内容能否推送、推送什么内容、内容推送给谁,https://wap.cqcb.com/shangyou_news/NewsDetail?classId=4&newsId=4509437
6.王莹算法侵害类型化研究与法律应对——以《个人信息保护法算法的普遍应用给个人及社会带来如下类型的侵害:算法标签、算法归化、算法操纵、算法歧视与算法错误。传统部门法分析框架无法对算法侵害进行完全的、有效的规制。GDPR和我国最新通过的《个人信息保护法》提供了源头数据规制与数据赋权制衡的应对方略,不仅规定了数据处理原则、个人数据权利,还专门引入自动决策概念,设置专条进https://lti.ruc.edu.cn/sy/xsgd/sjygrys_/dee44ba4681146c983fe2ebfcdf5c153.htm
7.“一个人连基本的算法都掌握不了,他肯定成不了优秀的程序员算法与数据结构:导论篇-算法的重要性 怎样学算法 算法学习笔记 锻炼内功,高效学习,如果有什么秘诀的话,那就都在这里了 算法分析的正确姿势解读 数据结构 排序算法 程序员必学的十个算法 学习算法思想,修炼编程内功 二、个人主页系列篇 Lxxyx作者 学习JavaScript数据结构与算法(四):二叉搜索树 https://www.imooc.com/article/details/id/254516
8.算法和个人努力到底能否和解?电影好像并为说清楚(逆行人生)影评电影开头程序员被开除,经理说是用他自己开发的人力系统算出的结果,并且强调了是他自己开发之初说的不能质疑算法。中间外卖小哥之间起冲突,因为“卷王”拉高了系统算法里的工作效率,让所有人被迫提高效率以保证收入不下降。到此已经两处暗暗讽刺打工牛马被算法扼住咽喉。中间对于外卖小哥群体个人刻画铺垫了很多人性的真https://movie.douban.com/review/16104498/
9.算法创意实践挑战赛(个人赛)本竞赛项目要求参赛选手在C++软件编程环境下,通过赛题分析、程序设计、创意实现,完成比赛目标。 二.比赛主题 “算法创想,科技创新” 三.比赛内容(详细内容请查看赛项说明文件) 1.比赛过程将全面检验参赛选手基于C++软件编程语言的技术实现能力,鼓励参赛者动手创造,提升中小学生创新创造能力、探 究协作能力、动手实践能力https://ceic.kpcb.org.cn/cms/cssc/8198.htm
10.[法治在线]法治封面关注个人信息保护法实施拨开“算法”迷雾来源:央视网 更新时间:2021年11月03日 13:27 视频简介:2020年7月,浙江绍兴的胡女士通过某商旅平台订购了一家酒店的房间,并通过平台支付了2889元房费。可当她完成住宿准备退房离开时却得知这家酒店的实际挂牌房价比自己通过平台所支付的要低得多。本期节目将聚焦“大数据杀熟”,拨开“算法”迷雾。?https://tv.cctv.com/2021/11/03/VIDEtExTmOs5Xv3JXoeB3fvu211103.shtml
11.将AI算法模型作为资产交易!京东科技是如何做的?(上篇)(4)根据上一步描述的不同发布形式及对应的授权方式,AI算法模型个人开发者将AI算法模型授权、交付给第(1)步领取需求任务对应的需求方或自主从AI交易市场采购的需求方;基于交易市场中的订单管理和计算管理功能,需求方按照算法模型发布时约定的计费方式与AI算法模型个人开发者进行结算。 https://maimai.cn/article/detail?fid=1648387382&efid=ZnpBsMMGwuPBQLcaFyEquA
12.?对于Logs官方算法的核心内容随手翻译与个人理解?对于Logs官方算法的核心内容随手翻译与个人理解 《最终幻想14》LOGS算法是FF14游戏中的一项强大的战斗记录工具,可以记录玩家在游戏中的所有战斗数据,包括技能使用、伤害输出、治疗数据等等。对于喜爱PVE的玩家来说,这是一个必不可少的工具。本文将详细解析FF14 LOGS算法的原理和使用方法,并给出一些优化建议,帮助http://ff14.17173.com/content/10312023/180343353.shtml