5 月 25 日,特斯拉官微宣布,「我们已经在中国建立数据中心,以实现数据存储本地化,并将陆续增加更多本地数据中心」。
其实,特斯拉数据本地存储,并不意外。特斯拉直接官宣「已经建立」,看似突然,却是特斯拉既定规划的正常执行而已,向前追溯,特斯拉智能网联汽车数据的本地存储早有征兆。
特斯拉数据门时间线
3 月,特斯拉摄像头隐私事件在国内发酵,华尔街日报从知情人处获悉,中国政府已经开始限制军方人员和重点国企员工使用特斯拉。对此,特斯拉 CEO Elon Musk 表示,特斯拉绝不会向美国政府提供在中国及其他国家收集到的任何车辆和用户数据。特斯拉也表示,会在中国建立数据中心,本地存储数据。
4 月,特斯拉全球副总裁陶琳在上海车展期间表示,「特斯拉从启动上海项目的时候,就在建设国内的数据中心,该数据中心应该在今年二季度就能建好。数据中心是特斯拉自己的,但有一部分会跟中国企业合作。」
4 月 28 日,全国信息安全标准化技术委员会发布《关于征求<信息安全技术 网联汽车 采集数据的安全要求>标准草案意见的通知》。针对数据跨境,《通知》明确指出:网联汽车通过摄像头、雷达等传感器从车外环境采集的道路、建筑、地形、交通参与者等数据,以及车辆位置、轨迹相关数据,不得出境。
5 月 20 日,中国网络空间安全协会秘书处联合清华大学互联网治理研究中心、伏羲智库在北京召开《汽车数据安全管理若干规定(征求意见稿)》专家研讨会,特斯拉全球副总裁陶琳、政府事务总监张栋出席。
所以,与外部广泛认知的公关临时应对不同,从国家的一系列数据安全动作和陶琳的表态来看,5 月 25 日的特斯拉中国数据中心落成,更像是一场长期规划的合规经营的产物。
汽车数据愈发重要
工业时代的血液和动脉是「石油+贸易」,到了信息时代,这个命脉就是「数据」,更确切地说,是成规模的庞大数据集。
根据国际数据公司的报告,每 3 年,全球数据量就会增长一倍。预计到 2022 年,数据总量会达到 80 ZB,而到了 2025 年,这个数字会达到 175 ZB。汽车相关的数据量,也正随着智能化的浪潮水涨船高。
一个搭载了大量传感器的自动驾驶车队,只需百辆规模,每小时产生的数据就以 10 TB 记,每天产生的数据甚至可达 PB 级别。入局自动驾驶较早的 Waymo 已经积累了超过 2000 万英里(约合 3200 万公里)的自动驾驶数据,百度 L4 级自动驾驶测试里程数也已突破 1000 万公里。
特斯拉也正是得益于前瞻性的自动驾驶布局,拥有了一个百万辆规模的自动驾驶车队,每天都可以提供充足的数据养料,支撑自动驾驶算法的训练和快速迭代,从而在自动驾驶领域一骑绝尘。
在可预见的将来,会有更多的后来者加入数据迭代算法的阵营。智能网联汽车的数据价值在一路攀升,随之而来的数据安全问题也在浮出水面。
自动驾驶汽车因为配有高清摄像头、激光雷达、4D 成像毫米波雷达等感知传感器,拥有强大的环境信息采集能力,难免会涉及敏感地点的受保护内容。这些敏感数据一旦跨境传输出去,后期治理难度极大,处理不好甚至会影响国家安全。
从国家数据安全下降到个人隐私保护,互联网时代,我们本就处在信息裸奔的大环境下。多少人有过类似经历,刚刚和朋友聊天谈到某项产品,随后手机就会精准推送相关产品的广告。智能网联汽车时代,个人数据隐私会增添新的困扰。
例如现今很多车型配备了疲劳驾驶预警系统,通过车内外的摄像头分别监控驾驶员和前方道路,在发现驾驶员出现疲劳、打哈欠、眯眼睛及其他错误驾驶状态后,及时进行分析和提示。
用户获得了预警保护的安全性,但前提是提供了个人面部信息。这些数据被上传到哪里,会被如何利用,用户无从知晓。而在将来,智能座舱可能会通过语音交互、面部表情捕捉、体温监测等技术手段获取更详尽的用户数据。
智能网联汽车在带来更加智能的服务体验的同时,也在引发更多的信息安全和个人隐私问题。但是,信息安全和隐私保护固然重要,新生事物想要发展,空间和自由不可或缺,因噎废食也不可取。智能网联汽车数据如何管理,松紧平衡如何把握,非常考验智慧。
智能网联汽车数据如何管理
各国对数据的主权意识都在觉醒,数据本地存储逐渐成为大趋势。在互联网行业,苹果公司就是将中国用户的数据留在「云上贵州」,TikTok 也被要求将用户数据留在美国。
回到汽车行业,《关于征求<信心安全技术 网联汽车 采集数据的安全要求>标准草案意见的通知》已经给出明确指示:智能网联汽车采集的数据不得出境。解决智能网联汽车数据安全问题的第一步,就是数据本地存储。
智能汽车数据本地存储,始于特斯拉,但并不限于特斯拉。参与 5 月 20 日《汽车数据安全管理若干规定(征求意见稿)》研讨会的,除了特斯拉相关人员,还有百度副总裁吴梦漪、公共政策研究院副院长桂宁,阿里云汽车行业解决方案总经理戴霖等行业代表。
汽车数据安全其实是整个智能网联汽车行业的问题,特斯拉以外的其他跨国车企陆续在中国以及其他地区建立大规模的数据中心,很可能是未来常态。
数据存储在本地后,如何监管和处理是新的问题,尤其是数据的脱敏。智能手机收集的数据要经过清洗、脱敏后,才可被上传和利用,智能汽车收集的数据也不会例外。
特斯拉在中国建立数据中心,敏感信息必然会被清洗脱敏,待不触及国家安全和个人隐私才会被允许开发利用,有些难以脱敏的重要数据,会被直接封存在本地,不允许外传。
对于特斯拉而言,如果需要脱敏的数据只涉及敏感地区等相关内容,而不包含道路指示标识等重要信息,并不会对其数据应用造成过多困扰。
其实,出现在特斯拉身上的问题,本质是我们如何应对智能网联汽车这种新生事物带来的新生态的问题。相较于传统汽车时代,智能网联汽车的软件技术发展太快了,法律法规和监管手段跟不上技术前进的脚步。更多时候,特斯拉是作为新事物的代表,被放在了聚光灯下。
清华大学车辆与运载学院创院院长杨殿阁表示,「在技术手段不完备、管理制度还不完善的情况下,对跨境传输应该采取更为严格的管理方式,尽快将数据先堵住,待研究清楚之后,这些确实需要传出去且不涉密的脱敏数据才能在全球范围联合研发。」
针对数据安全的管理制度的探索和完善,各主要经济体早有开展。欧盟在 2018 年 5 月 25 日出台的《通用数据保护条例》(GDPR),前身是 1995 年的《计算机保护法》,是欧盟针对 Facebook、Google 等互联网巨头发起调查和诉讼的重要法律依据。
硅谷汇集了全球最顶尖的高新科技机构,面对随科技进步而来的隐私保护问题,加州在 2018 年 6 月 28 日立法通过了《 2018 年加州消费者隐私法案》(CCPA)。CCPA 给予消费者更多的个人信息控制权,从而面对企业的数据收集。
中国也在推动数据安全保护的立法,2020 年 10 月 21 日公布的《个人信息保护法》草案就借鉴了欧洲 GDPR 的内容。该《保护法》如获通过,会成为中国第一部旨在解决数据隐私问题并为公民提供个人数据保护的法规。
另一方面,技术手段的完善也是保障数据安全的重要一环。以数据库安全技术为例,核心和敏感数据会被加密存储,并通过防火墙防止数据泄露,再进行匿名化等脱敏处理,以及数字水印等可溯源处理。
只是,智能网联汽车产生的庞大并还在指数增长的数据量,以及新场景下的新数据形式,会对数据的存储、脱密、传输等环节提出新的要求。
结语
特斯拉在中国建立数据中心,意味着国家对整个汽车行业数据安全问题的重视,并已展开相应行动。另一方面,智能网联汽车行业在走向成熟,必然会产生更加庞大的数据量,其实收集、存储、传输和开发等环节越规范,越有利于智能网联汽车行业的发展。