最近有人问国内使用Google Analytics是不是合法,其实去年的时候就写过关于这个,可以看:国内使用Google Analytics是否违规,那时我是不太确定的。


但经过交流,我是确定的了。


国内使用Google Analytics违法?

目前有部分人觉得在国内使用Google Analytics是违法的,认为:

Google Analytics的域名解析服务器在国内,国内没有数据中心,所以最终收集的数据是转发到境外的数据中心,所以违法。

我们来看一下Google Analytics在国内收集数据的流转过程:

 


国内使用Google Analytics收集数据是传递到:https://www.google-analytics.com 。


我们再ping一下收集服务器的地址www.google-analytics.com:

 

可以看到域名都是境内的,也即是国内使用Google Analytics是发送到境内的服务器,这样看上去是没问题。


但实际上没那么简单,我们还要结合谷歌在全球的数据中心情况来看,谷歌在中国是没有数据中心的,亚洲也只有台湾和新加坡这两个地区才有,详细的可以看https://www.google.com/intl/zh-CN/about/datacenters/locations/。

数据中心的定位是:Google 在全球各地都设有数据中心并自行运营,力保互联网全天候正常运行。可以理解为谷歌服务提供计算和存储的地方,Google Analytics的数据理应存储在数据中心的。


而且谷歌在中国境内是没有GCP(Google Cloud Platform),那么Google Analytics在国内收集数据会是怎么处理?


两种方式:

  • 一种是转发到境外,虽然前面看到的收集服务器是境内的,但实际是转发出去的,最近的数据中心有台湾和新加坡。

  • 一种是自建或和合作伙伴在境内合作的数据中心提供服务,为了合规做本地化。

 

第二种方式明显不可能,谷歌在国内业务受限,所以是第一种方式,Google Analytics在境内收集数据通过境内服务器转发到境外的数据中心。


你看,Google Analytics在国内收集的数据到境外了,所以违法。


但实际上,不是的,国内使用Google Analytics是不违规的。

 

为什么说不违法?

《个人信息保护法》针对的是个人信息而Google Analytics默认收集的的是匿名信息,这两者完全不一样的。


《个人信息保护法》第一章第四条对个人信息的定义:

个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息


如果你还不理解,可以看《信息安全技术个人信息安全规范》对匿名化所得信息的定义:

匿名化 anonymization

通过对个人信息的技术处理,使得个人信息主体无法被识别,且处理后的信息不能被复原的过程。

注:个人信息经匿名化处理后所得的信息不属于个人信息


总结就是:匿名信息是不属个人信息,不受《个人信息保护法》的限制,Google Analytics默认使用的是匿名信息,所以不违法。


其实,"不包括匿名化处理后的信息"这句可以理解为是鼓励企业采用匿名化的措施或手段去处理数据,而且匿名化也是常用的处理个人信息的一种方法,如《个人信息出境安全评估办法》中就明文指出,匿名化是作为涉境外数据处理合同终止时处理个人信息的方式之一,是鼓励使用匿名化的。

 

之所以有人觉得在国内使用Google Analytics违法,是因为对个人信息、匿名信息理解差异导致,很多的法律法规针对的是个人信息,接下来我们来看个人信息的定义和分类:


个人信息的定义和分类

《个人信息保护法》将个人信息可以分为一般个人信息(通常直接称为个人信息)和个人敏感信息:

  • 个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。

  • 敏感个人信息是一旦泄露或者非法使用,容易导致自然人的人格尊严受到侵害或者人身、财产安全受到危害的个人信息,包括生物识别、宗教信仰、特定身份、医疗健康、金融账户、行踪轨迹等信息,以及不满十四周岁未成年人的个人信息。


如果你只看《个人信息保护法》,往往不能准确理解个人信息和敏感个人信息定义和划分。


你还需要看《信息安全技术个人信息安全规范》,里面就对个人信息和个人敏感信息都做了举例,就很好理解。


个人信息举例:



 

个人敏感信息举例:


 

那么什么是匿名信息呢?


匿名信息是经过匿名化处理后所得的信息,它的特点是处理后的信息不能被复原,不能关联到个人。


如Google Analytics是用Client ID去识别用户,而Client ID是是一串时间戳和随机数,完全无法与个人信息识别与关联起来。


可以看个例子,对比一下:

结合一般个人信息和个人敏感信息的定义和举例来看,电子邮箱是一般个人信息,身份证是个人敏感信息,都属于个人信息,是可以识别个人,而Client ID是是一串时间戳和随机数,完全无法与个人信息识别与关联起来。



现在明白为什么说使用Google Analytics不违法了吧。


虽然不违法,但有需要注意的地方,接下来看需要注意什么?


不违法,但需要注意

Google Analytics默认收集匿名的数据,但你在设置或使用的时候需要注意:

  • 不要发送PII信息给Google Analytics,如果跟踪涉及PII信息,那就违法,比如你设置了Email,手机号,身份证号为自定义维度,这些都是不行的,严格来说,如URL上有邮箱地址也是不行的。

  • 设置IP匿名化:根据国内法律,IP地址是属于个人信息,所以不能收集,要做匿名化。

 

常见处理个人信息的方法

匿名化、假名化、去标识化是个人信息处理的方法,但在不同国家或地区的法律中,这几种方法的定义、范围和对应的处理原则是不一样的。


如在中国,主要是使用匿名化去标识化这两个概念,根据《信息安全技术个人信息安全规范》,“假名化”属于去标识化所使用的一种技术手段。

  • 匿名化(anonymization):通过对个人信息的技术处理,使得个人信息主体无法被识别或者关联,且处理后的信息不能被复原的过程。

  • 去标识化(de-identification):是指通过对个人信息的技术处理,使其在不借助额外信息的情况下,无法识别或者关联个人信息主体的过程。

 

可以看个例子,更好的去理解匿名化和去标志化:


Google Analytics是用Client ID去识别用户,而Client ID是是一串时间戳和随机数,不能复原,完全无法与个人信息识别与关联起来,可以理解Client ID就是匿名化。


而User ID,通常是Email或自己ID体系的哈希值,借助外部信息(Email/自己ID体系与哈希值的映射关系)是可以倒推出个人信息,可以理解为User ID是去标识化。


Google Analytics是允许使用通过哈希计算的User ID,但是在国内的法律框架下,这属于违规的了。

 



点赞(22) 打赏

Comment list 共有 0 条评论

暂无评论

服务号

订阅号

商务洽谈

微信联系站长

发表
评论
立即
投稿
返回
顶部