聊天截图厚码也不安全 大神写了算法分分钟给你还原

讲个恐怖的故事。

早上跟同事在微信闲谈,聊起了一位女同事最近的转变。

效果他反手就把文字打上马赛克,截图丢进了群里:

聊天截图厚码也不安全 大神写了算法分分钟给你还原

还欠欠儿地补了一刀:

@XXX,他说你坏话了呦~

万万没想到,这位同事气焰汹汹地走了过来,竟然直接点出了“隐秘文字”的内容。

那时的我是这样的:

聊天截图厚码也不安全 大神写了算法分分钟给你还原

见状,这位先生弥补道:

都什么年月了,以为打马赛克我就认不出来了?分分钟还原好吧!

……

好奇如我,马上对这个手艺睁开了一番“观察”。

(PS:谈天原图在文末揭晓)

若何还原打了马赛克的文字?

还别说,外洋一家公司的首席研究员Dan Petro(下文简称Dan),这两天就宣布了这么一篇帖子。

他直接点出了重点:

打马赛克(像素化),是一种异常欠好、不平安,而且会泄露敏感数据的方式。

为了验证他的说法,Dan亲自下场写了一个名为 Unredacter 的工具。

然后现场演示了一下,这个工具是若何一点一点把打了马赛克的文字还原的:

聊天截图厚码也不安全 大神写了算法分分钟给你还原

从上面的示例中,不难看出,即便原文打了厚厚的一层马赛克,在这个工具眼前依旧像“裸奔”一样。

或许你会说,这玩意儿操作起来会很庞大吧?

不不不。

异常之简朴,仅仅是2个步骤:

用npm install安装依赖项

用npm start来启动

聊天截图厚码也不安全 大神写了算法分分钟给你还原

虽然在Dan之前,已经有类似的工具存在了,例如 Depix。

但一个异常现实的问题就是,Depix还原的文字,从视觉效果上并不是很好:

聊天截图厚码也不安全 大神写了算法分分钟给你还原

Depix还原出来的文字,有些地方的照样糊糊的。

因此,外洋Jumpsec Lab的一位研究员指出了这个问题,而且还附上了一道对照有意思的挑战:

若是你破解了密码,请联系我们。

注意!冬奥会本月20日闭幕 北京部分道路分时段交通管制

注意!冬奥会本月20日闭幕 北京部分道路分时段交通管制

聊天截图厚码也不安全 大神写了算法分分钟给你还原

这样的挑战便引起了Dan极大的兴趣,这也就是他开发Unredacter的缘故原由。

于是,在Unredacter的加持下,Dan顺遂攻破了这项挑战:

聊天截图厚码也不安全 大神写了算法分分钟给你还原

尔后Dan联系上了这位研究员,在邮件的回复中,也证实了Dan的效果是准确的:

聊天截图厚码也不安全 大神写了算法分分钟给你还原

不仅云云,Dan还先容说,像类似用涂抹方式来打的马赛克,无论是在GiMP、Photoshop或者其它编辑器中,效果都是一样的。

因此,他的破解方式应当是具备一定的通用性。

固然,生涯中我们或多或少都市有“打码”的需求,既然马赛克不平安,那有没有更好的方式呢?

Dan对此的回答是:

用玄色条来遮挡。

聊天截图厚码也不安全 大神写了算法分分钟给你还原

另有还原打了马赛克的图片

实在“还原马赛克”这件事,AI界早就有所研究。

例如杜克大学提出的 PLUSE即是其中之一,还登顶了CVPR。

但它修复的并不是文字,而是人像,例如:

聊天截图厚码也不安全 大神写了算法分分钟给你还原

聊天截图厚码也不安全 大神写了算法分分钟给你还原

从原理角度来看,它本质上是天生匹敌网络 (GAN)。

PLUSE主要是凭证模糊的马赛克像素,“画”出新的一张张不存在的人脸,再压缩回马赛克状态跟原图比一比,把相似的版本拿出来展示。

固然,这项手艺也并非完善,也有翻车的时刻。

例如网友就拿马里奥试了试,效果……

聊天截图厚码也不安全 大神写了算法分分钟给你还原

Emmm……这“味道”,纷歧般。

One More Thing

最后,来揭晓一下开头故事的谜底。

聊天截图厚码也不安全 大神写了算法分分钟给你还原

着实是个凄惨的教训了……

聊天截图厚码也不安全 大神写了算法分分钟给你还原

项目地址:

https://github.com/bishopfox/unredacter

– THE END –

#截图#马赛克

原文链接:量子位 责任编辑:若风

,

原创文章,作者:燃点网络,如若转载,请注明出处:https://www.randianapp.com/26697.html