当前位置:首页 > 旧物 > 密码中的情感表达:基于大数据的发现

密码中的情感表达:基于大数据的发现

关键词:   发布时间:2019-06-12 08:00:01


      在我们日常使用的密码(口令)中,存在很多共同的模式。已经被发现的有123456,abcd1234,zaq12wsx,等等,这些口令最终被黑客所掌握,因此很容易导致口令被猜中而造成信息泄露。更多的口令使用习惯和模式正在被科研人员深入挖掘,目的是为了给公众提醒口令设置的风险因素,提高口令的安全性,进而设计口令安全性评估等方法。

       近日,国际信息安全老牌期刊Computers & Security 发表了复旦大学互联网大数据与安全课题组的研究论文。该论文针对口令中可能使用的个人情感进行大数据挖掘分析,在近2000万条泄露的口令中发现在口令中正面情感的表达比负面情感的表达要多。

     研究发现风险英文词汇包括“love”, “happy”, “good”, “win”, “sunny”, “joy”, “like”, “luck”等;而口令中中文情感表达的主要词汇(拼音)有:“woai”、 “nihao”、“wocao”等,属于口令设置中的风险字符串。

       以下这类形式的口令你是否使用过?



       这项研究工作首先对口令进行了切分,然后基于词汇级别和中文短句拼音情感表达进行了匹配

lovewen99@ -->love wen 99 @

lovezhoujing -->love zhou jing

letmethink --> let me think


引用方式

J Zeng, et al. Empirical study on lexical sentiment in passwords from Chinese websites, Computers & Security, 2019,80(1):200-210.


关于本文更多的知识基础可以阅读作者编著的《互联网大数据处理技术与应用》专著(清华大学出版社,2017),同名公众号,专注于大数据技术的相关科学和工程知识传播,同时也为读者提供一些拓展阅读材料。欢迎选用本书做大数据相关专业的教材,有相关教学资源共享。


以前推送的部分文章如下:

《互联网大数据处理技术与应用》的相关教学资源

大数据价值挖掘的难点和重点:非结构化数据处理

大数据技术体系中的语义分析

大数据技术平台的分类与选择

互联网大数据技术的现状及发展趋势(PPT可下载)


点击阅读原文链接,查看图书详情信息(目录、引言)。


相关内容
分享 2019-06-12 08:00:01

0个评论

文明上网理性发言,请遵守新闻评论服务协议