899
浏览基于用户行为特征的低能耗身份认证摘 要:目前,移动设备中传统的身份认证如密码、指纹等方式存在安全性低、易被破解等风险,不能完全保护使用者的隐私。本文提出基于用户行为特征的持续身份认证方案,通过调用移动终端传感器获得与用户行为相关的数据,采用最大互信息系数提取出能表征用户的特征,再利用机器学习算法进行模型训练,对用户身份进行识别。为了使持续的身份认证方式尽可能减少能耗,提出了低能耗的身份认证模型,对内置传感器的不同采样频率和识别算法进行能耗分析,实验结果表明,模型采用朴素贝叶斯算法,传感器采样率为25 Hz时,可以使认证精度达到97.94%,且显著降低认证模型的能耗。
关键词行为特征,移动终端,传感器数据,身份认证,低能耗
1. 引言
随着智能手机中存储的敏感信息(如银行账户)和个人信息(如短信、个人照片)的内容越来越多,隐私信息泄露正成为整个信息社会需要担忧的问题[1]。为了保护隐私和安全,目前移动端常用的身份识别方案有数字密码、图案密码、指纹识别、面部识别等[2] [3] [4]。然而,这类身份认证方式并不能够百分之百地保护,容易被攻破[5]并且认证频繁,每次唤醒设备都要进行验证。当前基于生物行为特征的连续身份验证越来越流行[6],采集移动终端传感器以及用户行为等信息[7],通过算法识别出当前使用者的身份,可以避免频繁使用口令、密码等显式认证方式,且能够对用户进行持续不间断的身份认证,因此能够兼顾用户的体验度与设备的安全性[8]。生物行为识别技术基于用户的行为,如挥手的手势[9]、步态[10]、击键[11]、触摸屏[12]等,以及其他一般行为特征。Frank 等人[13]讨论了用户与触摸屏的交互作为连续认证的行为生物特征是否有效的问题,并证明了简单的触摸行为就足以验证用户。Hestbek 等人[14]提出了一种基于穿戴传感器和非循环特征提取步态的方法。然而,持续的身份认证会增加移动设备的验证开销,Riva 等人提出了渐进式身份认证的方式[15],该方法将用户被要求输入密码的次数减少了 42%,使身份验证成为当前不使用安全锁用户的可行解决方案,并通过支持向量机算法得到 92.5%的召回率。Y. Yang 和 J. Sun 提出了基于行为的移动设备隐式认证的高效 w 层[16],该方法消耗了设备总电池使用量的 14.5%,并得到了 96.73%的平均准确率。在此基础上,本文提出了基于用户行为特征的身份认证方案,通过采集移动设备传感器数据,得到用户与移动设备触摸屏的交互信息,并提取出用户的行为特征,采用机器学习算法训练数据集从而实现对用户的身份验证。为了降低整个认证模型的开销,本文分别对采集数据阶段以及模型训练和认证阶段进行能耗分析,最终得到基于用户行为的低能耗认证模型,该模型不仅在一定程度上降低了能耗,并且能够得到较高的认证准确率。
2. 认证方案设计
基于用户行为特征的身份认证主要有以下几个阶段:数据采集、特征提取、模型训练、身份识别。数据采集部分主要是调用手机内置传感器获得与用户行为相关的交互数据;特征提取部分将采集到的原始数据进行一系列的计算得到更能够表征用户行为的特征(例如滑动轨迹长度等),再将提取出的特征进行分类;模型训练部分本文采用特征融合的方式将分类后的特征进行融合,采用机器学习算法进行模型的训练,并将模型保存;身份识别部分则将测试数据放入认证模型中,并得到认证结果。
2.1. 低能耗身份认证模型
在用户使用手机的过程中,会调用手机传感器来生成与用户行为相关的数据,再通过算法识别出用户的身份,从而达到持续的认证效果。然而这一过程会使认证后台持续运行,导致移动设备有能量的损耗。因此,本文提出了基于用户行为特征的低能耗的身份认证模型,在保证模型准确率的情况下,同时降低模型的能耗。
可以看出,整个身份认证的过程中,最体现能耗的部分即为传感器的调用和算法的识别,因此本文主要从内置传感器的数据采集和识别算法两个方面进行讨论,从降低数据采集过程中设备电量的消耗、减少训练模型过程中所耗费的时间和占用的内存来体现低能耗。认证模型如图 1 所示。
图 1. 基于用户行为特征的低能耗的身份认证模型
2.1.1. 内置传感器
本文主要调用加速度传感器、GPS 和陀螺仪传感器数据,以及触摸屏的 XY 坐标和速度。手机在调用传感器过程中,会导致 CPU、内存、网络和能量发生变化,而本文中的数据采集过程需要大量的调用传感器并返回数据,会频繁地占用内存以及消耗能量。为了探究低能耗的认证模型,本文决定采用不同的采样频率来采集数据,在 Android studio 平台将采集数据的 app 进行设置,采样率分别设为 50 Hz、25 Hz和 5 Hz 进行实验。
2.1.2. 识别算法
模型训练和身份识别是模型中十分耗能的部分。由于不同的算法内部逻辑不同,训练一个模型所消耗的时间也会有所差异;调用训练好模型进行认证时,不同的算法得到的模型所占用的内存也各不相同;另外,模型认证所耗时间和准确率也有一定区别。
本文采用了贝叶斯、支持向量机、逻辑回归和决策树四种算法进行对比实验,并对算法的能耗进行分析,将准确率较高且能耗较低的算法选入低能耗的身份认证模型。
2.2. 数据采集
为了获得准确和适用的实验数据,本文通过 Android studio 平台自主开发阅读软件,使用 vivo Y38手机运行软件,用户在阅读过程中滑动屏幕并调用内置传感器,软件后端记录每一滑动过程所产生的一系列数据。