> 文档中心 > 【AC.HASH】OpenHarmony啃论文俱乐部——关于哈希前端研究方向和应用于OpenHarmony的期望

【AC.HASH】OpenHarmony啃论文俱乐部——关于哈希前端研究方向和应用于OpenHarmony的期望

· 本文出自 AC.HASH 团队,ACAdaptive Creator,适应性创作者,旨在于能够在未来新领域下创造出新的哈希算法以应对未来局面。
·产出本文的成员:
中原工学院大一在校生马俊隆
·我们在OpenHarmony成长计划啃论文俱乐部里,通过啃论文方式学习hash技术…

目录

一、大数据学习系统方向——在线学习型哈希

二、大数据检索方向——基于局部敏感哈希技术的协同过滤

三、图像检索用于定位方向——室内连续视觉定位算法

四、结语:基于文献方法应用于OpenHarmony的期望

参考文献


一、大数据学习系统方向——在线学习型哈希

哈希用于检索来进行机器学习,学习型哈希通过将数据表示为紧凑的二进制码形式,很方便地使用异或运算快速计算数据间相似度,将原样本空间相似的两个数据点映射到海明空间里接近的两个点。学习型哈希不仅能大大减少数据的存储空间和运算开销,还能降低数据维度,从而显著提高大数据学习系统的效率。

而大数据时代,时时刻刻的产生着大量的信息,传统学习方式已经无法满足机器学习的需求,并且传统的学习方式每次训练新数据时,需要将所有先前数据调入内存处理,不仅对于现有的内存容量是无法接受的,同时也给中央处理器的调度增加了很大压力,训练后的数据仍然长期保存以应对多次训练,耗费大量存储空间,于是提出了在线学习型哈希。

在线哈希学习是一种特殊的学习型哈希方式,关键在于训练前后对数据的依赖性。离线的哈希学习假设所有数据都是已知的,基于全局优化的目标,数据被重复挑选用来纠正学习初期所产生的偏差。这就带来了在线哈希学习中最主要的矛盾:即随着模型更新带来的“遗忘”问题,因此在线哈希学习的目的是寻找一种变化与保持的平衡策略。

在线哈希学习是哈希前端的一个研究方向

二、大数据检索方向——基于局部敏感哈希技术的协同过滤

在大数据背景下,用户行为数据不仅经常频繁更新而且数据规模增长迅速,传统的协同过滤算法需要穷举搜索所有数据,相似度计算耗时较高,推荐效率低,无法满足用户实时体验的需求服务。快速从大数据中获得高质量的推荐服务成为一种新的需求,此外,用户的历史评级数据可能包含用户的隐私信息,可能被非法使用,甚至转售。然而,大多数 现有的协同过滤推荐方法很少考虑隐私保护。这可能导致用户隐私泄露的风险升高。

为此,提出基于局部敏感哈希技术的协同过滤算法,算法过滤了绝大多数不相似的项目,避免了冗余的相似度计算,另一方面算法将用户行为数据哈希为二进制哈希编码,进而保护用户隐私。

此哈希研究目标是指向当下数据检索和保护方面,也是前端一直在研究的东西。

三、图像检索用于定位方向——室内连续视觉定位算法

作为位置服务(location-based service ,LBS )的关键技术之一 ,室内定位在近年来引起了工业界和企业界的关注 。 由于遮挡和反射效应的影响 ,卫星定位系统 ,如北斗和 GPS ,在室内或地下环境难以获取准确 、连续的定位结果 。 在过去的10年中 ,各种室内定位技术得到了快速发展 ,如 Wi-Fi、蓝牙 、超声波、射频识别(radiofrequency identification ,RFID)、超宽带 (ultrawide band ,UWB)和地磁等 。 其中 ,Wi-Fi 、RFID 等定位技术由于信号容易受到室内复杂环境的干扰 ,定位精度和稳定性存在不足 。 UWB和蓝牙的定位精度较高 ,但对信号发射设备的布设要求同样很高 ,限制了这些技术的应用场景和范围。

相似性度量是图像检索技术的组成部分 ,主要通过计算特征向量之间的距离来实现 。 常见的距离计算方法包括欧氏距离 、曼哈顿距离 、切比雪夫距离 、余弦距离和海明距离等 。 其中海明距离常用于信号处理问题 ,在距离计算过程中通过比较向量每一位是否相同来计算 ,可以用于哈希指纹的快速匹配 。

为改进视觉匹配效率 ,构建了一种双层次的匹配图像搜索策略 ,包括基于感知哈希方法的全局搜索策略和顾及运动连续性的局部搜索策略 。 在此基础上 ,设计了一种室内连续视觉定位算法 ,结合视觉匹配与航位推算提高视觉定位的空间连续性 ,并利用运动恢复结构方法提高航向角估计精度,通过智能手机采集的连续视频帧与室内图像数据集的匹配 ,实现精确的视觉定位 。该方法在图像匹配定位 、连续离线定位 、连续在线定位能够达到亚米级定位精度 。 在线定位模式下 ,本文方法的平均计算时间为0.42s,能够支持连续的视觉定位 。

四、结语:基于文献方法应用于OpenHarmony的期望

OpenHarmony对于室内定位服务用于物联网,智能的全场景的需求,哈希的这些算法可以对用户的数据进行保护和用于图像的连续检索来进行室内定位和各项一体化全方位使用,对用户体验的优化,前端的哈希研究成果或许是一种好的解决方案。

参考文献

1.张星,林静,李清泉,等. 结合感知哈希与空间约束的室内连续视觉定位方法[J]. 测绘学报,2021,50(12):1639-1649.

2. 郭一村,陈华辉. 在线哈希算法研究综述[J]. 计算机应用,2021,41(4):1106-1112. DOI:10.11772/j.issn.1001-9081.2020071047.

3. 和凤珍. 基于局部敏感哈希的隐私保护实时服务推荐[J]. 计算机与数字工程,2022,50(1):140-146. DOI:10.3969/j.issn.1672-9722.2022.01.027.