机器学习
未读
中文详解-《Jbeil:基于时间图的归纳学习推断演化企业网络中的横向运动》
Jbeil框架通过自监督链接预测,使用良性和恶意认证事件的时序和拓扑数据来检测横向移动(Lateral Movement, LM)攻击。它利用BFS算法解析网络节点,并通过两阶段增强(选择立足点和执行攻击路径)生成威胁样本,以应对真实攻击数据不足的问题。这种方法通过节点嵌入和链接预测,有效提高了对新型LM攻击的检测能力。
机器学习
未读
DeepWalk代码复现并使用RWR替换RW+Cora数据集上的可视化对比
本文介绍了DeepWalk算法的代码复现,并使用重启随机游走(RWR)替换原有的随机游走(RW),在Cora数据集上进行可视化对比。文中提供了源码和数据集下载链接,详细描述了模型修改过程,并通过PCA技术展示了RW和RWR的嵌入效果对比。这一实验旨在展示通过算法修改提升图数据嵌入的效果。
微博网暴言论识别初尝试
这个项目的目的是开发一个自动化工具,以识别和分类微博上的网络暴力言论。考虑到微博平台的言论监管难度,尤其是隐晦和不易被发现的恶意表达,本文利用预训练语言模型和神经网络技术处理五万条微博评论数据,挑战在于准确区分出具有潜在伤害性但不明显的言论。项目通过敏感词库、语言模型(如COLD、SnowNLP)、以及word2vec等技术手段,将输出数据分类为明显恶意言论、隐晦恶意言论、存疑言论和正常言论,从而提高对网络暴力的识别率,保护用户权益,维护网络公正与和谐。
机器学习
未读
文献阅读笔记-《BRIGHT: A Bridging Algorithm for Network Alignment》
文章《BRIGHT: A Bridging Algorithm for Network Alignment》提出了BRIGHT算法,旨在解决网络对齐中的两大挑战:一是基于一致性优化的方法限制了随机游走的步骤,难以捕捉网络间的结构差异;二是基于嵌入的方法虽放宽一致性假设,但面临嵌入空间差异问题。BRIGHT通过结合这两种方法的优点,利用随机游走重启(RWR)与锚链接一热编码构建统一嵌入空间,并通过共享线性层调整RWR得分的权重,有效提升了对齐性能。
BRIGHT包含无属性网络对齐的BRIGHT-U和带属性网络对齐的BRIGHT-A两种变体,均在真实世界网络数据集上显著超越现有方法。该研究创新性地融合了两种主流网络对齐策略,不仅理论贡献显著,也为实际应用提供了有效工具,对网络分析和数据挖掘领域具有重要影响。
机器学习理论进阶-图机器学习
本文概述了图机器学习的关键概念和方法,介绍了图的基础知识、如何在机器学习中利用图来描述和分析具有复杂关系的实体。文中探讨了传统特征基方法在节点、边和图级别的应用,包括特征提取和表示学习的技术。进一步,讨论了节点嵌入与浅层编码方法,特别是随机游走和node2vec策略在节点相似性表达中的应用。文章还涵盖了图网络中消息传递机制及其在节点分类中的应用,以及图神经网络(GNN)的基本概念、高级应用和图数据的增强与划分方法。最后,介绍了图生成模型的基础概念和几种主要的图生成模型,展示了这些模型在模拟现实世界网络中的重要性。全文旨在为读者提供一个全面的视角,理解和应用图机器学习的各个方面。
机器学习
未读
RW与RWR的Python简单实现
本文通过Python和TensorBoard实验展示了随机游走(RW)与重启随机游走(RWR)算法的差异。作者创建了一个十节点图,用Floyd算法计算节点间最短路径,并分别对RW和RWR进行了实验。RW实验中,最终停留点分布较为分散,而RWR结果显示停留点与起始节点距离的紧密程度,表明RWR倾向于返回起始点或其附近,不同于RW的分散特性,直观展示了两种算法在图数据上的行为差异。
机器学习
未读
PyTorch入门-小土堆
本文通过详细代码示例,介绍了使用PyTorch进行深度学习的全过程,包括数据预处理、模型构建、训练、测试、以及使用预训练模型进行图片识别。初始部分展示了如何通过继承Dataset类加载和预处理图像数据。随后,通过TensorBoard的使用,展示了如何进行训练过程的可视化。接着,教程介绍了构建简单卷积神经网络(CNN)的方法,包括如何应用卷积层、池化层、ReLU激活函数、全连接层等基础神经网络构件。此外,还涉及了损失函数和优化器的选择,以及如何使用GPU加速训练过程。最后,教程通过加载预训练的模型,并对新的图像数据进行预测,展示了模型的实际应用。整个过程不仅涵盖了深度学习项目的典型步骤,还提供了关于模型保存、加载和转移学习的实用技巧。