机器学习
未读
《Meta-SNA(简称)》阅读笔记
《Sinkhorn Distance Minimization for Adaptive Semi-Supervised Social Network Alignment》的创新点在于引入Sinkhorn距离来替代Wasserstein距离,提升了计算效率和稳定性。文章还提出了个性化投影函数,结合元投影与个体特征,实现了更精确的社交网络对齐。通过元学习框架和正交投影矩阵,模型在保持全局同构信息的同时,提升了对齐效果,并在理论和实验中证明了其优越性。
机器学习
未读
《DLNA(简称)》论文阅读笔记
这篇笔记主要总结了《Distributional Learning for Network Alignment with Global Constraints》论文的核心内容。笔记内容涵盖了论文中提出的分布式学习方法及其在网络对齐问题中的应用,并重点讨论了全局约束如何提升对齐精度。还涉及了实验设计、结果分析以及与其他方法的对比,突出该方法在处理复杂网络对齐任务时的优势。
《RAPIER(简称)》论文阅读笔记
论文《Low-Quality Training Data Only? A Robust Framework for Detecting Encrypted Malicious Network Traffic》介绍了RAPIER,一个在低质量训练数据环境下检测加密恶意网络流量的框架。它利用深度生成模型进行数据分布估计,纠正错误标签,并通过集成学习提高检测精度。实验结果表明,RAPIER在多个公开数据集上表现出色,具备鲁棒性和高准确性。
《HyperVision(简称)》论文阅读笔记
《Flow Interaction Graph Analysis: Unknown Encrypted Malicious Traffic Detection》提出了HyperVision系统,通过流量交互图分析检测未知的加密恶意流量。该系统采用无监督的图学习方法,识别图中的异常交互模式,有效应对未知攻击。实验结果显示,HyperVision在检测准确性和实时性方面优于现有方法。
机器学习
未读
C与Python混编实战:效率提升20倍的神器
本文通过C与Python混合编程优化了随机游走算法的效率。DeepWalk是一种图嵌入算法,通过随机游走生成节点序列,并进行训练。然而,个性化随机游走计算复杂度较高,Python实现效率不高。本文将核心的随机游走函数用C语言重写,生成动态链接库,并在Python中调用该C库。实验结果显示,混合编程将计算时间从40分钟缩短至2分钟,提升了20倍,验证了C语言在计算效率上的优势。
机器学习
未读
《CNN for Sentence Classification》论文阅读笔记以及代码复现
本文基于《Convolutional Neural Networks for Sentence Classification》论文,通过实验验证了CNN在文本分类中的有效性,特别是结合预训练的词向量(如word2vec)能够显著提升性能。论文探讨了静态和非静态词向量的双通道输入模型,并详细介绍了模型的各个组成部分。本文还复现了论文中的模型,并在此基础上进行了改进和优化。
机器学习
未读
中文详解-《Jbeil:基于时间图的归纳学习推断演化企业网络中的横向运动》
Jbeil框架通过自监督链接预测,使用良性和恶意认证事件的时序和拓扑数据来检测横向移动(Lateral Movement, LM)攻击。它利用BFS算法解析网络节点,并通过两阶段增强(选择立足点和执行攻击路径)生成威胁样本,以应对真实攻击数据不足的问题。这种方法通过节点嵌入和链接预测,有效提高了对新型LM攻击的检测能力。
机器学习
未读
DeepWalk代码复现并使用RWR替换RW+Cora数据集上的可视化对比
本文介绍了DeepWalk算法的代码复现,并使用重启随机游走(RWR)替换原有的随机游走(RW),在Cora数据集上进行可视化对比。文中提供了源码和数据集下载链接,详细描述了模型修改过程,并通过PCA技术展示了RW和RWR的嵌入效果对比。这一实验旨在展示通过算法修改提升图数据嵌入的效果。
微博网暴言论识别初尝试
这个项目的目的是开发一个自动化工具,以识别和分类微博上的网络暴力言论。考虑到微博平台的言论监管难度,尤其是隐晦和不易被发现的恶意表达,本文利用预训练语言模型和神经网络技术处理五万条微博评论数据,挑战在于准确区分出具有潜在伤害性但不明显的言论。项目通过敏感词库、语言模型(如COLD、SnowNLP)、以及word2vec等技术手段,将输出数据分类为明显恶意言论、隐晦恶意言论、存疑言论和正常言论,从而提高对网络暴力的识别率,保护用户权益,维护网络公正与和谐。