能够有效地学习表格数据中常见的具有超平面边界的决策空间;
非常适合处理基数高、值缺失且比例不同的变量;
它们为决策树或通过事后分析阶段的集合提供定性解释;
在实际应用中,对于大量数据,它们收敛速度更快。
GNN 中含有的关系归纳偏差减轻了手动设计捕获网络拓扑特征的需求;
训练神经网络的端到端属性允许在依赖于应用程序的解决方案中将 GNN 进行多阶段或多组件集成;
采用图网络的预训练表征丰富了迁移学习中的许多重要任务,例如无监督领域自适应、自监督学习和主动学习机制。
设计了一种新的通用体系架构,将 GBDT 和 GNN 组合为一个 pipeline;
通过迭代添加适合 GNN 梯度更新的新树,该研究克服了 GBDT 的端到端训练的挑战,使得错误信号可从网络拓扑反向传播到 GBDT;
研究者针对节点预测任务中的强基准对方法进行了广泛的评估,实验结果表明,在各种现实表格数据中,异构节点回归和节点分类任务的性能显著提高;
由于训练过程中的损失收敛速度更快,该方法比其他 GNN SOTA 模型更有效。此外,学习到的表征在潜在空间中展现出可辨别的结构,这进一步证明了该方法的表达能力。
本文网址: