李蓉蓉 麻豆 用梯度下落求解整数贪图,中科大等提议无监督查验整数贪图求解器新范式
无监督学习查验整数贪图求解器的新范式来了李蓉蓉 麻豆。
中国科学时期大学王杰西席团队(MIRA Lab)提议了一种全新的整数贪图求解方法—— DiffILO(Differentiable Integer Linear Programming Optimization),关连论文已被东说念主工智能顶级海外会议 ICLR 2025 招揽为 Spotlight。
遵守裸露:与现存主流的监督学习方法对比,DiffILO 不仅显耀加速查验速率,还能生成更高质地的可行解。
前言:用机器学习解 ILP,为若何此勤勉?
整数线性贪图(ILP) 是组合优化中最基础亦然最重要的一类问题,庸碌哄骗于工业挪动、物流运载、辘集贪图、芯片布图等现实场景。然则 ILP 的求解十分勤勉 —— 变量摧毁、可行域复杂、搜索空间指数爆炸,践诺上属于 NP 难问题。
连年来,机器学习迟缓被引入这一过程,尝试通过数据运转的形态加速求解器。但现时主流作念法大多依赖监督学习:先用传统求解器(如 Gurobi)生成一批出恭脚标签,然后查验模子去"师法"这些解。这种作念法存在两大瓶颈:
昂贵的查验资本:每个样本王人需调用求解器生成标签;
查验指标与测试指标不一致:只优化测度舛错,无法保险最终解的可行性与质地。
有莫得可能十足解脱标签依赖,径直让模子"我方"学会求解 ILP 问题?
谜底是:不错!该论文提议了DiffILO方法,不错用梯度下落来"解整数贪图"!
中枢方法:DiffILO 是若何作念到的?
DiffILO,全称 Differentiable Integer Linear Programming Optimization,是一种无监督、端到端、可微分的 ILP 求解新范式。它的中枢立异是将摧毁、带阻挡的整数贪图问题,飞动为一语气、可微、无阻挡的问题,并借助深度学习模子来径直测度高质地解。
方法历程如下图所示:
方法简短不错分为三个法子:
Step 1:从摧毁到一语气——概率建模与阻挡渴望化
ILP 问题的神志频繁如下:
DiffILO 的第一步是将每个 0-1 变量视为伯努利散播下的立时变量,即。
其中是需要优化的概率值。
传统 ILP 的"硬阻挡" 被飞动为"渴望阻挡抗拒为零":
这种渴望建模形态有两个克己:
仍能保留原问题的最优解结构;
易于被管理函数进一步飞动为无阻挡神志。
Step 2:从阻挡到指标——管理函数与可微重参数化
该方法使用管理函数法将上述渴望阻挡合入指标函数:
但由于该函数的采样项并不成微,DiffILO 接管了Gumbel-Softmax + 重参数妙技,将摧毁采样相同为一个一语气可导的函数:
使用 ,终了对伯努利的可微相同;
使用保留组合结构;
梯度通过回传,值通过保留,兼顾
"可微"和"摧毁"的双重需求。
最终得到一个险些处处可导的指标函数,不错径直用梯度下落
进行优化。
Step 3:从图中学—— GNN 建模与端到端查验
每个 ILP 实例践诺上不错被示意为一个二分图:左边是变量,右边是阻挡,边代表变量出当今对应阻挡中。
使用一个图神经辘集(GNN)来编码这个结构,输入为图 G,输出为概率向量,再接入一个 MLP 进行最终测度。
查验过程十足无监督,指标是最小化上述可微指标函数。还引入了三种查验妙技来增强褂讪性:
样本归一化:对指标函数作念归一处理,合适不同实例规模;
余弦退火:自合适学习率挪动;
管理通盘调控:动态诊疗 μ,均衡解质地与可行性。
实验遵守
作家在多个行动 ILP 数据集(如 Set Covering、Independent Set、Combinatorial Auction)上进行了系统评估。遵守裸露:与现存主流的监督学习方法对比,DiffILO 不仅显耀加速查验速率,还能生成更高质地的可行解,而且在与 Gurobi、SCIP 蚁合使用时,显耀提高求解器的举座性能。
作家先容
本论文作家耿子介是中国科学时期大学 MIRA 实验室 2022 级博士生,师从王杰西席。此前,他于 2022 年毕业于少年班学院,取得数学与哄骗数学专科学士学位。他的主要计划标的包括机器学习在运筹优化与芯片联想等领域的哄骗、谎话语模子等。他在 NeurIPS、ICML、ICLR 等东说念主工智能顶级会议上发表论文十余篇,其中五篇论文入选 Oral/Spotlight。他曾获 2024 年度国度奖学金;曾两次赢得丘成桐大学生数学竞赛优越奖;曾在微软亚洲计划院实习,赢得"明日之星"名称;曾屡次担任顶会审稿东说念主,获评 NeurIPS 2023 Top 审稿东说念主;参与创办南京真则辘集科技有限公司。
论文地址:
openreview.net/pdf?id=FPfCUJTsCn
一键三连「点赞」「转发」「谨防心」
迎接在评述区留住你的思法!
— 完 —
学术投稿请于职责日发邮件到:
金瓶梅在线观看ai@qbitai.com
标题注明【投稿】,告诉咱们:
你是谁,从哪来,投稿内容
附上论文 / 技俩主页流畅,以及关连形态哦
咱们会(尽量)实时回应你
� � 点亮星标 � �
科技前沿证据逐日见李蓉蓉 麻豆