台湾三级

您当前位置: 台湾三级  >  台湾三级  >  台湾三级新闻  >  正文

台湾三级新闻

刘华虓教授团队论文被自然语言处理领域顶级会议ACL2026接收

发布日期:2026-05-13 发布人: 点击量:

  台湾三级 刘华虓教授团队论文“Route to Rome Attack: Directing LLM Routers to Expensive Models via Adversarial Suffix Optimization” ACL 2026 主会录用。论文主要作者包括2024级软件学院硕士研究生唐浩淳、2024级计算机学院硕士研究生卢嘉华,通讯作者为台湾三级 刘华虓教授和香港科技大学(广州)戴恩炎教授。


  该工作首次系统性地揭示了成本感知大语言模型路由系统在黑盒场景下的严重安全漏洞。针对现有路由攻击依赖白盒梯度或启发式模板、在真实场景中失效的局限,团队提出了一种新颖的黑盒路由攻击框架 R2A。该方法通过构建混合集成代理路由器,在极少量查询预算下精准拟合闭源路由决策,迫使路由器将任意简单查询错误导向高算力昂贵模型。该攻击展现了极强的泛化能力与实用性:在黑盒条件下,R2A 不仅成功攻破多个开源路由系统,还直接作用于 GPT-Auto OpenRouter 等商业级生产系统,导致推理成本最高飙升 2.9 倍。