CoAI

Liu，Xiao;Lei，Xuanyu;Wang，Shengyuan;Huang，Yue;Feng，Zhuoer;Wen，Bosi;Cheng，Jiale;Ke，Pei;Xu，Yifan;Tam，Weng Lam;Zhang，Xiaohan;Sun，Lichao;Gu，Xiaotao;Wang，Hongning;Zhang，Jing;Huang，Minlie;Dong，Yuxiao;Tang，Jie

AMoR: A Recipe for Building Adaptable Modular Knowledge Agents Through Process Feedback

NeurIPS 2024

Jian Guan，Wei Wu，Zujie Wen，Peng Xu，Hongning Wang，Minlie Huang

Perception of Knowledge Boundary forLarge Language Models through Semi-open-endedQuestion Answering (with Assoc. Prof. Zhiliang Tian)

NeurIPS 2024

Zhihua Wen，Zhiliang Tian，Zexin Jian，Zhen Huang，Pei Ke，Yifu Gao，Minlie Huang， Dongsheng Li

Benchmarking Complex Instruction-Following with Multiple Constraints Composition

NeurIPS D&B Track 2024

Bosi Wen，Pei Ke，Xiaotao Gu，Lindong Wu，Hao Huang，Jinfeng Zhou，Wenchuang Li，Binxin Hu，Wendy Gao，Jiaxing Xu，Yiming Liu，Jie Tang，Hongning Wang，Minlie Huang

Instruction Pre-Training: Language Models are Supervised Multitask Learners

EMNLP 2024

Daixuan Cheng，Yuxian Gu，Shaohan Huang，B Junyu Bi， Minlie Huang，B Furu Wei

CharacterGLM: Customizing Social Characters with Large Language Models

EMNLP 2024 industry track

Jinfeng Zhou，Zhuang Chen，Dazhen Wan，Bosi Wen，Yi Song，Jifan Yu，Yongkang Huang，Pei Ke，Guanqun Bi，Libiao Peng，Jiaming Yang，Xiyao Xiao，Sahand Sabour，Xiaohan Zhang，Wenjing Hou，Yijia Zhang，Yuxiao Dong，Hongning Wang，Jie Tang，Minlie Huang

ASETF: A Novel Method for Jailbreak Attack on LLMs through Translate Suffix Embeddings (with Prof. Lei Sha)

EMNLP 2024

Hao Wang，Hao Li，Minlie Huang，Lei Sha

AUTODETECT: Towards a Unified Framework for Automated Weakness Detection in Large Language Models

Findings of EMNLP 2024

Jiale Cheng ，Yida Lu，Xiaotao Gu，Pei Ke，Xiao Liu,Yuxiao Dong，Hongning Wang，Jie Tang，Minlie Huang

ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors

Findings of EMNLP 2024

Zhexin Zhang，Yida Lu，Jingyuan Ma，Di Zhang，Rui Li，Pei Ke，Hao Sun，Lei Sha，Zhifang Sui，Hongning Wang，Minlie Huang

All

2026

2025

2024

2023

2022

2021

2020

2019

2018

before

Large Language Models Are Not Robust Multiple Choice Selectors

MiniLLM: Knowledge Distillation of Large Language Models

Language Model Decoding as Direct Metrics Optimization

ToRA: A Tool-Integrated Reasoning Agent for Mathematical Problem Solving

EmoBench: Evaluating the Emotional Intelligence of Large Language Models

Depression Detection in Clinical Interviews with LLM-Empowered Structural Element Graph

Language Models Hallucinate, but May Excel at Fact Verification

On Prompt-Driven Safeguarding for Large Language Models

Towards Efficient Exact Optimization of Language Model Alignment

Human vs. Generative AI in Content Creation Competition: Symbiosis or Conflict?

ToMBench: Benchmarking Theory of Mind in Large Language Models

Defending Large Language Models Against Jailbreaking Attacks Through Goal Prioritization

SafetyBench: Evaluating the Safety of Large Language Models

Learning Task Decomposition to Assist Humans in Competitive Programming

CritiqueLLM: Towards an Informative Critique Generation Model for Evaluation of Large Language Model Generation

Black-Box Prompt Optimization: Aligning Large Language Models without Model Training

COKE: A Cognitive Knowledge Graph for Machine Theory of Mind

AlignBench: Benchmarking Chinese Alignment of Large Language Models (with Prof. Jie Tang)