Awesome

Awesome Tool Learning

Awesome papers and applications on tool learning.

📜 Table of Contents

📚 Papers
📱 Applications
🎉 Contributors

📚 Papers

📑 Survey

Augmented Language Models: a Survey, Preprint 2023.02 Grégoire Mialon, Roberto Dessì, Maria Lomeli, Christoforos Nalmpantis, Ram Pasunuru, Roberta Raileanu, Baptiste Rozière, Timo Schick, Jane Dwivedi-Yu, Asli Celikyilmaz, Edouard Grave, Yann LeCun, Thomas Scialom [pdf]
Tool Learning with Foundation Models, Preprint 2023.04 Yujia Qin, Shengding Hu, Yankai Lin, Weize Chen, Ning Ding, Ganqu Cui, Zheni Zeng, Yufei Huang, Chaojun Xiao, Chi Han, Yi Ren Fung, Yusheng Su, Huadong Wang, Cheng Qian, Runchu Tian, Kunlun Zhu, Shihao Liang, Xingyu Shen, Bokai Xu, Zhen Zhang, Yining Ye, Bowen Li, Ziwei Tang, Jing Yi, Yuzhang Zhu, Zhenning Dai, Lan Yan, Xin Cong, Yaxi Lu, Weilin Zhao, Yuxiang Huang, Junxi Yan, Xu Han, Xian Sun, Dahai Li, Jason Phang, Cheng Yang, Tongshuang Wu, Heng Ji, Zhiyuan Liu, Maosong Sun [pdf]
A Survey on Large Language Model based Autonomous Agents, Preprint 2023.08 Lei Wang, Chen Ma, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Zhang, Zhiyuan Chen, Jiakai Tang, Xu Chen, Yankai Lin, Wayne Xin Zhao, Zhewei Wei, Ji-Rong Wen [pdf]

🏋️‍♂️ Tool Use Via Fine-tuning

WebGPT: Browser-assisted question-answering with human feedback Preprint 2021.12 Reiichiro Nakano, Jacob Hilton, Suchir Balaji, Jeff Wu, Long Ouyang, Christina Kim, Christopher Hesse, Shantanu Jain, Vineet Kosaraju, William Saunders, Xu Jiang, Karl Cobbe, Tyna Eloundou, Gretchen Krueger, Kevin Button, Matthew Knight, Benjamin Chess, John Schulman [pdf]
TALM: Tool Augmented Language Models Preprint 2022.05 Aaron Parisi, Yao Zhao, Noah Fiedel [pdf]
WebShop: Towards Scalable Real-World Web Interaction with Grounded Language Agents NeurIPS 2022.07 Shunyu Yao, Howard Chen, John Yang, Karthik Narasimhan [pdf] [github]
Toolformer: Language Models Can Teach Themselves to Use Tools Preprint 2023.02 Timo Schick, Jane Dwivedi-Yu, Roberto Dessì, Roberta Raileanu, Maria Lomeli, Luke Zettlemoyer, Nicola Cancedda, Thomas Scialom [pdf]
ToolCoder: Teach Code Generation Models to use API search tools Preprint 2023.05 Kechi Zhang, Huangzhao Zhang, Ge Li, Jia Li, Zhuo Li, Zhi Jin [pdf]
WebCPM: Interactive Web Search for Chinese Long-form Question Answering ACL 2023.05 Yujia Qin, Zihan Cai, Dian Jin, Lan Yan, Shihao Liang, Kunlun Zhu, Yankai Lin, Xu Han, Ning Ding, Huadong Wang, Ruobing Xie, Fanchao Qi, Zhiyuan Liu, Maosong Sun, Jie Zhou [pdf]
ToolkenGPT: Augmenting Frozen Language Models with Massive Tools via Tool Embeddings Preprint 2023.05 Shibo Hao, Tianyang Liu, Zhen Wang, Zhiting Hu [pdf][github]
Making Language Models Better Tool Learners with Execution Feedback Preprint 2023.05 Shuofei Qiao, Honghao Gui, Huajun Chen, Ningyu Zhang [pdf]
Gorilla: Large Language Model Connected with Massive APIs Preprint 2023.05 Shishir G. Patil, Tianjun Zhang, Xin Wang, Joseph E. Gonzalez [pdf]
GPT4Tools: Teaching Large Language Model to Use Tools via Self-instruction Preprint 2023.05 Rui Yang, Lin Song, Yanwei Li, Sijie Zhao, Yixiao Ge, Xiu Li, Ying Shan [pdf] [github]
ToolAlpaca: Generalized Tool Learning for Language Models with 3000 Simulated Cases Preprint 2023.06 Qiaoyu Tang, Ziliang Deng, Hongyu Lin, Xianpei Han, Qiao Liang, Le Sun [pdf]
WebGLM: Towards An Efficient Web-Enhanced Question Answering System with Human Preferences KDD 2023.06 Xiao Liu, Hanyu Lai, Hao Yu, Yifan Xu, Aohan Zeng, Zhengxiao Du, Peng Zhang, Yuxiao Dong, Jie Tang [pdf]

📖 Tool Use via In-Context Learning

PAL: Program-aided Language Models Preprint 2022.11 Luyu Gao, Aman Madaan, Shuyan Zhou, Uri Alon, Pengfei Liu, Yiming Yang, Jamie Callan, Graham Neubig [pdf] [github]
Program of Thoughts Prompting: Disentangling Computation from Reasoning for Numerical Reasoning Tasks Preprint 2022.11 Wenhu Chen, Xueguang Ma, Xinyi Wang, William W. Cohen [pdf]
ART: Automatic multi-step reasoning and tool-use for large language models Preprint 2023.03 Bhargavi Paranjape, Scott Lundberg, Sameer Singh, Hannaneh Hajishirzi, Luke Zettlemoyer, Marco Tulio Ribeiro [pdf]
TaskMatrix.AI: Completing Tasks by Connecting Foundation Models with Millions of APIs Preprint 2023.03 Yaobo Liang, Chenfei Wu, Ting Song, Wenshan Wu, Yan Xia, Yu Liu, Yang Ou, Shuai Lu, Lei Ji, Shaoguang Mao, Yun Wang, Linjun Shou, Ming Gong, Nan Duan [pdf]
HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face Preprint 2023.03 Yongliang Shen, Kaitao Song, Xu Tan, Dongsheng Li, Weiming Lu, Yueting Zhuang [pdf]
OpenAGI: When LLM Meets Domain Experts Preprint 2023.04 Yingqiang Ge, Wenyue Hua, Kai Mei, Jianchao Ji, Juntao Tan, Shuyuan Xu, Zelong Li, Yongfeng Zhang [pdf]
ChemCrow: Augmenting large-language models with chemistry tools Preprint 2023.04 Andres M Bran, Sam Cox, Andrew D White, Philippe Schwaller [pdf]
GeneGPT: Augmenting Large Language Models with Domain Tools for Improved Access to Biomedical Information Preprint 2023.04 Qiao Jin, Yifan Yang, Qingyu Chen, Zhiyong Lu [pdf]
Chameleon: Plug-and-Play Compositional Reasoning with Large Language Models Preprint 2023.04 Pan Lu, Baolin Peng, Hao Cheng, Michel Galley, Kai-Wei Chang, Ying Nian Wu, Song-Chun Zhu, Jianfeng Gao [pdf] [github]
ChatCoT: Tool-Augmented Chain-of-Thought Reasoning on Chat-based Large Language Models Preprint 2023.05 Zhipeng Chen, Kun Zhou, Beichen Zhang, Zheng Gong, Wayne Xin Zhao, Ji-Rong Wen [pdf]
CREATOR: Disentangling Abstract and Concrete Reasonings of Large Language Models through Tool Creation Preprint 2023.05 Cheng Qian, Chi Han, Yi R. Fung, Yujia Qin, Zhiyuan Liu, Heng Ji [pdf]
Large Language Models as Tool Makers Preprint 2023.05 Tianle Cai, Xuezhi Wang, Tengyu Ma, Xinyun Chen, Denny Zhou [pdf] [github]
MultiTool-CoT: GPT-3 Can Use Multiple External Tools with Chain of Thought Prompting ACL 2023.05 Tatsuro Inaba, Hirokazu Kiyomaru, Fei Cheng, Sadao Kurohashi [pdf] [project]
RestGPT: Connecting Large Language Models with Real-World Applications via RESTful APIs Preprint 2023.06 Yifan Song, Weimin Xiong, Dawei Zhu, Cheng Li, Ke Wang, Ye Tian, Sujian Li [pdf]
AssistGPT: A General Multi-modal Assistant that can Plan, Execute, Inspect, and Learn Preprint 2023.06 Difei Gao, Lei Ji, Luowei Zhou, Kevin Qinghong Lin, Joya Chen, Zihan Fan, Mike Zheng Shou [pdf] [project]
GEAR: Augmenting Language Models with Generalizable and Efficient Tool Resolution Preprint 2023.07 Yining Lu, Haoping Yu, Daniel Khashabi [pdf]
Skills-in-Context Prompting: Unlocking Compositionality in Large Language Models Preprint 2023.08 Jiaao Chen, Xiaoman Pan, Dian Yu, Kaiqiang Song, Xiaoyang Wang, Dong Yu, Jianshu Chen [pdf]
Tool Documentation Enables Zero-Shot Tool-Usage with Large Language Models Preprint 2023.08 Cheng-Yu Hsieh, Si-An Chen, Chun-Liang Li, Yasuhisa Fujii, Alexander Ratner, Chen-Yu Lee, Ranjay Krishna, Tomas Pfister [pdf]
TPTU: Task Planning and Tool Usage of Large Language Model-based AI Agents Preprint 2023.08 Jingqing Ruan, Yihong Chen, Bin Zhang, Zhiwei Xu, Tianpeng Bao, Guoqing Du, Shiwei Shi, Hangyu Mao, Xingyu Zeng, Rui Zhao [pdf]

🧪 Evalution

tool_use_benchmark [github] A large-scale benchmark for tool use, including four English tool-use datasets and one Chinese tool-use dataset.
API-Bank: A Benchmark for Tool-Augmented LLMs Preprint 2023.04 Minghao Li, Feifan Song, Bowen Yu, Haiyang Yu, Zhoujun Li, Fei Huang, Yongbin Li [pdf]
On the Tool Manipulation Capability of Open-source Large Language Models Preprint 2023.05 Qiantong Xu, Fenglu Hong, Bo Li, Changran Hu, Zhengyu Chen, Jian Zhang [pdf]
Evaluating and Improving Tool-Augmented Computation-Intensive Math Reasoning Preprint 2023.06 Beichen Zhang, Kun Zhou, Xilin Wei, Wayne Xin Zhao, Jing Sha, Shijin Wang, Ji-Rong Wen [pdf]
ToolQA: A Dataset for LLM Question Answering with External Tools Preprint 2023.06 Yuchen Zhuang, Yue Yu, Kuan Wang, Haotian Sun, Chao Zhangu [pdf]
ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs Preprint 2023.07 Yujia Qin, Shihao Liang, Yining Ye, Kunlun Zhu, Lan Yan, Yaxi Lu, Yankai Lin, Xin Cong, Xiangru Tang, Bill Qian, Sihan Zhao, Runchu Tian, Ruobing Xie, Jie Zhou, Mark Gerstein, Dahai Li, Zhiyuan Liu, Maosong Sun [pdf]
AgentBench: Evaluating LLMs as Agents Preprint 2023.08 Xiao Liu, Hao Yu, Hanchen Zhang, Yifan Xu, Xuanyu Lei, Hanyu Lai, Yu Gu, Hangliang Ding, Kaiwen Men, Kejuan Yang, Shudan Zhang, Xiang Deng, Aohan Zeng, Zhengxiao Du, Chenhui Zhang, Sheng Shen, Tianjun Zhang, Yu Su, Huan Sun, Minlie Huang, Yuxiao Dong, Jie Tang [pdf]
ToolTalk: Evaluating Tool-Usage in a Conversational Setting Preprint 2023.11 Nicholas Farn, Richard Shin [pdf]
TaskBench: BENCHMARKING LARGE LANGUAGE MODELS FOR TASK AUTOMATION Preprint 2023.11 Yongliang Shen1, Kaitao Song, et.al., [pdf]
T-Eval: Evaluating the Tool Utilization Capability Step by Step Preprint 2023.12 Zehui Chen, Feng Zhao, et.al., [pdf]

📱 Applications

Auto-GPT: An experimental open-source attempt to make GPT-4 fully autonomous.
LangChain: Building applications with LLMs through composability.
DB-GPT: Revolutionizing Database Interactions with Private LLM Technology.

🎉 Contributors