Awesome

Interactive NLP Papers🤖+👨‍💼📚🤗⚒️🌏

Must-read papers on Interactive NLP: a new paradigm of NLP.

Content

What is Interactive NLP?
Keywords Convention
Paper
Related Projects
Contribution
- Contributors
- Contributing to this paper list

What is Interactive NLP?

Interactive Natural Language Processing (iNLP) considers language models as agents capable of observing, acting, and receiving feedback in a loop with external objects such as humans, knowledge bases, tools, models, and environments, where:

Observation involves all kinds of inputs to language models.
Action involves all kinds of outputs of language models such as text generation, requesting for external objects, text editing, etc.
Feedback involves feedback messages passed from external objects to language models such as scoring from humans.

In iNLP, language models can interact with four kinds of objects (i.e., entities):

interact with humans for better understanding and addressing user needs, personalizing responses, aligning with human values, and improving the overall user experience;
interact with knowledge bases for enriching language representations with factual knowledge, enhancing the contextual relevance of responses, and dynamically leveraging external information to generate more accurate and informed responses;
interact with models/tools for effectively decomposing and addressing complex tasks, leveraging specialized expertise for specific subtasks, and fostering the simulation of social behaviors;
interact with environments for learning grounded representations of language, and effectively tackling embodied tasks such as reasoning, planning, and decision-making in response to environmental observations.

Keywords Convention

The abbreviation of the work.

The interaction method used by the work.

The interaction interface used by the work.

Other important information of the work.

Paper

🔭Surveys and Position Papers

Interactive Natural Language Processing, 2023.05

Zekun Wang, Ge Zhang, Kexin Yang, Ning Shi, Wangchunshu Zhou, Shaochun Hao, Guangzheng Xiong, Yizhi Li, Mong Yuan Sim, Xiuying Chen, Qingqing Zhu, Zhenzhu Yang, Adam Nik, Qi Liu, Chenghua Lin, Shi Wang, Ruibo Liu, Wenhu Chen, Ke Xu, Dayiheng Liu, Yike Guo, Jie Fu.
Tool Learning with Foundation Models, 2023.04

Yujia Qin, Shengding Hu, Yankai Lin, Weize Chen, Ning Ding, Ganqu Cui, Zheni Zeng, Yufei Huang, Chaojun Xiao, Chi Han, Yi Ren Fung, Yusheng Su, Huadong Wang, Cheng Qian, Runchu Tian, Kunlun Zhu, Shihao Liang, Xingyu Shen, Bokai Xu, Zhen Zhang, Yining Ye, Bowen Li, Ziwei Tang, Jing Yi, Yuzhang Zhu, Zhenning Dai, Lan Yan, Xin Cong, Yaxi Lu, Weilin Zhao, Yuxiang Huang, Junxi Yan, Xu Han, Xian Sun, Dahai Li, Jason Phang, Cheng Yang, Tongshuang Wu, Heng Ji, Zhiyuan Liu, Maosong Sun.
Augmented Language Models: a Survey, 2023.02

Grégoire Mialon, Roberto Dessì, Maria Lomeli, Christoforos Nalmpantis, Ram Pasunuru, Roberta Raileanu, Baptiste Rozière, Timo Schick, Jane Dwivedi-Yu, Asli Celikyilmaz, Edouard Grave, Yann LeCun, Thomas Scialom.
Foundation Models for Decision Making: Problems, Methods, and Opportunities, 2023.03

Sherry Yang, Ofir Nachum, Yilun Du, Jason Wei, Pieter Abbeel, Dale Schuurmans.

👨‍💼Human-LM Interaction

Training language models to follow instructions with human feedback, 2022.03

Long Ouyang, Jeff Wu, Xu Jiang, Diogo Almeida, Carroll L. Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, John Schulman, Jacob Hilton, Fraser Kelton, Luke Miller, Maddie Simens, Amanda Askell, Peter Welinder, Paul Christiano, Jan Leike, Ryan Lowe.
Deep reinforcement learning from human preferences, 2017.06

Paul Christiano, Jan Leike, Tom B. Brown, Miljan Martic, Shane Legg, Dario Amodei.
Improving alignment of dialogue agents via targeted human judgements, 2022.09

Amelia Glaese, Nat McAleese, Maja Trębacz, John Aslanides, Vlad Firoiu, Timo Ewalds, Maribeth Rauh, Laura Weidinger, Martin Chadwick, Phoebe Thacker, Lucy Campbell-Gillingham, Jonathan Uesato, Po-Sen Huang, Ramona Comanescu, Fan Yang, Abigail See, Sumanth Dathathri, Rory Greig, Charlie Chen, Doug Fritz, Jaume Sanchez Elias, Richard Green, Soňa Mokrá, Nicholas Fernando, Boxi Wu, Rachel Foley, Susannah Young, Iason Gabriel, William Isaac, John Mellor, Demis Hassabis, Koray Kavukcuoglu, Lisa Anne Hendricks, Geoffrey Irving.
AI Chains: Transparent and Controllable Human-AI Interaction by Chaining Large Language Model Prompts, 2021.10

Tongshuang Wu, Michael Terry, Carrie J. Cai.
Interactive Text Generation, 2023.03

Felix Faltings, Michel Galley, Baolin Peng, Kianté Brantley, Weixin Cai, Yizhe Zhang, Jianfeng Gao, Bill Dolan.
PromptChainer: Chaining Large Language Model Prompts through Visual Programming, 2022.03

Tongshuang Wu, Ellen Jiang, Aaron Donsbach, Jeff Gray, Alejandra Molina, Michael Terry, Carrie J Cai.
RRHF: Rank Responses to Align Language Models with Human Feedback without tears, 2023.04

Zheng Yuan, Hongyi Yuan, Chuanqi Tan, Wei Wang, Songfang Huang, Fei Huang.
RAFT: Reward rAnked FineTuning for Generative Foundation Model Alignment, 2023.04

Hanze Dong, Wei Xiong, Deepanshu Goyal, Rui Pan, Shizhe Diao, Jipeng Zhang, Kashun Shum, Tong Zhang.
Interactive Language: Talking to Robots in Real Time, 2022.10

Corey Lynch, Ayzaan Wahid, Jonathan Tompson, Tianli Ding, James Betker, Robert Baruch, Travis Armstrong, Pete Florence.
Improving Grounded Language Understanding in a Collaborative Environment by Interacting with Agents Through Help Feedback, 2023.04

Nikhil Mehta, Milagro Teruel, Patricio Figueroa Sanz, Xin Deng, Ahmed Hassan Awadallah, Julia Kiseleva.
Is Reinforcement Learning (Not) for Natural Language Processing: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization, 2022.10

Rajkumar Ramamurthy, Prithviraj Ammanabrolu, Kianté Brantley, Jack Hessel, Rafet Sifa, Christian Bauckhage, Hannaneh Hajishirzi, Yejin Choi.
Improving Multimodal Interactive Agents with Reinforcement Learning from Human Feedback, 2022.11

Josh Abramson, Arun Ahuja, Federico Carnevale, Petko Georgiev, Alex Goldin, Alden Hung, Jessica Landon, Jirka Lhotka, Timothy Lillicrap, Alistair Muldal, George Powell, Adam Santoro, Guy Scully, Sanjana Srivastava, Tamara von Glehn, Greg Wayne, Nathaniel Wong, Chen Yan, Rui Zhu.
Towards Teachable Reasoning Systems: Using a Dynamic Memory of User Feedback for Continual System Improvement, 2022.04

Bhavana Dalvi Mishra, Oyvind Tafjord, Peter Clark.
MemPrompt: Memory-assisted Prompt Editing with User Feedback, 2022.12

Aman Madaan, Niket Tandon, Peter Clark, Yiming Yang.
Constitutional Al:learning from ai feedback, 2022.12

Yuntao Bai, Saurav Kadavath, Sandipan Kundu, Amanda Askell, Jackson Kernion, Andy Jones, Anna Chen, Anna Goldie, Azalia Mirhoseini, Cameron McKinnon, Carol Chen, Catherine Olsson, Christopher Olah, Danny Hernandez, Dawn Drain, Deep Ganguli, Dustin Li, Eli Tran-Johnson, Ethan Perez, Jamie Kerr, Jared Mueller, Jeffrey Ladish, Joshua Landau, Kamal Ndousse, Kamile Lukosuite, Liane Lovitt, Michael Sellitto, Nelson Elhage, Nicholas Schiefer, Noemi Mercado, Nova DasSarma, Robert Lasenby, Robin Larson, Sam Ringer, Scott Johnston, Shauna Kravec, Sheer El Showk, Stanislav Fort, Tamera Lanham, Timothy Telleen-Lawton, Tom Conerly, Tom Henighan, Tristan Hume, Samuel R. Bowman, Zac Hatfield-Dodds, Ben Mann, Dario Amodei, Nicholas Joseph, Sam McCandlish, Tom Brown, Jared Kaplan.
Craft an Iron Sword: Dynamically Generating Interactive Game Characters by Prompting Large Language Models Tuned on Code, 2022.01

Volum, Ryan and Rao, Sudha and Xu, Michael and DesGarennes, Gabriel A and Brockett, Chris and Van Durme, Benjamin and Deng, Olivia and Malhotra, Akanksha and Dolan, Bill.
LaMP: When Large Language Models Meet Personalization, 2023.04

Alireza Salemi, Sheshera Mysore, Michael Bendersky, Hamed Zamani.
Languages are Rewards: Hindsight Finetuning using Human Feedback, 2023.02

Hao Liu, Carmelo Sferrazza, Pieter Abbeel.
InternChat: Solving Vision-Centric Tasks by Interacting with Chatbots Beyond Language, 2023.05

Zhaoyang Liu, Yinan He, Wenhai Wang, Weiyun Wang, Yi Wang, Shoufa Chen, Qinglong Zhang, Yang Yang, Qingyun Li, Jiashuo Yu, Kunchang Li, Zhe Chen, Xue Yang, Xizhou Zhu, Yali Wang, Limin Wang, Ping Luo, Jifeng Dai, Yu Qiao.
Improving Code Generation by Training with Natural Language Feedback, 2023.03

Angelica Chen, Jérémy Scheurer, Tomasz Korbak, Jon Ander Campos, Jun Shern Chan, Samuel R. Bowman, Kyunghyun Cho, Ethan Perez.

📚KB-LM Interaction

Atlas: Few-shot learning with retrieval augmented language models, 2022.08

Gautier Izacard, Patrick Lewis, Maria Lomeli, Lucas Hosseini, Fabio Petroni, Timo Schick, Jane Dwivedi-Yu, Armand Joulin, Sebastian Riedel, Edouard Grave
MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge, 2022.09

Linxi Fan, Guanzhi Wang, Yunfan Jiang, Ajay Mandlekar, Yuncong Yang, Haoyi Zhu, Andrew Tang, De-An Huang, Yuke Zhu, Anima Anandkumar
WebGPT: Browser-assisted question-answering with human feedback, 2021.12

Reiichiro Nakano, Jacob Hilton, Suchir Balaji, Jeff Wu, Long Ouyang, Christina Kim, Christopher Hesse, Shantanu Jain, Vineet Kosaraju, William Saunders, Xu Jiang, Karl Cobbe, Tyna Eloundou, Gretchen Krueger, Kevin Button, Matthew Knight, Benjamin Chess, John Schulman
Improving language models by retrieving from trillions of tokens, 2022.07

Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George van den Driessche, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark, Diego de Las Casas, Aurelia Guy, Jacob Menick, Roman Ring, Tom Hennigan, Saffron Huang, Loren Maggiore, Chris Jones, Albin Cassirer, Andy Brock, Michela Paganini, Geoffrey Irving, Oriol Vinyals, Simon Osindero, Karen Simonyan, Jack W. Rae, Erich Elsen, Laurent Sifre
REALM: retrieval-augmented language model pre-training, 2020.07

Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat, Ming-Wei Chang
KELM: Knowledge Enhanced Pre-Trained Language Representations with Message Passing on Hierarchical Relational Graphs, 2022.04

Yinquan Lu, Haonan Lu, Guirong Fu, Qun Liu
K-Adapter: Infusing Knowledge into Pre-Trained Models with Adapters, 2021.06

Ruize Wang, Duyu Tang, Nan Duan, Zhongyu Wei, Xuanjing Huang, Jianshu Ji, Guihong Cao, Daxin Jiang, Ming Zhou
Binding Language Models in Symbolic Languages, 2023.05

Zhoujun Cheng, Tianbao Xie, Peng Shi, Chengzu Li, Rahul Nadkarni, Yushi Hu, Caiming Xiong, Dragomir Radev, Mari Ostendorf, Luke Zettlemoyer, Noah A. Smith, Tao Yu
Teaching language models to support answers with verified quotes, 2022.03

Jacob Menick, Maja Trebacz, Vladimir Mikulik, John Aslanides, Francis Song, Martin Chadwick, Mia Glaese, Susannah Young, Lucy Campbell-Gillingham, Geoffrey Irving, Nat McAleese
ERNIE: Enhanced Representation through Knowledge Integration, 2019.04

Yu Sun, Shuohuan Wang, Yukun Li, Shikun Feng, Xuyi Chen, Han Zhang, Xin Tian, Danxiang Zhu, Hao Tian, Hua Wu
K-BERT: Enabling Language Representation with Knowledge Graph, 2020.02

Weijie Liu, Peng Zhou, Zhe Zhao, Zhiruo Wang, Qi Ju, Haotang Deng, Ping Wang
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, 2020.12

Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela
DocPrompting: Generating Code by Retrieving the Docs, 2023.05

Shuyan Zhou, Uri Alon, Frank F. Xu, Zhiruo Wang, Zhengbao Jiang, Graham Neubig
Recitation-Augmented Language Models, 2023.05

Zhiqing Sun, Xuezhi Wang, Yi Tay, Yiming Yang, Denny Zhou
Mind's Eye: Grounded Language Model Reasoning through Simulation, 2023.05

Ruibo Liu, Jason Wei, Shixiang Shane Gu, Te-Yen Wu, Soroush Vosoughi, Claire Cui, Denny Zhou, Andrew M Dai
Don't Generate, Discriminate: A Proposal for Grounding Language Models to Real-World Environments, 2023.10

Yu Gu, Xiang Deng, Yu Su
Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automated Feedback, 2023.02

Baolin Peng, Michel Galley, Pengcheng He, Hao Cheng, Yujia Xie, Yu Hu, Qiuyuan Huang, Lars Liden, Zhou Yu, Weizhu Chen, Jianfeng Gao

🤖Model/🛠Tool-LM Interaction

Generative Agents: Interactive Simulacra of Human Behavior, 2023.04

Joon Sung Park, Joseph C. O'Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, Michael S. Bernstein.
ReAct: Synergizing reasoning and acting in language models, 2022.10

Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao.
Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models, 2023.05

Chenfei Wu, Shengming Yin, Weizhen Qi, Xiaodong Wang, Zecheng Tang, Nan Duan.
HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face, 2023.05

Yongliang Shen, Kaitao Song, Xu Tan, Dongsheng Li, Weiming Lu, Yueting Zhuang.
CAMEL: Communicative Agents for "Mind" Exploration of Large Scale Language Model Society, 2023.03

Guohao Li, Hasan Abed Al Kader Hammoud, Hani Itani, Dmitrii Khizbullin, Bernard Ghanem.
Socratic Models: Composing Zero-Shot Multimodal Reasoning with Language, 2022.05

Andy Zeng, Maria Attarian, Brian Ichter, Krzysztof Choromanski, Adrian Wong, Stefan Welker, Federico Tombari, Aveek Purohit, Michael Ryoo, Vikas Sindhwani, Johnny Lee, Vincent Vanhoucke, Pete Florence.
MindCraft: Theory of Mind Modeling for Situated Dialogue in Collaborative Tasks, 2021.09

Cristian-Paul Bara, Sky CH-Wang, Joyce Chai.
Program of Thoughts Prompting: Disentangling Computation from Reasoning for Numerical Reasoning Tasks, 2022.11

Wenhu Chen, Xueguang Ma, Xinyi Wang, William W. Cohen.
Toolformer: Language Models Can Teach Themselves to Use Tools, 2023.02

Timo Schick, Jane Dwivedi-Yu, Roberto Dessì, Roberta Raileanu, Maria Lomeli, Luke Zettlemoyer, Nicola Cancedda, Thomas Scialom.
ART: Automatic multi-step reasoning and tool-use for large language models, 2023.03

Bhargavi Paranjape, Scott Lundberg, Sameer Singh, Hannaneh Hajishirzi, Luke Zettlemoyer, Marco Tulio Ribeiro.
Small Models are valuable Plug-ins for large language models, 2023.05

Canwen Xu, Yichong Xu, Shuohang Wang, Yang Liu, Chenguang Zhu, Julian McAuley.
LEAST-TO-MOST PROMPTINGENABLESCOMPLEXREASONING IN LARGE LANGUAGE MODELS, 2022.05

Denny Zhou, Nathanael Schärli, Le Hou, Jason Wei, Nathan Scales, Xuezhi Wang, Dale Schuurmans, Claire Cui, Olivier Bousquet, Quoc Le, Ed Chi.
Decomposed Prompting: A Modular Approach for Solving Complex Tasks, 2022.10

Tushar Khot, Harsh Trivedi, Matthew Finlayson, Yao Fu, Kyle Richardson, Peter Clark, Ashish Sabharwal.
ViperGPT: Visual Inference via Python Execution for Reasoning, 2023.03

Dídac Surís, Sachit Menon, Carl Vondrick.
See,Think,Confirm:Interactive Prompting Between Vision and Language Models for Knowledge-based Visual Reasoning, 2023.01

Zhenfang Chen, Qinhong Zhou, Yikang Shen, Yining Hong, Hao Zhang, Chuang Gan.
Large Language Models Are Reasoning Teachers, 2022.12

Namgyu Ho, Laura Schmid, Se-Young Yun.
STaR:Self-Taught ReasonerBootstrapping Reasoning With Reasoning, 2022.03

Eric Zelikman, Yuhuai Wu, Jesse Mu, Noah D. Goodman.
Tree of Thoughts: Deliberate Problem Solving with Large Language Models, 2023.05

Shunyu Yao, Dian Yu, Jeffrey Zhao, Izhak Shafran, Thomas L. Griffiths, Yuan Cao, Karthik Narasimhan.
Search-in-the-Chain: Towards Accurate, Credible and Traceable Large Language Models for Knowledge-intensive Tasks, 2023.04

Shicheng Xu, Liang Pang, HuaWei Shen, Xueqi Cheng, Tat-Seng Chua.
RECURRENTGPT: Interactive Generation of (Arbitrarily) Long Text, 2023.05

Wangchunshu Zhou, Yuchen Eleanor Jiang, Peng Cui, Tiannan Wang, Zhenxin Xiao, Yifan Hou, Ryan Cotterell, Mrinmaya Sachan.
PAL: Program-aided Language Models, 2022.11

Luyu Gao, Aman Madaan, Shuyan Zhou, Uri Alon, PengFei Liu, Yiming Yang, Jamie Callan, Graham Neubig.
Internet-augmented language models through few-shot prompting for open-domain question answering, 2023.05

Angeliki Lazaridou, Elena Gribovskaya, Wojciech Stokowiec, Nikolai Grigorev.
Recitation-Augmented Language Models, 2022.10

Zhiqing Sun, Xuezhi Wang, Yi Tay, Yiming Yang, Denny Zhou.
Iteratively Prompt Pre-trained Language Models for Chain of Thought, 2022.03

Boshi Wang, Xiang Deng, Huan Sun.
MEASURING AND NARROWING THE COMPOSITIONALITY GAP IN LANGUAGE MODELS, 2022.10

Ofir Press, Muru Zhang, Sewon Min, Ludwig Schmidt, Noah A. Smith, Mike Lewis.
Self-Refine: Iterative Refinement with Self-Feedback, 2023.03

Aman Madaan, Niket Tandon, Prakhar Gupta, Skyler Hallinan, Luyu Gao, Sarah Wiegreffe, Uri Alon, Nouha Dziri, Shrimai Prabhumoye, Yiming Yang, Sean Welleck, Bodhisattwa Prasad Majumder, Shashank Gupta, Amir Yazdanbakhsh, Peter Clark.
LEVER: Learning to Verify Language-to-Code Generation with Execution, 2023.02

Ansong Ni, Srini Iyer, Dragomir Radev, Ves Stoyanov, Wen-tau Yih, Sida I. Wang, Xi Victoria Lin.
Computational Language Acquisition with Theory of Mind, 2023.03

Andy Liu, Hao Zhu, Emmy Liu, Yonatan Bisk, Graham Neubig.
Few-shot Language Coordination by Modeling Theory of Mind, 2021.07

Hao Zhu, Graham Neubig, Yonatan Bisk.
OpenAGI: When LLM Meets Domain Experts, 2023.04

Yingqiang Ge, Wenyue Hua, Jianchao Ji, Juntao Tan, Shuyuan Xu, Yongfeng Zhang.
MM-REACT: Prompting ChatGPT for Multimodal Reasoning and Action, 2023.03

Zhengyuan Yang, Linjie Li, JianFeng Wang, Kevin Lin, Ehsan Azarnasab, Faisal Ahmed, Zicheng Liu, Ce Liu, Michael Zeng, Lijuan Wang.
Prompt, Generate, then Cache: Cascade of Foundation Models makes Strong Few-shot Learners, 2023.03

Renrui Zhang, Xiangfei Hu, Bohao Li, Siyuan Huang, Hanqiu Deng, Hongsheng Li, Yu Qiao, Peng Gao.
Principle-Driven Self-Alignment of Language Models from Scratch with Minimal Human Supervision, 2023.05

Zhiqing Sun, Yikang Shen, Qinhong Zhou, Hongxin Zhang, Zhenfang Chen, David Cox, Yiming Yang, Chuang Gan.
Think Before You Act: Unified Policy for Interleaving Language Reasoning with Actions, 2023.04

Lina Mezghani, Piotr Bojanowski, Karteek Alahari, Sainbayar Sukhbaatar.
TALM: Tool Augmented Language Models, 2022.05

Aaron Parisi, Yao Zhao, Noah Fiedel.
Successive Prompting for Decomposing Complex Questions, 2022.12

Dheeru Dua, Shivanshu Gupta, Sameer Singh, Matt Gardner.
REFINER: Reasoning Feedback on Intermediate Representations, 2023.04

Debjit Paul, Mete Ismayilzada, Maxime Peyrard, Beatriz Borges, Antoine Bosselut, Robert West, Boi Faltings.
LeTI: Learning to Generate from Textual Interactions, 2023.05

Xingyao Wang, Hao Peng, Reyhaneh Jabbarvand, Heng Ji.
InternGPT: Solving Vision-Centric Tasks by Interacting with Chatbots Beyond Language, 2023.05

Zhaoyang Liu, Yinan He, Wenhai Wang, Weiyun Wang, Yi Wang, Shoufa Chen, Qinglong Zhang, Yang Yang, Qingyun Li, Jiashuo Yu, Kunchang Li, Zhe Chen, Xue Yang, Xizhou Zhu, Yali Wang, LiMin Wang, Ping Luo, Jifeng Dai, Yu Qiao.
Human-level play in the game of Diplomacy by combining language models with strategic reasoning, 2022.11

Anton Bakhtin, Noam Brown, Emily Dinan, Gabriele Farina, Colin Flaherty, Daniel Fried, Andrew Goff, Jonathan Gray, Hengyan Hu, Athul Paul Jacob, Mojtaba Komeili, Karthik Konath, Minae Kwon, Adam Lerer, Mike Lewis, Alexander H. Miller, Sash Mitts, Aditya Renduchintala, Stephen Roller, Dirk Rowe, Weiyan Shi, Joe Spisak, Alexander Wei, David Wu, Hugh Zhang, Markus Zijlstra.
Generating Sequences by Learning to Self-Correct, 2022.10

Sean Welleck, Ximing Lu, Peter West, Faeze Brahman, Tianxiao Shen, Daniel Khashabi, Yejin Choi.
ChatGPT-steered Editing Instructor for Customization of Abstractive Summarization, 2023.05

Wen Xiao, Yujia Xie, Giuseppe Carenini, Pengcheng He.
ChatGPT Asks, BLIP-2 Answers: Automatic Questioning Towards Enriched Visual Descriptions, 2023.03

Deyao Zhu, Jun Chen, Kilichbek Haydarov, Xiaoqian Shen, Wenxuan Zhang, Mohamed Elhoseiny.
Chameleon: Plug-and-Play Compositional Reasoning with Large Language Models, 2023.04

Pan Lu, Baolin Peng, Hao Cheng, Michel Galley, Kai-Wei Chang, Ying Nian Wu, Song-Chun Zhu, Jianfeng Gao.
Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data, 2023.04

Canwen Xu, Daya Guo, Nan Duan, Julian McAuley.

🌎Environment-LM Interaction

BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models, 2023.01

Junnan Li, Dongxu Li, Silvio Savarese, Steven Hoi.
Do As I Can, Not As I Say: Grounding Language in Robotic Affordances, 2022.04

Michael Ahn, Anthony Brohan, Noah Brown, Yevgen Chebotar, Omar Cortes, Byron David, Chelsea Finn, Chuyuan Fu, Keerthana Gopalakrishnan, Karol Hausman, Alex Herzog, Daniel Ho, Jasmine Hsu, Julian Ibarz, Brian Ichter, Alex Irpan, Eric Jang, Rosario Jauregui Ruano, Kyle Jeffrey, Sally Jesmonth, Nikhil J Joshi, Ryan Julian, Dmitry Kalashnikov, Yuheng Kuang, Kuang-Huei Lee, Sergey Levine, Yao Lu, Linda Luu, Carolina Parada, Peter Pastor, Jornell Quiambao, Kanishka Rao, Jarek Rettinghouse, Diego Reyes, Pierre Sermanet, Nicolas Sievers, Clayton Tan, Alexander Toshev, Vincent Vanhoucke, Fei Xia, Ted Xiao, Peng Xu, Sichun Xu, Mengyuan Yan, Andy Zeng.
RT-1: Robotics Transformer for Real-World Control at Scale, 2022.12

Anthony Brohan, Noah Brown, Justice Carbajal, Yevgen Chebotar, Joseph Dabis, Chelsea Finn, Keerthana Gopalakrishnan, Karol Hausman, Alex Herzog, Jasmine Hsu, Julian Ibarz, Brian Ichter, Alex Irpan, Tomas Jackson, Sally Jesmonth, Nikhil J Joshi, Ryan Julian, Dmitry Kalashnikov, Yuheng Kuang, Isabel Leal, Kuang-Huei Lee, Sergey Levine, Yao Lu, Utsav Malla, Deeksha Manjunath, Igor Mordatch, Ofir Nachum, Carolina Parada, Jodilyn Peralta, Emily Perez, Karl Pertsch, Jornell Quiambao, Kanishka Rao, Michael Ryoo, Grecia Salazar, Pannag Sanketi, Kevin Sayed, Jaspiar Singh, Sumedh Sontakke, Austin Stone, Clayton Tan, Huong Tran, Vincent Vanhoucke, Steve Vega, Quan Vuong, Fei Xia, Ted Xiao, Peng Xu, Sichun Xu, Tianhe Yu, Brianna Zitkovich.
PaLM-E: An Embodied Multimodal Language Model, 2023.03

Danny Driess, Fei Xia, Mehdi S. M. Sajjadi, Corey Lynch, Aakanksha Chowdhery, Brian Ichter, Ayzaan Wahid, Jonathan Tompson, Quan Vuong, Tianhe Yu, Wenlong Huang, Yevgen Chebotar, Pierre Sermanet, Daniel Duckworth, Sergey Levine, Vincent Vanhoucke, Karol Hausman, Marc Toussaint, Klaus Greff, Andy Zeng, Igor Mordatch, Pete Florence.
Grounded decoding: Guiding text generation with grounded models for robot control, 2023.03

Wenlong Huang, Fei Xia, Dhruv Shah, Danny Driess, Andy Zeng, Yao Lu, Pete Florence, Igor Mordatch, Sergey Levine, Karol Hausman, Brian Ichter.
Inner monologue: Embodied reasoning through planning with language models., 2022.07

Wenlong Huang, Fei Xia, Ted Xiao, Harris Chan, Jacky Liang, Pete Florence, Andy Zeng, Jonathan Tompson, Igor Mordatch, Yevgen Chebotar, Pierre Sermanet, Noah Brown, Tomas Jackson, Linda Luu, Sergey Levine, Karol Hausman, Brian Ichter.
Code as Policies: Language Model Programs for Embodied Control, 2022.09

Jacky Liang, Wenlong Huang, Fei Xia, Peng Xu, Karol Hausman, Brian Ichter, Pete Florence, Andy Zeng.
Open-vocabulary Queryable Scene Representations for Real World Planning, 2022.09

Boyuan Chen, Fei Xia, Brian Ichter, Kanishka Rao, Keerthana Gopalakrishnan, Michael S. Ryoo, Austin Stone, Daniel Kappler.
Plan4MC: Skill Reinforcement Learning and Planning for Open-World Minecraft Tasks, 2023.03

Haoqi Yuan, Chi Zhang, Hongcheng Wang, Feiyang Xie, Penglin Cai, Hao Dong, Zongqing Lu.
MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge, 2022.06

Linxi Fan, Guanzhi Wang, Yunfan Jiang, Ajay Mandlekar, Yuncong Yang, Haoyi Zhu, Andrew Tang, De-An Huang, Yuke Zhu, Anima Anandkumar.
Socratic Models: Composing Zero-Shot Multimodal Reasoning with Language, 2022.04

Andy Zeng, Maria Attarian, Brian Ichter, Krzysztof Choromanski, Adrian Wong, Stefan Welker, Federico Tombari, Aveek Purohit, Michael Ryoo, Vikas Sindhwani, Johnny Lee, Vincent Vanhoucke, Pete Florence.
Interactive Language: Talking to Robots in Real Time, 2022.10

Corey Lynch, Ayzaan Wahid, Jonathan Tompson, Tianli Ding, James Betker, Robert Baruch, Travis Armstrong, Pete Florence.
LM-Nav: Robotic Navigation with Large Pre-Trained Models of Language, Vision, and Action, 2022.07

Dhruv Shah, Blazej Osinski, Brian Ichter, Sergey Levine.
WebShop: Towards Scalable Real-World Web Interaction with Grounded Language Agents, 2022.07

Shunyu Yao, Howard Chen, John Yang, Karthik Narasimhan.
Improving Multimodal Interactive Agents with Reinforcement Learning from Human Feedback, 2022.11

Josh Abramson, Arun Ahuja, Federico Carnevale, Petko Georgiev, Alex Goldin, Alden Hung, Jessica Landon, Jirka Lhotka, Timothy Lillicrap, Alistair Muldal, George Powell, Adam Santoro, Guy Scully, Sanjana Srivastava, Tamara von Glehn, Greg Wayne, Nathaniel Wong, Chen Yan, Rui Zhu.
VIMA: General Robot Manipulation with Multimodal Prompts, 2022.10

Yunfan Jiang, Agrim Gupta, Zichen Zhang, Guanzhi Wang, Yongqiang Dou, Yanjun Chen, Li Fei-Fei, Anima Anandkumar, Yuke Zhu, Linxi Fan.
PIGLeT: Language Grounding Through Neuro-Symbolic Interaction in a 3D World, 2021.06

Rowan Zellers, Ari Holtzman, Matthew Peters, Roozbeh Mottaghi, Aniruddha Kembhavi, Ali Farhadi, Yejin Choi.
Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents, 2023.02

Zihao Wang, Shaofei Cai, Anji Liu, Xiaojian Ma, Yitao Liang.
ProgPrompt: Generating Situated Robot Task Plans using Large Language Models, 2022.09

Ishika Singh, Valts Blukis, Arsalan Mousavian, Ankit Goyal, Danfei Xu, Jonathan Tremblay, Dieter Fox, Jesse Thomason, Animesh Garg.
Plan,Eliminate,and Track-Language Models are Good Teachers for Embodied Agents., 2023.05

Yue Wu, So Yeon Min, Yonatan Bisk, Ruslan Salakhutdinov, Amos Azaria, Yuanzhi Li, Tom Mitchell, Shrimai Prabhumoye.
Collaborating with language models for embodied reasoning, 2023.02

Ishita Dasgupta, Christine Kaeser-Chen, Kenneth Marino, Arun Ahuja, Sheila Babayan, Felix Hill, Rob Fergus.
Open-World Object Manipulation using Pre-trained Vision-Language Models, 2023.03

Austin Stone, Ted Xiao, Yao Lu, Keerthana Gopalakrishnan, Kuang-Huei Lee, Quan Vuong, Paul Wohlhart, Brianna Zitkovich, Fei Xia, Chelsea Finn, Karol Hausman.
Mind's Eye: Grounded Language Model Reasoning through Simulation, 2022.10

Ruibo Liu, Jason Wei, Shixiang Shane Gu, Te-Yen Wu, Soroush Vosoughi, Claire Cui, Denny Zhou, Andrew M. Dai.
Guiding Pretraining in Reinforcement Learning with Large Language Models, 2023.02

Yuqing Du, Olivia Watkins, Zihan Wang, Cédric Colas, Trevor Darrell, Pieter Abbeel, Abhishek Gupta, Jacob Andreas.
Grounding Large Language Models in Interactive Environments with Online Reinforcement Learning, 2023.02

Thomas Carta, Clément Romac, Thomas Wolf, Sylvain Lamprier, Olivier Sigaud, Pierre-Yves Oudeyer.
Don't Generate, Discriminate: A Proposal for Grounding Language Models to Real-World Environments, 2022.12

Yu Gu, Xiang Deng, Yu Su.

👍Evaluation

Evaluating Human-Language Model Interaction, 2022.12

Mina Lee, Megha Srivastava, Amelia Hardy, John Thickstun, Esin Durmus, Ashwin Paranjape, Ines Gerard-Ursin, Xiang Lisa Li, Faisal Ladhak, Frieda Rong, Rose E. Wang, Minae Kwon, Joon Sung Park, Hancheng Cao, Tony Lee, Rishi Bommasani, Michael Bernstein, Percy Lia.
ReCEval: Evaluating Reasoning Chains via Correctness and Informativeness, 2023.04

Archiki Prasad, Swarnadeep Saha, Xiang Zhou, Mohit Bansa.
Evaluating Verifiability in Generative Search Engines, 2023.04

Liu, Nelson F., Zhang, Tianyi, Liang, Percy Lian.
Multi-Party Chat: Conversational Agents in Group Settings with Humans and Models, 2023.04

Jimmy Wei, Kurt Shuster, Arthur Szlam, Jason Weston, Jack Urbanek, Mojtaba Komeili.
Behavior-1k: A benchmark for embodied ai with 1,000 everyday activities and realistic simulation, 2023.03

Chengshu Li, Ruohan Zhang, Josiah Wong, Cem Gokmen, Sanjana Srivastava, Roberto Martín-Martín, Chen Wang, Gabrael Levine, Michael Lingelbach, Jiankai Sun, Mona Anvari, Minjune Hwang, Manasi Sharma, Arman Aydin, Dhruva Bansal, Samuel Hunter, Kyu-Young Kim, Alan Lou, Caleb R Matthews, Ivan Villa-Renteria, Jerry Huayang Tang, Claire Tang, Fei Xia, Silvio Savarese, Hyowon Gweon, Karen Liu, Jiajun Wu, Li Fei-Fei.
ORBIT: A Unified Simulation Framework for Interactive Robot Learning Environments, 2023.01

Mayank Mittal, Calvin Yu, Qinxi Yu, Jingzhou Liu, Nikita Rudin, David Hoeller, Jia Lin Yuan, Pooria Poorsarvi Tehrani, Ritvik Singh, Yunrong Guo, Hammad Mazhar, Ajay Mandlekar, Buck Babich, Gavriel State, Marco Hutter, Animesh Garg.
Learn to Explain: Multimodal Reasoning via Thought Chains for Science Question Answering, 2022.09

Pan Lu, Swaroop Mishra, Tony Xia, Liang Qiu, Kai-Wei Chang, Song-Chun Zhu, Oyvind Tafjord, Peter Clark, Ashwin Kalyan.
Alexa Arena: A User-Centric Interactive Platform for Embodied AI, 2023.03

Qiaozi Gao, Govind Thattai, Xiaofeng Gao, Suhaila Shakiah, Shreyas Pansare, Vasu Sharma, Gaurav Sukhatme, Hangjie Shi, Bofei Yang, Desheng Zheng, Lucy Hu, Karthika Arumugam, Shui Hu, Matthew Wen, Dinakar Guthy, Cadence Chung, Rohan Khanna, Osman Ipek, Leslie Ball, Kate Bland, Heather Rocker, Yadunandana Rao, Michael Johnston, Reza Ghanadan, Arindam Mandal, Dilek Hakkani Tur, Prem Natarajan.
CB2: Collaborative Natural Language Interaction Research Platform, 2023.03

Jacob Sharf, Mustafa Omer Gul, Yoav Artzi.
An AI Dungeon Master’s Guide: Learning to Converse and Guide with Intents and Theory-of-Mind in Dungeons and Dragons, 2022.12

Pei Zhou, Andrew Zhu, Jennifer Hu, Jay Pujara, Xiang Ren, Chris Callison-Burch, Yejin Choi, Prithviraj Ammanabrolu.

🎨Application

Related Projects

ToolLearningPapers
BMTools
AgentVerse
ChatArena
ChatGPT Plugins
LangChain
AutoGPT
BabyAGI
Awesome-Multimodal-Large-Language-Models

Contribution

Contributors

Contributing to this paper list

There are cases where we miss important works in this field, please contribute to this repo! Thanks for the efforts in advance.

Star History

Citation

If you find this paper list helpful, please consider citing our paper:

@article{wang2023interactive,
  title={Interactive Natural Language Processing},
  author={Wang, Zekun and Zhang, Ge and Yang, Kexin and Shi, Ning and Zhou, Wangchunshu and Hao, Shaochun and Xiong, Guangzheng and Li, Yizhi and Sim, Mong Yuan and Chen, Xiuying and others},
  journal={arXiv preprint arXiv:2305.13246},
  year={2023}
}