Jiawei Liu

I’m a Ph.D. candidate at UIUC PL/FM/SE, advised by Lingming Zhang.

I am generally interested in Programming Systems and Machine Learning.

📬 jiawei6@illinois.edu is the shortest path to find me.

Papers Show More

Pre-print

Learning Code Preference via Synthetic Evolution

Jiawei Liu, Thanh Nguyen, Mingyue Shang, Hantian Ding, Xiaopeng Li, Yu Yu, Varun Kumar, and Zijian Wang

arXiv preprint arXiv:2410.03837. 2024

PAPER Bib

@article{liu2024learning,
  title = {Learning Code Preference via Synthetic Evolution},
  author = {Liu, Jiawei and Nguyen, Thanh and Shang, Mingyue and Ding, Hantian and Li, Xiaopeng and Yu, Yu and Kumar, Varun and Wang, Zijian},
  journal = {arXiv preprint arXiv:2410.03837},
  year = {2024},
}

COLM’24

Evaluating Language Models for Efficient Code Generation

Jiawei Liu, Songrun Xie, Junhao Wang, Yuxiang Wei, Yifeng Ding, and Lingming Zhang

First Conference on Language Modeling. 2024

PAPER Bib Poster

@inproceedings{liu2024evaluating,
  title = {Evaluating Language Models for Efficient Code Generation},
  author = {Liu, Jiawei and Xie, Songrun and Wang, Junhao and Wei, Yuxiang and Ding, Yifeng and Zhang, Lingming},
  booktitle = {First Conference on Language Modeling},
  year = {2024},
  url = {https://openreview.net/forum?id=IBCBMeAhmC},
}

ICML’24

Magicoder: Empowering Code Generation with OSS-Instruct

Yuxiang Wei, Zhe Wang, Jiawei Liu, Yifeng Ding, and Lingming Zhang

Forty-first International Conference on Machine Learning. 2024

Adopted by Meta Llama 3.1, Google CodeGemma, and IBM Granite.

PAPER Bib Slides

@inproceedings{wei2023magic,
  title = {Magicoder: Empowering Code Generation with {OSS}-Instruct},
  author = {Wei, Yuxiang and Wang, Zhe and Liu, Jiawei and Ding, Yifeng and Zhang, Lingming},
  booktitle = {Forty-first International Conference on Machine Learning},
  year = {2024},
  url = {https://openreview.net/forum?id=XUeoOBid3x},
}

NeurIPS’23

Is Your Code Generated by ChatGPT Really Correct? Rigorous Evaluation of Large Language Models for Code Generation

Jiawei Liu, Chunqiu Steven Xia, Yuyao Wang, and Lingming Zhang

Thirty-seventh Conference on Neural Information Processing Systems. 2023

PAPER Bib Poster Slides

@inproceedings{liu2023is,
  title = {Is Your Code Generated by Chat{GPT} Really Correct? Rigorous Evaluation of Large Language Models for Code Generation},
  author = {Liu, Jiawei and Xia, Chunqiu Steven and Wang, Yuyao and Zhang, Lingming},
  booktitle = {Thirty-seventh Conference on Neural Information Processing Systems},
  year = {2023},
  url = {https://openreview.net/forum?id=1qvx610Cu7},
}

ESEC/FSE’23

NeuRI: Diversifying DNN Generation via Inductive Rule Inference

Jiawei Liu, Jinjun Peng, Yuyao Wang, and Lingming Zhang

Proceedings of the 31st ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering. 2023

🏆 ACM SIGSOFT Distinguished Paper Award

PAPER Bib Slides Artifact

@inproceedings{liu2023neuri,
  title = {NeuRI: Diversifying DNN Generation via Inductive Rule Inference},
  author = {Liu, Jiawei and Peng, Jinjun and Wang, Yuyao and Zhang, Lingming},
  year = {2023},
  isbn = {9798400703270},
  publisher = {Association for Computing Machinery},
  address = {New York, NY, USA},
  url = {https://doi.org/10.1145/3611643.3616337},
  doi = {10.1145/3611643.3616337},
  booktitle = {Proceedings of the 31st ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering},
  pages = {657--669},
  numpages = {13},
  location = {San Francisco, CA, USA},
  series = {ESEC/FSE 2023},
}

ASPLOS’23

NNSmith: Generating Diverse and Valid Test Cases for Deep Learning Compilers

Jiawei Liu, Jinkun Lin, Fabian Ruffy, Cheng Tan, Jinyang Li, Aurojit Panda, and Lingming Zhang

Proceedings of the 28th ACM International Conference on Architectural Support for Programming Languages and Operating Systems, Volume 2. 2023

🏆 Distinguished Artifact Award

PAPER Bib Poster Slides Artifact

@inproceedings{liu2023nnsmith,
  title = {NNSmith: Generating Diverse and Valid Test Cases for Deep Learning Compilers},
  author = {Liu, Jiawei and Lin, Jinkun and Ruffy, Fabian and Tan, Cheng and Li, Jinyang and Panda, Aurojit and Zhang, Lingming},
  year = {2023},
  isbn = {9781450399166},
  publisher = {Association for Computing Machinery},
  address = {New York, NY, USA},
  url = {https://doi.org/10.1145/3575693.3575707},
  doi = {10.1145/3575693.3575707},
  booktitle = {Proceedings of the 28th ACM International Conference on Architectural Support for Programming Languages and Operating Systems, Volume 2},
  pages = {530--543},
  numpages = {14},
  keywords = {Deep Learning Compilers, Compiler Testing, Fuzzing},
  location = {Vancouver, BC, Canada},
  series = {ASPLOS 2023},
}

OOPSLA’22

Coverage-guided tensor compiler fuzzing with joint IR-pass mutation

Jiawei Liu, Yuxiang Wei, Sen Yang, Yinlin Deng, and Lingming Zhang

Proceedings of the ACM on Programming Languages 6 (OOPSLA1). Apr 2022

PAPER Bib Slides Artifact

@article{liu2022coverage,
  title = {Coverage-guided tensor compiler fuzzing with joint IR-pass mutation},
  author = {Liu, Jiawei and Wei, Yuxiang and Yang, Sen and Deng, Yinlin and Zhang, Lingming},
  journal = {Proceedings of the ACM on Programming Languages},
  volume = {6},
  number = {OOPSLA1},
  pages = {1--26},
  year = {2022},
  publisher = {ACM New York, NY, USA},
  url = {https://doi.org/10.1145/3527317},
  doi = {10.1145/3527317},
  month = apr,
  articleno = {73},
}

Pre-print

Learning Code Preference via Synthetic Evolution

Jiawei Liu, Thanh Nguyen, Mingyue Shang, Hantian Ding, Xiaopeng Li, Yu Yu, Varun Kumar, and Zijian Wang

arXiv preprint arXiv:2410.03837. 2024

PAPER Bib

@article{liu2024learning,
  title = {Learning Code Preference via Synthetic Evolution},
  author = {Liu, Jiawei and Nguyen, Thanh and Shang, Mingyue and Ding, Hantian and Li, Xiaopeng and Yu, Yu and Kumar, Varun and Wang, Zijian},
  journal = {arXiv preprint arXiv:2410.03837},
  year = {2024},
}

COLM’24

Evaluating Language Models for Efficient Code Generation

Jiawei Liu, Songrun Xie, Junhao Wang, Yuxiang Wei, Yifeng Ding, and Lingming Zhang

First Conference on Language Modeling. 2024

PAPER Bib Poster

@inproceedings{liu2024evaluating,
  title = {Evaluating Language Models for Efficient Code Generation},
  author = {Liu, Jiawei and Xie, Songrun and Wang, Junhao and Wei, Yuxiang and Ding, Yifeng and Zhang, Lingming},
  booktitle = {First Conference on Language Modeling},
  year = {2024},
  url = {https://openreview.net/forum?id=IBCBMeAhmC},
}

OOPSLA’24

To Appear

White-box Compiler Fuzzing Empowered by Large Language Models

Chenyuan Yang, Yinlin Deng, Runyu Lu, Jiayi Yao, Jiawei Liu, Reyhaneh Jabbarvand, and Lingming Zhang

arXiv preprint arXiv:2310.15991. 2023

PAPER Bib

@article{yang2023white,
  title = {White-box Compiler Fuzzing Empowered by Large Language Models},
  author = {Yang, Chenyuan and Deng, Yinlin and Lu, Runyu and Yao, Jiayi and Liu, Jiawei and Jabbarvand, Reyhaneh and Zhang, Lingming},
  journal = {arXiv preprint arXiv:2310.15991},
  year = {2023},
}

ICML’24

Magicoder: Empowering Code Generation with OSS-Instruct

Yuxiang Wei, Zhe Wang, Jiawei Liu, Yifeng Ding, and Lingming Zhang

Forty-first International Conference on Machine Learning. 2024

Adopted by Meta Llama 3.1, Google CodeGemma, and IBM Granite.

PAPER Bib Slides

@inproceedings{wei2023magic,
  title = {Magicoder: Empowering Code Generation with {OSS}-Instruct},
  author = {Wei, Yuxiang and Wang, Zhe and Liu, Jiawei and Ding, Yifeng and Zhang, Lingming},
  booktitle = {Forty-first International Conference on Machine Learning},
  year = {2024},
  url = {https://openreview.net/forum?id=XUeoOBid3x},
}

ACL’24

XFT: Unlocking the Power of Code Instruction Tuning by Simply Merging Upcycled Mixture-of-Experts

Yifeng Ding, Jiawei Liu, Yuxiang Wei, Terry Yue Zhuo, and Lingming Zhang

arXiv preprint arXiv:2404.15247. 2024

PAPER Bib

@article{ding2024xft,
  title = {XFT: Unlocking the Power of Code Instruction Tuning by Simply Merging Upcycled Mixture-of-Experts},
  author = {Ding, Yifeng and Liu, Jiawei and Wei, Yuxiang and Zhuo, Terry Yue and Zhang, Lingming},
  journal = {arXiv preprint arXiv:2404.15247},
  year = {2024},
}

Pre-print

Emerging Platforms Meet Emerging LLMs: A Year-Long Journey of Top-Down Development

Siyuan Feng, Jiawei Liu, Ruihang Lai, Charlie F. Ruan, Yong Yu, Lingming Zhang, and Tianqi Chen

arXiv preprint arXiv:2404.09151. 2024

PAPER Bib

@article{feng2024emerging,
  title = {Emerging Platforms Meet Emerging LLMs: A Year-Long Journey of Top-Down Development},
  author = {Feng, Siyuan and Liu, Jiawei and Lai, Ruihang and Ruan, Charlie F. and Yu, Yong and Zhang, Lingming and Chen, Tianqi},
  journal = {arXiv preprint arXiv:2404.09151},
  year = {2024},
}

Pre-print

StarCoder 2 and The Stack v2: The Next Generation

Anton Lozhkov, Raymond Li, Loubna Ben Allal, Federico Cassano, Joel Lamy-Poirier, Nouamane Tazi, Ao Tang, Dmytro Pykhtar, Jiawei Liu, Yuxiang Wei and 56 more authors

arXiv preprint arXiv:2402.19173. 2024

PAPER Bib

@article{Lozhkov2024StarCoder2A,
  title = {StarCoder 2 and The Stack v2: The Next Generation},
  author = {Lozhkov, Anton and Li, Raymond and Allal, Loubna Ben and Cassano, Federico and Lamy-Poirier, Joel and Tazi, Nouamane and Tang, Ao and Pykhtar, Dmytro and Liu, Jiawei and Wei, Yuxiang and Liu, Tianyang and Tian, Max and Kocetkov, Denis and Zucker, Arthur and Belkada, Younes and Wang, Zijian and Liu, Qian and Abulkhanov, Dmitry and Paul, Indraneil and Li, Zhuang and Li, Wen-Ding and Risdal, Megan L. and Li, Jia and Zhu, Jian and Zhuo, Terry Yue and Zheltonozhskii, Evgenii and Dade, Nii Osae Osae and Yu, Wenhao and Krauss, Lucas and Jain, Naman and Su, Yixuan and He, Xuanli and Dey, Manan and Abati, Edoardo and Chai, Yekun and Muennighoff, Niklas and Tang, Xiangru and Oblokulov, Muhtasham and Akiki, Christopher and Marone, Marc and Mou, Chenghao and Mishra, Mayank and Gu, Alexander and Hui, Binyuan and Dao, Tri and Zebaze, Armel and Dehaene, Olivier and Patry, Nicolas and Xu, Canwen and McAuley, Julian and Hu, Han and Scholak, Torsten and Paquet, S{\'e}bastien and Robinson, Jennifer and Anderson, Carolyn Jane and Chapados, Nicolas and Patwary, Mostofa and Tajbakhsh, Nima and Jernite, Yacine and Ferrandis, Carlos Mu{\~n}oz and Zhang, Lingming and Hughes, Sean and Wolf, Thomas and Guha, Arjun and von Werra, Leandro and de Vries, Harm},
  journal = {arXiv preprint arXiv:2402.19173},
  year = {2024},
}

Pre-print

Relax: Composable Abstractions for End-to-End Dynamic Machine Learning

Ruihang Lai, Junru Shao, Siyuan Feng, Steven S. Lyubomirsky, Bohan Hou, Wuwei Lin, Zihao Ye, Hongyi Jin, Yuchen Jin, Jiawei Liu and 9 more authors

arXiv preprint arXiv:2311.02103. 2023

PAPER Bib

@article{lai2023relax,
  title = {Relax: Composable Abstractions for End-to-End Dynamic Machine Learning},
  author = {Lai, Ruihang and Shao, Junru and Feng, Siyuan and Lyubomirsky, Steven S. and Hou, Bohan and Lin, Wuwei and Ye, Zihao and Jin, Hongyi and Jin, Yuchen and Liu, Jiawei and Jin, Lesheng and Cai, Yaxing and Jiang, Ziheng and Wu, Yong and Park, Sunghyun and Srivastava, Prakalp and Roesch, Jared G. and Mowry, Todd C. and Chen, Tianqi},
  journal = {arXiv preprint arXiv:2311.02103},
  year = {2023},
}

NeurIPS’23

Is Your Code Generated by ChatGPT Really Correct? Rigorous Evaluation of Large Language Models for Code Generation

Jiawei Liu, Chunqiu Steven Xia, Yuyao Wang, and Lingming Zhang

Thirty-seventh Conference on Neural Information Processing Systems. 2023

PAPER Bib Poster Slides

@inproceedings{liu2023is,
  title = {Is Your Code Generated by Chat{GPT} Really Correct? Rigorous Evaluation of Large Language Models for Code Generation},
  author = {Liu, Jiawei and Xia, Chunqiu Steven and Wang, Yuyao and Zhang, Lingming},
  booktitle = {Thirty-seventh Conference on Neural Information Processing Systems},
  year = {2023},
  url = {https://openreview.net/forum?id=1qvx610Cu7},
}

ESEC/FSE’23

NeuRI: Diversifying DNN Generation via Inductive Rule Inference

Jiawei Liu, Jinjun Peng, Yuyao Wang, and Lingming Zhang

Proceedings of the 31st ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering. 2023

🏆 ACM SIGSOFT Distinguished Paper Award

PAPER Bib Slides Artifact

@inproceedings{liu2023neuri,
  title = {NeuRI: Diversifying DNN Generation via Inductive Rule Inference},
  author = {Liu, Jiawei and Peng, Jinjun and Wang, Yuyao and Zhang, Lingming},
  year = {2023},
  isbn = {9798400703270},
  publisher = {Association for Computing Machinery},
  address = {New York, NY, USA},
  url = {https://doi.org/10.1145/3611643.3616337},
  doi = {10.1145/3611643.3616337},
  booktitle = {Proceedings of the 31st ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering},
  pages = {657--669},
  numpages = {13},
  location = {San Francisco, CA, USA},
  series = {ESEC/FSE 2023},
}

ASPLOS’23

NNSmith: Generating Diverse and Valid Test Cases for Deep Learning Compilers

Jiawei Liu, Jinkun Lin, Fabian Ruffy, Cheng Tan, Jinyang Li, Aurojit Panda, and Lingming Zhang

Proceedings of the 28th ACM International Conference on Architectural Support for Programming Languages and Operating Systems, Volume 2. 2023

🏆 Distinguished Artifact Award

PAPER Bib Poster Slides Artifact

@inproceedings{liu2023nnsmith,
  title = {NNSmith: Generating Diverse and Valid Test Cases for Deep Learning Compilers},
  author = {Liu, Jiawei and Lin, Jinkun and Ruffy, Fabian and Tan, Cheng and Li, Jinyang and Panda, Aurojit and Zhang, Lingming},
  year = {2023},
  isbn = {9781450399166},
  publisher = {Association for Computing Machinery},
  address = {New York, NY, USA},
  url = {https://doi.org/10.1145/3575693.3575707},
  doi = {10.1145/3575693.3575707},
  booktitle = {Proceedings of the 28th ACM International Conference on Architectural Support for Programming Languages and Operating Systems, Volume 2},
  pages = {530--543},
  numpages = {14},
  keywords = {Deep Learning Compilers, Compiler Testing, Fuzzing},
  location = {Vancouver, BC, Canada},
  series = {ASPLOS 2023},
}

OOPSLA’22

Coverage-guided tensor compiler fuzzing with joint IR-pass mutation

Jiawei Liu, Yuxiang Wei, Sen Yang, Yinlin Deng, and Lingming Zhang

Proceedings of the ACM on Programming Languages 6 (OOPSLA1). Apr 2022

PAPER Bib Slides Artifact

@article{liu2022coverage,
  title = {Coverage-guided tensor compiler fuzzing with joint IR-pass mutation},
  author = {Liu, Jiawei and Wei, Yuxiang and Yang, Sen and Deng, Yinlin and Zhang, Lingming},
  journal = {Proceedings of the ACM on Programming Languages},
  volume = {6},
  number = {OOPSLA1},
  pages = {1--26},
  year = {2022},
  publisher = {ACM New York, NY, USA},
  url = {https://doi.org/10.1145/3527317},
  doi = {10.1145/3527317},
  month = apr,
  articleno = {73},
}

MM’21 OSC

Fast and Flexible Human Pose Estimation with HyperPose

Yixiao Guo, Jiawei Liu, Guo Li, Luo Mai, and Hao Dong

Proceedings of the 29th ACM International Conference on Multimedia. Apr 2021

PAPER Bib

@inproceedings{guo2021fast,
  author = {Guo, Yixiao and Liu, Jiawei and Li, Guo and Mai, Luo and Dong, Hao},
  title = {Fast and Flexible Human Pose Estimation with HyperPose},
  year = {2021},
  isbn = {9781450386517},
  publisher = {Association for Computing Machinery},
  address = {New York, NY, USA},
  url = {https://doi.org/10.1145/3474085.3478325},
  doi = {10.1145/3474085.3478325},
  booktitle = {Proceedings of the 29th ACM International Conference on Multimedia},
  pages = {3763--3766},
  numpages = {4},
  keywords = {computer vision, high-performance computing, pose estimation},
  location = {Virtual Event, China},
  series = {MM '21},
}

Awards & Honors

OpenAI Researcher Access Program 2024

ML and Systems Rising Stars, MLCommons 2024

Warren W. Yee Memorial Fellowship, University of Illinois 2024

ACM SIGSOFT Distinguished Paper Award (FSE'23) 2023

Distinguished Artifact Award (ASPLOS'23) 2023

Qidi Scholarship, Tongji University 2020

Invited Talk

Programming Systems, Uber: Evaluating LLMs for Correct & Efficient Code Generation Sept 2024

ARiSE Lab, Columbia University: Simplify the Making of Great Software in the ML Era April 2024

Snowflake GenAI: Rigorous Evaluation of LLMs for Code (Slides) Feb 2024

AST Lab, ETH Zürich: Generating Test-Cases for ML Compilers (Slides) Jan 2024

GAI4SE, NC State University: LLMs for Software Testing (Guest Lecture) Nov 2023

Apache TVM Conference: Automating DL Compiler Bug Finding with NNSmith Mar 2023

SAMPL, University of Washington: Coverage-Guided Tensor Compiler Fuzzing (Slides) May 2022

Service

Organizing: LLM4Code@ICSE'24

Program Committee/Reviewer: ASE'24, TSE, TOSEM, NeurIPS'24

Artifact Evaluation Committee: PLDI'23, OSDI'22, ATC'22