Haiyang Sun | 孙海洋

UFO: Unifying Feed-Forward and Optimization-based Methods for Large Driving Scene Modeling

Kaiyuan Tan, Yingying Shen, Mingfei Tu, Haohui Zhu, Bing Wang, Guang Chen, Hangjun Ye, Haiyang Sun†

CVPR 2026

Paper Code

DriveLaW: Unifying Planning and Video Generation in a Latent Driving World

Tianze Xia, Yongkang Li, Lijun Zhou, Jingfeng Yao, Kaixin Xiong, Haiyang Sun†, Bing Wang, Kun Ma, Guang Chen, Hangjun Ye, Wenyu Liu, Xinggang Wang

CVPR 2026

Paper Code

ParkGaussian: Surround-view 3D Gaussian Splatting for Autonomous Parking

Xiaobao Wei, Zhangjie Ye, Yuxiang Gu, Zunjie Zhu, Yunfei Guo, Yingying Shen, Shan Zhao, Ming Lu, Haiyang Sun†, Bing Wang, Guang Chen, Rongfeng Lu, Hangjun Ye

CVPR 2026

Paper Code

DGGT: Feedforward 4D Reconstruction of Dynamic Driving Scenes using Unposed Images

Xiaoxue Chen, Ziyi Xiong, Yuantao Chen, Gen Li, Nan Wang, Hongcheng Luo, Long Chen, Haiyang Sun†, Bing Wang, Guang Chen, Hangjun Ye, Hongyang Li, Ya-Qin Zhang, Hao Zhao

CVPR 2026

Paper Code

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun†, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang

ICLR 2026

Paper

WorldSplat: Gaussian-Centric Feed-Forward 4D Scene Generation for Autonomous Driving

Ziyue Zhu, Zhanqian Wu, Zhenxin Zhu, Lijun Zhou, Haiyang Sun†, Bing Wan, Kun Ma, Guang Chen, Hangjun Ye, Jin Xie

ICLR 2026

Paper Code

ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving

Yongkang Li, Kaixin Xiong, Xiangyu Guo, Fang Li, Sixu Yan, Gangwei Xu, Lijun Zhou, Long Chen, Haiyang Sun†, Bing Wang, Guang Chen, Hangjun Ye, Wenyu Liu, Xinggang Wang

ICLR 2026

Paper Code

Street Gaussians: Modeling Dynamic Urban Scenes With Gaussian Primitives

Sida Peng, Yushi Long, Yunzhi Yan, Haotong Lin, Chenxu Zhou, Haiyang Sun, Kun Zhan, Xianpeng Lang, Hujun Bao, Xiaowei Zhou

IEEE TPAMI

Paper

CorrectAD: A Self-Correcting Agentic System to Improve End-to-end Planning in Autonomous Driving

Enhui Ma, Lijun Zhou, Tao Tang, Jiahuan Zhang, Junpeng Jiang, Zhan Zhang, Dong Han, Kun Zhan, Xueyang Zhang, XianPeng Lang, Haiyang Sun, Xia Zhou, Di Lin, Kaicheng Yu

AAAI 2026

Paper

BAT: Learning Event-based Optical Flow with Bidirectional Adaptive Temporal Correlation

Gangwei Xu, Haotong Lin, Zhaoxing Zhang, Hongcheng Luo, Haiyang Sun, Xin Yang

AAAI 2026

Paper

Pixel-Perfect Depth with Semantics-Prompted Diffusion Transformers

Gangwei Xu, Haotong Lin, Hongcheng Luo, Xianqi Wang, Jingfeng Yao, Lianghui Zhu, Yuechuan Pu, Cheng Chi, Haiyang Sun†, Bing Wang, Guang Chen, Hangjun Ye, Sida Peng, Xin Yang†

NeurIPS 2025

Paper Code

Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency

Xiangyu Guo, Zhanqian Wu, Kaixin Xiong, Ziyang Xu, Lijun Zhou, Gangwei Xu, Shaoqing Xu, Haiyang Sun†, Bing Wang, Guang Chen, Hangjun Ye, Wenyu Liu, Xinggang Wang

NeurIPS 2025

Paper Code

3drealcar: An in-the-wild rgb-d car dataset with 360-degree views

Xiaobiao Du, Yida Wang, Haiyang Sun, Zhuojie Wu, Hongwei Sheng, Shuyun Wang, Jiaying Ying, Ming Lu, Tianqing Zhu, Kun Zhan, Xin Yu

ICCV 2025

Paper Code

PosePilot: Steering Camera Pose for Generative World Models with Self-supervised Depth

Bu Jin, Weize Li, Baihan Yang, Zhenxin Zhu, Junpeng Jiang, Huan-ang Gao, Haiyang Sun, Kun Zhan, Hengtong Hu, Xueyang Zhang, Peng Jia, Hao Zhao

IROS 2025

Paper

S2-Track: A Simple yet Strong Approach for End-to-End 3D Multi-Object Tracking

Tao Tang, Lijun Zhou, Pengkun Hao, Zihang He, Kalok Ho, Shuo Gu, Zhihui Hao, Haiyang Sun, Kun Zhan, Peng Jia, XianPeng Lang, Xiaodan Liang

ICML 2025

Paper

Bev-tsr: Text-scene retrieval in bev space for autonomous driving

Tao Tang, Dafeng Wei, Zhengyu Jia, Tian Gao, Changwei Cai, Chengkai Hou, Peng Jia, Kun Zhan, Haiyang Sun, Fan JingChen, Yixing Zhao, Xiaodan Liang, Xianpeng Lang, Yang Wang

AAAI 2025

Paper

DreamCar: Leveraging Car-Specific Prior for In-the-Wild 3D Car Reconstruction

Xiaobiao Du, Haiyang Sun, Ming Lu, Tianqing Zhu, Xin Yu

IEEE RA-L 2025

Paper

Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian Splatting

Yunzhi Yan, Haotong Lin, Chenxu Zhou, Weijie Wang, Haiyang Sun, Kun Zhan, Xianpeng Lang, Xiaowei Zhou, Sida Peng

ECCV 2024

Paper Code

TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes

Bu Jin, Yupeng Zheng, Pengfei Li, Weize Li, Yuhang Zheng, Sujie Hu, Xinyu Liu, Jinwei Zhu, Zhijie Yan, Haiyang Sun, Kun Zhan, Peng Jia, Xiaoxiao Long, Yilun Chen, Hao Zhao

ECCV 2024

Paper Code

OpenSight: A simple open-vocabulary framework for LiDAR-based object detection

Hu Zhang, Jianhua Xu, Tao Tang, Haiyang Sun, Xin Yu, Zi Huang, Kaicheng Yu

ECCV 2024

Paper

Mirage: One-Step Video Diffusion for Photorealistic and Coherent Asset Editing in Driving Scenes

Shuyun Wang, Haiyang Sun†, Bing Wang, Hangjun Ye, Xin Yu

arXiv, 2025

Paper Code

ExtraGS: Geometric-Aware Trajectory Extrapolation with Uncertainty-Guided Generative Priors

Kaiyuan Tan, Yingying Shen, Haohui Zhu, Zhiwei Zhan, Shan Zhao, Mingfei Tu, Hongcheng Luo, Haiyang Sun†, Bing Wang, Guang Chen, Hangjun Ye

arXiv, 2025

Paper Code

DriveMRP: Enhancing Vision-Language Models with Synthetic Motion Data for Motion Risk Prediction

Zhiyi Hou, Enhui Ma, Fang Li, Zhiyi Lai, Kalok Ho, Zhanqian Wu, Lijun Zhou, Long Chen, Chitian Sun, Haiyang Sun†, Bing Wang, Guang Chen, Hangjun Ye, Kaicheng Yu

arXiv, 2025

Paper

Uni-gaussians: Unifying camera and lidar simulation with gaussians for dynamic driving scenarios

Zikang Yuan, Yuechuan Pu, Hongcheng Luo, Fengtian Lang, Cheng Chi, Teng Li, Yingying Shen, Haiyang Sun†, Bing Wang, Xin Yang

arXiv, 2025

Paper Code

Cogen: 3d consistent video generation via adaptive conditioning for autonomous driving

Yishen Ji, Ziyue Zhu, Zhenxin Zhu, Kaixin Xiong, Ming Lu, Zhiqi Li, Lijun Zhou, Haiyang Sun†, Bing Wang, Tong Lu

arXiv, 2025

Paper

Unleashing generalization of end-to-end autonomous driving with controllable long video generation

Enhui Ma, Lijun Zhou, Tao Tang, Zhan Zhang, Dong Han, Junpeng Jiang, Kun Zhan, Peng Jia, Xianpeng Lang, Haiyang Sun, Di Lin, Kaicheng Yu

arXiv, 2024

Paper Code

Haiyang Sun | 孙海洋

About Me

News

Publications

UFO: Unifying Feed-Forward and Optimization-based Methods for Large Driving Scene Modeling

DriveLaW: Unifying Planning and Video Generation in a Latent Driving World

ParkGaussian: Surround-view 3D Gaussian Splatting for Autonomous Parking

DGGT: Feedforward 4D Reconstruction of Dynamic Driving Scenes using Unposed Images

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

WorldSplat: Gaussian-Centric Feed-Forward 4D Scene Generation for Autonomous Driving

ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving

Street Gaussians: Modeling Dynamic Urban Scenes With Gaussian Primitives

CorrectAD: A Self-Correcting Agentic System to Improve End-to-end Planning in Autonomous Driving

BAT: Learning Event-based Optical Flow with Bidirectional Adaptive Temporal Correlation

Pixel-Perfect Depth with Semantics-Prompted Diffusion Transformers

Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency

3drealcar: An in-the-wild rgb-d car dataset with 360-degree views

PosePilot: Steering Camera Pose for Generative World Models with Self-supervised Depth

S2-Track: A Simple yet Strong Approach for End-to-End 3D Multi-Object Tracking

Bev-tsr: Text-scene retrieval in bev space for autonomous driving

DreamCar: Leveraging Car-Specific Prior for In-the-Wild 3D Car Reconstruction

Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian Splatting

TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes

OpenSight: A simple open-vocabulary framework for LiDAR-based object detection

Mirage: One-Step Video Diffusion for Photorealistic and Coherent Asset Editing in Driving Scenes

ExtraGS: Geometric-Aware Trajectory Extrapolation with Uncertainty-Guided Generative Priors

DriveMRP: Enhancing Vision-Language Models with Synthetic Motion Data for Motion Risk Prediction

Uni-gaussians: Unifying camera and lidar simulation with gaussians for dynamic driving scenarios

Cogen: 3d consistent video generation via adaptive conditioning for autonomous driving

Unleashing generalization of end-to-end autonomous driving with controllable long video generation

Competition

ViSE: A Systematic Approach to Vision-Only Street-View Extrapolation

Dive: Dit-based video generation with enhanced control

Experience

Xiaomi EV | 小米汽车

LiAuto | 理想汽车

Alibaba DAMO Academy | 阿里达摩院

EHang | 亿航智能

Tsinghua University

Beijing University of Posts and Telecommunications

Contact

Email

GitHub

Google Scholar

知乎

小红书