谢雨来
博士,高级研究员@ 日立中国研究院
- 更新: 2025.03
- xie_yulai@outlook.com GitHub ResearchGate ORCID
- 企业导师 (10+毕设指导)
- 期刊/会议审稿人: 查看列表
最新动态
2025
- [4月] ChinaDaily媒体报道-MCVR2024
- [3月] 技术委员会 (ICCMS2025)
2024
- [12月] 特邀报告 (MCVR2024)
- [7月] Top Downloaded Article in IET Computer Vision
- [6月] 基于数字模拟的现场场景创建技术|全程赋能工业AI解决方案
- [3月] Hitachi Review
- [3月] 日立評論(日本語)
- [1月] 技术委员会 (ICCMS2024)
2023
- [11月] 科技赋能产业创新、共筑健康美好未来
- [7月] AI守护生命 智慧与安全同行
- [1月] 会议主席 (ICCSM2023)
2022
- [8月] 日立中国研究院受邀演讲
- [7月] 特邀报告 (ICCCV2022)
2020
- [6月] 日立AI博客:自动客流估计
研究领域
AI基础研究
- 机器学习 计算机视觉
- 多模态分析(视觉,听觉,语言,传感器)
- AIGC (时序数据,图像数据生成)
- 数字模拟/数字孪生
- 三维重建/三维生成
- 大语言模型/多模态大模型
AI应用研究
- 工业制造与物流
- 人群模拟
- 交通分析
- 养老解决方案
- AI方法的光学领域应用
- 大语言模型(DeepSeek,qwen等)的行业应用
教育与职业发展
教育经历
- 2010-2014 工学博士
- 北海道大学,日本
- 国家公派留学奖学金
- 2008-2010 工学硕士
- 天津大学,中国
- 2004-2008 工学,管理学士
- 天津大学,中国
- 2013 访问交流
- 爱荷华大学,美国
- 2013 访问交流
- 首尔大学,韩国
工作经历
- 2014-至今 高级研究员
- 日立中国研究院, 中国
- CV,AI,AIGC项目落地经验(10年+)
- GenAI,LLM,MLM技术革新探索
- 2014 研修
- 日立中央研究所, 日本
项目经历
落地导向
- 公共安全视频监控 (2016)
- 地勤作业车端分析(机场) (2020)
- 手机端视觉点餐(跨国餐饮企业) (2021)
- 厂区行为规范(头部制药企业) (2022)
- 厂区安全规范(大型饮料企业) (2023)
- 产线装配质量检测(头部汽配企业) (2024)
- 仓库行为传感分析(跨国物流企业) (2024)
- 厂区安全规范(电力企业) (2025)
前沿探索
- 基于视觉的公共交通管理(重大合作)
- 基于传感的公共区域人群分析(清华合作)
- 多模态视频理解分析(北科合作)
- 基于图像的三维重建(北科合作)
- 基于AI的光学系统(北科合作)
- 基于大语言模型(DeepSeek)的行业应用革新
近期论文
期刊论文
-
Ren, Fang, Yulai Xie (共同一作), Xiaoning Pi 和 Xiaohui Wang. "Bridge the gap between simulated and real-world data in optical fiber mode decomposition for accuracy improvement: A deep learning-based co-learning framework with visual similarity-based matching". Expert Systems with Applications 256 (2024): 124937. DOI (JCR Q1|中科院一区)
-
Xie, Yulai, Jingjing Niu, Yang Zhang, 和 Fang Ren. "Global-Shared Text Representation Based Multi-Stage Fusion Transformer Network for Multi-Modal Dense Video Captioning." IEEE Transactions on Multimedia, (2023). DOI (JCR Q1|中科院一区)
-
Xie, Yulai, Jingjing Niu, Yang Zhang, 和 Fang Ren. "Multisize Patched Spatial-Temporal Transformer Network for Short-and Long-Term Crowd Flow Prediction". IEEE Transactions on Intelligent Transportation Systems, (2022). DOI (JCR Q1|中科院一区)
-
Jingjing Niu, Yulai Xie (共同一作), Yang Zhang, 和 Fang Ren. "Tri-Modal Dense Video Captioning Based on Fine-Grained Aligned Text and Anchor-Free Event Proposals Generator". International Journal of Pattern Recognition and Artificial Intelligence, (2022). DOI
-
Xie, Yulai, Yang Zhang, 和 Fang Ren. "Temporal-Enhanced Graph Convolution Network for Skeleton-Based Action Recognition." IET Computer Vision, (2022). DOI (2022 Top Downloaded Article)
在投论文
-
Ren, Fang, Xie, Yulai (共同一作), Pi,Xiaoning. "Query-Based Neural Network for Long-Range Prediction of Optical Spatio-temporal Dynamics in Multimode Fibers.", Expert Systems with Applications, (2025). (in Revision) (JCR Q1|中科院一区)
-
Xie, Yulai, Pi, Xiaoning, Zhang,Yang, and Ren,Fang. "Structured Guided Diffusion Models for Industrial Defect Image Generation." Knowledge-based System, (2025). (in Revision) (JCR Q1|中科院一区)
会议论文
-
Pi, XiaoNing, YuLai Xie (共同一作), Yang Zhang, XiaoHui Wang, 和 Fang Ren. "Automatic Iterative Diversity Improvement for Defect Data Generation." In Proceedings of the 2024 16th International Conference on Computer Modeling and Simulation, 41-47. ICCMS '24. ACM, 2024. DOI
-
Wang, Xiaohui, Yulai Xie (共同一作), Yang Zhang, Xiaoning Pi, 和 Fang Ren. "Digital Simulation-Based Data Generation for Quality Inspection." In ICCMS 2023, 6. 2023. DOI
-
Zhang, Yanfei, Yulai Xie (共同一作), Yang Zhang, Yiruo Dai, 和 Fang Ren. "VSSum: A Virtual Surveillance Dataset for Video Summary." In ICCCV 2022, 7, 2022. DOI
技能
技能KNOW-HOW
- Python, C++, Java PyTorch, OpenCV, LangChain
- Linux, Docker, Git LATEX, H5, Unreal, Omniverse
- 中文, 英文(专业), 日文(日常)