Skip to content

谢雨来

博士,高级研究员@ 日立中国研究院

研究领域

AI基础研究

  • 机器学习 计算机视觉
  • 多模态分析(视觉,听觉,语言,传感器)
  • AIGC (时序数据,图像数据生成)
  • 数字模拟/数字孪生
  • 三维重建/三维生成
  • 大语言模型/多模态大模型

AI应用研究

  • 工业制造与物流
  • 人群模拟
  • 交通分析
  • 养老解决方案
  • AI方法的光学领域应用
  • 大语言模型(DeepSeek,qwen等)的行业应用

教育与职业发展

教育经历

  • 2010-2014 工学博士
    • 北海道大学,日本
    • 国家公派留学奖学金
  • 2008-2010 工学硕士
    • 天津大学,中国
  • 2004-2008 工学,管理学士
    • 天津大学,中国
  • 2013 访问交流
    • 爱荷华大学,美国
  • 2013 访问交流
    • 首尔大学,韩国

工作经历

  • 2014-至今 高级研究员
    • 日立中国研究院, 中国
    • CV,AI,AIGC项目落地经验(10年+)
    • GenAI,LLM,MLM技术革新探索
  • 2014 研修
    • 日立中央研究所, 日本

项目经历

落地导向

  • 公共安全视频监控 (2016)
  • 地勤作业车端分析(机场) (2020)
  • 手机端视觉点餐(跨国餐饮企业) (2021)
  • 厂区行为规范(头部制药企业) (2022)
  • 厂区安全规范(大型饮料企业) (2023)
  • 产线装配质量检测(头部汽配企业) (2024)
  • 仓库行为传感分析(跨国物流企业) (2024)
  • 厂区安全规范(电力企业) (2025)

前沿探索

  • 基于视觉的公共交通管理(重大合作)
  • 基于传感的公共区域人群分析(清华合作)
  • 多模态视频理解分析(北科合作)
  • 基于图像的三维重建(北科合作)
  • 基于AI的光学系统(北科合作)
  • 基于大语言模型(DeepSeek)的行业应用革新

近期论文

查看完整论文列表

期刊论文

  1. Ren, Fang, Yulai Xie (共同一作), Xiaoning Pi 和 Xiaohui Wang. "Bridge the gap between simulated and real-world data in optical fiber mode decomposition for accuracy improvement: A deep learning-based co-learning framework with visual similarity-based matching". Expert Systems with Applications 256 (2024): 124937. DOI (JCR Q1|中科院一区)

  2. Xie, Yulai, Jingjing Niu, Yang Zhang, 和 Fang Ren. "Global-Shared Text Representation Based Multi-Stage Fusion Transformer Network for Multi-Modal Dense Video Captioning." IEEE Transactions on Multimedia, (2023). DOI (JCR Q1|中科院一区)

  3. Xie, Yulai, Jingjing Niu, Yang Zhang, 和 Fang Ren. "Multisize Patched Spatial-Temporal Transformer Network for Short-and Long-Term Crowd Flow Prediction". IEEE Transactions on Intelligent Transportation Systems, (2022). DOI (JCR Q1|中科院一区)

  4. Jingjing Niu, Yulai Xie (共同一作), Yang Zhang, 和 Fang Ren. "Tri-Modal Dense Video Captioning Based on Fine-Grained Aligned Text and Anchor-Free Event Proposals Generator". International Journal of Pattern Recognition and Artificial Intelligence, (2022). DOI

  5. Xie, Yulai, Yang Zhang, 和 Fang Ren. "Temporal-Enhanced Graph Convolution Network for Skeleton-Based Action Recognition." IET Computer Vision, (2022). DOI (2022 Top Downloaded Article)

在投论文

  1. Ren, Fang, Xie, Yulai (共同一作), Pi,Xiaoning. "Query-Based Neural Network for Long-Range Prediction of Optical Spatio-temporal Dynamics in Multimode Fibers.", Expert Systems with Applications, (2025). (in Revision) (JCR Q1|中科院一区)

  2. Xie, Yulai, Pi, Xiaoning, Zhang,Yang, and Ren,Fang. "Structured Guided Diffusion Models for Industrial Defect Image Generation." Knowledge-based System, (2025). (in Revision) (JCR Q1|中科院一区)

会议论文

  1. Pi, XiaoNing, YuLai Xie (共同一作), Yang Zhang, XiaoHui Wang, 和 Fang Ren. "Automatic Iterative Diversity Improvement for Defect Data Generation." In Proceedings of the 2024 16th International Conference on Computer Modeling and Simulation, 41-47. ICCMS '24. ACM, 2024. DOI

  2. Wang, Xiaohui, Yulai Xie (共同一作), Yang Zhang, Xiaoning Pi, 和 Fang Ren. "Digital Simulation-Based Data Generation for Quality Inspection." In ICCMS 2023, 6. 2023. DOI

  3. Zhang, Yanfei, Yulai Xie (共同一作), Yang Zhang, Yiruo Dai, 和 Fang Ren. "VSSum: A Virtual Surveillance Dataset for Video Summary." In ICCCV 2022, 7, 2022. DOI

专利

专利列表

查看完整列表(20+)

  • 主要领域: CV应用, AI应用, GenAI应用, 工业解决方案, 人群分析等

技能

技能KNOW-HOW

  • Python, C++, Java PyTorch, OpenCV, LangChain
  • Linux, Docker, Git LATEX, H5, Unreal, Omniverse
  • 中文, 英文(专业), 日文(日常)
页面访问量:    独立访客数: