牛文旭

算法软件工程师

Tell me and I forget, teach me and I may remember, involve me and I learn.

教育背景

电子科技大学

工学学士 电子科学与技术 2015-2019

绩点: 3.62/4.00; 托福: 98/120; GRE: 314+2.5; 一等奖学金; MCM/ICM 省二,M奖;

项目经历:光栅投射3D重建系统; 实时目标检测系统Jetson TX2;

实习经历:Virtuos成都: AAA游戏 Beyond Two Soul PC Port;

实习经历:中国移动成都研究院: 边缘AI智能管理系统开发;

香港科技大学

硕士 ICDE 集成电路设计 2019-2021

项目经历:HLS FPGA智能交通控制系统,人脸计数加速计算系统;

实习经历:威富视界 Slowfast视频流识别算法,端到端爬虫及数据预标注、标注管线;

实习经历: CRAFT+CRNN 手写汉字识别; 高效云端、移动端部署;

关键技能

  • 计算机视觉
  • 机器学习算法
  • TinyML
  • 嵌入式系统软件
  • AI底层算子开发
  • AI的边缘端部署
  • AI核架构
  • 专业英语
  • SIMT SIMD 脉冲矩阵

工作经验

鹏城实验室 技德科技

| 2月 2020 - 6月 2021

  • Atlas800集群AIPerf打榜; Atlas 300 私有云人脸识别加速、深度学习软件栈、Serverless 推理 SDK;
  • uAISS Tinyml部署架构,与 TFLM 100%延迟性能提升;支持典型Tiny算法场景落地。
  • 基于Pulp的RISCV RVV的AI算子开发并与Tensorflow Lite Flatbuffer对接;
  • 基于定制留片RISC-V硬件,参与 MLCommoms v0.5 MLPerf Tiny Submission,全球首个超低功耗AI Benchmark,NIPS2021;

华为技术 海思半导体

6月 2021 - 至今

  • 端到端人脸检测与关键点识别在Hi3796、全志T5、Hi3751 GPU上的部署加速,及算法的迁移训练;
  • 道路目标检测在SD3403 NPU的部署,远红外与RGB,uvc,mipi等端到端嵌入式软件开发;
  • 车道线检测在NXP IMX8平台的加速部署与软件栈基线开发;
  • 端到端Conv3D双目视差算法与Livox激光雷达的3D目标检测算法开发及其在Jetson样机平台的部署;
  • AI核架构设计,底层算子开发、架构验证用例开发; 熟悉SIMT SIMD 和 脉冲矩阵架构算子开发,曾参与MCU级别、自动驾驶、手机、超算AI核开发;