AI Tools · Product Engineering · Automation

AI 落地实践者 将前沿构想转化为生产力系统

在 AI 生产力呈指数级爆发的时代,我致力于用 AI 重新定义个人与工程的边界。我不仅关注底层模型的单一能力,更聚焦于AI智能体思维、前沿工具调用自动化工作流的深度融合。

我擅长将大模型、自动化脚本、高并发数据管道与现代化 UI 缝合在一起,构建端到端的智能闭环系统。我主张以 AI 为杠杆,实现从构想到生产级系统的超高速迭代,用技术连接断点,交付真正能解决具体业务痛点的全栈智能系统。

18+ 年研发经验
10 个近期 GitHub 项目
6 篇国际论文
CV/AI 核心技术方向

概览

从算法研究到产品交付,覆盖视觉、医学信号、AI 工作流和后台系统。

我长期做算法研发,熟悉机器学习、计算机视觉、医学信号分析和嵌入式实时处理;这些经历让我在面对新问题时,能把数据、模型、工程约束和产品目标放在一起判断。

近年的重点转向 AI 工具和端到端应用落地:用 Go 与 SQLite 构建轻量服务,用 Python 完成自动化抓取、图像/视频处理、模型训练和 AI 调用, 用 Electron、Vue、React、Uni-app 搭建桌面端、Web 端和大屏端产品。

AI Tools AI Workflow Automation Product Engineering Computer Vision Machine Learning 1D-CNN ECG Analysis OpenCV PyTorch YOLO nnUNet FastAPI Go SQLite WAL Playwright Electron React Vue 3 TypeScript FFmpeg Whisper

近期项目

近期 GitHub 项目,体现 AI 产品化、自动化、数据系统和全栈交付能力。

中洲企业出海服务平台,提供政策、案例、IP 等内容检索,企业画像、订阅套餐、后台内容管理、导入审核和 AI 辅助整理。

Go / SQLite FTS5 / DeepSeek / SiliconFlow / 原生 Web

面向 YouTube 行业博主素材采集和二次内容生产的半自动系统,支持字幕下载、Whisper 转录、素材池管理和口播文案生成流程。

Go / Python / SQLite / yt-dlp / Whisper / FFmpeg / openpyxl

视频制作流程管理桌面应用,管理视频切分、高清化、图像生成、文本生成、语音识别、视频合成等流程。

Electron / React / TypeScript / Ant Design / Python / FFmpeg / PyInstaller

膝关节超声图像 AI 识别项目,支持标注与 ROI 编辑、数据格式转换、模型训练、评估和演示。

Python / PyTorch / YOLO / nnUNet / MONAI / Segment Anything / OpenCV

巨量引擎广告投放数据抓取工具,登录后切换组织和应用,抓取账户、项目、单元数据,入库后按规则检测并飞书通知。

Python / Playwright / SQLite / YAML / requests / 飞书 Webhook

MR/VR 游戏运营管理系统,提供实时游戏授权、按玩家数计费、运营商充值与账单、统计分析、管理员后台和 SDK 接入。

FastAPI / PostgreSQL / Redis / Vue 3 / TypeScript / Docker Compose

赛场信息屏项目,用于赛事现场实时展示成绩排名、出发时刻、赞助商轮播和事件跑马灯,适配安卓设备外接 HDMI 大屏。

Uni-app / uni-ui / TypeScript OpenAPI Client / HTTP Web API / Android

抖音主页和线索筛选自动化工具,从主页、评论、截图等数据中抽取信息,按城市、性别、年龄和关键词规则筛选目标用户。

Python / Flask / Selenium / Airtest / MySQL / SQLite / openpyxl

抖音自动打招呼脚本,基于 Airtest 执行评论截图、主页访问和打招呼流程,按配置控制执行间隔、每日数量和启动时间。

Python / Airtest / JSON 配置 / 移动端与浏览器自动化

工作经历

长期算法研发经历,覆盖科研、工程实现、产品集成和团队研发。

2010 至今

算法研发,全面 AI 化

北京触角科技有限公司

近期重点:AI 工具与业务系统落地

近年来,我的工作重心进一步转向AI 工具与业务系统的快速落地:围绕内容生产、视频生成、广告投放、医疗影像识别、赛事信息展示、MR/VR 授权计费等场景,独立设计并实现了一系列端到端工具和系统。项目覆盖 Go/Python/TypeScript 技术栈,包含 AI 视频工作流、自动化数据抓取与规则通知、YouTube 素材采集与 Whisper 转录、超声图像识别实验平台、轻量级业务后台、桌面端工具和移动端/大屏应用。整体目标是把大模型、自动化脚本、数据管道和产品界面连接起来,将具体业务问题快速转化为可运行、可迭代的生产力系统

早期算法研发:

  • 依托深度相机,识别追踪人体轮廓动作,同步光学视频,支撑 AR 虚拟试衣。
  • 融合 3D 人脸特征点与光流追踪,实时识别追踪三维人脸,落地虚拟试镜方案。
  • 研发小型识别标识,精准稳定追踪,适配虚拟戒指、耳饰等首饰试戴场景。
2014 - 2025

算法研发,植入业务、流程改造、人机交互

北京康博众联电子科技有限公司

  • 基于 AI 技术进行动态心电图分析,采用一维卷积神经网络研发心电信号 PQRST 波检测、波形聚类、多种心率异常检测算法。
  • 相关算法系列在识别率、识别种类、噪声检测率上超过当时医院使用的 CFDA 认证同类仪器,并已申请专利。
2007 - 2010

算法研发,工程落地

北京海鑫科金高科技股份有限公司

  • 带领团队研发 ATM 机监控算法,实时检测粘贴假告示、换键盘、安装读卡器、遮挡摄像头等恶意行为,应用于 8 个城市近 1000 台 ATM 机。
  • 研发新的指纹拼接与质量判断算法,提升运行速度和拼接质量;研发红外图像人眼定位算法,降低嵌入式系统 CPU 消耗。
  • 研发道路车辆跟踪算法,包括夜晚车辆的车灯检测、跟踪、配对;开发基于 HOG 的嵌入式人脸跟踪算法,保证实时性。
2006 - 2007

算法研发

信雅达系统工程股份有限公司

  • 进行数字水印研发,用于票据、文档数字图像防伪,防止图像在生成、传输、处理、保存过程中被非法使用和修改。

教育与论文

机器学习、遗传编程与故障检测方向的研究背景。

  • 博士,电子工程系,利物浦大学 2002 - 2006。研究方向为机器学习算法及其应用,主要研究课题为遗传编程算法,并将其应用于滚动轴承故障检测、乳癌诊断等模式识别问题。
  • 本科,电子信息与控制工程学院,北京工业大学 1997 - 2002。电子工程系。
  • L. B. Jack, L. Zhang and A. K. Nandi (2003), Genetic programming for automated fault detection. In Proceedings of Condition Monitoring and Diagnostic Engineering Management, 125-134.
  • L. Zhang, L. B. Jack and A. K. Nandi (2004), Extending Genetic Programming for multi-class classification by combining K-Nearest Neighbour. In Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Philadelphia, US.
  • L. Zhang, L. B. Jack and A. K. Nandi (2005), Fault detection using genetic programming. Mechanical Systems and Signal Processing, 19(3), 447-466.
  • L. Zhang and A. K. Nandi (2007) Fault classification using genetic programming. Mechanical Systems and Signal Processing, 21(3), 1273-1284.
  • L. Zhang and A. K. Nandi (2007), Neutral offspring controlling operators in genetic programming. Pattern Recognition, 40(10), 2696-2705.
  • L. Zhang and A. K. Nandi (2009), Diversity-preserving non-destructive operators in genetic programming. Transactions of the Institute of Measurement and Control. 31 (6): 533 SAGE.