龚亚南
电话: 434-466-5462 电子邮件: gongyn3@gmail.com 领英: linkedin.com/in/yanan-gong-yg GitHub: github.com/Yanan-Gong
技术技能
编程与数据库: Python, SQL, Neo4j 框架与工具: PyTorch, Hugging Face, Scikit-learn, PySpark, Hadoop, Git, ETL 云与部署: Azure, AWS, MLflow, Kubernetes, Airflow, Docker, Databricks, MLOps, CI/CD 亮点: LLM, NLP, GenAI, RLHF, Foundation Models, A/B Testing, Machine Learning, Deep Learning
教育背景
统计学硕士 | 弗吉尼亚大学,夏洛茨维尔,弗吉尼亚州 | GPA-3.9/4.0 | 2019年8月 - 2021年5月
应用统计学学士 | 中山大学,广东,中国 | GPA-3.5/4.0 | 2014年9月 - 2018年8月
工作经历
高级数据科学家/机器学习工程师 | 空调、供暖和制冷研究所,阿灵顿,弗吉尼亚州 | 2021年8月 - 至今
人工智能选择助手与MLOps(商业智能工具):
- 发起并领导开发了基于GPT-4的多智能体AI助手,使用检索增强生成(RAG)技术,自动化机械审计,将工程工作量减少了80%
- 编写了与CI/CD工作流集成的生产级ML管道,通过Docker和Kubernetes部署,实现了可扩展和可复现的模型部署
- 开发了用于低延迟ML推理服务的RESTful API,以亚秒级响应时间支持实时工程决策
- 使用MLflow和Airflow实现模型版本控制和监控,确保生产中的持续交付和回滚支持
- 利用LLM作为评估器来评估输出的准确性和相关性,应用概念性微调以提高鲁棒性
异常/欺诈检测: 开发并部署了一个端到端的XGBoost模型,用于实时识别1000万个HVAC评级中的异常,每年减少了50万美元的运营成本。实现了97%的召回率、85%的精确率和90%的F1分数,确保捕获关键异常。
跨职能协作: 领导与工程师、法律和政策团队的跨职能协作,与多个利益相关者互动,确保一致的用户体验和行业合规性。
领导力: 指导多名实习生完成项目;帮助新员工融入公司文化。
研究助理 | Right Legal & 阿尔伯塔大学,埃德蒙顿,加拿大 | 2017年9月 - 2018年5月
- 实现了一个用于历史法律文档的多标签文本分类系统,通过Word2Vec对特征词进行预处理,将专业法律术语转换为通俗语言
- 构建并部署了一个基于Transformer的模型,准确率达到94%,并进行情感分析以增强网站的匹配算法,提高了客户与律师的配对效率
项目
模拟面试AI智能体 - LLM智能体黑客马拉松 | Python, Flask, AWS | 2024年12月
- 领导、设计并部署了一个可扩展的AI模拟面试平台,利用GPT-4、RAG和多智能体架构。提供特定职位的问题、行业定制的场景和实时AI反馈,将用户成本降低了80%
- 实现了推理与行动提示工程和基于LLM的评估,部署在Kubernetes上,具有自动扩展功能,支持1000 QPS并具备未来可扩展性