量化私募急招分布式机器学习平台专家 全职
岗位职责:
1.负责规划设计高性能分布式机器学习训练平台的整体架构,支撑大规模数据处 理和模型训练;
2.主导分布式训练相关的技术选型,比如适配业务的并行策略、存储方案等;
3.持续分析大规模集群的训练性能,解决数据读取、显存、通信等核心瓶颈,同 时跟踪前沿分布式训练技术,推动平台架构持续演进;
4.对接算法团队,配合算法团队适配不同的机器学习任务,并做针对性的优化。
5.监控系统运行状态,识别潜在风险,建立预防机制以减少故障发生。
职位要求
1.计算机科学、电子工程、软件工程或相关理工科本科及以上学历,5 年以上工 作经验
2.熟悉Python/Golang/C++中至少一种语言,掌握主流深度学习框架(如 PyTorch)
3.熟悉在分布式环境中快速定位故障根源,如网络延迟、节点失效或数据同步问 题,具备日志分析、性能剖析和调试工具使用经验(如 Prometheus、Grafana)
4.熟悉机器学习训练全链路工具(如 Kubernetes+Slurm 混合调度、机器学习平 台)、熟悉分布式训练框架(如 DeepSpeed、Megatron)、掌握 CUDA 性能调优或者 GPU 架构等。
5.有大规模 AI 训练集群(1000+节点)项目的设计、实施管理经验
6.具备金融行业或大型互联网公司 HPC 运维经验
7.具备较强的责任心和团队合作意识、具有良好的学习能力和分析解决问题能力
8.精通分布式队列系统实现原理,有 Slurm/YARN、RAY 等资源管理系统经验者优先
量化私募急招分布式机器学习平台专家 全职岗位职责: 1.负责规划设计高性能分布式机器学习训练平台的整体架构,支撑大规模数据处 理和模型训练; 2.主导分布式训练相关的技术选型,比如适配业务的并行
张小明
前端开发工程师
高效构建企业级报表:FastReport开源报表生成器完全指南
高效构建企业级报表:FastReport开源报表生成器完全指南 【免费下载链接】FastReport Free Open Source Reporting tool for .NET6/.NET Core/.NET Framework that helps your application generate document-like reports 项目地址: https://gitcode.com/gh_mirro…
Blender建筑神器building_tools:5分钟学会专业级建筑建模
Blender建筑神器building_tools:5分钟学会专业级建筑建模 【免费下载链接】building_tools Building generation addon for blender 项目地址: https://gitcode.com/gh_mirrors/bu/building_tools 还在为Blender中复杂的建筑建模而苦恼吗?buildin…
提升用户体验的关键一步:引入EmotiVoice情感语音
提升用户体验的关键一步:引入EmotiVoice情感语音 在智能音箱每天清晨用千篇一律的语调叫你起床,在客服机器人毫无波澜地重复“感谢您的来电”时,你是否曾感到一丝疏离?语音交互早已普及,但大多数系统仍停留在“能说”的…
B站UP主数据解析终极指南:快速掌握创作者完整画像
还在为找不到优质B站创作者而烦恼吗?面对海量UP主,如何快速识别真正有实力的内容创作者?BiliScope免费开源工具为你提供完美解决方案! 【免费下载链接】biliscope Bilibili chrome extension to show uploaders stats 项目地址:…
EmotiVoice语音过渡自然性评测:跨情感切换无突兀感
EmotiVoice语音过渡自然性评测:跨情感切换无突兀感 在虚拟主播深夜直播中突然从温柔低语切换到激动呐喊,却毫无音色断裂之感;儿童教育机器人讲述童话时,能随着剧情自然流露从喜悦到悲伤的情绪递进——这些曾经依赖专业配音演员才能…
应对领用混乱与浪费:包装耗材这样管!
包装耗材是仓库日常作业中的高频消耗品。传统粗放的管理方式,常导致领用混乱、使用浪费和补货不及时等问题。为提升耗材管理精准性、实现精细化管控,弘人网络C-WMS推出了独立的「包装耗材」管理模块。包装耗材概要介绍C-WMS包装耗材管理模块的核心价值&a…