1、使用C语言编写并深度优化深度学习算子,比如激活算子,卷积算子。
2、设计高效的代码实习,能够对编写的算子进行深度的性能调优。
3、带领、指导小组成员完成算子的开发和优化工作。
1、有扎实的C语言基础和算法基础,能够独立分析计算需求,并设计编写相应的C代码算子优化实现。
2、熟练掌握C语言代码优化技术,熟悉计算机体系结构和计算机原理的知识。
3、有多年并行编程的经验,比如CUDA/OpenMP/Pthread/Athread等。
4、有开发计算库的经验,比如BLAS/FFT/DNN库等。
5、有良好的带队能力、学习能力、沟通能力和团队合作能力。