Torch_Chen
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作日21:00-23:30、周末08:30-21:00工作地点: 远程
服务企业: 1家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是程序员客栈的Torch_Chen,主要进行后端计算开发。

我毕业于中国地质大学(武汉),主要研究方向是地球热动力学的二维和三维数值模拟及相关并行加速算法,熟悉力学和热传导数值模拟算法,将其应用于地质构造变形演化过程中,能编写相应的程序进行计算,能够熟练使用C++、Fortran、MATLAB、CUDA等进行多节点多GPU的并行算法设计。

如果我能帮上您的忙,清点击立预约”或发布需求!

工作经历

  • 2013-09-01 -2013-12-31武汉国遥新天地信息技术有限公司实习

    基于遥感大数据服务体系,该公司为自然资源、农业、环保、水利、应急、住建等领域提供了高效高质的测绘遥感服务,并且在国防军事、电力应用、石油石化、生态环境、应急管理、海事管理、社会治理、海洋监测等领域提供了专业平台和行业解决方案。公司是国家级专精特新“小巨人”企业、国家规划布局内重点软件企业、国家高新技术企业、中国地理信息百强企业,拥有多项甲级测绘资质。实习期间主要进行GIS软件二次开发的学习。

教育经历

  • 2014-09-01 - 中国地质大学(武汉)地球物理学博士

  • 2010-09-01 - 2014-06-30中国地质大学(武汉)地质学硕士

  • 2006-09-01 - 2010-06-30中国地质大学(武汉)地球信息科学与技术本科

技能

C++
C
多线程
多进程
0
1
2
3
4
5
0
1
2
3
4
5
作品
地球热-力学二维数值模拟

基于二维热动力学数值模拟的地球动力学研究。本研究中的研究对象的温度和压强随深度发生变化,各圈层物质发生运动,相应圈层中的岩石所处的温度和压强发生变化,导致岩石的粘塑性发生变化,甚至导致岩石相变和部分熔融。各圈层物质的运动中涉及的主要热源包括岩石的放射性热、绝热变压生热、剪切生热和相变热等。因此,本人研究的数值模型中岩石的流变性质考虑温度和压强的影响,同时也考虑岩石的相变和部分熔融。该数值模拟涉及斯托克斯方程、质量连续方程和热传导方程的耦合求解。现在的主要研究对象是青藏高原形成演化中的动力学问题,例如印度-欧亚板块汇聚作用下青藏高原形成过程中内部岩石圈结构和高原隆升的动态演化特征和动力学机制,重点研究了地壳流动形成和横向流动的运动学和动力学特征。

0
2023-08-19 00:21
地球热-力学三维数值模拟

基于三维热动力学数值模拟的地球动力学研究。本研究中的研究对象的温度和压强随深度发生变化,各圈层物质发生运动,相应圈层中的岩石所处的温度和压强发生变化,导致岩石的粘塑性发生变化,甚至导致岩石相变和部分熔融。各圈层物质的运动中涉及的主要热源包括岩石的放射性热、绝热变压生热、剪切生热和相变热等。因此,本人研究的数值模型中岩石的流变性质考虑温度和压强的影响,同时也考虑岩石的相变和部分熔融。该数值模拟涉及斯托克斯方程、质量连续方程和热传导方程的耦合求解。现在的主要研究对象是青藏高原形成演化中的动力学问题,例如印度-欧亚板块汇聚作用下青藏高原形成过程中内部岩石圈结构和高原隆升的动态演化特征和动力学机制,重点研究了地壳流动形成和横向流动的运动学和动力学特征。

0
2023-08-19 00:21
一种超大型稀疏矩阵的分块轮流LU分解的GPU加速算法

利用GPU加速并行方法对大型稀疏矩阵进行LU分解需要大量的计算资源,特别是当矩阵的规模大到GPU内存不能将所有数据装入时,线性方程组的求解就不能进行了。本文提出一种基于LU分解的超大型稀疏矩阵的GPU加速算法“SuperLU3D_Alternate”。该算法是基于SuperLU3D算法的改进算法。SuperLU3D算法在有限的GPU资源下,解决不了超大型稀疏矩阵的LU分解问题。同时,SuperLU3D算法在计算过程中有大量数据的非阻塞通信,可能出现超过集群通信缓存限制导致内存溢出,从而无法稳定工作。为了解决这两个问题,SuperLU3D_Alternate算法利用矩阵列消去树将矩阵分成多个子矩阵,将每个子矩阵当成一个待处理的任务轮流执行,按预定顺序调用GPU进行LU分解,计算过程中把GPU中间结果保存在主机内存或硬盘中,计算结束后在各个子矩阵块之间进行数据交换并组装。算法“SuperLU3D_Alternate”依据硬件资源情况,细分三种情况来设计算法:(1)主机内存大小同时满足LU分解所需内存和GPU矩阵数据保存到主机的内存之和,子矩阵数据所在进程与绑定的GPU在同一节点上;(2)GPU节点主机内存不能满足LU分解所需内存,部分子矩阵数据保存在不带GPU的节点主机内存中;(3)进行LU分解需要的内存大于集群的总内存。SuperLU3D_Alternate的时间复杂度、空间复杂度分析和实例验证结果表明,在计算资源足够的情况下,其计算效率也能够媲美SuperLU3D算法。总体上实验矩阵规模越大,SuperLU3D_Alternate算法越有优势。而且,在GPU显存不足以对整个矩阵进行LU分解的情况下,仍然可以利用集群主机内存或者硬盘保存中间计算过程的数据,以此来解决大规模矩阵LU分解问题。同时,该算法也减少大量数据在进程之间的传输,以防止超过集群MPI数据传输的缓存上限,提高了程序的稳定性。

0
2023-08-18 23:27
更新于: 2023-08-19 浏览: 157