Skip to main content

GDock

合作伙伴应用:星药科技

GDock是全球首个能同时预测小分子和靶蛋白三维结合构象及结合亲和力的深度表征学习分子对接方法,其表现大幅超越现存方法的最好结果。

注意事项

  • 输入文件为.pdb格式的蛋白文件。
  • 配体文件要求是.csv格式的配体分子库;.csv文件内容:第一列为分子名称,第二列是smiles,例如:
lig1,C1CCCCC1
lig2,Oc1cccs1
lig3,CCc1cccs1
lig4,COc1cccs1
  • 注意:配体CSV⽂件中不得包含表头(Header)

一.模板提交

​ 使用Gdock 模板提交时,会根据配体文件的行数,和设置拆分后配体文件的数量(行数),启动对应数量的作业节点。如:上传的.csv配体文件的行数为480行,设置拆分后配体文件的数量为200行,会拆分为3个配体文件;硬件配置选择节点数量为1提交作业时,会启动3个作业节点同时计算,相应以3个节点的价格进行计费;相比于串行提交,以相同的成本节约了计算的时间。

Step 1. 在应用中心搜索 Gdock 软件,点击提交作业-选择模板提交;

Step 2.选择可视化模板提交;

Step 3. 上传输入文件蛋白文件(.pdb格式),配体文件(.csv格式),并设置Docking参数和设置拆分后配体文件的数量(行数);

Step 4. 选择硬件配置,使⽤GPU进⾏⾼通量筛选推荐使用白鲸1卡(T4),使⽤CPU进⾏⾼精度对接推荐使用海鲢(16c32g);

  • 节点数量:设置启动多少个并行计算的计算节点。

  • 内存配比:设置各个计算节点内存大小为单节点核心数×内存配比。

Step 5. 查看作业内容汇总,并提交作业;

Step 6. 通过作业管理查看运行中的作业;

二. 结果文件介绍

  • 对接成功后会输出两个⽂件,分别是预测的亲和⼒信息info_with_predicted_affinity.csv 和构象的SDF⽂件 output.sdf 。(⾼通量筛选模式不会输出SDF⽂件