本文基于davis数据集进行操作2021SC@SDUSC
首先最直接的方式是学习一下别人的项目中是如何处理数据的
在项目代码中,指定了一个ParamList的字典用键值对的方式存储配置信息
下图为所选的数据集ESOL_SMILESValue.txt的结构,每一行数据逗号左侧为分子SMILES序列,右侧为该分子对应的label
下一步就是把刚刚的ParamList(此次已封装到opt里),将opt作为参数送入MolDatasetCreator构造方法中创建一个对应的对象,后续会使用此对象进行进一步处理,接下来看看该构造方法有关opt部分的具体实现
仅仅是将opt赋值给了self.opt
返回到上一层,下面随即使用maldatasetcreator调用CreateDatasets函数进行处理,接下来看实现
此函数开头会获取前面paramList里的DataPath键的值,也就是ESOL_SMILESValue.txt的路径,然后创建文件加载