《新化学物质环境管理登记办法》(12号令)自2021年1月1日实施至今已有近4年时间,截至目前,瑞欧科技已协助数百家企业完成12号令的登记工作,在非测试数据的应对上积累了丰富的经验。
非测试数据主要分为以下3大类型:QSAR模型预测数据、交叉参照数据和文献数据。
本文为大家详细解读【新化学物质登记中非测试数据的应对经验专栏】第一篇—— QSAR评估报告。
QSAR模型
定量结构-活性关系(Quantitative Structure-Activity Relationship,QSAR)是利用理论计算和统计分析的工具,研究化合物结构与其生物效应之间的定量关系的方法。
它主要建立在相似的分子结构具有相似的功能、分子的生物活性,可以通过其结构特征来预测结构与活性之间存在的可量化的数学关系,基于各种分子描述符和模型算法,建立化合物的结构与其理化性质、生物学活性、毒理学效应、环境行为和归趋等的定性/定量关系。
QSAR模型能够在短时间内对大量化学物质进行毒性和生物活性的预测,避免了传统实验方法的时间和成本,因此在化学、药物开发、环境科学等领域具有重要的作用。
QSAR模型的应用
随着监管机构对定量结构-活性关系认可度的提高,QASR在工业化学品、化妆品等领域的研发、风险评估、注册和管理方面发挥着越来越重要的作用。
许多国家和地区的监管机构(如 OECD)已认可QSAR模型作为评估化学品安全性的有效工具,并制定了相应的指导原则。
中国的生态环境部为规范新化学物质环境管理登记行为,减轻企业的负担,在《新化学物质环境管理登记指南》明确了对非测试数据的要求。QSAR模型在新化学物质登记中的应用主要包括:
最低要求数据中规定可来自模型计算的数据:如亨利常数、生殖/发育毒性等;
最低要求数据中测试数据无法进行时的数据:因物质自身特性确实无法开展的理化、健康毒理学或生态毒理学测试,如被试物无紫外响应且电导率差,无法进行试验的解离常数。
对最低要求数据无法满足新化学物质环境风险评估需要的,申请人应根据新化学物质申请用途的主要暴露途径提供最低要求数据之外的其他数据:环境风险评估报告中在健康与环境暴露评估中所需的非最低要求数据,如固体的蒸气压、水解产物的健康毒理数据等。
无法开展测试的化学物质免于提交测试数据但需对物质的高危害性进行判别时所需的数据:如具有易燃性或自反应物质在常规条件下无法进行的但需要用于高危害性判别的持久性、生物累积性和毒性的数据。
遇水/光分解或发生反应的化学物质以光解或水解产物作为对象时提交的数据:若以快速水解/光解的物质的水解/光解产物作为对象,提交的数据可来自 QSAR评估数据。
QSAR评估报告的质量要求
据《新化学物质环境管理登记指南》对QSAR模型预测数据的质量要求:申请数据源自QSAR模型预测的,应同时满足下列条件并提交相关说明材料——
QSAR模型应当具有科学性和有效性,即具有明确定义的毒性终点或环境指标、明确的模型算法、适用的应用域、适当的拟合度、稳定性和预测能力,尽可能给出模型预测机理解释;
待预测的新化学物质应当涵盖在QSAR模型的应用域中;
QSAR模型预测结果应当足以用于新化学物质环境管理,如新化学物质危害性识别、分类和/或环境风险评估;
QSAR模型预测过程应当公开透明,并提供详细的过程文档。包括但不限于分子结构参数、模型算法、应用域、模型拟合度、稳定性和预测能力等模型构建和验证过程文档,以及模型使用方法和预测结果的过程文档等。
QSAR评估报告面临的挑战
适用的物质类型有限
随着计算机技术迅猛发展,QSAR的学术研究已步入到一个新水平,涉及化学、药物、环境和健康等诸多领域。按照建模方法分类,QSAR软件可分为:
统计模型(Statistical-Based Models)
规则模型(Rule-Based Models)
混合模型(Hybrid Models)
现阶段通常采用混合模型,即将统计模型和规则模型结合起来,利用两者的优势来提高预测的准确性,市面上常用的免费的混合模型包括如QSAR Toolbox、VEGA等,能评估的测试节点也几乎涵盖了新化学物质中的常规登记的最低要求数据。
但QSAR模型预估主要针对具有明确结构式的有机物,以下物质无法通过QSAR模型进行评估:
含有未知或可变化成分的物质(UVCB物质):如复杂的反应产物(A与B的反应产物)、生物材料物质(如生姜提取液),这些物质的成分不明确,导致模型预测的不确定性增加。
混合物:由于混合物中成分的复杂性和相互作用,QSAR模型难以提供准确的预测。
可电离物质:例如盐类、弱酸和弱碱等,这些物质在不同pH值下可能表现出不同的化学行为,这使得其在不同条件下的行为难以预测。
大分子量物质:如聚合物等,其结构复杂且通常不符合QSAR模型所需的简单结构描述。
无机物:QSAR模型主要依赖于分子描述符,这些描述符通常是为有机化合物设计的。无机物的结构和性质与有机物有显著不同,因此现有的描述符往往无法准确反映无机物的特性。
因此,部分疑难物质无法采用QSAR模型进行评估,需采用其他非测试的方法进行评估。
QSAR并不是一个只要输入物质结构,或者是CAS号码,就能输出一份报告的简单工具。
事实上,QSAR的应用需要大量的理论和实践基础。只有对模型算法选择、化学信息学、实验方法、毒性/生物活性的作用机制、可靠性验证、法规知识等具备相当深入的研究,才能准确地将之运用相关领域。
根据《新化学物质环境管理登记指南》对QSAR模型的质量要求,预测过程应当公开透明,并提供详细的过程文档。因此,编写QSAR评估报告应包含以下的原则:
终点:应有明确的毒性终点或环境指标,比如预测物种、暴露时长以及确定的终点表示。因此,报告中必须明确所预测的生物活性或毒性终点,例如致癌性、致突变性等。这一部分应详细描述评价的目标和预期结果,以便于理解和评估模型的适用性。
算法:使用透明清晰的算法。报告中应详细说明所使用的QSAR模型,包括其数学基础和统计方法。常见的方法包括线性回归、支持向量机、神经网络等。还需提供模型构建过程中的参数选择和算法的具体实现细节。
应用域:需要定义模型的应用域,避免模型滥用。每个模型均有其适用域,需根据物质的分子量、结构片段等进行适用域的说明。报告中应界定模型适用的化合物范围,包括化学结构特征、分子量范围等。确保所评估的化合物在模型训练集的范围内,以提高预测的可靠性。
拟合度、稳健性和预测能力:建立的模型应该具备良好的拟合度、稳健性和预测能力来表征模型效果。报告中需提供适当的统计指标来衡量模型的性能,如决定系数(R²)、均方根误差等。这些指标应反映模型对训练数据和测试数据的拟合程度,确保其稳健性和可预测性。
机理解释:科学的机理解释,确保使用的数据来源可靠,并且数据质量高。引用相关文献或数据库,说明数据收集的方法和标准,以增强结果的可信度。
QSAR模型评估报告中应有明确的终点、透明清晰的算法、在模型应用域内、应具备良好的拟合度、稳健性和预测能力以及科学的机理解释才能保证报告的有效性、相关性和科学性。
写在最后
QSAR评估报告在新化学物质登记中具有弥补测试无法开展的缺失、减少测试成本、对动物友好等优势。
然而,需注意的是,QSAR的应用范围存在局限性,对于含有未知或可变成分的物质以及无机物等,QSAR模型无法进行准确预测。
在编制QSAR评估报告时应有明确的终点、透明清晰的算法、在模型应用域内、具备良好的拟合度、稳健性和预测能力以及科学的机理解释才能保证报告的有效性、相关性和科学性。
瑞欧科技有着丰富的QSAR评估报告的编制经验,欢迎随时咨询。我们也将结合自身的注册经验,为大家持续分享新化学物质登记过程中非测试数据的应对经验。
更多关于新化学物质登记经验分享文章,可点击查看: