作者:谢松梅,杨智敏 等(国家食品药品监督管理局药品审评中心)
编辑:春雪
摘要:目的:探讨生物类似药临床相似性比对试验设计的关键考虑要素及结果评价标准。方法:检索、调研国外生物类似药指导原则及临床相似性评价相关文献进展,通过案例分析并与生物制药行业研发者、临床及统计学专家共同研讨等方法,形成对生物类似药临床相似性评价的思考。结果与结论:生物类似药临床相似性评价的标准应基于产品特异性制定。对于不同的生物制品,在充分了解原研产品质量、有效性、安全性特征的基础上,找到合适的研究人群、终点及等效/非劣效界值至关重要。临床相似性评价标准中应考虑引入参照药自身临床应答变异、受试者临床疗效变异等因素设定界值,并在临床相似性比对试验中进行直接对比评估.从而全面评价临床相似性。
自20世纪80年代开始,生物创新药物陆续上市并在一些重大疾病和慢性疾病领域发挥了很好的治疗作用,其市场份额也因此不断攀升。近年,随着原研生物制品专利到期,生物类似药研发已成为国内外制药企业关注的热点。各国药品监管机构、学术界也纷纷从不同角度积极探讨生物类似药研发和评价的科学路径和方法,以推动在质量、有效性和安全性方面与原研生物制品具有相似性的生物类似药的上市,进而降低医疗成本、增加患者临床使用的可及性。
与小分子化学药物相比,生物产品具有相对分子质量大、结构复杂、生物活性对其结构完整性依赖性强、生产工艺复杂等特点,目前的分析方法尚不足以了解这类产品的全部特征。因此,评估生物类似药与原研生物制品的相似性,仅基于生物利用度的生物等效性研究尚不充分,通常还需通过药代动力学(PK)/药效动力学(PD)和/或有效性和安全性比对试验研究建立二者之间的治疗学等效性以评估临床相似性。
由于临床优效结果可能带来额外的安全性风险(例如,免疫原性),采用传统的非劣效性试验设计来建立生物相似性存在担忧。同时,用于评价化学仿制药生物利用度的生物等效性试验设计中推荐的等效性界值通常太宽或缺乏统计学论证或临床基础,该设计用于评估临床疗效的相似性并不恰当。因此,临床相似性比对试验设计和评价的标准始终是业界备受关注和激烈讨论的问题。
2014年,基于生物类似药研发和监管的需要,国家食品药品监督管理总局药品审评中心在参考借鉴世界卫生组织、美国、欧盟以及日本等相关指导原则的基础上,结合我国对于此类药物研发和评价的认知和实践,组织起草了<生物类似药研发和评价技术指导原则>。在指导原则起草过程中对临床相似性评价的标准,尤其是基于临床终点比对的临床等效性/非劣效性试验设计和评价标准进行了深入探讨,并提出指导性建议。本文将对此部分内容的讨论和思考进行介绍,以期使研发者更好地理解并可应用于生物类似药的研发和评价。
1 国外指导原则及文献建议
生物类似药临床有效性比对试验的合理设计对于评价生物类似药与原研生物制品之间的临床相似性至关重要。对此,世界卫生组织及各国针对生物类似药的指导原则一致推荐,采用临床相关且敏感的有效性终点和研究人群进行随机对照比较试验,同时,基于临床相似性比较试验的目的,等效性设计是最佳选择,也是实现研究目的最直接的设计。某些情况下,如经过合理性论证,非劣效性设计也可以接受,例如:已确定参照药的安全范围较宽,当参照药剂量超过说明书推荐剂量时并不会引起安全性的担忧时。
但也有个别国家,如韩国、日本,则并未在其指南中提及有关非劣效性设计的考虑和建议。同时,各国指南均明确说明,等效性/非劣效性界值应根据统计学和临床意义预先确定。对于等效性/非劣效界值的设定,世界卫生组织指南提到“必须根据临床意义预先定义等效性/非劣效界值,并对其进行论证;选择的界值应可代表临床上最大可接受的疗效差异,而该差异在临床实践中不具有临床意义”。而FDA还提出“应使用已知的参照药及此类药品相关临床知识来设定等效性界值,尽管界值的上限(优效性)和下限(劣效)通常相同,但在一些情况下使用不同的上限和下限可能更合理”。
然而,以证明生物类似药与参照药之间临床相似性为目标的等效性/非劣效性试验的设计中,应如何基于生物类似药的特点有针对性地考虑并设定等效性/非劣效性界值?如何界定并选择临床敏感的有效性终点和研究人群?等问题在各国指南中并没有给出具体标准和要求,而这些往往是评价生物类似药临床相似性的基础。
2 临床相似性评价的思考与建议
2.1 思考
2.1.1 临床相似性评价应基于生物类似药特性开展
生物类似药是指在质量、安全性和有效性方面与已获准注册的参照药具有相似性的治疗用生物制品。尽管可能在临床非活性成分上存在细微差异,但生物类似药应与参照药高度相似,且二者之间在安全性、纯度和效价上并无临床意义的差异。
生物制品通常是在活细胞中制造的重组蛋白分子,其生产工艺高度复杂且需要多次特定的分离和纯化步骤。生物药剂学的复杂性导致难以避免来自相同生产工艺的不同批次产品之间、以及来自不同生产厂家的相同蛋白质之间存在异质性。同时,生产工艺中小的变化或差异可能导致终产品在纯度、生物学特征以及临床有效性方面的显著影响。此外,与小分子化学药品之间一个重要的安全性差异在于生物制品存在导致免疫应答(免疫原性)的潜在风险”。由此,对于生物类似药与参照药之间临床相似性的评估,应充分考虑原研产品自身固有疗效变异及受试者间变异因素带来的影响。
2.1.2 充分认知参照药是制定相似性评价标准的前提
由于目标疾病、临床终点的性质、有无历史数据以及历史数据形式的不同,使得不同产品的临床相似性标准有所不同,该标准应该是特定于某个临床试验而制定的。疾病人群不同、终点设计不同,则获得的药物反应结果数据必然有所不同,因此,基于参照药已获得临床试验数据和获批适应证选择最能反映临床疗效的人群和临床相关终点,选择易于检测出差异的人群和终点是进行临床相似性比对的重要前提。
2.1.3 等效性/非劣效性界值的合理选择是相似性评价的关键
随机对照试验是评估新药有效性和安全性的金标准。通过研究终点来对特定临床问题进行研究,其优势在于可以通过对照来确立疗效和安全性,并通过随机分组来控制各种已知和未知的影响因素对疗效和安全性的影响。基于研究目的,随机对照临床试验可分为优效性、等效性和非劣效性试验设计。对于生物类似药与参照药之间是否存在临床相似性的评价,等效性设计显然是最佳选择。然而,在研究设计阶段,临床疗效还不能很好确定的情况下,相比非劣效试验,等效性试验通常需要较大的样本量才能获得相同的研究把握度,故研究成本较高、周期较长。因此,业界也非常关注非劣效性试验研究的关键考虑及可行性。
但是,相比等效性设计,在评价临床相似性方面,非劣效试验设计存在自身固有的局限性,以两组问临床指标差值为例,差异为正代表较好的疗效,依据95%置信区间和正负界值的相对关系可以将所得出的非劣效结果分为4种情况 :
①疗效指标差值的95% 置信区间下限大于某一事先设定的正界值,这时可建立统计优效且该优效具有临床意义;
② 疗效指标差值的95% 置信区间下限大于0,这时可以建立统计学优效,但是差异并不一定有临床意义;
③95%置信区间在正界值和负界值构成的区间之内,这时等效成立,但同时非劣效也成立;
④95% 置信区间下限大于负界值,而上限小于0,这时试验组的比值比小于对照组,同时非劣效是成立的。
由此,第1种情况明显与相似性的原则矛盾,其可能因为优效的同时带来安全性的担忧,不能支持得出相似性的结论。第2种情况中,如果差异被认定为有临床意义的话,同样可能由于优效而带来安全性的担忧而不能用来支持相似性的结论。而第4种情况,则可能出现尽管获得非劣效的结论,但也会带来临床实际疗效不如参照药的担心。
因此,非劣效试验设计可能导致上述不同情况的非劣效结果,对于生物类似药临床相似性评价可能带来逻辑上的以及实际上的不一致。如何避免由于优效可能带来的不一致、甚至假阳性结果的出现,是一个值得商榷的重要问题,而其中,界值的合理选择是避免或减少上述问题的关键环节。
2.2 建议
2.2.1 总体考虑
遵循随机、双盲的原则进行比对试验研究。样本量应能满足统计学要求。剂量可选择参照药剂量范围内的一个剂量进行。对有多个适应证的,应考虑首先选择临床终点易判定的适应证进行。对临床试验的终点指标,首先考虑与参照药注册临床试验所用的一致,也可以根据对疾病临床终点的认知选择确定。
临床有效性比对试验研究通常采用等效性设计,应慎重选择非劣效性设计,并设定合理的界值。对采用非劣效设计的,需考虑比对试验研究中参照药的临床疗效变异程度以评价候选药和参照药的相似性。
2.2.2 试验设计
设计1:以原研生物制品为对照,进行随机、双盲、临床等效性/非劣效性比对试验。试验将目标受试人群随机分为两组,一组为研究药物组,另一组为原研药物组。
试验设计时应考虑原研生物制品自身固有的变异可能带来临床疗效和安全性的差异,故需引入参照药自身临床疗效变异因素和受试者个体疗效变异因素进行临床相似性评价。通常,参照药疗效和受试者个体间疗效变异越大,所需样本量越多。对此,应考虑入选足够样本的受试者,使在结果评价时可进行分层分析比对,包括:对参照药不同批次之间临床疗效的变异情况、同一批产品不同受试者之间个体临床疗效的变异程度等,以助于将比对试验中研究数据的变异作为参照进行临床相似性分析比对。
设计2:以原研生物制品为对照,进行随机、双盲、临床等效性/非劣效性比对试验。试验将目标受试人群随机分为三组,一组为研究药物组,一组为原研药A批组,一组为原研药B批组。
试验设计将不同批次原研产品分别作为不同对照组,将产品批次作为独立的变量引入比对试验中,此种设计可将不同批次对照产品对主要有效性终点的作用进行评估,进而将研究药物与不同批次参照药物的有效性终点进行比对。该设计不仅在界值设定时可以考虑参照药历史数据的变异性,同时也考虑了相似性比对试验中的参照药不同批次的变异性。以不同批次参照药的疗效变异作为参考,可以可好地用于评估生物类似药与参照药之间的临床相似性。
设计1与设计2均是未设立安慰剂对照的阳性对照试验,此类临床试验都是假定原研药是基于其相对于安慰剂的疗效而获准上市的基础上进行的设计,因此,有效性比对试验实际上是比较生物类似药和原研药与安慰剂相比的相对有效性。
2.2.3 相似性评价关键要素的选择
试验人群和终点:临床比对试验中是否选择了敏感的人群和终点是建立临床相似性标准的一个重要考虑因素。但是,何为敏感?其标准是什么?并无统一认识。<生物类似药研究和评价指导原则>中提出,“对有多个适应证的,应考虑首先选择临床终点易判定的适应证进行。”
其中,“选择临床终点易判定的适应证”将“研究人群”与“临床终点”进行关联考虑,明确了研究人群和终点选择的基本要求,即:临床终点易判定。其含义包括:
①终点指标是否客观、易于检测评价。
②基于参照药与安慰剂相比的历史疗效数据,不同适应证人群中疗效应答差值越大则该适应证人群相关终点指标越易于判定。
因此,结合疗效终点的易于判定性来选择目标适应证人群将更易于检测出临床有意义的差异。
界值:等效性/非劣效性界值δ的设定非常重要。决定δ取值的方法包括以往随机试验的结果、专家的判断、患者的情况 等。EMA和FDA建议了一种称为95~95的方法 。
具体的步骤为,首先确定对照和安慰剂间差值95%置信区间下限的值为M1。然后根据以M1的50% -75%确定M2值,即为界值。针对生物类似药特点,还应额外考虑评估原研药既往临床试验中的疗效变异情况并对界值进行必要的调整。最终,界值是由研究者、临床医生、统计学家和药物注册管理人员协商确定的。
2.2.4 结果比较评价
基于生物类似药的特殊性,在疗效结果比对评价时,应考虑将试验中参照药自身变异以及受试者间变异因素带来的临床疗效差异作为临床相似性评价的标准之一在试验之中进行直接比较分析。
设计1结果的判定:首先,根据统计学评价的一般原则进行统计学分析确定是否得出等效性/非劣效性试验结论;在此基础上,进一步对参照药组内不同批次药物之间临床疗效差别及变异,以及同一批次药物不同受试者的疗效变异程度,并结合生物类似药组的变异程度进行分析,以进一步确证等效 F劣效界值设定的合理性并用来支持临床相似性评价。
设计2结果的判定:首先,根据统计学评价的一般原则进行统计学分析确定生物类似药与原研药A、B两组分别比较是否得出等效性/非劣效性试验结论;当与原研药A,B两组比较等效性/非劣效性均成立情况下可很好地支持临床相似性评价。如果原研药A,B两组样本量较小(随机未按1:1:l进行),则可根据统计学分析确定生物类似药与原研药A,B两组合并分析是否可得出等效性/非劣效性试验结论;在等效性/非劣效性成立的情况下,可进一步参照设计1的评价方法对参照药组不同批次药物之间和同一批次受试者之间的疗效变异进行分析,以支持临床相似性评价。
3 结语
生物类似药临床相似性评价的标准应具有产品特异性,而非固定不变。对于不同的生物制品,在充分了解原研产品质量、有效性、安全性特征的基础上,找到合适的研究人群、终点、及等效/非劣效界值至关重要。同时,基于生物类似药分子量大、结构和工艺复杂的特点,应考虑引入参照药自身临床应答变异、受试者临床疗效变异等因素设定界值,并考虑临床相似性比对试验中相关变异因素,从而避免实际上不等效而得出等效结论的情况,进而确保获得临床相似性结论。此外,建立临床相似性的重要考虑还包括选择临床终点易判定的适应证人群进行比对研究。
摘自:<中国药学杂志>,2015年3月第6期
======联系我们=========
天之力医药(微信号:bjtianzhili)专注于医药产品力提升。
回复数字“2”可查看历史推送文章。
【编辑:amanda】 国际药物制剂网 本文链接: http://www.phexcom.cn/hydt.aspx