日水轉(zhuǎn):培養(yǎng)基和補料中生物添加物的多元分析
發(fā)布時間:
2022-11-16
作者:
日水培養(yǎng)基
生物藥工業(yè)化生產(chǎn)中,生長培養(yǎng)基配方中通常含酵母提取物和蛋白胨等添加物。盡管政策鼓勵公司使用化學限定性培養(yǎng)基以減少哺乳動物細胞培養(yǎng)工藝中的變量,許多微生物和哺乳動物細胞培養(yǎng)工藝中仍繼續(xù)使用生物添加物作為其生長培養(yǎng)基配方或補料。據(jù)Sheff ield Bioscience (Kerry, Inc.)報道,已獲批的哺乳動物細胞–衍生的生物治療產(chǎn)品中至少有六成在生產(chǎn)中使用了生物添加物。
工藝開發(fā)過程中,難以確定哪種添加物適合于某種特定應(yīng)用,因為添加物的復(fù)雜組分和多樣性。多變量分析(MVA)技術(shù)越來越廣泛地應(yīng)用于幫助公司了解他們的生物制藥產(chǎn)品和生產(chǎn)工藝的復(fù)雜性。
技巧包括基于統(tǒng)計的工藝建模、傳感器校準和工藝可比性。
多變量分析(MVA)技術(shù)本質(zhì)上是一種統(tǒng)計回歸技術(shù),試圖通過捕捉新的正交變量或稱為主成分(PCS)的可變性來對實際變量的可變性作出解釋。相關(guān)實際變量之間的相關(guān)性允許使用數(shù)量較少的主成分來捕捉建模和作出預(yù)計,從而對更大量的數(shù)據(jù)集的原始信息作出分析。
這里,主成分分析法(PCA)用于對來自六十五種無動物成分(ACF)生物添加物的組合數(shù)據(jù)變化,進行數(shù)據(jù)捕獲和建模。由此產(chǎn)生的模型用于研究兩種生物添加物的批間變化,并對市場上的新產(chǎn)品進行評估。本文展示定量結(jié)構(gòu)-活性關(guān)系(QSAR)方法來研究組分與培養(yǎng)表現(xiàn)和產(chǎn)品蛋白含量之間的關(guān)系。
這里推薦定量結(jié)構(gòu)-活性關(guān)系(QSAR)為基礎(chǔ)的方法,使用主成分空間的因子設(shè)計來評價添加劑組成和細胞培養(yǎng)表現(xiàn)之間的聯(lián)系。由生物添加物衍生的主成分分析法(PCA)分數(shù)和由定量結(jié)構(gòu)-活性關(guān)系(QSAR)方法選擇出來的生物添加物的細胞培養(yǎng)物的模擬性能數(shù)據(jù)組成的訓(xùn)練集,被用來創(chuàng)建偏最小二乘(PLS)模型。然后PLS模型可以用于預(yù)測不屬于訓(xùn)練組的生物添加物的性能。
數(shù)據(jù)源和數(shù)據(jù)匯編
145個生物添加物的化學成分數(shù)據(jù),可從公開來源獲得,由OxoD,Becton Dickinson和Sheff ield Bioscience公布。
這些數(shù)據(jù)代表了每種生物添加物的典型組成,并且可以被認為是從許多生產(chǎn)批次、子樣本或分析中得出的平均值。每個生物添加物的化學組成在電子表格中被編輯并注釋以方便后續(xù)的分析。注釋里包含供應(yīng)商、原材料來源、產(chǎn)品類型、消化法和ACF狀態(tài)(表1)。在供應(yīng)商之間的測量單元不同的情況下,這些測量單元被標準化,使得數(shù)據(jù)集具有可比性。選擇65個無動物成分(ACF)生物添加物組成的訓(xùn)練數(shù)據(jù)集,每個數(shù)據(jù)集有59個變量來描述每種生物添加物的物理化學數(shù)據(jù)、分子量分布和自由氨基酸總量。表2列出了這里使用的變量。
分析方法
使用SIMCA P 11.5(MKS UMeMeX,瑞典)用于錯誤篩選、PCA和PLS分析。從編譯數(shù)據(jù)集中選擇ACF生物添加物以構(gòu)建PCA模型。80%以上的產(chǎn)品的變量可用于分析。在分析前用中間定心和單變量定標對所有變量進行預(yù)處理。
結(jié)果
1市售無動物成分(ACF)的主成分分析(PCA)
生物添加物:總計59個變量被用來描述每種無動物成分(ACF)生物添加物(共計65種),以建立主成分分析模型。結(jié)果模型捕獲了67%的數(shù)據(jù)集變動,來自于四個PCs。圖1顯示了PCs 1, 2和3的分數(shù)曲線。這些圖顯示了添加劑組分之間的關(guān)聯(lián)。在左側(cè),酵母提取物傾向于與ACF共混物沿著PC1(X)軸分離,而ACF共混物和大豆蛋白胨傾向于沿著PC2(Y)軸分離。在右側(cè),大豆蛋白胨和ACF共混物傾向于沿著PC3(Y)軸分離。
圖2顯示了PC1/PC2(左)和PC2/PC3(右)的加載圖,總結(jié)了PC1和PC3之間原始組成變量的關(guān)系。可變標記根據(jù)可變類型著色:生理化學(CHE);游離氨基酸(FAA);分子大小分布(SIZ);和總氨基酸(TAA)。PC1與個別和總的游離氨基酸(FAA)呈正相關(guān),與氨基氮百分比(%AN)呈正相關(guān)。中、高MW分布與PC1呈負相關(guān)。正如預(yù)期的那樣,更高的水解度(AN/TN)是與增加的低范圍MW種類和較高的游離氨基酸(FAA)含量相關(guān)。如圖1的左側(cè)面板所示,酵母提取物傾向于沿PC1與ACF共混物分離,表明酵母提取物是與較高氨基氮百分比(%AN)和游離氨基酸(FAA)相關(guān),具有較低范圍的MW種類。PC2與總氨基酸(TAA)呈正相關(guān),PC3與中范圍MW種類增加相關(guān),與低范圍MW種類呈負相關(guān)。ACF共混物和大豆蛋白胨是沿著PC2分布,表明變化的主要原因是由于總氨基酸(TAA)含量的變化。大豆蛋白與ACF共混物沿PC3分離,表明那些蛋白胨肽與中范圍MW種類的增加相關(guān)。
2ACF生物添加物批量差異的PCA分析
供應(yīng)商網(wǎng)站提供的來自HyPep1510大豆蛋白胨和SHIFCHO PF ACF共混物組分的多批次數(shù)據(jù)。這些數(shù)據(jù)被編譯成如上所述的PCA模型。HyPep1510和SHIFCHO PF ACF共混物的批間比較數(shù)據(jù)被用作預(yù)測集,以比較在PCA模型中捕獲的典型參考數(shù)據(jù)。圖3比較每一個具有典型產(chǎn)品--參考數(shù)據(jù)(紅色圓圈)的產(chǎn)品批次的預(yù)測得分。因為預(yù)測得分在PCA模型的t-測試圓形范圍內(nèi),產(chǎn)品批次內(nèi)的可變性被很好地建模。盡管所有批次都是在指定范圍內(nèi)制造的,但大量的批間變化是清晰可見的。
在圖3中,SHIFCHO PF批次被安排在一個不同的組中,在典型的參考數(shù)據(jù)(倒置三角形)下面。NVA #1165批次位于遠離主組的位置和典型的參考數(shù)據(jù)作為數(shù)據(jù)缺失的結(jié)果。剩余的批次沿著PC2(y)軸分布,表明總氨基酸(TAA)含量的一些變化。圖4左側(cè)面板顯示了組合批(NVA #1165除外)與典型參考數(shù)據(jù)批之間的差異,。不同的SHIFCHO PF批次的平均總氨基酸(TAA)含量比典型的參考數(shù)據(jù)顯示的總氨基酸(TAA)含量要低。特別地,SheffCHO PF批次通常具有較低的總谷氨酸、絲氨酸和纈氨酸,比典型參考數(shù)據(jù)報道中的總半胱氨酸含量更高。
圖4的右側(cè)顯示,與典型參考數(shù)據(jù)相比,半胱氨酸含量在所有批次中的含量都要大五倍多。從圖4的左側(cè)也可以清楚地看出,雖然典型參考數(shù)據(jù)和批次之間的差異是清楚的,但總的游離氨基酸(FAA)不變。
圖3中,HyPep1510批被定位在一個單一的組中,其中包括典型的參考數(shù)據(jù)。該組沿PC1(X)軸分布,表明游離氨基酸(FAA)有一定的可變性。貢獻圖的研究比較了典型參考數(shù)據(jù)與HyPep1510批次的平均值之間的差異(圖5)。
在圖5的左面板中繪制的貢獻權(quán)重在批次和參考材料之間沒有顯著差異。與參考物質(zhì)相比,許多單個氨基酸的實際總氨基酸(TAA)含量減少。然而,在新的HyPep1510批次中,游離酪氨酸含量確實升高。圖5的右側(cè)顯示,與典型的參考數(shù)據(jù)相比,HyPep1510批次中游離酪氨酸含量是變動很大。在10個HyPep1510批次中,有六個批次顯示游離酪氨酸含量增加了兩倍多,與典型參考數(shù)據(jù)批相比。目前沒有關(guān)于使用這些批次的細胞培養(yǎng)增長和產(chǎn)率的數(shù)據(jù),因此,無法確定多批次生物添加物中的變化是否具有生物學影響。批間生物添加物的變化,對哺乳動物細胞生長和單克隆抗體產(chǎn)率有很大影響。如果對多種生物添加物在多批次中的培養(yǎng)性能進行評價,就有可能預(yù)測批間變化對細胞培養(yǎng)生長和產(chǎn)率的影響。然后可以使用以下詳細描述的PLS建模技術(shù),將成分變化與培養(yǎng)性能和/或產(chǎn)品質(zhì)量屬性關(guān)聯(lián)起來。
3商業(yè)化生物添加物的PCA分析
隨著新產(chǎn)品不斷面市,生物添加物用于供應(yīng)細胞培養(yǎng)和微生物發(fā)酵應(yīng)用的商業(yè)市場是極具競爭力的。當供應(yīng)商提供了足夠而適當?shù)慕M成數(shù)據(jù),這樣的新產(chǎn)品可以使用PCA模型進行快速比對。數(shù)據(jù)庫中,有Solobia生產(chǎn)的10種和Organotechnie 生產(chǎn)的13種添加劑添加劑的組成成分數(shù)據(jù)。單位已按材料和方法中的描述標準化。新的數(shù)據(jù)集被導(dǎo)入SIMCA,作為預(yù)測集與PCA模型比較。
圖6是將新產(chǎn)品的預(yù)測得分與數(shù)據(jù)庫中所有145種產(chǎn)品的預(yù)測得分進行比較的3D圖。該圖顯示,在Hotelling T 2橢球區(qū)內(nèi)捕獲了許多添加劑,包括新產(chǎn)品。許多位于 Hotelling T 2 區(qū)域外部的產(chǎn)品是動物來源,沿著PC1和PC2軸導(dǎo)出和分布。
Organotechnie的產(chǎn)品位于 Hotelling T 2 區(qū)域,正如預(yù)期的那樣,主要包含非動物衍生產(chǎn)品。然而,Solobia的產(chǎn)品-馬鈴薯來源的蛋白胨和麥芽提取物-位于 Hotelling T 2 區(qū)域外,表明這兩種添加劑與其他添加劑有明顯不同。馬鈴薯蛋白胨與模型平均值(不包括在這里)比較,顯示馬鈴薯蛋白胨的較高總半胱氨酸和蘇氨酸的水平。這些差異是否轉(zhuǎn)化為生物影響尚待確定。
4使用定量構(gòu)效關(guān)系QSAR將生物添加物成分與培養(yǎng)性能聯(lián)系起來
許多技術(shù)已被用于選擇和優(yōu)化細胞培養(yǎng)和微生物生長培養(yǎng)基的生物添加物。有供應(yīng)商報告了基于析因設(shè)計的培養(yǎng)基優(yōu)化技術(shù),已發(fā)展為市售工具包。本文推薦一種替代的多元建模方法,使用定量構(gòu)效關(guān)系QSAR將生物添加物成分和培養(yǎng)性能聯(lián)系起來。QSAR已廣泛應(yīng)用于藥物開發(fā)中,用于篩選肽類藥物。但據(jù)我所知,生長培養(yǎng)基的開發(fā)和優(yōu)化是該技術(shù)的一種新應(yīng)用。
65 種ACF生物添加物的組成變化預(yù)先已在PCA模型中捕獲。主成分定義為正交,可用于析因設(shè)計實驗,每個主成分為一個設(shè)計因子。表3展示具有一個中心點的兩級三因子設(shè)計的設(shè)計點,其中每個因素都是來自主成分分析模型的主成分。每個設(shè)計點通過匹配其在PCA模型的主成分空間中的位置而與生物添加物相關(guān)聯(lián)。對于這種設(shè)計,不可能將中心點精確地與給定的生物添加物相匹配。然而,在PC3的中心點不匹配,這比PC1中變化的占比少得多,所以PC1不是關(guān)鍵的。
模擬細胞培養(yǎng)性能數(shù)據(jù)被用來證明QSAR方法,因為在設(shè)計中單細胞系生長使用每個生物添加物的信息目前難以獲得。對于細胞培養(yǎng)實驗,QSAR方法假定類似濃度的生物添加物在接種前添加到基礎(chǔ)培養(yǎng)基中,或作為培養(yǎng)期間的補料。最終的產(chǎn)品濃度(蛋白含量)和完整活細胞(IVC)產(chǎn)出變量直接使用微軟Excel電子表格中的公式1和2從化學成分數(shù)據(jù)中模擬。在這些方程中使用的組成變量由化學成分數(shù)據(jù)集隨機生成。為簡單起見,蛋白含量和完整活細胞(IVC)均使用具有相同變量集的線性方程模擬,假設(shè)沒有變量交互。選擇每個變量的指標,以提供與已發(fā)表文獻中相似的蛋白含量和完整活細胞(IVC)值。通過以±10%標準偏差添加人工噪聲,產(chǎn)生每個輸出變量的一式三份。每個設(shè)計點的PCA得分和表4中的一式三份蛋白含量和完整活細胞(IVC)值被用于擬合PLS模型。得到的三要素模型里R2Y=0.9,Q2=0.81。
圖7顯示了比較細胞培養(yǎng)性能數(shù)據(jù)和PLS模型對蛋白含量和完整活細胞(IVC)值的預(yù)測的等效圖。這兩個圖顯示出預(yù)測和模擬數(shù)據(jù)之間良好的一致性。等效圖中回歸系數(shù)(R2)的差異表明蛋白含量模型相關(guān)性優(yōu)于IVC模型相關(guān)性。這些差異是成分變量的相對權(quán)重函數(shù),用于模擬蛋白含量和完整活細胞(IVC)值。與PC1、2和3(圖2)強烈相關(guān)(負荷)的成分變量對蛋白含量和完整活細胞(IVC)值有很大影響。來自PCA得分值的PLS模型預(yù)測,而不是來自原始成分數(shù)據(jù),證實了PCA模型從化學成分數(shù)據(jù)捕獲充分的信息以預(yù)測蛋白含量和完整活細胞(IVC)值的能力,源于QSAR方法且使用PLS模型。未被用作訓(xùn)練集的一部分的數(shù)據(jù)庫里的剩余生物添加物,PLS模型可以用來預(yù)測其培養(yǎng)表現(xiàn)。
圖8中的3D評分圖顯示了數(shù)據(jù)庫中,剩余生物添加物對應(yīng)的蛋白含量和完整活細胞(IVC)值的預(yù)測的范圍。在這個例子中,PC1和PC2的陽性得分值更高的生物添加物,預(yù)計會有較高的目標蛋白含量和完整活細胞(IVC)值。
MVA的一種新應(yīng)用
這項工作表明,PCA建??梢杂脕斫忉?,用于細胞培養(yǎng)或發(fā)酵培養(yǎng)基的ACF生物添加物的化學組成。在65類 ACF生物添加物的組成數(shù)據(jù)65%的變化可以用PCA模型來解釋。正如預(yù)期的那樣,PCA模型表明,生物添加物的成分主要在游離氨基酸(FAA)含量(PC1)中變化顯著。總氨基酸(TAA)含量在很大程度上獨立于游離氨基酸(FAA)含量,因為總氨基酸(TAA)參數(shù)與PC2密切相關(guān),而游離氨基酸(FAA)與PC1密切相關(guān)(圖2)。評分圖表明,酵母提取物游離氨基酸(FAA)成分比ACF共混物蛋白胨游離氨基酸(FAA變化更大。這種差異反映了大豆蛋白胨生產(chǎn)過程中可以實現(xiàn)的更高程度的差異控制,比起使用酵母提取物。
對Kerry Bioscience 生物添加物(Sheffield HyPep 1510 and SheffCHO PF)的多批次組成分析與PCA模型進行比較,該模型包含每個產(chǎn)品的典型參考數(shù)據(jù)(圖3)。雖然PCA模型很好地代表了這兩種產(chǎn)品的批次變化,當檢測數(shù)據(jù)與PCA模型進行比較時,還是發(fā)現(xiàn)一些批間差異。HyPep1510的典型參考成分代表了測試批次。在總氨基酸(TAA)變化和游離氨基酸(FAA)酪氨酸含量(圖5,左側(cè))中發(fā)現(xiàn)了一些微小的差異,后者是典型參考成分(圖5,右)的兩倍。SheffCHO PF批次PCA評分與典型參考組分有一定差異,與典型組分分離(圖4,左)。這些小的差異歸因于總氨基酸(TAA)含量的差異,特別是總半胱氨酸、總絲氨酸和總氨基酸(TAA)。PCA模型確定批次數(shù)據(jù)中總半胱氨酸含量比典型參考數(shù)據(jù)大五倍(圖4,右)。因為游離氨基酸(FAA)含量和理化數(shù)據(jù)變化不大,鎖定在肽中的總氨基酸(TAA)含量差異的生物學相關(guān)性是未知的。其影響應(yīng)取決于培養(yǎng)物分解多肽的能力,多肽分解能力依賴于細胞系和培養(yǎng)生長特性。
PCA提供了一種簡單、直觀的方法來評估生物添加物的化學組成中的多元差異。它還允許快速識別大量批間差異的根本原因。確定觀察到的批次變異是否與生物學相關(guān),需要額外的培養(yǎng)數(shù)據(jù)。類似的方法被用來評估批次差異和評估新產(chǎn)品的組成。這些新產(chǎn)品將包含在PCA模型訓(xùn)練集的未來版本中。將Solobia和Organotechnie生產(chǎn)的新型生物添加物使用PCA模型進行了比較。正如預(yù)期的那樣,PCA模型很好地代表了許多新產(chǎn)品的預(yù)測得分。兩種產(chǎn)品(麥芽提取物和馬鈴薯蛋白胨)在PCA模型的 Hotelling T2 極限之外輕微下降,提示馬鈴薯蛋白胨一個很好的主題,來測試成分差異是否造成不同的培養(yǎng)行為。
基于QSAR的方法可以將PCA模型中捕獲的化學成分數(shù)據(jù)與培養(yǎng)性能相聯(lián)系。由于PCA模型的軸是正交的,因此可以使用基于統(tǒng)計的析因設(shè)計實驗來評估代表訓(xùn)練集的生物添加物的子集。PLS回歸模型被用于將PCA得分與模擬的培養(yǎng)性能相聯(lián)系。所得到的結(jié)果模型使得有可能確定產(chǎn)品差異或批次差異是否與被評估的細胞系生物學相關(guān)。
為了將QSAR方法應(yīng)用于新的細胞系,培養(yǎng)物可能生長在含有不同生物添加物的基礎(chǔ)培養(yǎng)基中。但是必須注意由于適應(yīng)新的條件而不是生物添加物的影響而導(dǎo)致的改進。另外,添加劑的使用對培養(yǎng)性能的影響可以用一致的補料策略來評價。這種策略通常涉及在培養(yǎng)達到細胞密度峰值后每隔一段時間補料。然后可以在固定時間間隔往培養(yǎng)體系里添加由表3所示的生物添加物制成的固定量的補料。
基于QSAR的每一個新細胞系的模型也將提供一個機會,快速評估剩余生物添加物在數(shù)據(jù)庫中的影響,以及細胞系是否具有確切的營養(yǎng)需求。
為了簡化QSAR的這一應(yīng)用,使用標準析因設(shè)計選擇了生物添加物的子集。有建議表明,標準析因設(shè)計不能有效地映射由PCA模型捕獲的多元空間。他們推薦使用D-最優(yōu)實驗設(shè)計,可對多元空間提供更有效的覆蓋。這樣的設(shè)計使用計算機算法來從一組固定條件中選擇一個子集,來有效地覆蓋多元空間。此外,這種設(shè)計還可以適用于使用不同濃度的生物添加物。
PCA用于分析從145個生物添加物較大的數(shù)據(jù)集里得到的65種ACF生物添加物的子集。已有更大的子集被分析,這里沒有報道。隨著新的生物添加物或額外的分析變得公開可用,數(shù)據(jù)集將每年更新一次。
本文描述的方法可用于快速評估新的細胞系。細胞系在大多數(shù)商業(yè)可用生物添加物下的的性能可以被預(yù)測,通過使用大量減少的生物添加物的子集開展一系列實驗。該子集可以使用實驗設(shè)計(DOE)方法來選擇,例如析因設(shè)計或D-最優(yōu)設(shè)計。隨著新的生物添加物的商業(yè)化可用,可以使用QSAR- PLS模型法快速預(yù)測細胞系的性能。
參考來源:Ronan.D.O'Kennedy.Multivariate Analysis of Biological Additives for Growth Media and Feeds.
日水培養(yǎng)基qdrishfui.cn