そのMiddle-out approach、大丈夫ですか?(6) Middle-outの誤謬
2023-12-08
Middle-outでは、一般に、以下のようなプロセスでモデルの構築が行われます。
(1) 生理学的パラメータと薬物固有パラメータを、個々の薬物動態過程に関するメカニズムベースモデルに入れて、Bottom-up modelを構築する。
(2) Bottom-up modelを用いて、ある投与条件下における、血中濃度推移を「予測」する(Bottom-up prediction)(Cp(t)pred)。
(3) Cp(t)predと、実測血中濃度推移データ(Cp(t)obs)を重ね合わせた図を作成し、両者を比較する。
(4) 予測が外れたように見える場合(*)、1つあるいはいくつかのパラメータ(あるいはスケーリングファクター(**))を、感度分析により選択し、Cp(t)obsから逆算する。
(5) 逆算されたパラメータを用いて血中濃度推移を計算し(CP(t)back-calc)、逆算の基データであるCp(t)obsと重ね合わせた図を作成する。(あたりまですが、これらは一致します。逆算で合わせに行っているので。。。)
しかし、残念ながら、非常に多くのPBPK論文で、以下のような事態になっています(***)。
(A) Bottom-up predictionが報告されない(隠蔽)。
(B) 逆算した結果(CP(t)back-calc)を、「予測」と報告する(偽装)。
(C) (偽装された)予測値(実際には逆算モデルによる計算値)と、(逆算に用いた)実測値が一致することで、モデルが検証されたとする。
無論、ほとんどの場合、単に無知ゆえに、これらの不正が意図せずに行われているのだと思います。しかし、以下のように、この無知が引き起こす結末は重大です。
「予測」が成功するのは、すべてのパラメータとモデル式が正しい場合にほぼ限られます(****)。また、あるパラメータの逆算は、それ以外のパラメータのエラーを隠蔽してしまいます(*****)。したがって、(A)(B)(C)によって、現在のPBPKは完ぺきという「幻想」が生まれ、誤りは放置されたままになります。
この幻想が社会に与える影響は深刻です。まず、医療関係者や患者に、そのPBPKによる予測が妥当であるという誤解を与えます。また、もし本当にPBPKが完璧ならば、もうこれ以上、研究は不要です。そうすると、薬物動態部門は人員削減されます(実際にされている会社があるのです!)。生き残るのは「モデラー」と呼ばれている人たちですが、PBPKの操作を自動化(標準化)してしまえば、ゆくゆくは「モデラー」もいらなくなるでしょう。やがて、薬物動態研究を志す若手や学生は、いなくなるでしょう。これでは、まるで、天動説が支配していた中世暗黒時代に逆戻りです(******)。
逆算はデータに対してモデルを合わせに行っているだけなのに、何故、われわれ人間は、それを「予測」と錯覚し、正しいモデルだと勘違いしてしまうのでしょうか?
Optimizeボタンを押せば、まるで魔法のように、Cp(t)obsに一致したシミュレーション結果が得られます。この「一致」を見た時、我々の脳は「Aha!合ってる!」となり、多幸感を感じる物質(ドーパミン?)が出ているのではないかと思います(実際、快感を感じませんか?)。そして、予測の「幻想」を見るのではないでしょうか?逆算の過程では、やや複雑な計算がコンピュータ内(魔法の箱)で行われていますが、この魔法のような方法を、直感的に理解するのが難しいため、錯覚が起きているのかもしれません。
まして、魔法を使えば「予測」できると主張する論文が有名製薬メーカーからたくさん出ていたら、魔法が申請資料にいろいろと使われていると言われたら、そして、周りの人たちみんながこの魔法にかかっていたら、皆さん自身もこの魔法にかかってしまうのかもしれません。この集団催眠のような状態(洗脳?)が、現在進行しているのではないでしょうか?
しかし、まず、大学で習ったことを、もう一度、思い出してみましょう。冷静に考えれば、いくつかの関数を組み合わせるだけで、Cp(t)obsに一致する曲線を描くことが出来ることはわかるでしょう。例えば、経口投与後のCp(t)は、指数関数を2つ組み合わせたモデル(パラメータ数はたったの3つ(ka, kel, Vd/F)で表せる場合がほとんどです(PPKではそうしていますよね?)。しかし、PBPKの複雑な数式を前にすると、まるで魔法にかかったように眼が眩んで、分からなくなってしまうのかもしれません。(*******)
私が大げさすぎるのでしょうか?
以下の資料を見てみてください。
https://www.pmda.go.jp/files/common/js/pdfjs/web/viewer.html?file=/drugs/2022/P20221007001/430574000_30400AMX00434_K100_1.pdf
* ほとんどすべての論文でmiddle-outが行われているという事実は、bottom-upが外れるということ、すなわち、生理学的パラメータ、薬物固有パラメータ、あるいは、モデル式の、1つ以上が間違っているということを表しています(****)。
**パラメータの逆算とスケーリングファクター(SF)の逆算は、同じことです。a' = SF x aとしているだけなので。。。
*** PBPKモデルを自作できるレベルの研究者は、これらの点を十分理解しているので、こういう不正を意図せず犯してしまうことはあまりないと思います。自分で作ったモデルに自分が騙されてしまうこともありますが(ピグマリオン効果)。。。
https://ja.wikipedia.org/wiki/%E3%83%94%E3%83%A5%E3%82%B0%E3%83%9E%E3%83%AA%E3%82%AA%E3%83%BC%E3%83%B3
**** 例えば、a = b + c + d + e + f ...という計算で、aが正しく計算されるのは、b,c,d,e、f...の値がすべて正しい場合にほぼ限られます(エラーが偶然相殺される確率は極めて低い)。すなわち、合計値が合っていれば、b,c,d,e、f...にエラーがある確率は非常に低いと言えます(この性質を利用したエラーチェックをCheck-sumと言います。)。一方、合計値が間違っていた場合、b,c,d,e、f...のどれかにエラーがあります。ただし、どのパラメータが間違っているのかについては、一つ一つ確認しないとわかりません。(感度分析によって、「どの」パラメータを逆算すべきか決めることはできません。感度があるパラメータは複数あるので。。。)
具体的な例として、経口吸収が溶解度膜透過律速の場合、Faの予測値が実測と一致するのは、
Fa = 2DF/R * Peff * Sdissolv * Vsi * Tsi/ Dose
の右辺のデータがすべて正しい場合です。(Faは、右辺パラメータのすべてに、感度があります。)
***** 例えば、a = b + cというモデルがあったとします。Bottom-up予測が、b = 2, c = 3でa(pred) = 5だとします。実測の結果、a(obs) = 10でした。したがって、予測は外れました。そこで、middle-outでbを計算すると、b(back-calc) = 7、a(back-calc) = 10になります(当たり前ですが、a(obs) = a(back-calc) = 10 になります。そうなるようにbを逆算しているのですから。。。)。ただし、この計算は、c = 3が正しいことも、b(back-calc) = 7が正しい値であることも、全く保証しません。実際、cの値はなんだって良いのです。c = -10000000であってもb(back-calc) = 10000010 とすれば、 a(back-calc) = 10 になります。
具体的な例として、経口吸収が溶解度膜透過律速の場合、PeffをCp(t)obsから逆算すると、Vsiのエラーは気付かれないまま放置されることになります。(あるソフトでは、ここ20年間ずっと600 mL(40%)がデフォルトのままですよね?)
******天動説では、既存観測データにに対して、地球中心モデルのパラメータを各惑星ごとに逆算(fitting, fine tuning)していました。
******* まだ、魔法が解けない方は、「自在曲線定規」を想像してみましょう(むかし、パソコンが普及する前は、これを使ってレポートを書いたものです)。自在曲線定規をデータに合わせて曲げることで、データに合った曲線を描くことができます。これは、まさに最小二乗法を直感的に行っているのと同じです。このようにして描いた曲線は、「予測」でしょうか?もちろん違いますよね?
https://bungu-bope.livedoor.biz/archives/13489636.html
-----------------------------------------------------------------------
それでは、PBPKにおいて、middle-outを全面禁止すべきなのでしょうか?
理論上は、middle-outで構築した部分モデルに関して「予測性」がしっかりと検証されているのであれば、問題は無いと思います(道具主義的(統計モデル的な)な考え方です)。
予測性を検証するには、
(I) モデル構築に用いたデータとは別のデータで検証すること。(test setが必要)
(II) モデルの検証は、予測したい値(予測ターゲット)のtest setで検証すること。
(III) 内挿の範囲で用いること。
(I)については、既に上記で議論しました。
(II)(III)ついては、かなり広く誤解が広まっています。
よく見かける間違いが、
単回投与後の血中濃度推移データを用いてMiddle-out PBPK modelを構築
→連投試験の結果で予測性を検証
→モデル全体が検証されたと判断
→食事の影響やDDIを予測できると判断
というものです。
あたりまえですが、これで検証されたのは連投試験の予測であって、食事の影響やDDIの予測ではありません。これは、上記(****)の誤謬とも関連しています。
このようにmiddle-outで構築した部分モデルを統計モデルとして考えるのであれば問題ないのですが、PBPKはそもそも、科学的実在論に立脚しているのですから、道具主義的(統計モデル的)に用いることに、違和感を覚えます。Middle-outにより求めた部分モデルを、Physiologically-basedと呼ぶことに違和感があります。また、予測と実測の一致は、相関であり、因果を示唆するものではありません。理論モデルの検証でもありません。あくまで統計モデルです。メカニズムモデルを検証するには、別途の実験が必要です。
(1) 生理学的パラメータと薬物固有パラメータを、個々の薬物動態過程に関するメカニズムベースモデルに入れて、Bottom-up modelを構築する。
(2) Bottom-up modelを用いて、ある投与条件下における、血中濃度推移を「予測」する(Bottom-up prediction)(Cp(t)pred)。
(3) Cp(t)predと、実測血中濃度推移データ(Cp(t)obs)を重ね合わせた図を作成し、両者を比較する。
(4) 予測が外れたように見える場合(*)、1つあるいはいくつかのパラメータ(あるいはスケーリングファクター(**))を、感度分析により選択し、Cp(t)obsから逆算する。
(5) 逆算されたパラメータを用いて血中濃度推移を計算し(CP(t)back-calc)、逆算の基データであるCp(t)obsと重ね合わせた図を作成する。(あたりまですが、これらは一致します。逆算で合わせに行っているので。。。)
しかし、残念ながら、非常に多くのPBPK論文で、以下のような事態になっています(***)。
(A) Bottom-up predictionが報告されない(隠蔽)。
(B) 逆算した結果(CP(t)back-calc)を、「予測」と報告する(偽装)。
(C) (偽装された)予測値(実際には逆算モデルによる計算値)と、(逆算に用いた)実測値が一致することで、モデルが検証されたとする。
無論、ほとんどの場合、単に無知ゆえに、これらの不正が意図せずに行われているのだと思います。しかし、以下のように、この無知が引き起こす結末は重大です。
「予測」が成功するのは、すべてのパラメータとモデル式が正しい場合にほぼ限られます(****)。また、あるパラメータの逆算は、それ以外のパラメータのエラーを隠蔽してしまいます(*****)。したがって、(A)(B)(C)によって、現在のPBPKは完ぺきという「幻想」が生まれ、誤りは放置されたままになります。
この幻想が社会に与える影響は深刻です。まず、医療関係者や患者に、そのPBPKによる予測が妥当であるという誤解を与えます。また、もし本当にPBPKが完璧ならば、もうこれ以上、研究は不要です。そうすると、薬物動態部門は人員削減されます(実際にされている会社があるのです!)。生き残るのは「モデラー」と呼ばれている人たちですが、PBPKの操作を自動化(標準化)してしまえば、ゆくゆくは「モデラー」もいらなくなるでしょう。やがて、薬物動態研究を志す若手や学生は、いなくなるでしょう。これでは、まるで、天動説が支配していた中世暗黒時代に逆戻りです(******)。
逆算はデータに対してモデルを合わせに行っているだけなのに、何故、われわれ人間は、それを「予測」と錯覚し、正しいモデルだと勘違いしてしまうのでしょうか?
Optimizeボタンを押せば、まるで魔法のように、Cp(t)obsに一致したシミュレーション結果が得られます。この「一致」を見た時、我々の脳は「Aha!合ってる!」となり、多幸感を感じる物質(ドーパミン?)が出ているのではないかと思います(実際、快感を感じませんか?)。そして、予測の「幻想」を見るのではないでしょうか?逆算の過程では、やや複雑な計算がコンピュータ内(魔法の箱)で行われていますが、この魔法のような方法を、直感的に理解するのが難しいため、錯覚が起きているのかもしれません。
まして、魔法を使えば「予測」できると主張する論文が有名製薬メーカーからたくさん出ていたら、魔法が申請資料にいろいろと使われていると言われたら、そして、周りの人たちみんながこの魔法にかかっていたら、皆さん自身もこの魔法にかかってしまうのかもしれません。この集団催眠のような状態(洗脳?)が、現在進行しているのではないでしょうか?
しかし、まず、大学で習ったことを、もう一度、思い出してみましょう。冷静に考えれば、いくつかの関数を組み合わせるだけで、Cp(t)obsに一致する曲線を描くことが出来ることはわかるでしょう。例えば、経口投与後のCp(t)は、指数関数を2つ組み合わせたモデル(パラメータ数はたったの3つ(ka, kel, Vd/F)で表せる場合がほとんどです(PPKではそうしていますよね?)。しかし、PBPKの複雑な数式を前にすると、まるで魔法にかかったように眼が眩んで、分からなくなってしまうのかもしれません。(*******)
私が大げさすぎるのでしょうか?
以下の資料を見てみてください。
https://www.pmda.go.jp/files/common/js/pdfjs/web/viewer.html?file=/drugs/2022/P20221007001/430574000_30400AMX00434_K100_1.pdf
* ほとんどすべての論文でmiddle-outが行われているという事実は、bottom-upが外れるということ、すなわち、生理学的パラメータ、薬物固有パラメータ、あるいは、モデル式の、1つ以上が間違っているということを表しています(****)。
**パラメータの逆算とスケーリングファクター(SF)の逆算は、同じことです。a' = SF x aとしているだけなので。。。
*** PBPKモデルを自作できるレベルの研究者は、これらの点を十分理解しているので、こういう不正を意図せず犯してしまうことはあまりないと思います。自分で作ったモデルに自分が騙されてしまうこともありますが(ピグマリオン効果)。。。
https://ja.wikipedia.org/wiki/%E3%83%94%E3%83%A5%E3%82%B0%E3%83%9E%E3%83%AA%E3%82%AA%E3%83%BC%E3%83%B3
**** 例えば、a = b + c + d + e + f ...という計算で、aが正しく計算されるのは、b,c,d,e、f...の値がすべて正しい場合にほぼ限られます(エラーが偶然相殺される確率は極めて低い)。すなわち、合計値が合っていれば、b,c,d,e、f...にエラーがある確率は非常に低いと言えます(この性質を利用したエラーチェックをCheck-sumと言います。)。一方、合計値が間違っていた場合、b,c,d,e、f...のどれかにエラーがあります。ただし、どのパラメータが間違っているのかについては、一つ一つ確認しないとわかりません。(感度分析によって、「どの」パラメータを逆算すべきか決めることはできません。感度があるパラメータは複数あるので。。。)
具体的な例として、経口吸収が溶解度膜透過律速の場合、Faの予測値が実測と一致するのは、
Fa = 2DF/R * Peff * Sdissolv * Vsi * Tsi/ Dose
の右辺のデータがすべて正しい場合です。(Faは、右辺パラメータのすべてに、感度があります。)
***** 例えば、a = b + cというモデルがあったとします。Bottom-up予測が、b = 2, c = 3でa(pred) = 5だとします。実測の結果、a(obs) = 10でした。したがって、予測は外れました。そこで、middle-outでbを計算すると、b(back-calc) = 7、a(back-calc) = 10になります(当たり前ですが、a(obs) = a(back-calc) = 10 になります。そうなるようにbを逆算しているのですから。。。)。ただし、この計算は、c = 3が正しいことも、b(back-calc) = 7が正しい値であることも、全く保証しません。実際、cの値はなんだって良いのです。c = -10000000であってもb(back-calc) = 10000010 とすれば、 a(back-calc) = 10 になります。
具体的な例として、経口吸収が溶解度膜透過律速の場合、PeffをCp(t)obsから逆算すると、Vsiのエラーは気付かれないまま放置されることになります。(あるソフトでは、ここ20年間ずっと600 mL(40%)がデフォルトのままですよね?)
******天動説では、既存観測データにに対して、地球中心モデルのパラメータを各惑星ごとに逆算(fitting, fine tuning)していました。
******* まだ、魔法が解けない方は、「自在曲線定規」を想像してみましょう(むかし、パソコンが普及する前は、これを使ってレポートを書いたものです)。自在曲線定規をデータに合わせて曲げることで、データに合った曲線を描くことができます。これは、まさに最小二乗法を直感的に行っているのと同じです。このようにして描いた曲線は、「予測」でしょうか?もちろん違いますよね?
https://bungu-bope.livedoor.biz/archives/13489636.html
-----------------------------------------------------------------------
それでは、PBPKにおいて、middle-outを全面禁止すべきなのでしょうか?
理論上は、middle-outで構築した部分モデルに関して「予測性」がしっかりと検証されているのであれば、問題は無いと思います(道具主義的(統計モデル的な)な考え方です)。
予測性を検証するには、
(I) モデル構築に用いたデータとは別のデータで検証すること。(test setが必要)
(II) モデルの検証は、予測したい値(予測ターゲット)のtest setで検証すること。
(III) 内挿の範囲で用いること。
(I)については、既に上記で議論しました。
(II)(III)ついては、かなり広く誤解が広まっています。
よく見かける間違いが、
単回投与後の血中濃度推移データを用いてMiddle-out PBPK modelを構築
→連投試験の結果で予測性を検証
→モデル全体が検証されたと判断
→食事の影響やDDIを予測できると判断
というものです。
あたりまえですが、これで検証されたのは連投試験の予測であって、食事の影響やDDIの予測ではありません。これは、上記(****)の誤謬とも関連しています。
このようにmiddle-outで構築した部分モデルを統計モデルとして考えるのであれば問題ないのですが、PBPKはそもそも、科学的実在論に立脚しているのですから、道具主義的(統計モデル的)に用いることに、違和感を覚えます。Middle-outにより求めた部分モデルを、Physiologically-basedと呼ぶことに違和感があります。また、予測と実測の一致は、相関であり、因果を示唆するものではありません。理論モデルの検証でもありません。あくまで統計モデルです。メカニズムモデルを検証するには、別途の実験が必要です。