シミュレーションで迷子になった?1

2021-03-22
Lost in modelling and simulation?
https://pub.iapchem.org/ojs/index.php/admet/article/view/923/1276

この論文では、経口吸収PBPK modelで迷子になった方々のために、以下の3点について解説しました。
(1) PBPK論文執筆における留意事項
(2) モデルの検証と選択
(3) 臨床データに対するパラメータフィッテイング(Middle-out approach)

今回は、(1)についてです。(1)は要するに、モデル式と生理学的パラメータを公開しましょう(Black boxはやめましょう)、ということです。科学論文としては当たり前ですよね?ところが、これまでに、かなりの反論を受けました。反論をまとめると、

(i) 同じインプットパラメータとソフト(同一バージョン)を使えば、モデル式と生理学的パラメータを公開しなくても、再現性は確認できる。
(ii) 多岐にわたる数式やパラメータを、実際にチェックする人はいない。
(iii) 商用ソフトなので開示できない。

です。サイエンスにおける「公開」の重要性を理解していないのかな?と思います。

(i)は、「再現性(reproducibility)」という言葉を、誤解していると思います。数理モデルの論文における再現性とは、計算過程をtraceできる(独立に再現できる)、ということです。
たとえば、エクセルシートを用いた計算では、同じシートを用いて、インプットパラメータを同じにすれば、たとえセルの数式が間違っていても、同じ結果(同じ間違った結果)が得られます。我々は、科学的妥当性を検証したいのですから、当然、これではダメですね。

(ii)については、少なくとも日本では「実験項は、第3者が実験を再現できるように書きなさい」と習ったと思います。実際、すべての科学論文について再現実験が行わるわけではないですが、第三者が追試しようと思えばできるように実験項を書くのが科学論文のルールですよね?

(iii)については、今回の論文では、モデル式の開示を求めています。ソースコードではないです。上記の例でいうと、エクセルシート自体を公開すべきというのではなく、数式を公開してね、ということです。

実は、これらの点は、経口吸収PBPK modelに限った話ではなく、様々な分野で、現在問題となっています。
全米科学・工学・医学アカデミー(NASEM)の記事はこちら(↓)。
https://www.nationalacademies.org/news/2019/05/new-report-examines-reproducibility-and-replicability-in-science-recommends-ways-to-improve-transparency-and-rigor-in-research
科学技術振興機構による日本語訳(↓)。
https://crds.jst.go.jp/dw/20190702/2019070220159/
この記事では、単に数式だけでなく、ソースコードまで公開するように求められています。

Black boxがある論文は、査読をしっかりと行うことはできません。そのようにして、出版された論文を信じるかどうかは、研究者の皆様の科学リテラシーに係っています。

もう一点、(1)で注意喚起したのは、予測(prediction)という言葉の使い方です。非常に多くの論文で、臨床PKデータにcurve fittingしたものがpredictedと書かれています。これは非常に大きな誤解を与える表現です。また、fittingする前のin vitro dataだけからの予測(Bottom-up prediction)の結果は、ほとんど全く報告されていません。おそらく、Bottom-up予測が外れたために、fittingを行っているのではないでしょうか?Fittingを予測と記載し、なおかつ、外れたBottom-up予測を報告しなければ、読者はそのソフトウェアの予測が良く当たっていると錯覚するのではないでしょうか?これらの点は、(2)および(3)と大きく関係していますので、(2)および(3)で詳しく説明しています。