データインテグリティ(Data Integrity)とは?
データインテグリティは、日本語ではデータ完全性とも呼ばれ、もともと情報処理やコンピューターセキュリティなどのデジタルデータを扱う業種において、データの完全性や妥当性などを指して使われていた言葉です。
データやデータシステムの内容が一貫しており、信頼できる状態であり、外部からの攻撃や何らかのエラーによって、データに異常が起きたりしていないことを保証する、というような意味合いを持ちます。
近年は特にライフサイエンスや製薬の領域で使われることが多く、データインテグリティという言葉自体が「ライフサイエンスや製薬におけるデータの完全性」という意味合いを持つように変化してきています。
データインテグリティ(データ完全性)が一見関連のなさそうなライフサイエンス業界において重要になってきた理由として、医薬品の安全性の信頼性確保の基準がより厳密になってきたことや、製薬の国際標準化によってプロセス全体のデジタル化が進んだことが挙げられます。
規制当局の監査強化に対応していくため、完全性のあるデータを提示する必要性が非常に高まっています。
対象のデータ
データインテグリティ(データ完全性)の定義における「データ」とは、具体的にはどのようなものなのでしょうか?
上述した通り、規制当局に正当性を説明するため、分析機器から取得した生データ(ソースデータ)が必要です。これがなければ、そもそも根拠がない、ということになってしまいます。
しかし、これだけでは正当性を証明するには少し足りません。もう一つ重要なのがメタデータと言われるデータです。
メタデータとは、生データ(ソースデータ)の情報を補足するもので、「○○という研究者が、〇月〇日〇時に、○○の施設で○○のような実験を行った結果である」というような、生データだけではわからない状況などを説明します。
これがあることで結果を再現でき、より信頼性のある「完全なデータ」といえるようになるのです。
しかし、データを作成した本人がいかに「完全なデータ」だと思っていても、客観的に理解できるものでなければ、データインテグリティを満たしているとは言えません。
そこで重要になってくるのが、ALCOA(アルコア)と呼ばれる概念です。
データインテグリティの原則ALCOA(アルコア)
ALCOAとは、データインテグリティを満たすために必要な要素の頭文字をとったものです。
Attributable(帰属性)
Legible(判読性)
Contemporaneous(同時性)
Original(原本性)
Accurate(正確性)
つまり、データインテグリティを確保するためには、データは「帰属(データの記録者やソース)が明確で、理解できて、発生と同時に記録され、オリジナルであり、正確でなければならない」ということです。
この要件を満たしていなければ、データ完全性があるとは言えない、ということになります。
ALCOAは、WHOやFDA(米国)、MHRA(英国)といった規制当局のガイダンスに明記されています。
より詳細なデータインテグリティの定義の解説はこちらから
データインテグリティについてより詳しく知りたい方は、以下のリンクから解説動画をご視聴いただけます。
初心者向けの動画には、最後に簡単なチェックテストもありますので、理解度の確認にもぜひ、ご利用ください。
データインテグリティ(Data Integrity)を深く知りたい方に、少しでもお役立ていただけると幸いです。
研究用にのみ使用できます。診断用には使用いただけません。