なんとなく

誰得感満載な記事が多いかも。Mono関係とLinuxのサーバ関係、レビューとか。

遺伝子解析研究に参加してみて-個人情報の保護と倫理審査委員会-

はじめに

少し前のことになるが、今年のはじめに「日本人多種化学物質過敏症に関連する遺伝要因の解明」という研究に協力するため、検体を提供してきた。その説明文書の中でプライバシー保護などに関し、足りない点が多々あり、インフォームド・コンセントで確認し、理解し、提供に同意したが、モヤモヤするものがあったので記したいと思う。

なお、この研究については、よい成果が得られ、機序解明、治療法の解明につながってほしいと思っている。苦言を呈している部分はあるもののこの研究を否定するものではない。また、同意できないと思った場合、検体についてはオプトアウトできることは理解している。

一度、この研究の研究計画書を文書開示請求し、確認した方がいいと今は思っている。 参加して、研究と個人情報の保護についての落とし所を考えさせられた。

説明文書

この研究に参加する際の説明文書をPDFにした。

https://drive.google.com/file/d/1RRHcwPS9UiqEvSuYhS4tviYIhb0xzhdQ/view?usp=sharing

これに基づいて以降話を進めていくので、読み進めようと思う方は、まずPDFを見てほしい。 なお、12ページ目が抜けているが、これは同意文書があり、当方以外のサインがあったため含めていない。また、スキャン時に曲がってしまって醜いのはご了承いただきたい。

この研究におけるデータの流れ

この研究に参加した提供者が提供し、データ化されるものには、

  • 血液から得られるゲノムデータ
  • 問診データ

がある。 説明文書において記述されていない点もあったが、インフォームド・コンセントにおいて確認し、図示してみる。

データの流れ
データの流れ

血液から遺伝子情報が解析されるまでの流れ

説明文書の「4 . 研究の方法」に記載されているように、病院においての血液採取から東京大学大学院医学系研究科人類遺伝学教室で統計解析されるまでは理解できた。しかし、東京大学大学院医学系研究科人類遺伝学教室で解析されたデータがどこへ行くか不明であった。 インフォームド・コンセントにおいて確認したところ、国立病院機構相模原病院の研究者のもとに行くとのことであった。 また、以降に記載する問診票データと解析されたデータは紐付けられるとのことであった。

問診データの流れ

問診データについては、説明文書の「4 . 研究の方法」に取得されることは記載されているものの、「17 . プライバシーの保護について」において

この研究における情報のやり取りは、Web を利用します

とあり、その流れをほのめかす記述はあったが、具体的にどういう流れでどう取り扱われるかについて記載がなく不明であった。

そのため、インフォームド・コンセントにおいて確認したところ、下に図示したように、アクセスコントロールされたWEBサービスを利用し、6つの病院から集約され、最終的には国立病院機構相模原病院の研究者のもとに行くとの回答を得た。

問診データの流れ
問診データの流れ

情報の保管及び廃棄

説明文書の「18 . 試料・情報の保管及び廃棄について」において

研究等の実施に関わる文書は当院の医局の鍵のかかるロッカーに保管します。保管期
間は、研究の終了について報告された日から5 年を経過した日又は研究結果の最終の公
表について報告された日から3 年を経過した日のいずれか遅い日までの期間としてお
ります。保管期間終了後に紙媒体に関してはシュレッダーで裁断し破棄、その他媒体に
関しては適切な方法で破棄します。
また各研究参加施設から提供いただいた検体く血液から抽出されたDNA ・血しよう)
はBBJ にてバンキングされ、将来の研究で利用することを目的とし、長期的に保管し
ます。
バンキングされた検体を廃棄したい場合は、検体の廃棄を希望する旨を、研究担当医
師または、相談窓口 までお知らせください。ただし、検体の廃棄ができない場合(検体
が使用された後など) には、倫理指針等に基づき、該当する機関の倫理審査委員会の意
見のもとに対応いたします。
また、本研究が終了した後、この研究に関するすべてのデータは公的バンキングとの
連携において利用するため、永久保管します。なお保管は厳重に行います。

とあり、文書とは何を示し、この研究に関するすべてのデータとは何を示すのか理解できなかったので、インフォームド・コンセントにおいて確認した。

文書とは

  • 紙ベースの問診票とのことであった。

研究に関するデータは、

  • 問診票データと解析されたデータが紐付けられるもの
  • それ以外のこの研究に関するデータ

とのことであった。

研究中においては院内のサーバ及びローカルPCでのみ使用するとのことであった。 研究終了後は、このデータは破棄されず、国立病院機構相模原病院内のサーバもしくはPCで保管されるとのことであった。 検体については、BBJにおいて保管されているが、国立病院機構相模原病院からオプトアウトできるように対応表を作成し、それはガイドラインに従い管理するとのことであった。

対応表について、この説明文書では全く説明されていないのがとても気になった。

なお、説明文書の「17 . プライバシーの保護について」において、二次利用については、

二次利用する場合には、改めてその研究計画を該当する倫理審査委員会において審査
し、データ類の扱いも含め、適切な研究計画であるかどうか評価がなされて、必ず院長
の承認を得て、初めて実施されます。また、二次利用の内容について当院のホームペー
ジで情報を公開します。このような確認の過程を経ず、勝手に二次利用されることはあ
りません。

とあるが、

本研究が終了した後、この研究に関するすべてのデータは公的バンキングとの連携において利用する

とあり、「二次利用は倫理審査委員会を経、院長の承認を得て、初めて実施されるもの」としてあるのにすでに何か決まっていることがあるかのような記述が気になった。インフォームド・コンセントにおいてこの点については確認するのを忘れた。 なお、公的バンキングに保管されているものについては、倫理審査委員会などを経ず二次利用されるものと理解している。

個人情報の保護と倫理審査委員会

この研究における個人情報保護についての捉え方は、説明文書の「17 . プライバシーの保護について」および「18 . 試料・情報の保管及び廃棄について」からうかがい知ることができる。なお、平成29年に個人情報保護法およびヒトゲノム・遺伝子解析研究に関する倫理指針の改正が行われたが、個人情報の範囲が変更されたわけではないから、この説明文書はそれより前に作成されているが、影響を受けないものと思われる。

個人情報の定義

国立病院機構独立行政法人なので、独立行政法人等の保有する個人情報の保護に関する法律が当てはまるのだろうと思われる。その第二条にその記述がある。

第二条 この法律において「独立行政法人等」とは、独立行政法人通則法(平成十一年法律第百三号)第二条第一項に規定する独立行政法人及び別表に掲げる法人をいう。 2 この法律において「個人情報」とは、生存する個人に関する情報であって、次の各号のいずれかに該当するものをいう。 一 当該情報に含まれる氏名、生年月日その他の記述等(文書、図画若しくは電磁的記録(電磁的方式(電子的方式、磁気的方式その他人の知覚によっては認識することができない方式をいう。次項第二号において同じ。)で作られる記録をいう。以下同じ。)に記載され、若しくは記録され、又は音声、動作その他の方法を用いて表された一切の事項(個人識別符号を除く。)をいう。以下同じ。)により特定の個人を識別することができるもの(他の情報と照合することができ、それにより特定の個人を識別することができることとなるものを含む。) 二 個人識別符号が含まれるもの e-Gov法令検索

匿名化された問診データは個人情報になるか

この研究で扱う個人情報は

  • 問診票に記載しデータになるもの
  • 提供した血液から解析されたゲノムデータ
  • ゲノムデータから解析され、問診票に記載しデータになったものと紐付けられたゲノム情報

と考えられる。

問診票からデータ化され、集約された問診データは匿名化されたとしても、提供者の最大数が800名のため、レコードとしては最大800であり、複数の問診項目からなり一意になるレコードが少なくないと考えられる。 問診票の項目として、性別・発症年齢・合併症・体重の増減などがあり、提供者の集団の中で項目のすべてで同じにならないということは起こり得る。

加えて、一意となるレコードの項目は、SNSなどの情報から本人を特定することが可能な場合があり、参照性があると言える。 (例えば、twitterで本研究に参加したことを公開しており、性別・発症年齢・合併症などの今回の問診項目に関する情報を公開していたり、twitterから紐づくブログで公開している場合である。) さらに集約された問診データと解析されたゲノム情報は紐付けられ、研究されるとのことであった。

つまり、この研究で扱うデータは、特定の個人を識別することができるものとできないものの両者が含まれる匿名化されているもの(どの研究対象者の試料・情報であるかが直ちに判別できないよう、加工又は管理されたものに限る。)との位置づけと思われる。*1

この研究で扱うデータは、匿名化されていても特定の個人を識別することができるものすなわち個人情報になるものもある。

なお、提供した血液から解析されたゲノムデータである、東芝ヘルスケア社、東京大学大学院医学系研究科人類遺伝学教室でのゲノムデータは調査、解析後、適切に廃棄されるとのことであった。

説明文書での個人情報保護の記述の雑さ

「17 . プライバシーの保護について」おいて

患者さまの
氏名は研究のための番号に置き換えて管理します。また住所や電話番号などの個人情報
は登録しません。研究の結果は他の病院から集められた結果とともにまとめられ、学会
や医学雑誌などに発表されることもあります。ただし、いずれの場合にも、あなたの個
人情報が公表されることは一切ありません。

とある。 また、「18 . 試料・情報の保管及び廃棄について」において、データではない問診票については適切に管理する旨記しているように、保護しなければならない個人情報であると考えているのをうかがい知ることができるが、匿名化された問診データについては適切に管理するとの記載がないことから、個人情報にもなるとの認識が無いように思える。個人情報にもなるという認識であれば、個人情報は登録しませんとしており、問診データを登録できないことになり研究自体成り立たないだろう。

また、この研究においては、個人情報は公開されることはないが、研究中にそのデータについて適切に管理されるとは謳われていない。 インフォームド・コンセントにおいて、データの集約については、アクセスコントロールされたWEBサービスを利用し、その後は院内のサーバ及びローカルPCでのみ使用し、適切に管理されるということは確認した。 研究終了後は、保管は厳重に行いますとは記述されているのだが。。。

当方の見解としては、

  • この研究においては、匿名化されていても特定の個人を識別することができるものも含まれる問診データと自分の知らない自分のゲノム情報が紐づき、利用、保管されるわけであるから、このような雑な記述をするべきではないと考える。
  • この研究において、保護するプライバシーとは何かを明確にしていない。保護すべき対象を明確にし、どういうタイミングで、それをどこでどう管理するかについてまで記載するべきであると考える。

倫理審査委員会の質の担保

さらに、二次利用において「17 . プライバシーの保護について」では

なお、将来、この研究で得られたデータおよび検体(DNA ・血しよう) を別の研究に
利用する可能性や他の研究機関に提供する(二次利用といいます。) 可能性があります。
そのような場合も、あなたの実名を出すようなことは一切ありません。あなたの病状や
名前などに関する情報を含め、個人情報は厳重に守ります。
二次利用する場合には、改めてその研究計画を該当する倫理審査委員会において審査
し、データ類の扱いも含め、適切な研究計画であるかどうか評価がなされて、必ず院長
の承認を得て、初めて実施されます。また、二次利用の内容について当院のホームペー
ジで情報を公開します。このような確認の過程を経ず、勝手に二次利用されることはあ
りません。
なお、前述しました患者さまからご提供いただきました検体は次に研究者に利用され
るまで、厳重に保管(バンキング) されます。バンキングする検体は、匿名化された上
で保管されるため、患者さまのプライバシーは保護されます。

とある。

この研究で得られたデータにある守るべき個人情報に当たるものをきちんと認識できていないと思われる記述の仕方と感じる。

実名を出さないのは当然のことであるが、今回の研究において得られるゲノム情報に触れないのはなぜなのだろうか。 検体についての記述はあり、別組織に検体は保存されるが、国立病院機構相模原病院内のサーバもしくはPCで解析されたデータは問診データと紐付いて保存されると確認できている。 個人情報を厳重に守るとは記述してあるが、「名前などに関する情報を含め」の「など」で、個人情報になる問診データとそれに紐付いたゲノム情報は対象にあがってこない。今回は遺伝子解析が目的で対象としている解析された情報は個人情報になると思われる。 この研究での最終的なアウトプットは統計的に解析されたものであって、個人情報にはならないと思われるが、この研究で得られた全てのデータは廃棄されず、保管される。そして、2次利用される可能性は大いにあるのに、なぜそこを言及しないのか疑問に思う。

さらに倫理審査委員会や医師にこの研究で得られたデータにおける個人情報の把握が不明確とうかがえる状況で、二次利用時にこの研究で取得したデータである問診データとそれに紐付いたゲノム情報が利用され、それが個人情報にもなるとの認識がないために公開されてしまう可能性は否定できない。 そもそもこのインフォームド・コンセントのための説明文書は倫理審査委員会で審査されたもので、「プライバシーの保護について」としているにも関わらず、保護すべき対象を明確にせず、どういうタイミングで、それをどう管理するかにも十分に言及できていない残念なありようなのだから、 二次利用時において、この説明文書で証明されているように本来倫理審査委員会で審査され、正しいものになるべき質を担保できないということが起こり、さらに個人情報が守られない可能性は十分にある。

他所で倫理審査委員会の質が担保されていないのではないかと思われる例があり、生存する個人ではないものの、難病に罹患した声優さんの症例を記述したと特定されてしまった論文がある。しかし、これは、遺族の同意があったのかもしれないので、断言することはできない。*2

これと同様のこともしくはそれに近いことが起こりかねないとの懸念がある。症例報告は流石にないにしても、事例での公開などが考えられる。

二次利用時に事例などとしてこの研究で得られるデータを扱う場合、繰り返しになるが、そのデータは、匿名化されており個人情報ではないから問題ないとされるのではないかという懸念がある。前述したようにこの研究で得られるデータは、特定の個人を識別することができるものとできないものの両者が含まれる匿名化されているもの(どの研究対象者の試料・情報であるかが直ちに判別できないよう、加工又は管理されたものに限る。)と考えられる。

名古屋市のHPVワクチンの副反応調査の件でのように調査回答データ*3が出されるようなことはないと思うが、症例報告とは言えないものの事例などそれに近い形での2次利用はあり得え、公表されてしまう可能性は否定できない。 そうなった場合、問診データと解析されたゲノム情報(ごく一部であろう)が公表される。SNSなどの情報から、自分の知らない自分の遺伝情報を他人に知られることになる可能性もある。また、この研究では当人には知らせないはずの遺伝情報を二次利用時の公開情報から入手できるということにもなりかねない。

二次利用の内容の確認がハードモード

懸念を持った場合でも、二次利用についてチェックしていくこともできる。

二次利用の内容について当院のホームページで情報を公開します。

とあるが、現状、国立病院機構相模原病院のホームーページのトップページから簡単な操作でそれに類するものにたどり着くことは試してみたが残念ながらできなかった。

つまりは二次利用の内容についてどこに公開されるかわからず、その情報のキャッチアップが難しいものをどうにかして収集し、問題がないかどうかを確認しなければならないというハードモードな状況である。

公開されればいいというものではなく、わかりやすいところに公開するべきであろう。

まとめ

個人的にはこの研究やそれに続く研究において、提供したデータを利用し、化学物質過敏症の機序解明につながってほしいと思っているが、一方で提供したデータにある個人情報はきちんと管理してほしい。

そして、そのきちんと管理しますとか保護しますという記述を確かな形で文書にして提示してほしい。説明文書ではそれが残念ながらできていなかった。 研究を担当する医師のみならず倫理審査委員会しっかりしてほしい。

今回の説明文書でのプライバシー保護の記述は審査で承認を得る過程において複数人のそれなりに検討できる方が関わっていると思うが、このような雑な記述で審査が通ってしまうということが驚きであった。弁護士の方も含まれているようである。 つまりは、この研究以外の研究においても、このような倫理審査委員会の質が同様なのかと思うとちょっと怖いと感じた。

他にも個人情報に関すること以外に「想定した期間内に研究を終えるようどのように研究対象者を集めるつもりであったのか」という疑問もあったりするので、研究計画書を閲覧しようと思う。

速やかな研究の遂行と個人情報保護、考えさせられる出来事だった。興味の続く範囲でさらに見ていきたい。

ほんといろいろとモヤモヤと考えてしまうんだなぁというのが遺伝情報を提供して思うことだ。

*1:ヒトゲノム・遺伝子解析研究に関する倫理指針の 本指針における「個人情報」「要配慮個人情報」「匿名加工情報(非識別加工情報)」 「匿名化されているもの」等の分類について http://www.mhlw.go.jp/file/06-Seisakujouhou-10600000-Daijinkanboukouseikagakuka/0000162455.pdf

*2:http://www.jges.net/index.php/member_submenu/archives/134

*3:名古屋市:子宮頸がん予防接種調査の結果を報告します(暮らしの情報)