AI応用医学部門AI Applied Medicine

クリニカルデータマイニング
コアセンター
Center for Clinical Data Mining

医療AIに資する
データの拡大

コアセンター長/中山 雅晴教授
コアセンター長
中山 雅晴教授

医療の世界にAIを活用することは当たり前になってきました。

そのAIの能力を最大限に引き出すためには良質で膨大なビッグデータの存在が不可欠です。しかしながら、電子カルテなどの診療情報は雑多なデータの集合体であり、多くは構造化されていないため、そのままでの活用は困難となっています。

我々は、収集できる診療データの拡大、データの構造化や正規化の徹底、データクレンジング、個人情報の秘匿などを通して医療データを活用するための基盤を構築し、さらに自然言語処理や機械学習などを駆使して研究を促進する手法の確立を行います。本コアセンターが多くの臨床医や研究者に貢献できるよう尽力していきたいと考えています。

電子カルテを自然言語処理で
医療の質評価に応用する

副コアセンター長/宮下 光令教授
副コアセンター長
宮下 光令教授

緩和ケアの質の評価の研究に20年間取り組んで参りました。いままではアンケート調査やレセプトなどのビッグデータ解析を行ってきましたが、「調査や回答者の負担が大きい」「レセプトでは実際の患者の苦痛の状況が抽出できない」といった限界があります。自然言語処理や機械学技術の発展により、電子カルテに格納されている膨大な情報の処理が容易にできるようになってきました。私たちのグループでは主に終末期患者を対象とし、電子カルテデータから患者・家族の苦痛を抽出する試みをはじめました。将来的には、それをアンケート調査やレセプトなどと結合し、緩和ケアや看護・医療の質の評価研究に発展させていく予定です。

コアセンター概要Overview of the Core Center

東北大学病院を中心とした臨床データやその他の事業による多施設情報収集基盤であるビッグデータメディシンセンターと連携し、大規模かつ多種類の臨床データを効率的に活用するための環境を提供します。標準コードが正しく振られていることやデータバリデーションが行われていることなどを通して臨床データの質を担保し、研究促進に役立てたいと考えています。

臨床データ、個人の日常記録、ゲノム・オミックスなどそれぞれ重要なデータは単体で収集されることが多く、連携は不十分な状況です。多くの研究者が望むものは統合データであり、中でも診療記録は臨床研究や臨床に役立つAIアプリ開発の中心かつ不可欠な情報といえます。臨床情報の活用を中心として統合基盤の整備を進めていきます。

コアセンター研究紹介Research at the Core Center

厚労省標準規格であるSS-MIX2におけるデータバリデーションとデータ収集。日本循環器学会出力フォーマットであるSEAMATなどを用いたSS-MIX2拡張ストレージの利用促進。電子カルテや、地域連携システムから個人情報記録(PHR)までを一元的に扱うための、次世代データ交換規約であるFHIRを用いたプラットフォームの確立。電子カルテデータを用いた、機械学習による疾患群同定(EHR driven Phenotyping)など。(中山)

電子カルテ内の多くの情報が非構造化データ、つまり文章の形で存在しています。自然言語処理や機械学習技術の発展に伴い、電子カルテ内の非構造化データから特定の情報を抽出し、患者の状態を把握する研究が進められています。本コアセンターでは、終末期がん患者を主な対象とし、電子カルテからの苦痛症状の抽出を試みております。(宮下)

コアセンター関連画像Related images to Core Center

  • クリニカルデータマイニングコアセンター

コアセンターメンバーCore Center Member

  • 中山 雅晴教授医学情報学分野
  • 宮下 光令教授緩和ケア看護学分野