この研究は、がん患者の臨床ノートから社会的決定要因(SDoH)を把握するためのアプローチを紹介しています。ブリガム・アンド・ウィメンズ病院やベス・イスラエル・ディーコネス医療センターなどの医療記録から、患者の性別や人種、治療履歴などの情報を網羅的に収集。
データは多様な出典と期間から得られ、それぞれ放射線治療、免疫療法や集中治療が施された患者の記録が使われました。文書は専門のソフトウェアを用いて、SDoHに関する情報が含まれるかどうかを熟練のデータサイエンティストが一つ一つ精査しました。その結果、大規模な機械学習モデルを用いて、医療文書からSDoH情報を正確に分類する方法が考案されたのです。
また、公平性を確保するために、文書に人工的に異なる人口統計データを挿入し、バイアスの有無を評価する試みも行われました。これによって、患者ケアに欠かせないSDoH情報が電子健康記録(EHR)にどの程度記録されているかを、そしてどう改善できるかを明らかにしようとしています。
出典 : Large language models to identify social determinants of health in electronic health records – npj Digital Medicine https://www.nature.com/articles/s41746-023-00970-0