ページ

2026年1月16日金曜日

オンライン会話型ヘルスケアデータの分類・評価のための標準準拠LLMパイプライン SALP-CG

#aidexx #news

2026年01月16日


## 要約:
本研究では、オンラインヘルスケアデータにおけるプライバシーリスクの分類・評価を行うLLMパイプライン「SALP-CG」を開発しました。標準規格GB/T 39725-2020に準拠し、多様なLLMで安定した分類と信頼性の高いリスク評価を実現します。MedDialog-CNベンチマークでは高い精度を示し、ヘルスケアデータのガバナンスに役立つ実用的な手法を提供します。

---

## 翻訳:
arXiv:2601.09717v1 Announce Type: new
Abstract: オンライン医療相談では、保護された医療情報が埋め込まれる可能性のある大量の会話型ヘルスケアデータが生成され、ポリシーと慣行に沿ってデータカテゴリを分類し、リスクレベルを割り当てるための堅牢な方法が必要です。しかし、既存のアプローチは統一された標準と、そのような会話型ヘルスケアデータの機密分類を満たすための信頼性の高い自動化された方法が不足しています。本研究では、LLMベースの抽出パイプラインSALP-CGを提示し、オンライン会話型ヘルスケアデータにおけるプライバシーリスクの分類・評価を行います。GB/T 39725-2020に準拠したヘルスケアデータの分類・評価ルールを結論付けました。少数ショットガイダンス、JSONスキーマ制約付きデコーディング、決定論的な高リスクルールを組み合わせることで、バックエンドに依存しない抽出パイプラインは、多様なLLMで強力なカテゴリ遵守と信頼性の高い機密性を実現します。MedDialog-CNベンチマークでは、モデルは堅牢なエンティティ数、高いスキーマ遵守性、正確な機密性評価を示し、最も強力なモデルは、最高レベルの予測でmicro-F1=0.900を達成します。機密性によって層化されたカテゴリの状況は、レベル2〜3の項目が優勢であり、組み合わせると再識別を可能にし、レベル4〜5の項目は発生頻度が低いものの、過大な被害をもたらすことを示しています。SALP-CGは、LLMにわたってオンライン会話型ヘルスケアデータのカテゴリを分類し、機密性を評価するための信頼できる方法を提供し、ヘルスケアデータガバナンスのための実用的な手法を提供します。コードはhttps://github.com/dommii1218/SALP-CGで入手可能です。

[📰 原文はこちら](https://arxiv.org/abs/2601.09717)

---

※本記事はAI(Ollama)による自動翻訳・要約です。

BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/

AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/

頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。

動画の最後にお得な情報がありますので、
最後までご覧ください。

3分で片付く!仕事前のデスク整理術

#aidexx #生活習慣 #knowhow 【保存版】 3分で片付く!仕事前のデスク整理術 1. まずはデスクの物を全て引き出しや棚に移動させる。 2. 次に、3分間でペン、クリップ、メモ帳など使用頻度の高い物を整理する。 3. デスクマットの上で5つ...