はじめに
[機密情報の種類]は、Microsoft Purviewに含まれる機能です。
Microsoft Purview(https://compliance.microsoft.com/)>データの分類>機密情報の種類
主に、ファイルやメールに秘密度ラベルを自動適用する際の条件や、DLP(データ損失防止)ポリシーで検知する際の条件として活用することができます。
また、[機密情報の種類]はMicrosoftによって既定で用意されているものもありますが、「+機密情報の種類を作成する」独自で作成することもできます。
既定で用意されている[機密情報の種類]:一部抜粋
この[機密情報の種類]には、[名前つきエンティティ]が存在します。
今回は、[名前つきエンティティ]についてご紹介します。
名前つきエンティティとはなにか
[名前つきエンティティ]とは、Microsoftによって既定で用意されている[機密情報の種類]のうち、人名・地名・医療関連等の具体的なキーワードを含むものを指します。
[名前つきエンティティ]:一部抜粋
既定で用意されている[機密情報の種類] | 説明 |
All Full Names | オーストラリア、中国、日本、米国、EU 諸国など、サポートされているすべての国/地域の人々の氏名を検出 |
All Physical Addresses | サポートされているすべての国/地域の住所に関連するパターンを検出 |
Brand Medication Names | ブランド薬の名前を検出 ※英語の用語のみ |
Blood Test Terms | 血液検査に関連する用語を検出 ※英語の用語のみ |
クレジットカード番号やパスポート番号など、英数字のパターン等により検出される [機密情報の種類]は、[名前つきエンティティ]には該当しません。
既定で用意されている[機密情報の種類]のうち、[名前つきエンティティ]に該当しないもの:一部抜粋
既定で用意されている[機密情報の種類] | 説明 |
Credit Card Number | クレジット カード番号を検出 |
Japan Passport Number | 日本のパスポート番号を検出 |
また、「+機密情報の種類を作成する」から独自で作成する[機密情報の種類]は、[名前つきエンティティ]には該当しません。
[名前つきエンティティ]をテストしてみる
[機密情報の種類]の[名前つきエンティティ]である、「All Full Names」で動作テストを実施してみます。
テストファイル:漢字表記の氏名
結果:検出されない
テストファイル:ローマ字表記の氏名
結果:検出された
「All Full Names」の場合、日本語の氏名をアルファベットで記載した場合に検出するものの、漢字やカナで記載した場合は、検出しないことが現状の動作です。
補足
今回のテストでは、漢字で表記された氏名を検出することができませんでした。
ただ、過去の事例では、「All Full Names」において、漢字で表記された氏名を検出する事例がありました。
これは、「All Full Names」は全く漢字やカナの検出を行わないという動作ではなく、漢字やカナの検出が行われる・行われないことのいずれの可能性も存在するからということになります。
今回のテストのように、漢字やカナの検知が行われない可能性もあるため、日本語の氏名を確実に検知させたい場合は、
「+機密情報の種類を作成する」から独自で[機密情報の種類]を作成することを推奨します。
※全ての[名前つきエンティティ]が上記のような結果になるわけではなく、基本的に漢字やカナも検出する[名前つきエンティティ]も存在します。