|
最近、EasyPoi をバージョン 4.3 にアップデートしました。その主な機能はデータの匿名化を実装し、誰もが日常的に匿名化を必要とする場合に便利に使えるようにすることです。 Baidu Baikeは、データ匿名化を、匿名化ルールを用いて機密情報を変換し、機密データや個人情報を確実に保護するプロセスと定義しています。顧客のセキュリティデータや特定の商業上の機密データを扱う場合、システムルールに違反することなく、実際のデータを加工してテストに提供します。IDカード番号、携帯電話番号、カード番号、顧客番号などの個人情報はすべて、データの匿名化が必要です。 IDカードなどのデータを定義に厳密に従って変換する機能は、まだ実装していません。これは、データ改ざん防止ルールが設計に対応しており、ユーザーがルールを指定する必要があるためです。社内の改ざん防止システムにもまだロジックが残っていますが、ここでは詳細は割愛します。今回実装する主な機能は、アスタリスク(*)の追加です(最も一般的なのは星印なので、後でカスタムアスタリスクを追加します)。これにより、データのエクスポート時に不要なフィールドを非表示にしやすくなります。
データの維持 主な機能実装されている機能は主に3つの種類に分けられます。 - 1. 末尾の文字を非表示にします。電話番号や ID カードなどの固定長テキストに適しています。
- 2. 名前、住所など、長さが異なる部分を非表示にする
- 3. 電子メール アドレスなど、保持する必要がある部分を指定して、特定の部分を非表示にします。
単純な効果は - 13112345678 --> 131****1234
- 張三 --> 張*
- ロナウジーニョ --> ロナウジーニョ
- [email protected] -> w****@16com.com
脱感作効果 実施方法1. 注釈アノテーションは引き続き `@Excel` プロパティを通じて実装されます。`@Excel` に `desensitizationRule` プロパティが追加され、対応するフォーマットを設定して目的の結果を得ることができます。 - /**
- データ匿名化ルール
- * ルール 1: 先頭と末尾を保持する方式を使用し、中間のデータにアスタリスクを追加します。
- * 例: IDカード番号が6_4の場合、370101********1234のままにしてください
- ※末尾が3または4の電話番号の場合は、131****1234をそのまま使用してください。
- * ルール 2: ヘッダーの保持を優先して、明示的に非表示にされているフィールドを非表示にします。
- * 例: 名前 1,3 は、最大 3 文字、最小 1 文字を非表示にできることを意味します。
- * 李
- * 李三
- *張全丹
- * 李張泉丹
- * ニコラス・リー・チャン・クアンダン -> ニコラス*** チャン・クアンダン
- * ルール3: 特殊文字を保持する
- * 例: メールアドレス 1~@ は最初の数字のみが保持され、@ の後のフィールドが保持されることを意味します。
- * [email protected] -> a********@wupaas.com
- * 複雑なバージョンの場合は、インターフェースを使用してください。
- * {@link cn.afterturn.easypoi.handler.inter.IExcelDataHandler}
- /
- パブリック文字列 desensitizationRule()デフォルト "" ;
コメントからわかるように、3 つの簡単なルールの使用法は主に次のとおり非常に明確です。 - アンダースコアで区切られた最初の形式では、開始と終了の両方が保持されます。
- この形式では、開始と終了の両方を 0 にすることができ、何も保持されないことを示します。
- カンマで区切られた隠しデータの2番目の形式
- 保存のルールは主に対称性に基づいています。
- 文字を区切るにはチルダ (~) を使用し、特殊文字の書式を保持します。
- 複数の特殊文字が存在する場合は、最後の文字のみが保持されます。
具体的な実装コードは次のとおりです。 - /**
- * アスタリスクを追加して文字を区切ります。
- * @param 開始
- * @param マーク
- * @パラメータ値
- * @戻る
- /
- プライベート静的文字列 markSpilt( int開始, 文字列マーク, 文字列値) {
- 値 == nullの場合
- 戻る ヌル;
- }
- 整数 end = value.lastIndexOf(マーク);
- if (終了<= 開始) {
- 戻り値;
- }
- StringUtils.left (value, start).concat(StringUtils.leftPad(StringUtils.right ( value, value.length() - end ) , value.length() - start, "*" ));を返します。
- }
-
- /**
- * 対称的な切り捨てを優先して、部分的なデータ切り捨てを行います。
- * @param 開始
- * @param終了
- * @パラメータ値
- * @戻る
- /
- プライベート静的文字列subMaxString( int start, int 終了、文字列値){
- 値 == nullの場合
- 戻る ヌル;
- }
- 開始 >終了の場合
- 新しい IllegalArgumentException( "開始は終了より小さくなければなりません" );
- }
- int len = 値.長さ();
- if (長さ <= 開始) {
- StringUtils.leftPad( "" , len, "*" )を返します。
- }そうでなければ (len > start && len <= end ) {
- 長さ == 1 の場合
- 戻り値;
- }
- 長さ == 2 の場合
- StringUtils.left (value, 1).concat( "*" );を返します。
- }
- StringUtils.left ( value, 1).concat(StringUtils.leftPad(StringUtils.right ( value, 1), StringUtils.length(value) - 1, "*" ));を返します。
- }それ以外{
- 開始 = ( int ) Math.ceil((len - end + 0.0D) / 2);
- end = len - start - end ;
- end = end == 0 ? 1 : end ;
- StringUtils.left (value, start) .concat (StringUtils.leftPad(StringUtils.right ( value, end ), len - start, "*" ));を返します。
- }
- }
-
- /**
- * 行末データの抽出
- * @param 開始
- * @param終了
- * @パラメータ値
- * @戻る
- /
- プライベート静的文字列subStartEndString( int start, int 終了、文字列値){
- 値 == nullの場合
- 戻る ヌル;
- }
- if (value.length() <= 開始 +終了) {
- 戻り値;
- }
- StringUtils.left (value, start).concat(StringUtils.leftPad(StringUtils.right ( value, end ), StringUtils.length(value) - start, "*" ));を返します。
- }
注釈デモ使い方も非常に簡単で、簡単な注釈設定で実現できます。 - @Excel( name = "名前" , desensitizationRule = "1,6" )
- プライベート文字列名;
- @Excel( name = "IDカード" , desensitizationRule = "6_4" )
- プライベート文字列カード。
- @Excel( name = "電話番号" , desensitizationRule = "3_4" )
- プライベートストリング電話;
- @Excel( name = "メールアドレス" , desensitizationRule = "3~@" )
- プライベート文字列メール;
-
- //
- // これらはすべてテスト データなので、一部のみが生成されました。
- リスト<DesensitizationEntity> リスト = 新しい ArrayList<>();
- ( int i = 0; i < 20; i++)の場合{
- DesensitizationEntity エンティティ = 新しい DesensitizationEntity();
- エンティティ.setCard( "37010119900101123" + i % 10);
- entity.setName( "張三" );
- エンティティ.setPhone( "1311234567" + i % 10);
- entity.setEmail(i % 10 + "[email protected]" );
- list.add (エンティティ);
- }
- 日付の開始 = 新しい日付();
- ExportParams params = new ExportParams( "脱感作テスト" , "脱感作テスト" , ExcelType.XSSF);
- ワークブック workbook = ExcelExportUtil.exportExcel(params, DesensitizationEntity.class, list);
- システム.out.println (new Date ().getTime() - start.getTime());
- ファイル savefile = new File( "D:/home/excel/" );
- 保存ファイルが存在する場合(){
- 保存ファイル.mkdirs();
- }
- ファイル出力ストリーム fos = 新しいファイル出力ストリーム ( "D:/home/excel/ExcelDesensitizationTest.xlsx" );
- workbook.write(fos);
- fos.close ();
生成された結果は以下の通りです。ご覧のとおり、複数のシナリオがカバーされており、基本的によく使用されるフィールドはすべて含まれています。 PS: バリアント アノテーションとアノテーションは互換性があるため、バリアント アノテーションを使用するときにこの方法を使用してデータを匿名化することもできます。 ここでは例は示しません。新しいExcelExportEntityを作成した後、setDesensitizationRule(rule)を呼び出して対応するルールを設定してください。ルールは上記のものと一致している必要があります。 2. テンプレートテンプレート脱感作 グループでのフィードバックと質問の数から判断すると、現在最もよく使われている方法はテンプレートです。私は一貫してアノテーションを推奨していますが、テンプレートはアノテーションよりも明らかにシンプルで、コードへの影響も少ないです。私自身も独自の特殊タグをどんどん増やしています。 脱感作タグは「desensitizationRule」の最初の2文字から取得され、データの脱感作が必要であることを示します。使い方は非常に簡単で、「deru:1_3」のように記述します。「deru:」の後に具体的なルールが続きます。ルールの使い方は上記の説明と一致するため、ここでは繰り返しません。以下に例を示します。 - /**
- これには 2 つのルールが含まれます。
- * 1. deru: このデータは匿名化する必要があることを示します。
- * 2. dict: 転送には辞書インターフェースを呼び出す必要があることを示します。
- **/
- deru:1_1;dict:mtype;t.supMaterialList.mtype
脱感作はタグ処理における最下層です。タグの記述順序に関係なく、他のすべてのタグが処理された後にのみ処理されます。例えば、上記の例では、脱感作が最初のタグであるにもかかわらず、タグが処理される前に辞書が処理されます。 コアコードは次のとおりです。 - /**
- * テンプレート解析関数に基づいて値を取得する
- * @param funStr
- * @param マップ
- * @戻る
- /
- プライベート Object getValByHandler(String funStr,Map<String, Object> map, Cell cell) は例外をスローします {
- // ステップ 2. 分析関数が存在するかどうかを判断します。
- if (isHasSymbol(funStr, NUMBER_SYMBOL)) {
- funStr = funStr.replaceFirst(NUMBER_SYMBOL, "" );
- }
- ブール値 isStyleBySelf = false ;
- if (isHasSymbol(funStr, STYLE_SELF)) {
- isStyleBySelf = true ;
- funStr = funStr.replaceFirst(STYLE_SELF, "" );
- }
- ブール値 isDict = false ;
- 文字列 dict = null ;
- if (isHasSymbol(funStr, DICT_HANDLER)) {
- isDict = true ;
- dict = funStr.substring (funStr.indexOf(DICT_HANDLER) + 5).split( ";" )[0];
- funStr = funStr.replaceFirst(DICT_HANDLER, "" );
- funStr = funStr.replaceFirst(dict + ";" , "" );
- }
- ブール値 isI18n = false ;
- if (isHasSymbol(funStr, I18N_HANDLER)) {
- isI18n = true ;
- funStr = funStr.replaceFirst(I18N_HANDLER、 "" );
- }
- //このセクションでは、アノテーションルールが存在するかどうかを確認します。存在する場合は、アノテーションルールが選択され、削除されます。
- ブール値 isDern = false ;
- 文字列 dern = null ;
- if (isHasSymbol(funStr, DESENSITIZATION_RULE)) {
- isDern = true ;
- dern = funStr.substring (funStr.indexOf(DESENSITIZATION_RULE) + 5).split( ";" )[0];
- funStr = funStr.replaceFirst(DESENSITIZATION_RULE, "" );
- funStr = funStr.replaceFirst(dern + ";" , "" );
- }
- if (isHasSymbol(funStr, MERGE)) {
- 文字列 mergeStr = PoiPublicUtil.getElStr(funStr,MERGE);
- funStr = funStr.replace (mergeStr, "" );
- mergeStr = mergeStr.replaceFirst(MERGE, "" );
- 試す {
- int colSpan = ( int ) Double .parseDouble(PoiPublicUtil.getRealValue(mergeStr, map).toString());
- PoiMergeCellUtil.addMergedRegion(cell.getSheet(), cell.getRowIndex(),
- cell.getRowIndex()、cell.getColumnIndex()、cell.getColumnIndex() + colSpan - 1);
- } キャッチ (例外 e) {
- LOGGER.error(e.getMessage(),e);
- }
- }
- オブジェクト obj = funStr.indexOf(START_STR) == -1 ? eval(funStr, map): PoiPublicUtil.getRealValue(funStr, map);
- if (isDict) {
- obj = dictHandler.toName(dict, null , funStr, obj);
- }
- if (isI18n) {
- obj = i18nHandler.getLocaleName(obj.toString());
- }
- // ここで感度低下ルールが呼び出されます。アノテーションと同じユーティリティクラスを使用しているため、ルールは一貫しています。
- if (isDern) {
- obj = PoiDataDesensitizationUtil.desensitization(dern,obj);
- }
- objを返します。
- }
テンプレートがどのように機能するかを以下に示します。 最終結果 |